CN109976153A - 控制无人驾驶设备及模型训练的方法、装置及电子设备 - Google Patents

控制无人驾驶设备及模型训练的方法、装置及电子设备 Download PDF

Info

Publication number
CN109976153A
CN109976153A CN201910154597.8A CN201910154597A CN109976153A CN 109976153 A CN109976153 A CN 109976153A CN 201910154597 A CN201910154597 A CN 201910154597A CN 109976153 A CN109976153 A CN 109976153A
Authority
CN
China
Prior art keywords
data
target
hidden variable
control parameter
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910154597.8A
Other languages
English (en)
Other versions
CN109976153B (zh
Inventor
穆荣均
夏华夏
任冬淳
郭潇阳
付圣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201910154597.8A priority Critical patent/CN109976153B/zh
Publication of CN109976153A publication Critical patent/CN109976153A/zh
Priority to PCT/CN2019/123394 priority patent/WO2020177417A1/zh
Application granted granted Critical
Publication of CN109976153B publication Critical patent/CN109976153B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Abstract

本申请提供一种控制无人驾驶设备及模型训练的方法、装置及电子设备,所述方法的一具体实施方式包括:获取目标设备当前的控制指导数据;获取预先确定的所述目标设备对应的目标隐变量;所述目标隐变量用于表示针对所述目标设备,控制指导数据与控制参数之间的转化影响因素;基于所述当前的控制指导参数及所述目标隐变量,得到当前的控制参数;根据所述当前的控制参数控制所述目标设备。该实施方式无需通过大量人工标定得到每个无人驾驶设备所对应的对应关系表,从而节省了大量的人力资源,并减小了控制参数的误差。

Description

控制无人驾驶设备及模型训练的方法、装置及电子设备
技术领域
本申请涉及无人驾驶技术领域,特别涉及一种控制无人驾驶设备及模型训练的方法、装置及电子设备。
背景技术
目前来说,在无人驾驶技术中,在确定了驾驶决策后,一般是参考驾驶决策得到当前的控制指导数据,并通过查表的方式(查询控制指导数据与控制参数的对应关系表),得到当前的控制指导数据所对应的控制参数,以进行无人驾驶控制。但是,上述方式需要预先针对每个无人驾驶设备进行大量人工标定,从而得到每个无人驾驶设备所对应的对应关系表,因此,浪费了大量的人力资源。并且,上述对应关系表仅能表示查询控制指导数据与控制参数之间的离散关系,从而使得控制参数的误差增大。
发明内容
为了解决上述技术问题之一,本申请提供一种控制无人驾驶设备及模型训练的方法、装置及电子设备。
根据本申请实施例的第一方面,提供一种控制无人驾驶设备的方法,包括:
获取目标设备当前的控制指导数据;
获取预先确定的所述目标设备对应的目标隐变量;所述目标隐变量用于表示针对所述目标设备,控制指导数据与控制参数之间的转化影响因素;
基于所述当前的控制指导数据及所述目标隐变量,得到当前的控制参数;
根据所述当前的控制参数控制所述目标设备。
可选的,预先通过如下方式确定所述目标隐变量:
确定针对所述目标设备采集的多组样本数据,每组所述样本数据包括控制指导数据及控制参数;
将所述多组样本数据输入目标卷积神经网络,得到所述目标卷积神经网络输出的所述目标隐变量。
可选的,所述基于所述当前的控制指导数据及所述目标隐变量,得到当前的控制参数,包括:
将所述当前的控制指导数据及所述目标隐变量输入至目标循环神经网络,得到当前的控制参数。
可选的,所述目标卷积神经网络及所述目标循环神经网络通过如下方法训练而成:
执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据;将所述第一数据输入至当前的卷积神经网络,得到隐变量,所述隐变量用于表示控制指导数据与控制参数之间的转化影响因素;将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数;
若基于所述预测参数与所述第二数据对应的控制参数,确定未满足预设条件,对所述卷积神经网络和所述循环神经网络的网络参数进行调整,并重新执行所述目标操作;
若基于所述预测参数与所述第二数据对应的控制参数,确定满足所述预设条件,输出经过调整后的目标卷积神经网络及目标循环神经网络。
可选的,所述第一数据和所述第二数据为针对同一无人驾驶设备而采集的数据;
所述目标操作还包括:
在将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络的同时,将随机生成的噪声信号也输入至当前的循环神经网络。
可选的,通过如下方式确定满足所述预设条件:
确定目标函数,所述目标函数为所述预测参数与所述第二数据对应的控制参数之间的ELBO证据下线函数;
当所述目标函数收敛时,确定满足所述预设条件。
根据本申请实施例的第二方面,提供一种用于控制无人驾驶设备的模型训练方法,包括:
执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据,每组所述样本数据包括控制指导数据及控制参数;将所述第一数据输入至当前的卷积神经网络,得到隐变量,所述隐变量用于表示控制指导数据与控制参数之间的转化影响因素;将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数;
若基于所述预测参数与所述第二数据对应的控制参数,确定未满足预设条件,对所述卷积神经网络和所述循环神经网络的网络参数进行调整,并重新执行所述目标操作;
若基于所述预测参数与所述第二数据对应的控制参数,确定满足所述预设条件,输出经过调整后的目标卷积神经网络及目标循环神经网络。
可选的,所述第一数据和所述第二数据为针对同一无人驾驶设备而采集的数据;
所述目标操作还包括:
在将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络的同时,将随机生成的噪声信号也输入至当前的循环神经网络。
根据本申请实施例的第三方面,提供一种控制无人驾驶设备的装置,包括:
获取模块,用于获取目标设备当前的控制指导数据,并获取预先确定的所述目标设备对应的目标隐变量;所述目标隐变量用于表示针对所述目标设备,控制指导数据与控制参数之间的转化影响因素;
确定模块,用于基于所述当前的控制指导数据及所述目标隐变量,得到当前的控制参数;
控制模块,用于根据所述当前的控制参数控制所述目标设备。
根据本申请实施例的第四方面,提供一种用于控制无人驾驶设备的模型训练装置,包括:
执行模块,用于执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据,每组所述样本数据包括控制指导数据及控制参数;将所述第一数据输入至当前的卷积神经网络,得到隐变量,所述隐变量用于表示控制指导数据与控制参数之间的转化影响因素;将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数;
调整模块,用于在基于所述预测参数与所述第二数据对应的控制参数,确定未满足预设条件时,对所述卷积神经网络和所述循环神经网络的网络参数进行调整,并指示所述执行模块重新执行所述目标操作;
输出模块,用于在基于所述预测参数与所述第二数据对应的控制参数,确定满足所述预设条件时,输出经过调整后的目标卷积神经网络及目标循环神经网络。
根据本申请实施例的第五方面,提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面以及第二方面中任一项所述的方法。
根据本申请实施例的第六方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第一方面以及第二方面中任一项所述的方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
本申请的实施例提供的控制无人驾驶设备的方法和装置,通过获取目标设备当前的控制指导数据,及获取预先确定的目标设备对应的目标隐变量,基于当前的控制指导数据及目标隐变量,得到当前的控制参数,并根据当前的控制参数控制目标设备。其中,目标隐变量用于表示针对目标设备,控制指导数据与控制参数之间的转化影响因素。本实施例无需通过大量人工标定得到每个无人驾驶设备所对应的对应关系表,从而节省了大量的人力资源,并减小了控制参数的误差。
本申请的实施例提供的用于控制无人驾驶设备的模型训练的方法和装置,执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据,每组样本数据包括控制指导数据及控制参数。将第一数据输入至当前的卷积神经网络,得到隐变量,该隐变量用于表示控制指导数据与控制参数之间的转化影响因素。将该隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数。若基于预测参数与第二数据对应的控制参数,确定未满足预设条件,则对当前的卷积神经网络和循环神经网络的网络参数进行调整,并重新执行目标操作。若基于预测参数与第二数据对应的控制参数,确定满足上述预设条件,则输出经过调整后的目标卷积神经网络及目标循环神经网络。由于本实施例引入了表示控制指导数据与控制参数之间转化影响因素的隐变量,并同时对用于构建隐变量的卷积神经网络,和用于预测控制参数的循环神经网络进行训练,使得训练得到的目标卷积神经网络及目标循环神经网络在应用于无人驾驶控制时,所得的控制参数更加准确。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请根据一示例性实施例示出的一种控制无人驾驶设备的方法的流程图;
图2是本申请根据一示例性实施例示出的一种用于控制无人驾驶设备的模型训练的方法的流程图;
图3是本申请根据一示例性实施例示出的一种控制无人驾驶设备的装置的框图;
图4是本申请根据一示例性实施例示出的一种用于控制无人驾驶设备的模型训练的装置的框图;
图5是本申请根据一示例性实施例示出的一种电子设备的结构示意图;
图6是本申请根据一示例性实施例示出的另一种电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如图1所示,图1是根据一示例性实施例示出的一种控制无人驾驶设备的方法的流程图,该方法可以应用于无人驾驶设备中。本领域技术人员可以理解,该无人驾驶设备可以包括但不限于无人车、无人操作机器人、无人机、无人船等等。该方法包括以下步骤:
在步骤101中,获取目标设备当前的控制指导数据。
在步骤102中,获取预先确定的目标设备对应的目标隐变量,该目标隐变量用于表示针对目标设备,控制指导数据与控制参数之间的转化影响因素。
在步骤103中,基于当前的控制指导数据及目标隐变量,得到当前的控制参数。
在本实施例中,目标设备为待控制的无人驾驶设备,目标设备可以是无人车,或者是无人操作机器人,或者是无人机,或者是无人船等等,本申请对目标设备的具体类型方面不限定。
在本实施例中,当前的控制参数为当前用于对目标设备进行控制的参数,例如,以无人车为例,控制参数可以是无人车的底盘控制参数(如,油门或刹车的控制量等)等。可以理解,控制参数还可以是其它的控制参数,本申请对此方面不限定。目标设备当前的控制指导数据可以用于确定当前的控制参数,例如,以无人车为例,当前的控制指导数据可以包括无人车当前的运行速度以及当前准备施加的加速度。可以理解,控制指导数据还可以是其它任意能够用于确定当前的控制参数的数据,本申请对此方面不限定。
在本实施例中,目标设备对应的目标隐变量能够用于表示控制指导数据与控制参数之间的转化影响因素,并且,该转化影响因素为针对目标设备的转化影响因素。可以预先基于训练好的目标卷积神经网络,确定该目标隐变量,并将目标隐变量存储于目标设备中,当对目标设备进行无人驾驶控制时,可以从目标设备存储的数据中获取目标隐变量,并基于目标隐变量进行无人驾驶控制。
在本实施例中,目标卷积神经网络和目标循环神经网络均为预先训练好的模型,具体来说,可以通过如下方式训练得到目标卷积神经网络和目标循环神经网络:执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据,每组样本数据包括控制指导数据及控制参数。将第一数据输入至当前的卷积神经网络,得到隐变量,该隐变量用于表示控制指导数据与控制参数之间的转化影响因素。将该隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数。若基于预测参数与第二数据对应的控制参数,确定未满足预设条件,则对当前的卷积神经网络和循环神经网络的网络参数进行调整,并重新执行目标操作。若基于预测参数与第二数据对应的控制参数,确定满足上述预设条件,则输出经过调整后的目标卷积神经网络及目标循环神经网络。
进一步地,在目标操作过程中,在将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络的同时,还可以将随机生成的噪声信号也输入至当前的循环神经网络,并且,保证第一数据和第二数据为针对同一无人驾驶设备而采集的数据。
在步骤104中,根据当前的控制参数控制目标设备。
在本实施例中,可以将当前的控制指导数据及目标隐变量输入至目标循环神经网络,将目标循环神经网络输出的结果作为当前的控制参数。可以按照当前的控制参数控制目标设备。
本申请的上述实施例提供的控制无人驾驶设备的方法,通过获取目标设备当前的控制指导数据,及获取预先确定的目标设备对应的目标隐变量,基于当前的控制指导数据及目标隐变量,得到当前的控制参数,并根据当前的控制参数控制目标设备。其中,目标隐变量用于表示针对目标设备,控制指导数据与控制参数之间的转化影响因素。本实施例无需通过大量人工标定得到每个无人驾驶设备所对应的对应关系表,从而节省了大量的人力资源,并减小了控制参数的误差。
在另一些可选实施方式中,可以预先通过如下方式确定目标设备对应的目标隐变量:可以确定针对目标设备采集的多组样本数据,每组样本数据包括控制指导数据及控制参数,并将上述多组样本数据输入目标卷积神经网络,得到目标卷积神经网络输出的目标隐变量。
在本实施例中,首先,可以预先针对目标设备进行驾驶测试,在驾驶测试的过程中,采集多组样本数据,每组样本数据可以包括控制指导数据及该控制指导数据对应的控制参数。该样本数据的组数可以是任意合理的数量,例如,可以是3组,或者5组,或者10组等。可以理解,本申请对样本数据的具体组数方面不限定。
接着,可以确定预先针对目标设备采集的多组样本数据,并将上述多组样本数据输入至目标卷积神经网络中,将目标卷积神经网络输出的结果作为目标隐变量。
由于本实施例中,可以采用预先针对目标设备而采集的多组样本数据,通过预先训练的目标卷积神经网络,得到能够表示控制指导数据与控制参数之间转化影响因素的目标隐变量,该目标隐变量为针对目标设备的隐变量。因此,进一步提高了控制参数的准确度。
如图2所示,图2根据一示例性实施例示出的一种用于控制无人驾驶设备的模型训练的方法的流程图,该方法可以应用于终端设备中,也可以应用于服务器中。该方法包括以下步骤:
在步骤201中,从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据,每组样本数据包括控制指导数据及控制参数。
在本实施例中,首先,可以预先针对型号相同的多个不同的无人驾驶设备进行驾驶测试,在驾驶测试的过程中,采集大量样本数据得到样本集(样本集中的样本数据均对应于相同型号的无人驾驶设备)。其中,样本集中的每组样本数据可以包括控制指导数据及该控制指导数据对应的控制参数。在进行模型训练时,可以从样本集中选多组样本数据作为第一数据,以及从样本集中选一组样本数据作为第二数据。
在步骤202中,将第一数据输入至当前的卷积神经网络,得到隐变量,该隐变量用于表示控制指导数据与控制参数之间的转化影响因素。
在步骤203中,将该隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数。
在本实施例中,首先,可以将第一数据输入至当前的卷积神经网络中,得到该卷积神经网络输出的隐变量。接着,可以将该隐变量和第二数据所对应的控制指导数据输入至当前的循环神经网络,得到该循环神经网络输出的预测参数。
在步骤204中,基于该预测参数与第二数据所对应的控制参数,确定当前是否满足预设条件。
在本实施例中,可以基于该预测参数与第二数据所对应的控制参数,确定目标函数是否收敛,当目标函数收敛时,可以确定当前满足预设条件。当目标函数未收敛时,可以确定当前未满足预设条件。其中,目标函数可以是上述预测参数与第二数据对应的控制参数之间的ELBO证据下线函数。具体来说,预测参数的分布与第二数据所对应的控制参数的分布服从正态分布,则可以根据ELBO的定义式以及极大似然估计方法,得到预测参数与第二数据对应的控制参数之间的ELBO证据下线函数。可以理解,目标函数还可以是其它任意合理的函数,本申请对此方面不限定。
在步骤205中,若未满足预设条件,则对上述卷积神经网络和上述循环神经网络的网络参数进行调整,并重新执行步骤201。
在本实施例中,当确定未满足预设条件时,则可以对上述卷积神经网络和上述循环神经网络的网络参数进行调整。具体来说,可以根据该预测参数与第二数据所对应的控制参数,确定上述卷积神经网络和上述循环神经网络的网络参数的调整方向(如,将参数调大,或者将参数调小),然后按照该调整方向调整上述卷积神经网络和上述循环神经网络的网络参数。从而使得调整后,预测参数与第二数据所对应的控制参数之间的差异尽可能减小。
在步骤206中,若满足预设条件,则输出经过调整后的目标卷积神经网络及目标循环神经网络。
在本实施例中,当确定满足预设条件时,可以输出当前经过调整后的卷积神经网络及循环神经网络作为目标卷积神经网络及目标循环神经网络。
需要说明的是,通过上述方式训练得到的目标卷积神经网络及目标循环神经网络可以用于无人驾驶控制。具体来说,可以首先基于目标卷积神经网络获取目标设备对应的目标隐变量,并确定目标设备当前的控制指导数据。然后,将当前的控制指导数据及目标隐变量输入至目标循环神经网络中,得到目标循环神经网络的结果作为当前的控制参数。最后,可以按照当前的控制参数对目标进行设备控制。其中,可以通过如下方式确定目标隐变量:首先,确定针对目标设备采集的多组样本数据,每组样本数据包括控制指导数据及控制参数。接着,将多组样本数据输入至目标卷积神经网络,得到目标卷积神经网络输出的结果作为目标隐变量。
本申请的上述实施例提供的用于控制无人驾驶设备的模型训练的方法,执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据,每组样本数据包括控制指导数据及控制参数。将第一数据输入至当前的卷积神经网络,得到隐变量,该隐变量用于表示控制指导数据与控制参数之间的转化影响因素。将该隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数。若基于预测参数与第二数据对应的控制参数,确定未满足预设条件,则对当前的卷积神经网络和循环神经网络的网络参数进行调整,并重新执行目标操作。若基于预测参数与第二数据对应的控制参数,确定满足上述预设条件,则输出经过调整后的目标卷积神经网络及目标循环神经网络。由于本实施例引入了表示控制指导数据与控制参数之间转化影响因素的隐变量,并同时对用于构建隐变量的卷积神经网络,和用于预测控制参数的循环神经网络进行训练,使得训练得到的目标卷积神经网络及目标循环神经网络在应用于无人驾驶控制时,所得的控制参数更加准确。
在另一些可选实施方式中,在目标操作过程中,在将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络的同时,还可以将随机生成的噪声信号也输入至当前的循环神经网络,并且,保证第一数据和第二数据为针对同一无人驾驶设备而采集的数据。
一般来说,相同型号的无人驾驶设备通常具有一定的共性,通常可以将相同型号的无人驾驶设备归为一类进行样本数据采集并进行模型训练。但是,通过上述方式进行训练得到的模型只能体现相同型号的无人驾驶设备的共性特性。实际上,每个无人驾驶设备又具有其独特的特性,因此,相同型号的不同无人驾驶设备也是具有不同特性的。
在本实施例中,在每轮训练中,可以从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据。其中,第一数据和第二数据均为针对同一无人驾驶设备而采集的数据,使得每轮训练均对应同一无人驾驶设备。并且,在目标操作过程中,可以随机生成噪声信号,并将噪声信号与隐变量和第二数据对应的控制指导数据一起输入至当前的循环神经网络中。由于每轮训练对应同一无人驾驶设备,并在每轮训练引入随机噪声信号(随机噪声信号可以为循环神经网络提供预设的自由度),不同轮次的训练对应不同的无人驾驶设备。因此,最终训练得到的目标卷积神经网络能够针对每个无人驾驶设备,得到能反映其独特特性的隐变量。
由于本实施例中,在目标操作过程中,在将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络的同时,还将随机生成的能为循环神经网络提供预设自由度的噪声信号也输入至当前的循环神经网络,并且,第一数据和第二数据为针对同一无人驾驶设备而采集的数据。因此,无需对每个无人驾驶设备进行大量样本数据的采集,即可使训练得到的目标卷积神经网络能够针对每个无人驾驶设备,得到反映其独特特性的隐变量,提高了模型训练的效率以及精确度。
应当注意,尽管在上述实施例中,以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
与前述控制无人驾驶设备及模型训练的方法实施例相对应,本申请还提供了控制无人驾驶设备及模型训练的装置的实施例。
如图3所示,图3是本申请根据一示例性实施例示出的一种控制无人驾驶设备的装置框图,该装置可以包括:获取模块301,确定模块302和控制模块303。
其中,获取模块301,用于获取目标设备当前的控制指导数据,并获取预先确定的目标设备对应的目标隐变量。目标隐变量用于表示针对目标设备,控制指导数据与控制参数之间的转化影响因素。
确定模块302,用于基于当前的控制指导数据及目标隐变量,得到当前的控制参数。
控制模块303,用于根据当前的控制参数控制目标设备。
在一些可选实施方式中,可以预先通过如下方式确定目标隐变量:确定针对目标设备采集的多组样本数据,每组样本数据包括控制指导数据及控制参数。并将多组样本数据输入目标卷积神经网络,得到目标卷积神经网络输出的目标隐变量。
在另一些可选实施方式中,确定模块302被配置用于:将当前的控制指导数据及目标隐变量输入至目标循环神经网络,得到当前的控制参数。
在另一些可选实施方式中,目标卷积神经网络及目标循环神经网络通过如下方法训练而成:
执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据,每组样本数据包括控制指导数据及控制参数。将第一数据输入至当前的卷积神经网络,得到隐变量,该隐变量用于表示控制指导数据与控制参数之间的转化影响因素。将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数。
若基于预测参数与第二数据对应的控制参数,确定未满足预设条件,对卷积神经网络和循环神经网络的网络参数进行调整,并重新执行目标操作。
若基于预测参数与第二数据对应的控制参数,确定满足预设条件,输出经过调整后的目标卷积神经网络及目标循环神经网络。
在另一些可选实施方式中,第一数据和第二数据为针对同一无人驾驶设备而采集的数据。
目标操作还可以包括:在将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络的同时,将随机生成的噪声信号也输入至当前的循环神经网络。
在另一些可选实施方式中,可以通过如下方式确定满足预设条件:
确定目标函数,目标函数为上述预测参数与第二数据对应的控制参数之间的ELBO证据下线函数。当目标函数收敛时,确定满足预设条件。
应当理解,上述装置可以预先设置在无人驾驶设备中,也可以通过下载等方式而加载到无人驾驶设备中。上述装置中的相应模块可以与无人驾驶设备中的模块相互配合以实现无人驾驶控制的方案。
如图4所示,图4是本申请根据一示例性实施例示出的一种用于控制无人驾驶设备的模型训练装置框图,该装置可以包括:执行模块401,调整模块402和输出模块403。
其中,执行模块401,用于执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据,每组样本数据包括控制指导数据及控制参数。将第一数据输入至当前的卷积神经网络,得到隐变量,该隐变量用于表示控制指导数据与控制参数之间的转化影响因素,将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数。
调整模块402,用于在基于预测参数与第二数据对应的控制参数,确定未满足预设条件时,对上述卷积神经网络和上述循环神经网络的网络参数进行调整,并指示执行模块401重新执行目标操作。
输出模块403,用于在基于预测参数与第二数据对应的控制参数,确定满足预设条件时,输出经过调整后的目标卷积神经网络及目标循环神经网络。
在另一些可选实施方式中,第一数据和第二数据为针对同一无人驾驶设备而采集的数据。
执行模块401还用于:在将隐变量和第二数据对应的控制指导数据输入至当前的循环神经网络的同时,将随机生成的噪声信号也输入至当前的循环神经网络。
应当理解,上述装置可以预先设置在终端设备或服务器中,也可以通过下载等方式而加载到终端设备或服务器中。上述装置中的相应模块可以与无人驾驶设备中的模块相互配合以实现用于控制无人驾驶设备的模型训练的方案。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请实施例还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1至图2任一实施例提供的控制无人驾驶设备及模型训练的方法。
对应于上述的控制无人驾驶设备的方法,本申请实施例还提出了图5所示的根据本申请的一示例性实施例的电子设备的示意结构图。请参考图5,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成控制无人驾驶设备的装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
对应于上述的用于控制无人驾驶设备的模型训练方法,本申请实施例还提出了图6所示的根据本申请的一示例性实施例的电子设备的示意结构图。请参考图6,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成用于控制无人驾驶设备的模型训练装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (12)

1.一种控制无人驾驶设备的方法,其特征在于,所述方法包括:
获取目标设备当前的控制指导数据;
获取预先确定的所述目标设备对应的目标隐变量;所述目标隐变量用于表示针对所述目标设备,控制指导数据与控制参数之间的转化影响因素;
基于所述当前的控制指导数据及所述目标隐变量,得到当前的控制参数;
根据所述当前的控制参数控制所述目标设备。
2.根据权利要求1所述的方法,其特征在于,预先通过如下方式确定所述目标隐变量:
确定针对所述目标设备采集的多组样本数据,每组所述样本数据包括控制指导数据及控制参数;
将所述多组样本数据输入目标卷积神经网络,得到所述目标卷积神经网络输出的所述目标隐变量。
3.根据权利要求2所述的方法,其特征在于,所述基于所述当前的控制指导数据及所述目标隐变量,得到当前的控制参数,包括:
将所述当前的控制指导数据及所述目标隐变量输入至目标循环神经网络,得到当前的控制参数。
4.根据权利要求3所述的方法,其特征在于,所述目标卷积神经网络及所述目标循环神经网络通过如下方法训练而成:
执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据;将所述第一数据输入至当前的卷积神经网络,得到隐变量,所述隐变量用于表示控制指导数据与控制参数之间的转化影响因素;将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数;
若基于所述预测参数与所述第二数据对应的控制参数,确定未满足预设条件,对所述卷积神经网络和所述循环神经网络的网络参数进行调整,并重新执行所述目标操作;
若基于所述预测参数与所述第二数据对应的控制参数,确定满足所述预设条件,输出经过调整后的目标卷积神经网络及目标循环神经网络。
5.根据权利要求4所述的方法,其特征在于,所述第一数据和所述第二数据为针对同一无人驾驶设备而采集的数据;
所述目标操作还包括:
在将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络的同时,将随机生成的噪声信号也输入至当前的循环神经网络。
6.根据权利要求4所述的方法,其特征在于,通过如下方式确定满足所述预设条件:
确定目标函数,所述目标函数为所述预测参数与所述第二数据对应的控制参数之间的ELBO证据下线函数;
当所述目标函数收敛时,确定满足所述预设条件。
7.一种用于控制无人驾驶设备的模型训练方法,其特征在于,所述方法包括:
执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据,每组所述样本数据包括控制指导数据及控制参数;将所述第一数据输入至当前的卷积神经网络,得到隐变量,所述隐变量用于表示控制指导数据与控制参数之间的转化影响因素;将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数;
若基于所述预测参数与所述第二数据对应的控制参数,确定未满足预设条件,对所述卷积神经网络和所述循环神经网络的网络参数进行调整,并重新执行所述目标操作;
若基于所述预测参数与所述第二数据对应的控制参数,确定满足所述预设条件,输出经过调整后的目标卷积神经网络及目标循环神经网络。
8.根据权利要求7所述的方法,其特征在于,所述第一数据和所述第二数据为针对同一无人驾驶设备而采集的数据;
所述目标操作还包括:
在将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络的同时,将随机生成的噪声信号也输入至当前的循环神经网络。
9.一种控制无人驾驶设备的装置,其特征在于,所述装置包括:
获取模块,用于获取目标设备当前的控制指导数据,并获取预先确定的所述目标设备对应的目标隐变量;所述目标隐变量用于表示针对所述目标设备,控制指导数据与控制参数之间的转化影响因素;
确定模块,用于基于所述当前的控制指导参数数据及所述目标隐变量,得到当前的控制参数;
控制模块,用于根据所述当前的控制参数控制所述目标设备。
10.一种用于控制无人驾驶设备的模型训练装置,其特征在于,所述装置包括:
执行模块,用于执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据,每组所述样本数据包括控制指导数据及控制参数;将所述第一数据输入至当前的卷积神经网络,得到隐变量,所述隐变量用于表示控制指导数据与控制参数之间的转化影响因素;将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数;
调整模块,用于在基于所述预测参数与所述第二数据对应的控制参数,确定未满足预设条件时,对所述卷积神经网络和所述循环神经网络的网络参数进行调整,并指示所述执行模块重新执行所述目标操作;
输出模块,用于在基于所述预测参数与所述第二数据对应的控制参数,确定满足所述预设条件时,输出经过调整后的目标卷积神经网络及目标循环神经网络。
11.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-8中任一项所述的方法。
12.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1-8中任一项所述的方法。
CN201910154597.8A 2019-03-01 2019-03-01 控制无人驾驶设备及模型训练的方法、装置及电子设备 Active CN109976153B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910154597.8A CN109976153B (zh) 2019-03-01 2019-03-01 控制无人驾驶设备及模型训练的方法、装置及电子设备
PCT/CN2019/123394 WO2020177417A1 (zh) 2019-03-01 2019-12-05 控制无人驾驶设备及训练模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910154597.8A CN109976153B (zh) 2019-03-01 2019-03-01 控制无人驾驶设备及模型训练的方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN109976153A true CN109976153A (zh) 2019-07-05
CN109976153B CN109976153B (zh) 2021-03-26

Family

ID=67077636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910154597.8A Active CN109976153B (zh) 2019-03-01 2019-03-01 控制无人驾驶设备及模型训练的方法、装置及电子设备

Country Status (2)

Country Link
CN (1) CN109976153B (zh)
WO (1) WO2020177417A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110488821A (zh) * 2019-08-12 2019-11-22 北京三快在线科技有限公司 一种确定无人车运动策略的方法及装置
CN110660103A (zh) * 2019-09-17 2020-01-07 北京三快在线科技有限公司 一种无人车定位方法及装置
WO2020177417A1 (zh) * 2019-03-01 2020-09-10 北京三快在线科技有限公司 控制无人驾驶设备及训练模型

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106154831A (zh) * 2016-07-25 2016-11-23 厦门大学 一种基于学习法的智能汽车纵向神经滑模控制方法
CN107300863A (zh) * 2017-07-12 2017-10-27 吉林大学 一种基于map图和在线标定的纵向加速度控制方法
CN107463953A (zh) * 2017-07-21 2017-12-12 上海交通大学 在标签含噪情况下基于质量嵌入的图像分类方法及系统
CN107703564A (zh) * 2017-10-13 2018-02-16 中国科学院深圳先进技术研究院 一种降雨预测方法、系统及电子设备
CN108056789A (zh) * 2017-12-19 2018-05-22 飞依诺科技(苏州)有限公司 一种生成超声扫描设备的配置参数值的方法和装置
CN108198268A (zh) * 2017-12-19 2018-06-22 江苏极熵物联科技有限公司 一种生产设备数据标定方法
CN108897313A (zh) * 2018-05-23 2018-11-27 清华大学 一种分层式端到端车辆自动驾驶系统构建方法
US20190061771A1 (en) * 2018-10-29 2019-02-28 GM Global Technology Operations LLC Systems and methods for predicting sensor information

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503393A (zh) * 2016-11-15 2017-03-15 浙江大学 一种利用仿真生成样本实现无人车自主行进的方法
CN106873566B (zh) * 2017-03-14 2019-01-22 东北大学 一种基于深度学习的无人驾驶物流车
CN107609502A (zh) * 2017-09-05 2018-01-19 百度在线网络技术(北京)有限公司 用于控制无人驾驶车辆的方法和装置
CN109272108A (zh) * 2018-08-22 2019-01-25 深圳市亚博智能科技有限公司 基于神经网络算法的移动控制方法、系统和计算机设备
CN109299732B (zh) * 2018-09-12 2020-05-05 北京三快在线科技有限公司 无人驾驶行为决策及模型训练的方法、装置及电子设备
CN109961509B (zh) * 2019-03-01 2020-05-05 北京三快在线科技有限公司 三维地图的生成及模型训练方法、装置及电子设备
CN109976153B (zh) * 2019-03-01 2021-03-26 北京三快在线科技有限公司 控制无人驾驶设备及模型训练的方法、装置及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106154831A (zh) * 2016-07-25 2016-11-23 厦门大学 一种基于学习法的智能汽车纵向神经滑模控制方法
CN107300863A (zh) * 2017-07-12 2017-10-27 吉林大学 一种基于map图和在线标定的纵向加速度控制方法
CN107463953A (zh) * 2017-07-21 2017-12-12 上海交通大学 在标签含噪情况下基于质量嵌入的图像分类方法及系统
CN107703564A (zh) * 2017-10-13 2018-02-16 中国科学院深圳先进技术研究院 一种降雨预测方法、系统及电子设备
CN108056789A (zh) * 2017-12-19 2018-05-22 飞依诺科技(苏州)有限公司 一种生成超声扫描设备的配置参数值的方法和装置
CN108198268A (zh) * 2017-12-19 2018-06-22 江苏极熵物联科技有限公司 一种生产设备数据标定方法
CN108897313A (zh) * 2018-05-23 2018-11-27 清华大学 一种分层式端到端车辆自动驾驶系统构建方法
US20190061771A1 (en) * 2018-10-29 2019-02-28 GM Global Technology Operations LLC Systems and methods for predicting sensor information

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
姚春德: "《柴油/甲醇二元燃料燃烧理论与实践》", 30 September 2015, 天津大学出版社 *
金凡: "基于时空递归神经网络的智能车端到端决策研究", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020177417A1 (zh) * 2019-03-01 2020-09-10 北京三快在线科技有限公司 控制无人驾驶设备及训练模型
CN110488821A (zh) * 2019-08-12 2019-11-22 北京三快在线科技有限公司 一种确定无人车运动策略的方法及装置
CN110660103A (zh) * 2019-09-17 2020-01-07 北京三快在线科技有限公司 一种无人车定位方法及装置

Also Published As

Publication number Publication date
WO2020177417A1 (zh) 2020-09-10
CN109976153B (zh) 2021-03-26

Similar Documents

Publication Publication Date Title
CN109976153A (zh) 控制无人驾驶设备及模型训练的方法、装置及电子设备
CN109990790A (zh) 一种无人机路径规划方法及装置
CN107609502A (zh) 用于控制无人驾驶车辆的方法和装置
CN110705690B (zh) 基于生成模型和元学习优化方法的连续学习方法及系统
CN109819032B (zh) 一种联合考虑基站选择与计算迁移的云机器人任务分配方法
CN109961509B (zh) 三维地图的生成及模型训练方法、装置及电子设备
CN109583594A (zh) 深度学习训练方法、装置、设备及可读存储介质
CN110650208A (zh) 分布式集群存储方法、系统、装置及计算机可读存储介质
CN110866602A (zh) 一种集成多任务模型的方法和装置
CN107909037A (zh) 信息输出方法和装置
CN113743661A (zh) 锂离子电池在线容量预测的方法、系统、设备及存储介质
CN110245809B (zh) 一种用于多机器人多任务协作工作的智能优化方法和系统
CN109102073A (zh) 一种稀疏训练方法
CN106354633A (zh) 基于算法插件的任务调度表生成方法
CN111063000A (zh) 基于神经网络结构搜索的磁共振快速成像方法和装置
CN113671386B (zh) 一种氢燃料电池耐久性能分析方法及装置
CN109614999A (zh) 一种数据处理方法、装置、设备及计算机可读存储介质
CN110533189B (zh) 机器学习系统
CN115576317A (zh) 一种基于神经网络的多预瞄点路径跟踪控制方法及系统
CN112162404B (zh) 一种自由曲面成像系统的设计方法
CN113158134A (zh) 非侵入式负荷辨识模型的构建方法、装置和存储介质
CN114239392B (zh) 无人机决策模型训练方法、使用方法、设备及介质
CN114692888A (zh) 系统参数处理方法、装置、设备及存储介质
CN113627104B (zh) 多约束条件下的水下潜艇航迹模拟方法和装置及设备
CN110009749A (zh) 一种虚拟对象定位方法、装置、计算设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant