WO2022078189A1

WO2022078189A1 - 一种支持动态意图的控制方法、装置及存储介质

Info

Publication number: WO2022078189A1
Application number: PCT/CN2021/120604
Authority: WO
Inventors: 何博文; 曹晓康; 马世奎
Original assignee: 达闼机器人有限公司
Priority date: 2020-10-12
Filing date: 2021-09-26
Publication date: 2022-04-21
Also published as: CN112306236B; CN112306236A

Abstract

本公开提供了一种支持动态意图的控制方法、装置及存储介质，该方法包括：机器人设备首先获取来自用户的输入信息；接着识别输入信息表征的意图信息；之后根据意图信息确定对应的蓝图节点；最后调用蓝图节点执行蓝图逻辑，以控制执行与意图信息匹配的行为操作。

Description

一种支持动态意图的控制方法、装置及存储介质

技术领域

本公开涉及人工智能技术领域，尤其涉及一种支持动态意图的控制方法、装置及存储介质。

背景技术

在机器人设备的开发应用中，当用户与机器人设备进行信息交互时，用户的输入信息会通过自然语言理解，从而形成一个个用户意图，以通过机器人设备理解并执行所述用户意图。由于用户意图的多样性，故机器人设备需要一种技术去支持这种多样化的意图。

发明内容

本公开实施例为了解决现有机器人设备与用户进行信息交互时所存在的问题，创造性地提供了一种支持动态意图的控制方法、装置及存储介质。

根据本公开第一方面，创造性地提供了一种支持动态意图的控制方法，所述方法包括：获取输入信息；识别所述输入信息表征的意图信息；根据所述意图信息确定对应的蓝图节点；调用所述蓝图节点执行蓝图逻辑，以控制执行与所述意图信息匹配的行为操作。

根据本公开一实施方式，所述意图信息为包括意图名称和意图参数的意图结构体。

根据本公开一实施方式，根据所述意图信息确定对应的蓝图节点包括：根据所述意图结构体中的意图名称确定对应的蓝图节点；控制所述蓝图节点的参数与所述意图结构体中的意图参数一致。

根据本公开一实施方式，调用所述蓝图节点执行蓝图逻辑，包括：当所述蓝图节点被触发时，执行所述蓝图节点对应的下一个蓝图节点。

根据本公开一实施方式，识别所述输入信息表征的意图信息，包括：发送所述输入信息至云端；接收由云端对所述输入信息进行意图识别后所得到的意图信息。

根据本公开第二方面，还提供了一种支持动态意图的控制装置，所述装置包括：获取模块，用于获取输入信息；意图识别模块，用于识别所述输入信息表征的意图信息；蓝图模块，用于根据所述意图信息确定对应的蓝图节点；控制执行模块，用于调用所述蓝图节点执行蓝图逻辑，以控制执行与所述意图信息匹配的行为操作。

根据本公开一实施方式，所述蓝图模块包括：蓝图节点确定单元，用于根据所述意图结构体中的意图名称确定对应的蓝图节点；控制单元，用于控制所述蓝图节点的参数与所述意图结构体中的意图参数一致。

根据本公开一实施方式，所述控制执行模块，具体用于触发所述蓝图节点；当所述蓝图节点被触发时，执行所述蓝图节点对应的下一个蓝图节点。

根据本公开一实施方式，所述意图识别模块，具体用于发送所述输入信息至云端；接收由云端对所述输入信息进行意图识别后所得到的意图信息。

根据本公开第三方面，又提供了一种支持动态意图的控制装置，包括：一个或多个处理器；存储器，用于存储一个或多个程序，所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现上述任一支持动态意图的控制方法。

根据本公开第四方面，又提供了一种计算机可读存储介质，所述存储介质包括一组计算机可执行指令，当所述指令被执行时用于执行上述任一支持动态意图的控制方法。

本公开实施例支持动态意图的控制方法、装置及存储介质，机器人设备首先获取来自用户的输入信息；接着识别输入信息表征的意图信息；之后根据意图信息确定对应的蓝图节点；最后调用蓝图节点执行蓝图逻辑，以控制执行与意图信息匹配的行为操作。如此，本公开机器人设备通过借助虚拟引擎的蓝图技术，使得应用蓝图根据意图信息触发对应的蓝图节点执行相关的逻辑，得以控制机器人设备的行为，从而实现机器人设备对动态意图的支持。

需要理解的是，本公开的教导并不需要实现上面所述的全部有益效果，而是特定的技术方案可以实现特定的技术效果，并且本公开的其他实施方式还能够实现上面未提到的有益效果。

附图说明

通过参考附图阅读下文的详细描述，本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本公开的若干实施方式，其中：

在附图中，相同或对应的标号表示相同或对应的部分。

图1示出了本公开实施例支持动态意图的控制方法的实现流程示意图一。

图2示出了本公开实施例支持动态意图的控制方法的实现流程示意图二。

图3示出了本公开一应用实例在云端的意图配置的响应处理的蓝图。

图4示出了本公开另一应用实例在云端的意图配置的响应处理的蓝图。

图5示出了本公开又一应用实例在云端的意图配置的响应处理的蓝图。

图6示出了本公开实施例支持动态意图的控制装置的组成结构示意图一。

图7示出了本公开实施例支持动态意图的控制装置的组成结构示意图二。

图8示出了本公开实施例提供的机器人设备的组成结构示意图。

具体实施方式

为使本公开的目的、特征、优点能够更加的明显和易懂，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而非全部实施例。基于本公开中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本公开的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

图1示出了本公开实施例支持动态意图的控制方法的实现流程示意图一。本公开实施例可应用在机器人设备上，如图1所示，包括如下步骤：

步骤101，获取输入信息。

具体地，机器人设备获取来自用户的输入信息。

其中，输入信息可以是来自用户的语音信息，如机器人设备通过麦克风阵列硬件采集用户的语音信息；输入信息也可以是响应于用户触发，机器人设备自动生成的指令信息，如当用户在机器人设备的硬件触发按钮或触控界面上的软件触发按键进行按键触发时，响应于用户触发所生成的与触发按键匹配的指令信息；输入信息还可以是用户在机器人设备的显示界面的输入区域所输入的文本信息。

当然，本领域技术人员应该理解的是，在步骤101接收输入信息之后，机器人设备可以进一步对输入信息进行预处理，比如对输入语句进行分句、去除停用词、去除特殊字符等预处理操作；之后，再继续执行后续步骤102。

步骤102，识别输入信息表征的意图信息。

其中，意图信息为包括意图名称和意图参数的意图结构体。

具体地，机器人设备可以通过自身的意识识别系统对输入信息进行意图识别，得到包括意图信息的识别结果；机器人设备还可以借助云端的意图识别系统来对输入信息进行意图识别，从而得到包括意图信息的识别结果。

本领域技术人员应该理解的是，机器人设备无论是通过自身的意图识别系统还是借助云端的意图识别系统来对输入信息进行意图识别，其意图识别的具体实现都类似。

在一应用示例中，以输入信息为语音信息为例，机器人设备可以通过意图识别系统进行自然语音处理(NLP)和自然语音理解(NLU)，从而识别得到输入信息所表征的意图信息。

步骤103，根据意图信息确定对应的蓝图节点。

具体地，机器人设备基于虚拟引擎的应用的蓝图模块，根据所接收到的意图结构体的意图名称确定对应的蓝图节点，并控制蓝图节点的参数与意图结构体的意图参数一致。当然，对于意图结构体中意图参数为空的情况，可以在确定对应的蓝图节点后，省略对蓝图节点参数的控制操作。

步骤104，调用蓝图节点执行蓝图逻辑，以控制执行与意图信息匹配的行为操作。

具体地，机器人设备触发蓝图节点，当蓝图节点被触发时，自动执行蓝图节点对应的下一个蓝图节点，以控制执行与意图信息匹配的行为操作。

如此，本公开机器人设备通过借助虚拟引擎的蓝图技术，使得应用蓝图根据意图信息触发对应的蓝图节点执行相关的逻辑，得以控制机器人设备的行为，从而实现机器人设备对动态意图的支持。

图2示出了本公开实施例支持动态意图的控制方法的实现流程示意图二；图3示出了本公开一应用实例在云端的意图配置的响应处理的蓝图；图4示出了本公开另一应用实例在云端的意图配置的响应处理的蓝图；图5示出了本公开又一应用实例在云端的意图配置的响应处理的蓝图。

参考图2，本公开实施例支持动态意图的控制方法可应用在机器人设备上，具体包括如下步骤：

步骤201，获取输入信息。

具体地，机器人设备获取来自用户的输入信息。

当然，本领域技术人员应该理解的是，在步骤201接收输入信息之后，机器人设备可以进一步对输入信息进行预处理，比如对输入语句进行分句、去除停用词、去除特殊字符等预处理操作；之后，在继续执行后续步骤202。

步骤202，发送输入信息至云端。

具体地，机器人设备将接收的输入信息通过机器人控制单元(RCU)发送至云端，也可称作云端大脑。

步骤203，接收由云端对输入信息进行意图识别后所得到的意图信息。

其中，意图信息为包括意图名称和意图参数的意图结构体。以输入信息为语音信息为例，机器人设备可以通过云端大脑的意图识别系统进行自然语音处理(NLP)和自然语音理解(NLU)，从而识别得到输入信息所表征的意图信息，并反馈所述意图信息至机器人设备。

步骤204，根据意图信息确定对应的蓝图节点。

步骤205，调用蓝图节点执行蓝图逻辑，以控制执行与意图信息匹配的行为操作。

在一应用实例中，用户与机器人设备进行语音交互，机器人设备获取输入信息(语音信息)“请做动作碰拳”，该输入信息(语音信息)在云端的意图配置为：意图结构体中的意图名称为“做动作(TakeAction)”，意图参数为“动作名称(motionName)”，意图参数motionName对应的值为“碰拳”。进一步地，该意图结构体从云端发送到机器人设备本体的机器人控制单元(RCU)时，响应处理的蓝图如图3所示，蓝图节点名称为“做动作(TakeAction)”，和意图结构体的意图名称一一对应，蓝图节点的参数为“手游动作名称(PlayMotionName)”，对应于意图结构的意图参数，它的值为 “碰拳”。当该蓝图节点被触发时，它会执行下一个蓝图节点“手游动作(PlayMotion)”，该蓝图节点控制机器人设备的行为，即控制机器人设备执行动作“碰拳”。

在另一应用实例中，用户与机器人设备进行语音交互，机器人设备获取输入信息(语音信息)“向前一点”，该输入信息(语音信息)在云端的意图配置为：意图结构体中的意图名称为“向前移动(MoveForward)”，无意图参数，即意图参数为空。进一步地，该意图结构体从云端发送到机器人设备本体的机器人控制单元(RCU)时，响应处理的蓝图如图4所示，蓝图节点名称为“向前移动(MoveForward)”，和意图结构体的意图名称一一对应，蓝图节点无参数。当该蓝图节点被触发时，它会执行下一个蓝图节点“移动(Move)”，该蓝图节点控制机器人设备的行为，即控制机器人设备执行向前移动，移动的距离可以是预设的移动距离。

在又一应用实例中，用户与机器人设备进行语音交互，机器人设备获取输入信息(语音信息)“走到桌子那”，该输入信息(语音信息)在云端的意图配置为：意图结构体中的意图名称为“导航(navigationToPosion)”，意图参数为“目的地(destination)”，意图参数destination对应的值为“桌子”。进一步地，该意图结构体从云端发送到机器人设备本体的机器人控制单元(RCU)时，响应处理的蓝图如图5所示，蓝图节点名称为“导航(navigationToPosion)”，和意图结构体的意图名称一一对应，蓝图节点的参数为“目的地(destination)”，对应于意图结构的意图参数，它的值为“桌子”。当该蓝图节点被触发时，它会执行下一个蓝图节点“CS导航技能(CSNavigate Skill)”，该蓝图节点控制机器人设备导航到目的地“桌子”对应的坐标。

如此，本公开机器人设备首先借助云端大脑对接收到的输入信息进行意图识别，得到输入信息表征的意图信息；接着借助虚拟引擎的蓝图技术，使得应用蓝图根据意图信息触发对应的蓝图节点执行相关的逻辑，得以控制机器人设备的行为，从而实现机器人设备对动态意图的支持。

图6示出了本公开实施例支持动态意图的控制装置的组成结构示意图一；图7示出了本公开实施例支持动态意图的控制装置的组成结构示意图二。

参考图6，本公开实施例支持动态意图的控制装置60，包括：

获取模块601，用于获取输入信息；

意图识别模块602，用于识别输入信息表征的意图信息；其中，意图信息为包括意图名称和意图参数的意图结构体。

蓝图模块603，用于根据意图信息确定对应的蓝图节点；以及

控制执行模块604，用于调用蓝图节点执行蓝图逻辑，以控制执行与意图信息匹配的行为操作。

在一可实施方式中，如图7所示，蓝图模块603包括：

蓝图节点确定单元6031，用于根据意图结构体中的意图名称确定对应的蓝图节点；

控制单元6032，用于控制蓝图节点的参数与意图结构体中的意图参数一致。

在一可实施方式中，控制执行模块604，具体用于触发蓝图节点；当蓝图节点被触发时，执行蓝图节点对应的下一个蓝图节点。

在一可实施方式中，意图识别模块602，具体用于发送输入信息至云端；接收由云端对输入信息进行意图识别后所得到的意图信息。

下面，参考图8来描述根据本公开实施例的机器人设备。该机器人设备可以是支持动态意图的控制装置60或与它独立的单机设备，该单机设备可以与支持动态意图的控制装置60进行通信，以从它们接收所采集到的输入信号。

图8图示了根据本公开实施例的机器人设备的框图。

如图8所示，机器人设备11包括一个或多个处理器111和存储器112。

处理器111可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制机器人设备11中的其他组件以执行期望的功能。

存储器112可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器111可以运行所述程序指令，以实现上文所述的本公开的各个实施例的支持动态意图的控制方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。

在一个示例中，机器人设备11还可以包括：输入装置113和输出装置114，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如，在该机器人设备是支持动态意图的控制装置60时，该输入装置113可以是上述的麦克风或麦克风阵列，用于捕捉声源的输入信号。在该电子设备是单机设备时，该输入装置113可以是通信网络连接器，用于从支持动态意图的控制装置60接收所采集的输入信号。

此外，该输入装置13还可以包括例如键盘、鼠标等等。

该输出装置114可以向外部输出各种信息，包括确定出的距离信息、方向信息等。该输出装置114可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等。

当然，为了简化，图8中仅示出了该机器人设备11中与本公开有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，机器人设备11还可以包括任何其他适当的组件。

除了上述方法和设备以外，本公开的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的多任务模型的训练方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本公开的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的多任务模型的训练方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本公开的基本原理，但是，需要指出的是，在本公开中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本公开为必须采用上述具体的细节来实现。

本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“如但不限于”，且可与其互换使用。

还需要指出的是，在本公开的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此，本公开不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

一种支持动态意图的控制方法，其特征在于，所述方法包括：

获取输入信息；

识别所述输入信息表征的意图信息；

根据所述意图信息确定对应的蓝图节点；

调用所述蓝图节点执行蓝图逻辑，以控制执行与所述意图信息匹配的行为操作。
根据权利要求1所述的方法，其特征在于，所述意图信息为包括意图名称和意图参数的意图结构体。
根据权利要求2所述的方法，其特征在于，根据所述意图信息确定对应的蓝图节点包括：

根据所述意图结构体中的意图名称确定对应的蓝图节点；

控制所述蓝图节点的参数与所述意图结构体中的意图参数一致。
根据权利要求1所述的方法，其特征在于，调用所述蓝图节点执行蓝图逻辑，包括：

触发所述蓝图节点；

当所述蓝图节点被触发时，执行所述蓝图节点对应的下一个蓝图节点。
根据权利要求1至4任一项所述的方法，其特征在于，识别所述输入信息表征的意图信息，包括：

发送所述输入信息至云端；

接收由云端对所述输入信息进行意图识别后所得到的意图信息。
一种支持动态意图的控制装置，其特征在于，所述装置包括：

获取模块，用于获取输入信息；

意图识别模块，用于识别所述输入信息表征的意图信息；

蓝图模块，用于根据所述意图信息确定对应的蓝图节点；

控制执行模块，用于调用所述蓝图节点执行蓝图逻辑，以控制执行与所述意图信息匹配的行为操作。
根据权利要求6所述的装置，其特征在于，所述意图信息为包括意图名称和意图参数的意图结构体。
根据权利要求7所述的装置，其特征在于，所述蓝图模块包括：

蓝图节点确定单元，用于根据所述意图结构体中的意图名称确定对应的蓝图节点；

控制单元，用于控制所述蓝图节点的参数与所述意图结构体中的意图参数一致。
一种支持动态意图的控制装置，其特征在于，包括：一个或多个处理器；存储器，用于存储一个或多个程序，所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1至5任一项所述的支持动态意图的控制方法。
一种计算机可读存储介质，其特征在于，所述存储介质包括一组计算机可执行指令，当所述指令被执行时用于执行权利要求1至5任一项所述的支持动态意图的控制方法。