CN114580576B

CN114580576B - 一种基于知识处理的机器人任务规划方法和装置

Info

Publication number: CN114580576B
Application number: CN202210478258.7A
Authority: CN
Inventors: 王海涛; 张少林; 葛悦光; 王硕
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2022-05-05
Filing date: 2022-05-05
Publication date: 2022-09-06
Anticipated expiration: 2042-05-05
Also published as: CN114580576A

Abstract

本发明涉及一种基于知识处理的机器人任务规划方法和装置，包括：基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象及其对应的动作原语；确定外部结构化知识库中与实体对象相匹配的实体；根据与实体对象相匹配的实体、实体对象及其对应的动作原语和动作指令函数，生成从初始任务场景到目标任务场景机器人所要执行的动作序列。本发明赋予机器人对任务场景的自主决策能力，解决了机器人对任务场景理解以及任务规划困难的问题。

Description

一种基于知识处理的机器人任务规划方法和装置

技术领域

本发明涉及机器人智能服务领域，尤其涉及一种基于知识处理的机器人任务规划方法和装置。

背景技术

服务机器人的理想目标是学习、理解和执行人类所要完成的任务。人类通过观察环境，运用经验知识来执行任务，但是服务机器人既没有先天的知识积累，也不具备运用知识推理决策的能力。服务机器人的任务规划技术是服务机器人迈向自主化和智能化的关键技术，受到海内外学者和研究人员的广泛关注。

服务机器人的任务规划技术是指服务机器人运用环境知识进行推理和决策，定义任务动作和执行顺序，使得任务顺利完成的技术。相关技术中，利用RoboEarth框架为任务手工设定一组操作指令来实现任务规划，即首先将任务分解为结构化的子任务列表，随后将子任务定义为一连串的简单动作序列。该方法未对任务场景下的物体进行关系定义，无法进行任务逻辑推理。基于ART神经网络，并根据先前任务经验中获得的情景记忆来规划任务。基于马尔科夫决策过程(MDP)，将每个任务表示为一个MDP架构来实现任务规划，即基于迁移学习的思想，利用现有状态和MDP生成新的MDP。这两种方法任务规划仅考虑了任务经验。利用语义推理系统，使用情景学习提取任务相关的动作和坐标，形成定性的空间关系；以定性的空间关系来表示最大泛化和最小化的知识工程，进而实现任务规划。该方法仅利用实体的动作和坐标来进行任务逻辑推理，考虑因素过于片面。

但是，复杂多变的任务场景的任务逻辑推理往往需要深入挖掘物体特征，上述四种方法明显不符合。因此上述四种方法比较适用于预先定义好的简单任务，高度复杂的任务会使整个过程变得困难且耗时。

发明内容

本发明的目的是提供一种基于知识处理的机器人任务规划方法和装置，以解决服务机器人任务规划困难且耗时的问题，进而为服务机器人赋予智能且高效的任务规划能力。

第一方面，本发明实施例提供一种基于知识处理的机器人任务规划方法，包括：

基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语；

利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体；

根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数，生成从初始任务场景到目标任务场景机器人所要执行的动作序列；

其中，所述外部结构化知识库，是由任务涉及到的实体及其对应的特征组成的。

根据本发明提供的基于知识处理的机器人任务规划方法，所述初始任务场景与目标任务场景中的实体，表面都贴有二维码标签；所述基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语之前，还包括：

检测初始任务场景/目标任务场景中的二维码标签，确定初始任务场景/目标任务场景中包含的实体。

根据本发明提供的基于知识处理的机器人任务规划方法，所述基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象，包括：

检索仅存在于所述初始任务场景或仅存在于所述目标任务场景中的实体，并将其作为机器人待操控的实体对象；

所述确定所述实体对象对应的动作原语，包括：

若所述实体对象存在于所述初始任务场景中且未存在于所述目标任务场景中，则所述实体对象对应的动作原语为移除所述实体对象；

若所述实体对象存在于所述目标任务场景中且未存在于所述初始任务场景中，则所述实体对象对应的动作原语为载入所述实体对象。

根据本发明提供的基于知识处理的机器人任务规划方法，所述实体对应的特征，包括：尺寸、颜色和形状；所述外部结构化知识库的构建过程，包括：

确定任务涉及到的实体；

将所述任务涉及到的实体映射到各个特征空间，得到所述任务涉及到的实体在各个特征空间的特征向量；

利用所述任务涉及到的实体以及所述任务涉及到的实体在各个特征空间的特征向量生成所述外部结构化知识库。

根据本发明提供的基于知识处理的机器人任务规划方法，所述利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体，包括：

确定所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵；

基于所述特征相似矩阵，并采用特征匹配算法，确定所述外部结构化知识库中与所述实体对象相匹配的实体。

根据本发明提供的基于知识处理的机器人任务规划方法，所述基于所述特征相似矩阵，并采用特征匹配算法，确定所述外部结构化知识库中与所述实体对象相匹配的实体，包括：

对于外部结构化知识库中所述实体对象之外的任一其它实体，将预存的特征权重向量和所述实体对象与所述任一其它实体的特征相似矩阵相乘，得到所述实体对象与所述任一其它实体的匹配分数；

若所述实体对象与所述任一其它实体的匹配分数大于预设分数阈值，则所述任一其它实体与所述实体对象相匹配；否则，所述任一其它实体与所述实体对象不匹配；

遍历所述外部结构化知识库，确定所述外部结构化知识库中与所述实体对象相匹配的实体；

其中，所述预存的特征权重向量，是利用感知器模型迭代训练得到的。

根据本发明提供的基于知识处理的机器人任务规划方法，所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵，具体用下述公式表示：

上式中，

表示所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

之间的特征相似矩阵，

表示所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

关于第

个特征的相似度，

，

表示特征的维度数；

其中，所述

，具体用下述公式表示：

上式中，

表示所述实体对象

的第

个特征的特征向量，

表示所述外部结构化知识库中所述实体对象之外的实体

的第

个特征的特征向量，

表示

与

的内积；所述感知器模型的迭代过程，具体用下述公式表示：

上式中，

表示初始特征权重向量，

表示第

次迭代得到的特征权重向量，

表示第

次迭代得到的特征权重向量，

表示

的转置，

表示学习率，

表示所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

的匹配情况，

和

分别为第

次迭代第一中间变量和第二中间变量的取值；

其中，

取值为1时，所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

匹配；

取值为0时，所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

不匹配。

第二方面，本发明还提供一种基于知识处理的机器人任务规划装置，所述装置包括：

待操控实体对象及其对应的动作原语确定模块，用于基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语；

实体匹配模块，用于利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体；

动作序列生成模块，用于根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数，生成从初始任务场景到目标任务场景机器人所要执行的动作序列；

第三方面，本发明还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如第一方面所述的基于知识处理的机器人任务规划方法。

第四方面，本发明还公开了一种非暂态计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的基于知识处理的机器人任务规划方法。

本发明提供的一种基于知识处理的机器人任务规划方法和装置，基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语；利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体；根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数，生成从初始任务场景到目标任务场景机器人所要执行的动作序列；其中，所述外部结构化知识库，是由任务涉及到的实体及其对应的特征组成的。本发明解决了如何使机器人理解当前任务场景并做出任务规划的技术问题，赋予机器人对当前任务场景的自主决策能力，提升了机器人的智能化程度。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的基于知识处理的机器人任务规划方法的流程示意图；

图2是本发明提供的初始场景与目标场景差异性示意图；

图3是本发明提供的外部结构化知识库示意图；

图4是本发明提供的特征匹配与感知器模型示意图；

图5是本发明提供的感知器模型误差曲线示意图；

图6是本发明提供的基于知识处理的机器人任务规划装置的结构示意图；

图7是本发明提供的实现基于知识处理的机器人任务规划的电子设备结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合图1至图7描述本发明基于知识处理的机器人任务规划方法和装置。

第一方面，知识处理是指机器人获取和存储有关任务环境的知识，并将其转化为机器人可理解的表达形式。机器人获取环境中物体的知识最常用的方法是通过传感器进行感知，通过特征提取可以获得物体的形状、大小和颜色之类的物理特性以及物体之间的空间关系。

Beetz等人提出了一个非结构化信息管理系统RoboSherlock，用于提取和管理环境中物体的物理信息和语义信息，该系统的作用是回答任务相关物体信息的查询。Tenorth等人提出了一种知识处理系统KnowRob，其使用本体作为知识载体，通过定义物体类和位置属性存储物体语义位置。Bizer等人提出了一种语义网框架DBpedia，与互联网类似，语义网是机器可以访问和理解的万维网版本，该框架使用感知技术来预测已知对象的类别以及已知与未知对象之间的空间关系，这些信息与语义网获取的信息相结合，可以预测未知对象的类标签并生成语义关系。但以上知识处理方法更多局限于知识的查询问答，知识表征形式难以挖掘更深层次的逻辑（对象之间不仅仅是空间关系，对象的属性特征也存在丰富的逻辑推理依据），难以解决多步任务的规划问题。

在此基础上，本发明提供一种基于知识处理的机器人任务规划方法，如图1所示，所述方法包括：

S11：基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语；

本发明用于服务机器人的任务规划，因此需要确定服务机器人待操控的实体对象，以及待操控的实体对象对应的操控动作（动作原语）。

S12：利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体；

本发明有效利用外部结构化知识库对多步任务中物体的动作逻辑进行情景推理，从而解决多步任务的规划问题。

S13：根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数，生成从初始任务场景到目标任务场景机器人所要执行的动作序列；

需要注意的是，预存的动作指令函数，是任务中涉及到的一系列基础动作（例如：拿起、放下等）对应的代码函数。

本发明提供的一种基于知识处理的机器人任务规划方法，基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语；利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体；根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数，生成从初始任务场景到目标任务场景机器人所要执行的动作序列；其中，所述外部结构化知识库，是由任务涉及到的实体及其对应的特征组成的。本发明解决了如何使机器人理解当前任务场景并做出任务规划的技术问题，赋予机器人对当前任务场景的自主决策能力，提升了机器人的智能化程度。

在上述各实施例的基础上，作为一种可选的实施例，所述初始任务场景与目标任务场景中的实体，表面都贴有二维码标签；所述基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语之前，还包括：

可以理解的是，初始任务场景也可以看作为当前任务场景，在执行本发明之前，需要先设置任务对应的初始任务场景和目标任务场景，并在初始任务场景和目标任务场景中的物体（实体）表面贴上二维码标签。

通常，本发明利用相机拍摄初始任务场景/目标任务场景中的物体表面的二维码标签，并对二维码标签进行检测识别，得到初始任务场景/目标任务场景中包含的实体。

本发明通过识别任务场景中的二维码标签来确定初始任务场景和目标任务场景中包含的实体，进而为寻找服务机器人待操控的实体对象奠定基础。

在上述各实施例的基础上，作为一种可选的实施例，所述基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象，包括：

所述确定所述实体对象对应的动作原语，包括：

本发明比较初始任务场景和目标任务场景，确定两个场景中实体差异。若实体出现在初始任务场景中且没有出现在目标任务场景中，则将实体作为待操控实体对象，待操控实体对象对应的动作原语为去掉该实体；若实体出现在目标任务场景中且没有出现在初始任务场景中，则将实体作为待操控实体对象，待操控实体对象对应的动作原语为加入该实体；若实体同时出现在初始任务场景和目标任务场景中，则实体不作为待操控实体对象，并且不会得到动作原语。

举例来说，图2示例了初始场景与目标场景差异性的一种示例，如图2所示，初始任务场景包括实体A与实体B；目标任务场景包括实体B与实体C。实体A出现在初始任务场景但没有出现在目标任务场景，则实体A将作为待操控实体对象，生成的动作原语为去掉实体A；实体B同时出现在初始任务场景和目标任务场景，则实体B将不作为待操控实体，没有动作原语生成；实体C出现在目标任务场景但没有出现在初始任务场景，则实体C将作为待操控实体对象，生成动作原语为加入实体C。

本发明根据初始任务场景和目标任务场景的实体差异，选定机器人待操控的实体及其对应的操控动作，进而为机器人任务规划奠定基础。

在上述各实施例的基础上，作为一种可选的实施例，所述实体对应的特征，包括：尺寸、颜色和形状；所述外部结构化知识库的构建过程，包括：

确定任务涉及到的实体；

本发明将任务涉及的物体以实体的形式录入数据库，然后利用传感器，将实体映射到各个特征空间，特征以向量的形式存储在数据库；最后将数据库作为外部结构化知识库。

图3示例了外部结构化知识库，外部结构化知识库内总共有n个实体，每个实体都有m个特征空间，通过映射每个实体将会生成一个特征向量集合，需要注意的是特征向量集合中对应位置的特征属于同一特征空间，例如每个实体的特征1都代表该实体的颜色，每个实体的特征m都代表该实体的形状等。

本发明构建外部结构化知识库，存储任务中涉及的实体的多维的属性特征，为任务规划提供丰富的逻辑推理依据。

在上述各实施例的基础上，作为一种可选的实施例，所述利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体，包括：

本发明根据待操控实体对象与外部结构化知识库中其他实体之间各个特征的相似度，构建待操控实体对象与外部结构化知识库中其他实体的特征相似矩阵，以便从外部结构化知识库中寻找与待操控实体对象匹配的实体，以便服务机器人根据待操控实体对象、外部结构化知识库中与待操控实体对象匹配的其它实体、待操控实体对象的动作原语实现情景理解，进而结合动作指令模板得到从初始任务场景到目标任务场景的动作序列。

本发明为服务机器人理解当前任务场景并做出任务规划提供可行方式，提升服务机器人的智能化程度。

在上述各实施例的基础上，作为一种可选的实施例，所述基于所述特征相似矩阵，并采用特征匹配算法，确定所述外部结构化知识库中与所述实体对象相匹配的实体，包括：

本发明利用感知器模型训练特征权重向量，并基于特征权重向量计算实体之间的匹配分数，进而利用实体之间的匹配分数判定实体之间是否匹配，达到提高实体之间的匹配准确度的效果。

在上述各实施例的基础上，作为一种可选的实施例，所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵，具体用下述公式表示：

上式中，

表示所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

之间的特征相似矩阵，

表示所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

关于第

个特征的相似度，

，

表示特征的维度数；

其中，所述

，具体用下述公式表示：

上式中，

表示所述实体对象

的第

个特征的特征向量，

表示所述外部结构化知识库中所述实体对象之外的实体

的第

个特征的特征向量，

表示

与

的内积；

所述感知器模型的迭代过程，具体用下述公式表示：

上式中，

表示初始特征权重向量，

表示第

次迭代得到的特征权重向量，

表示第

次迭代得到的特征权重向量，

表示

的转置，

表示学习率，

表示所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

的匹配情况，

和

分别为第

次迭代第一中间变量和第二中间变量的取值；

其中，

取值为1时，所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

匹配；

取值为0时，所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

不匹配。

可以理解的是，

实则为第

次迭代所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

的匹配分数，

实则为第

次迭代所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

的匹配误差。

图4是特征匹配与感知器模型示意图，如图4所示，实体

是待操控实体对象，实体

是外部结构化知识库内除实体

以外的实体，将实体

与实体

对应特征空间的特征向量做内积，得到两个实体之间各个特征空间的匹配分数，该分数可以反应两个实体在各个特征空间的相似性，随后将匹配分数乘以特征权重向量得到实体

与实体

的匹配分数，若匹配分数大于阈值则实体i与实体j匹配，否则实体i与实体j不匹配。

其中特征权重向量通过感知器模型训练获取，首先初始化一组权重

，然后将初始化权重与实体

与实体

的特征相似矩阵相乘得到第一次迭代实体

与实体

的匹配分数，接着将第一次迭代实体

与实体

的匹配分数

与训练标签

做差得到的误差

，最后用

修正初始化权重

得到第一次迭代对应的特征权重向量

，不断循环至误差收敛，得到最终的特征权重向量。

图5示例了感知器模型误差曲线，可以看出图5中感知器模型经过160次迭代之后收敛。

本发明给出了特征相似矩阵以及感知器模型的迭代公式，为实体之间的匹配提供计算依据，进而便于机器人的任务规划。

为了便于理解本发明，给出一个服务机器人根据当前任务场景进行自主推理决策和任务规划的实施示例。

任务实体包括3个不同颜色不同形状的插件和16个不同形状大小的孔位。16个不同形状大小的孔位位于插板上，且3个插件与插板上3个孔位可以对应插接。初始任务场景插板上插有蓝色插件和黄色插件，目标任务场景插板上插有蓝色插件和红色插件；然后推理得出待操控插件是黄色插件和红色插件，动作原语是拔出黄色插件，插入红色插件；经过特征匹配得到红色插件和黄色插件在板子上对应的孔位，这里筛选得到的匹配特征主要是插件和插孔的大小和形状；根据动作指令函数组合成下述动作序列：移动至黄色插件对应孔位——夹住黄色插件——拔出黄色插件——放置黄色插件——移动至红色插件处——夹住红色插件——移动至红色插件对应孔位——插入红色插件。

第二方面，对本发明提供的基于知识处理的机器人任务规划装置进行描述，下文描述的基于知识处理的机器人任务规划装置与上文描述的基于知识处理的机器人任务规划方法可相互对应参照。图6示例了一种基于知识处理的机器人任务规划装置的结构示意图，如图6所示，该装置包括：待操控实体对象及其对应的动作原语确定模块21、实体匹配模块22和动作序列生成模块23；

待操控实体对象及其对应的动作原语确定模块21，用于基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语；

实体匹配模块22，用于利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体；

动作序列生成模块23，用于根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数，生成从初始任务场景到目标任务场景机器人所要执行的动作序列；

本发明提供的一种基于知识处理的机器人任务规划装置，基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语；利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体；根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数，生成从初始任务场景到目标任务场景机器人所要执行的动作序列；其中，所述外部结构化知识库，是由任务涉及到的实体及其对应的特征组成的。本发明解决了如何使机器人理解当前任务场景并做出任务规划的技术问题，赋予机器人对当前任务场景的自主决策能力，提升了机器人的智能化程度。

在上述各实施例的基础上，作为一种可选的实施例，所述初始任务场景与目标任务场景中的实体，表面都贴有二维码标签；所述装置还包括：实体检测模块；

所述实体检测模块，用于检测初始任务场景/目标任务场景中的二维码标签，确定初始任务场景/目标任务场景中包含的实体。

在上述各实施例的基础上，作为一种可选的实施例，所述待操控实体对象及其对应的动作原语确定模块21，包括：

检索单元，用于检索仅存在于所述初始任务场景或仅存在于所述目标任务场景中的实体，并将其作为机器人待操控的实体对象；

所述待操控实体对象及其对应的动作原语确定模块21，还包括：

动作原语确定单元，用于若所述实体对象存在于所述初始任务场景中且未存在于所述目标任务场景中，则所述实体对象对应的动作原语为移除所述实体对象；

在上述各实施例的基础上，作为一种可选的实施例，所述实体对应的特征，包括：尺寸、颜色和形状；所述装置还包括：外部结构化知识库构建模块；

所述外部结构化知识库构建模块，包括：

任务实体确定单元，用于确定任务涉及到的实体；

特征向量确定单元，用于将所述任务涉及到的实体映射到各个特征空间，得到所述任务涉及到的实体在各个特征空间的特征向量；

外部结构化知识库生成单元，用于利用所述任务涉及到的实体以及所述任务涉及到的实体在各个特征空间的特征向量生成所述外部结构化知识库。

在上述各实施例的基础上，作为一种可选的实施例，所述实体匹配模块，包括：

特征相似矩阵确定单元，用于确定所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵；

实体匹配单元，用于基于所述特征相似矩阵，并采用特征匹配算法，确定所述外部结构化知识库中与所述实体对象相匹配的实体。

在上述各实施例的基础上，作为一种可选的实施例，所述实体匹配单元，包括：

匹配分数确定子单元，用于对于外部结构化知识库中所述实体对象之外的任一其它实体，将预存的特征权重向量和所述实体对象与所述任一其它实体的特征相似矩阵相乘，得到所述实体对象与所述任一其它实体的匹配分数；

实体匹配判断单元，用于若所述实体对象与所述任一其它实体的匹配分数大于预设分数阈值，则所述任一其它实体与所述实体对象相匹配；否则，所述任一其它实体与所述实体对象不匹配；

遍历单元，用于遍历所述外部结构化知识库，确定所述外部结构化知识库中与所述实体对象相匹配的实体；

上式中，

表示所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

之间的特征相似矩阵，

表示所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

关于第

个特征的相似度，

，

表示特征的维度数；

其中，所述

，具体用下述公式表示：

上式中，

表示所述实体对象

的第

个特征的特征向量，

表示所述外部结构化知识库中所述实体对象之外的实体

的第

个特征的特征向量，

表示

与

上式中，

表示初始特征权重向量，

表示第

次迭代得到的特征权重向量，

表示第

次迭代得到的特征权重向量，

表示

的转置，

表示学习率，

表示所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

的匹配情况，

和

分别为第

次迭代第一中间变量和第二中间变量的取值；

其中，

取值为1时，所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

匹配；

取值为0时，所述实体对象

与所述外部结构化知识库中所述实体对象之外的实体

不匹配。

第三方面，图7示例了一种电子设备的实体结构示意图，如图7所示，该电子设备可以包括：处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740，其中，处理器710，通信接口720，存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令，以执行基于知识处理的机器人任务规划方法，该方法包括：基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语；利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体；根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数，生成从初始任务场景到目标任务场景机器人所要执行的动作序列；其中，所述外部结构化知识库，是由任务涉及到的实体及其对应的特征组成的。

此外，上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

第四方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，以执行基于知识处理的机器人任务规划方法，该方法包括：基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语；利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体；根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数，生成从初始任务场景到目标任务场景机器人所要执行的动作序列；其中，所述外部结构化知识库，是由任务涉及到的实体及其对应的特征组成的。

第五方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，以执行基于知识处理的机器人任务规划方法，该方法包括：基于初始任务场景与目标任务场景的实体差异，确定机器人待操控的实体对象以及所述实体对象对应的动作原语；利用特征匹配算法，确定预存的外部结构化知识库中与所述实体对象相匹配的实体；根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数，生成从初始任务场景到目标任务场景机器人所要执行的动作序列；其中，所述外部结构化知识库，是由任务涉及到的实体及其对应的特征组成的。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。