CN114580576B - 一种基于知识处理的机器人任务规划方法和装置 - Google Patents

一种基于知识处理的机器人任务规划方法和装置 Download PDF

Info

Publication number
CN114580576B
CN114580576B CN202210478258.7A CN202210478258A CN114580576B CN 114580576 B CN114580576 B CN 114580576B CN 202210478258 A CN202210478258 A CN 202210478258A CN 114580576 B CN114580576 B CN 114580576B
Authority
CN
China
Prior art keywords
entity
entity object
robot
knowledge base
entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210478258.7A
Other languages
English (en)
Other versions
CN114580576A (zh
Inventor
王海涛
张少林
葛悦光
王硕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN202210478258.7A priority Critical patent/CN114580576B/zh
Publication of CN114580576A publication Critical patent/CN114580576A/zh
Application granted granted Critical
Publication of CN114580576B publication Critical patent/CN114580576B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

本发明涉及一种基于知识处理的机器人任务规划方法和装置,包括:基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象及其对应的动作原语;确定外部结构化知识库中与实体对象相匹配的实体;根据与实体对象相匹配的实体、实体对象及其对应的动作原语和动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列。本发明赋予机器人对任务场景的自主决策能力,解决了机器人对任务场景理解以及任务规划困难的问题。

Description

一种基于知识处理的机器人任务规划方法和装置
技术领域
本发明涉及机器人智能服务领域,尤其涉及一种基于知识处理的机器人任务规划方法和装置。
背景技术
服务机器人的理想目标是学习、理解和执行人类所要完成的任务。人类通过观察环境,运用经验知识来执行任务,但是服务机器人既没有先天的知识积累,也不具备运用知识推理决策的能力。服务机器人的任务规划技术是服务机器人迈向自主化和智能化的关键技术,受到海内外学者和研究人员的广泛关注。
服务机器人的任务规划技术是指服务机器人运用环境知识进行推理和决策,定义任务动作和执行顺序,使得任务顺利完成的技术。相关技术中,利用RoboEarth框架为任务手工设定一组操作指令来实现任务规划,即首先将任务分解为结构化的子任务列表,随后将子任务定义为一连串的简单动作序列。该方法未对任务场景下的物体进行关系定义,无法进行任务逻辑推理。基于ART神经网络,并根据先前任务经验中获得的情景记忆来规划任务。基于马尔科夫决策过程(MDP),将每个任务表示为一个MDP架构来实现任务规划,即基于迁移学习的思想,利用现有状态和MDP生成新的MDP。这两种方法任务规划仅考虑了任务经验。利用语义推理系统,使用情景学习提取任务相关的动作和坐标,形成定性的空间关系;以定性的空间关系来表示最大泛化和最小化的知识工程,进而实现任务规划。该方法仅利用实体的动作和坐标来进行任务逻辑推理,考虑因素过于片面。
但是,复杂多变的任务场景的任务逻辑推理往往需要深入挖掘物体特征,上述四种方法明显不符合。因此上述四种方法比较适用于预先定义好的简单任务,高度复杂的任务会使整个过程变得困难且耗时。
发明内容
本发明的目的是提供一种基于知识处理的机器人任务规划方法和装置,以解决服务机器人任务规划困难且耗时的问题,进而为服务机器人赋予智能且高效的任务规划能力。
第一方面,本发明实施例提供一种基于知识处理的机器人任务规划方法,包括:
基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;
利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;
根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;
其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。
根据本发明提供的基于知识处理的机器人任务规划方法,所述初始任务场景与目标任务场景中的实体,表面都贴有二维码标签;所述基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语之前,还包括:
检测初始任务场景/目标任务场景中的二维码标签,确定初始任务场景/目标任务场景中包含的实体。
根据本发明提供的基于知识处理的机器人任务规划方法,所述基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象,包括:
检索仅存在于所述初始任务场景或仅存在于所述目标任务场景中的实体,并将其作为机器人待操控的实体对象;
所述确定所述实体对象对应的动作原语,包括:
若所述实体对象存在于所述初始任务场景中且未存在于所述目标任务场景中,则所述实体对象对应的动作原语为移除所述实体对象;
若所述实体对象存在于所述目标任务场景中且未存在于所述初始任务场景中,则所述实体对象对应的动作原语为载入所述实体对象。
根据本发明提供的基于知识处理的机器人任务规划方法,所述实体对应的特征,包括:尺寸、颜色和形状;所述外部结构化知识库的构建过程,包括:
确定任务涉及到的实体;
将所述任务涉及到的实体映射到各个特征空间,得到所述任务涉及到的实体在各个特征空间的特征向量;
利用所述任务涉及到的实体以及所述任务涉及到的实体在各个特征空间的特征向量生成所述外部结构化知识库。
根据本发明提供的基于知识处理的机器人任务规划方法,所述利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体,包括:
确定所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵;
基于所述特征相似矩阵,并采用特征匹配算法,确定所述外部结构化知识库中与所述实体对象相匹配的实体。
根据本发明提供的基于知识处理的机器人任务规划方法,所述基于所述特征相似矩阵,并采用特征匹配算法,确定所述外部结构化知识库中与所述实体对象相匹配的实体,包括:
对于外部结构化知识库中所述实体对象之外的任一其它实体,将预存的特征权重向量和所述实体对象与所述任一其它实体的特征相似矩阵相乘,得到所述实体对象与所述任一其它实体的匹配分数;
若所述实体对象与所述任一其它实体的匹配分数大于预设分数阈值,则所述任一其它实体与所述实体对象相匹配;否则,所述任一其它实体与所述实体对象不匹配;
遍历所述外部结构化知识库,确定所述外部结构化知识库中与所述实体对象相匹配的实体;
其中,所述预存的特征权重向量,是利用感知器模型迭代训练得到的。
根据本发明提供的基于知识处理的机器人任务规划方法,所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵,具体用下述公式表示:
Figure 334167DEST_PATH_IMAGE001
上式中,
Figure 8862DEST_PATH_IMAGE002
表示所述实体对象
Figure 486242DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体对象 之外的实体
Figure 588190DEST_PATH_IMAGE004
之间的特征相似矩阵,
Figure 16767DEST_PATH_IMAGE005
表示所述实体对象
Figure 760732DEST_PATH_IMAGE006
与所述外部结构化知识库 中所述实体对象之外的实体
Figure 844617DEST_PATH_IMAGE004
关于第
Figure 383046DEST_PATH_IMAGE007
个特征的相似度,
Figure 33339DEST_PATH_IMAGE008
Figure 315416DEST_PATH_IMAGE009
表示特征的维度 数;
其中,所述
Figure 751076DEST_PATH_IMAGE005
,具体用下述公式表示:
Figure 211139DEST_PATH_IMAGE010
上式中,
Figure 99460DEST_PATH_IMAGE011
表示所述实体对象
Figure 434495DEST_PATH_IMAGE003
的第
Figure 724662DEST_PATH_IMAGE012
个特征的特征向量,
Figure 355626DEST_PATH_IMAGE013
表示所述外 部结构化知识库中所述实体对象之外的实体
Figure 996823DEST_PATH_IMAGE004
的第
Figure 869970DEST_PATH_IMAGE007
个特征的特征向量,
Figure 14644DEST_PATH_IMAGE014
表示
Figure 816509DEST_PATH_IMAGE015
Figure 945002DEST_PATH_IMAGE016
的内积;所述感知器模型的迭代过程,具体用下述公式表示:
Figure 356260DEST_PATH_IMAGE017
上式中,
Figure 621020DEST_PATH_IMAGE018
表示初始特征权重向量,
Figure 322347DEST_PATH_IMAGE019
表示第
Figure 672557DEST_PATH_IMAGE020
次迭代得到的特征权重 向量,
Figure 903818DEST_PATH_IMAGE021
表示第
Figure 272352DEST_PATH_IMAGE022
次迭代得到的特征权重向量,
Figure 665287DEST_PATH_IMAGE023
表示
Figure 987946DEST_PATH_IMAGE024
的转置,
Figure 757319DEST_PATH_IMAGE025
表示学习 率,
Figure 245938DEST_PATH_IMAGE026
表示所述实体对象
Figure 809775DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体对象之外的实体
Figure 619730DEST_PATH_IMAGE004
的匹 配情况,
Figure 192794DEST_PATH_IMAGE027
Figure 535919DEST_PATH_IMAGE028
分别为第
Figure 270657DEST_PATH_IMAGE022
次迭代第一中间变量和第二中间变量的取值;
其中,
Figure 833488DEST_PATH_IMAGE026
取值为1时,所述实体对象
Figure 679084DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体对象 之外的实体
Figure 876716DEST_PATH_IMAGE004
匹配;
Figure 47934DEST_PATH_IMAGE029
取值为0时,所述实体对象
Figure 81749DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体对 象之外的实体
Figure 475909DEST_PATH_IMAGE004
不匹配。
第二方面,本发明还提供一种基于知识处理的机器人任务规划装置,所述装置包括:
待操控实体对象及其对应的动作原语确定模块,用于基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;
实体匹配模块,用于利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;
动作序列生成模块,用于根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;
其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。
第三方面,本发明还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的基于知识处理的机器人任务规划方法。
第四方面,本发明还公开了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于知识处理的机器人任务规划方法。
本发明提供的一种基于知识处理的机器人任务规划方法和装置,基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。本发明解决了如何使机器人理解当前任务场景并做出任务规划的技术问题,赋予机器人对当前任务场景的自主决策能力,提升了机器人的智能化程度。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的基于知识处理的机器人任务规划方法的流程示意图;
图2是本发明提供的初始场景与目标场景差异性示意图;
图3是本发明提供的外部结构化知识库示意图;
图4是本发明提供的特征匹配与感知器模型示意图;
图5是本发明提供的感知器模型误差曲线示意图;
图6是本发明提供的基于知识处理的机器人任务规划装置的结构示意图;
图7是本发明提供的实现基于知识处理的机器人任务规划的电子设备结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1至图7描述本发明基于知识处理的机器人任务规划方法和装置。
第一方面,知识处理是指机器人获取和存储有关任务环境的知识,并将其转化为机器人可理解的表达形式。机器人获取环境中物体的知识最常用的方法是通过传感器进行感知,通过特征提取可以获得物体的形状、大小和颜色之类的物理特性以及物体之间的空间关系。
Beetz等人提出了一个非结构化信息管理系统RoboSherlock,用于提取和管理环境中物体的物理信息和语义信息,该系统的作用是回答任务相关物体信息的查询。Tenorth等人提出了一种知识处理系统KnowRob,其使用本体作为知识载体,通过定义物体类和位置属性存储物体语义位置。Bizer等人提出了一种语义网框架DBpedia,与互联网类似,语义网是机器可以访问和理解的万维网版本,该框架使用感知技术来预测已知对象的类别以及已知与未知对象之间的空间关系,这些信息与语义网获取的信息相结合,可以预测未知对象的类标签并生成语义关系。但以上知识处理方法更多局限于知识的查询问答,知识表征形式难以挖掘更深层次的逻辑(对象之间不仅仅是空间关系,对象的属性特征也存在丰富的逻辑推理依据),难以解决多步任务的规划问题。
在此基础上,本发明提供一种基于知识处理的机器人任务规划方法,如图1所示,所述方法包括:
S11:基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;
本发明用于服务机器人的任务规划,因此需要确定服务机器人待操控的实体对象,以及待操控的实体对象对应的操控动作(动作原语)。
S12:利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;
本发明有效利用外部结构化知识库对多步任务中物体的动作逻辑进行情景推理,从而解决多步任务的规划问题。
S13:根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;
需要注意的是,预存的动作指令函数,是任务中涉及到的一系列基础动作(例如:拿起、放下等)对应的代码函数。
其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。
本发明提供的一种基于知识处理的机器人任务规划方法,基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。本发明解决了如何使机器人理解当前任务场景并做出任务规划的技术问题,赋予机器人对当前任务场景的自主决策能力,提升了机器人的智能化程度。
在上述各实施例的基础上,作为一种可选的实施例,所述初始任务场景与目标任务场景中的实体,表面都贴有二维码标签;所述基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语之前,还包括:
检测初始任务场景/目标任务场景中的二维码标签,确定初始任务场景/目标任务场景中包含的实体。
可以理解的是,初始任务场景也可以看作为当前任务场景,在执行本发明之前,需要先设置任务对应的初始任务场景和目标任务场景,并在初始任务场景和目标任务场景中的物体(实体)表面贴上二维码标签。
通常,本发明利用相机拍摄初始任务场景/目标任务场景中的物体表面的二维码标签,并对二维码标签进行检测识别,得到初始任务场景/目标任务场景中包含的实体。
本发明通过识别任务场景中的二维码标签来确定初始任务场景和目标任务场景中包含的实体,进而为寻找服务机器人待操控的实体对象奠定基础。
在上述各实施例的基础上,作为一种可选的实施例,所述基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象,包括:
检索仅存在于所述初始任务场景或仅存在于所述目标任务场景中的实体,并将其作为机器人待操控的实体对象;
所述确定所述实体对象对应的动作原语,包括:
若所述实体对象存在于所述初始任务场景中且未存在于所述目标任务场景中,则所述实体对象对应的动作原语为移除所述实体对象;
若所述实体对象存在于所述目标任务场景中且未存在于所述初始任务场景中,则所述实体对象对应的动作原语为载入所述实体对象。
本发明比较初始任务场景和目标任务场景,确定两个场景中实体差异。若实体出现在初始任务场景中且没有出现在目标任务场景中,则将实体作为待操控实体对象,待操控实体对象对应的动作原语为去掉该实体;若实体出现在目标任务场景中且没有出现在初始任务场景中,则将实体作为待操控实体对象,待操控实体对象对应的动作原语为加入该实体;若实体同时出现在初始任务场景和目标任务场景中,则实体不作为待操控实体对象,并且不会得到动作原语。
举例来说,图2示例了初始场景与目标场景差异性的一种示例,如图2所示,初始任务场景包括实体A与实体B;目标任务场景包括实体B与实体C。实体A出现在初始任务场景但没有出现在目标任务场景,则实体A将作为待操控实体对象,生成的动作原语为去掉实体A;实体B同时出现在初始任务场景和目标任务场景,则实体B将不作为待操控实体,没有动作原语生成;实体C出现在目标任务场景但没有出现在初始任务场景,则实体C将作为待操控实体对象,生成动作原语为加入实体C。
本发明根据初始任务场景和目标任务场景的实体差异,选定机器人待操控的实体及其对应的操控动作,进而为机器人任务规划奠定基础。
在上述各实施例的基础上,作为一种可选的实施例,所述实体对应的特征,包括:尺寸、颜色和形状;所述外部结构化知识库的构建过程,包括:
确定任务涉及到的实体;
将所述任务涉及到的实体映射到各个特征空间,得到所述任务涉及到的实体在各个特征空间的特征向量;
利用所述任务涉及到的实体以及所述任务涉及到的实体在各个特征空间的特征向量生成所述外部结构化知识库。
本发明将任务涉及的物体以实体的形式录入数据库,然后利用传感器,将实体映射到各个特征空间,特征以向量的形式存储在数据库;最后将数据库作为外部结构化知识库。
图3示例了外部结构化知识库,外部结构化知识库内总共有n个实体,每个实体都有m个特征空间,通过映射每个实体将会生成一个特征向量集合,需要注意的是特征向量集合中对应位置的特征属于同一特征空间,例如每个实体的特征1都代表该实体的颜色,每个实体的特征m都代表该实体的形状等。
本发明构建外部结构化知识库,存储任务中涉及的实体的多维的属性特征,为任务规划提供丰富的逻辑推理依据。
在上述各实施例的基础上,作为一种可选的实施例,所述利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体,包括:
确定所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵;
基于所述特征相似矩阵,并采用特征匹配算法,确定所述外部结构化知识库中与所述实体对象相匹配的实体。
本发明根据待操控实体对象与外部结构化知识库中其他实体之间各个特征的相似度,构建待操控实体对象与外部结构化知识库中其他实体的特征相似矩阵,以便从外部结构化知识库中寻找与待操控实体对象匹配的实体,以便服务机器人根据待操控实体对象、外部结构化知识库中与待操控实体对象匹配的其它实体、待操控实体对象的动作原语实现情景理解,进而结合动作指令模板得到从初始任务场景到目标任务场景的动作序列。
本发明为服务机器人理解当前任务场景并做出任务规划提供可行方式,提升服务机器人的智能化程度。
在上述各实施例的基础上,作为一种可选的实施例,所述基于所述特征相似矩阵,并采用特征匹配算法,确定所述外部结构化知识库中与所述实体对象相匹配的实体,包括:
对于外部结构化知识库中所述实体对象之外的任一其它实体,将预存的特征权重向量和所述实体对象与所述任一其它实体的特征相似矩阵相乘,得到所述实体对象与所述任一其它实体的匹配分数;
若所述实体对象与所述任一其它实体的匹配分数大于预设分数阈值,则所述任一其它实体与所述实体对象相匹配;否则,所述任一其它实体与所述实体对象不匹配;
遍历所述外部结构化知识库,确定所述外部结构化知识库中与所述实体对象相匹配的实体;
其中,所述预存的特征权重向量,是利用感知器模型迭代训练得到的。
本发明利用感知器模型训练特征权重向量,并基于特征权重向量计算实体之间的匹配分数,进而利用实体之间的匹配分数判定实体之间是否匹配,达到提高实体之间的匹配准确度的效果。
在上述各实施例的基础上,作为一种可选的实施例,所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵,具体用下述公式表示:
Figure 278780DEST_PATH_IMAGE001
上式中,
Figure 604588DEST_PATH_IMAGE002
表示所述实体对象
Figure 391279DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体对象 之外的实体
Figure 594989DEST_PATH_IMAGE004
之间的特征相似矩阵,
Figure 252367DEST_PATH_IMAGE005
表示所述实体对象
Figure 749076DEST_PATH_IMAGE030
与所述外部结构化知识 库中所述实体对象之外的实体
Figure 23063DEST_PATH_IMAGE004
关于第
Figure 499305DEST_PATH_IMAGE012
个特征的相似度,
Figure 542348DEST_PATH_IMAGE008
Figure 632795DEST_PATH_IMAGE009
表示特征的维度 数;
其中,所述
Figure 138950DEST_PATH_IMAGE031
,具体用下述公式表示:
Figure 668152DEST_PATH_IMAGE010
上式中,
Figure 549389DEST_PATH_IMAGE011
表示所述实体对象
Figure 404213DEST_PATH_IMAGE003
的第
Figure 872365DEST_PATH_IMAGE012
个特征的特征向量,
Figure 470837DEST_PATH_IMAGE013
表示所述外 部结构化知识库中所述实体对象之外的实体
Figure 472160DEST_PATH_IMAGE032
的第
Figure 232305DEST_PATH_IMAGE012
个特征的特征向量,
Figure 702601DEST_PATH_IMAGE014
表示
Figure 589917DEST_PATH_IMAGE015
Figure 196479DEST_PATH_IMAGE016
的内积;
所述感知器模型的迭代过程,具体用下述公式表示:
Figure 642372DEST_PATH_IMAGE017
上式中,
Figure 334385DEST_PATH_IMAGE018
表示初始特征权重向量,
Figure 759812DEST_PATH_IMAGE019
表示第
Figure 220880DEST_PATH_IMAGE020
次迭代得到的特征权重 向量,
Figure 103255DEST_PATH_IMAGE021
表示第
Figure 282563DEST_PATH_IMAGE022
次迭代得到的特征权重向量,
Figure 263680DEST_PATH_IMAGE023
表示
Figure 110414DEST_PATH_IMAGE024
的转置,
Figure 632531DEST_PATH_IMAGE025
表示学习 率,
Figure 299136DEST_PATH_IMAGE026
表示所述实体对象
Figure 66365DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体对象之外的实体
Figure 767605DEST_PATH_IMAGE004
的匹 配情况,
Figure 476935DEST_PATH_IMAGE033
Figure 614524DEST_PATH_IMAGE028
分别为第
Figure 700292DEST_PATH_IMAGE022
次迭代第一中间变量和第二中间变量的取值;
其中,
Figure 741192DEST_PATH_IMAGE026
取值为1时,所述实体对象
Figure 621423DEST_PATH_IMAGE006
与所述外部结构化知识库中所述实体对象之 外的实体
Figure 246308DEST_PATH_IMAGE004
匹配;
Figure 870188DEST_PATH_IMAGE026
取值为0时,所述实体对象
Figure 31173DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体对 象之外的实体
Figure 82305DEST_PATH_IMAGE004
不匹配。
可以理解的是,
Figure 194487DEST_PATH_IMAGE034
实则为第
Figure 622057DEST_PATH_IMAGE022
次迭代所述实体对象
Figure 366110DEST_PATH_IMAGE006
与所述外部结构化知识库 中所述实体对象之外的实体
Figure 588144DEST_PATH_IMAGE004
的匹配分数,
Figure 203933DEST_PATH_IMAGE028
实则为第
Figure 418883DEST_PATH_IMAGE022
次迭代所述实体对象
Figure 538148DEST_PATH_IMAGE003
与所述 外部结构化知识库中所述实体对象之外的实体
Figure 681816DEST_PATH_IMAGE035
的匹配误差。
图4是特征匹配与感知器模型示意图,如图4所示,实体
Figure 519322DEST_PATH_IMAGE003
是待操控实体对象,实 体
Figure 272383DEST_PATH_IMAGE004
是外部结构化知识库内除实体
Figure 511735DEST_PATH_IMAGE003
以外的实体,将实体
Figure 560724DEST_PATH_IMAGE003
与实体
Figure 151106DEST_PATH_IMAGE004
对应特征空间的特 征向量做内积,得到两个实体之间各个特征空间的匹配分数,该分数可以反应两个实体在 各个特征空间的相似性,随后将匹配分数乘以特征权重向量得到实体
Figure 707858DEST_PATH_IMAGE003
与实体
Figure 536137DEST_PATH_IMAGE004
的匹配 分数,若匹配分数大于阈值则实体i与实体j匹配,否则实体i与实体j不匹配。
其中特征权重向量通过感知器模型训练获取,首先初始化一组权重
Figure 287186DEST_PATH_IMAGE018
,然后将 初始化权重与实体
Figure 833705DEST_PATH_IMAGE003
与实体
Figure 194148DEST_PATH_IMAGE004
的特征相似矩阵相乘得到第一次迭代实体
Figure 142513DEST_PATH_IMAGE003
与实体
Figure 313731DEST_PATH_IMAGE004
的 匹配分数,接着将第一次迭代实体
Figure 92419DEST_PATH_IMAGE003
与实体
Figure 741706DEST_PATH_IMAGE004
的匹配分数
Figure 59424DEST_PATH_IMAGE036
与训练标签
Figure 135964DEST_PATH_IMAGE026
做差得到的误 差
Figure 407808DEST_PATH_IMAGE037
,最后用
Figure 595207DEST_PATH_IMAGE038
修正初始化权重
Figure 33010DEST_PATH_IMAGE018
得到第一次迭代对应的特征权重向量
Figure 280452DEST_PATH_IMAGE039
,不断循环 至误差收敛,得到最终的特征权重向量。
图5示例了感知器模型误差曲线,可以看出图5中感知器模型经过160次迭代之后收敛。
本发明给出了特征相似矩阵以及感知器模型的迭代公式,为实体之间的匹配提供计算依据,进而便于机器人的任务规划。
为了便于理解本发明,给出一个服务机器人根据当前任务场景进行自主推理决策和任务规划的实施示例。
任务实体包括3个不同颜色不同形状的插件和16个不同形状大小的孔位。16个不同形状大小的孔位位于插板上,且3个插件与插板上3个孔位可以对应插接。初始任务场景插板上插有蓝色插件和黄色插件,目标任务场景插板上插有蓝色插件和红色插件;然后推理得出待操控插件是黄色插件和红色插件,动作原语是拔出黄色插件,插入红色插件;经过特征匹配得到红色插件和黄色插件在板子上对应的孔位,这里筛选得到的匹配特征主要是插件和插孔的大小和形状;根据动作指令函数组合成下述动作序列:移动至黄色插件对应孔位——夹住黄色插件——拔出黄色插件——放置黄色插件——移动至红色插件处——夹住红色插件——移动至红色插件对应孔位——插入红色插件。
第二方面,对本发明提供的基于知识处理的机器人任务规划装置进行描述,下文描述的基于知识处理的机器人任务规划装置与上文描述的基于知识处理的机器人任务规划方法可相互对应参照。图6示例了一种基于知识处理的机器人任务规划装置的结构示意图,如图6所示,该装置包括:待操控实体对象及其对应的动作原语确定模块21、实体匹配模块22和动作序列生成模块23;
待操控实体对象及其对应的动作原语确定模块21,用于基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;
实体匹配模块22,用于利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;
动作序列生成模块23,用于根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;
其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。
本发明提供的一种基于知识处理的机器人任务规划装置,基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。本发明解决了如何使机器人理解当前任务场景并做出任务规划的技术问题,赋予机器人对当前任务场景的自主决策能力,提升了机器人的智能化程度。
在上述各实施例的基础上,作为一种可选的实施例,所述初始任务场景与目标任务场景中的实体,表面都贴有二维码标签;所述装置还包括:实体检测模块;
所述实体检测模块,用于检测初始任务场景/目标任务场景中的二维码标签,确定初始任务场景/目标任务场景中包含的实体。
在上述各实施例的基础上,作为一种可选的实施例,所述待操控实体对象及其对应的动作原语确定模块21,包括:
检索单元,用于检索仅存在于所述初始任务场景或仅存在于所述目标任务场景中的实体,并将其作为机器人待操控的实体对象;
所述待操控实体对象及其对应的动作原语确定模块21,还包括:
动作原语确定单元,用于若所述实体对象存在于所述初始任务场景中且未存在于所述目标任务场景中,则所述实体对象对应的动作原语为移除所述实体对象;
若所述实体对象存在于所述目标任务场景中且未存在于所述初始任务场景中,则所述实体对象对应的动作原语为载入所述实体对象。
在上述各实施例的基础上,作为一种可选的实施例,所述实体对应的特征,包括:尺寸、颜色和形状;所述装置还包括:外部结构化知识库构建模块;
所述外部结构化知识库构建模块,包括:
任务实体确定单元,用于确定任务涉及到的实体;
特征向量确定单元,用于将所述任务涉及到的实体映射到各个特征空间,得到所述任务涉及到的实体在各个特征空间的特征向量;
外部结构化知识库生成单元,用于利用所述任务涉及到的实体以及所述任务涉及到的实体在各个特征空间的特征向量生成所述外部结构化知识库。
在上述各实施例的基础上,作为一种可选的实施例,所述实体匹配模块,包括:
特征相似矩阵确定单元,用于确定所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵;
实体匹配单元,用于基于所述特征相似矩阵,并采用特征匹配算法,确定所述外部结构化知识库中与所述实体对象相匹配的实体。
在上述各实施例的基础上,作为一种可选的实施例,所述实体匹配单元,包括:
匹配分数确定子单元,用于对于外部结构化知识库中所述实体对象之外的任一其它实体,将预存的特征权重向量和所述实体对象与所述任一其它实体的特征相似矩阵相乘,得到所述实体对象与所述任一其它实体的匹配分数;
实体匹配判断单元,用于若所述实体对象与所述任一其它实体的匹配分数大于预设分数阈值,则所述任一其它实体与所述实体对象相匹配;否则,所述任一其它实体与所述实体对象不匹配;
遍历单元,用于遍历所述外部结构化知识库,确定所述外部结构化知识库中与所述实体对象相匹配的实体;
其中,所述预存的特征权重向量,是利用感知器模型迭代训练得到的。
在上述各实施例的基础上,作为一种可选的实施例,所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵,具体用下述公式表示:
Figure 39592DEST_PATH_IMAGE001
上式中,
Figure 296261DEST_PATH_IMAGE002
表示所述实体对象
Figure 322991DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体对象 之外的实体
Figure 741334DEST_PATH_IMAGE004
之间的特征相似矩阵,
Figure 237038DEST_PATH_IMAGE005
表示所述实体对象
Figure 782551DEST_PATH_IMAGE003
与所述外部结构化知识 库中所述实体对象之外的实体
Figure 414520DEST_PATH_IMAGE004
关于第
Figure 518612DEST_PATH_IMAGE012
个特征的相似度,
Figure 501611DEST_PATH_IMAGE008
Figure 579376DEST_PATH_IMAGE009
表示特征的维度 数;
其中,所述
Figure 65853DEST_PATH_IMAGE005
,具体用下述公式表示:
Figure 606424DEST_PATH_IMAGE010
上式中,
Figure 811141DEST_PATH_IMAGE011
表示所述实体对象
Figure 698456DEST_PATH_IMAGE003
的第
Figure 39439DEST_PATH_IMAGE007
个特征的特征向量,
Figure 485333DEST_PATH_IMAGE013
表示所述外 部结构化知识库中所述实体对象之外的实体
Figure 442924DEST_PATH_IMAGE035
的第
Figure 868352DEST_PATH_IMAGE040
个特征的特征向量,
Figure 329420DEST_PATH_IMAGE014
表示
Figure 962527DEST_PATH_IMAGE015
Figure 125524DEST_PATH_IMAGE016
的内积;所述感知器模型的迭代过程,具体用下述公式表示:
Figure 603909DEST_PATH_IMAGE017
上式中,
Figure 935796DEST_PATH_IMAGE018
表示初始特征权重向量,
Figure 474225DEST_PATH_IMAGE019
表示第
Figure 390097DEST_PATH_IMAGE020
次迭代得到的特征权重 向量,
Figure 406595DEST_PATH_IMAGE021
表示第
Figure 610566DEST_PATH_IMAGE022
次迭代得到的特征权重向量,
Figure 319896DEST_PATH_IMAGE023
表示
Figure 723064DEST_PATH_IMAGE024
的转置,
Figure 808832DEST_PATH_IMAGE025
表示学习 率,
Figure 849731DEST_PATH_IMAGE026
表示所述实体对象
Figure 729962DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体对象之外的实体
Figure 354848DEST_PATH_IMAGE004
的匹 配情况,
Figure 978727DEST_PATH_IMAGE041
Figure 388980DEST_PATH_IMAGE028
分别为第
Figure 925266DEST_PATH_IMAGE022
次迭代第一中间变量和第二中间变量的取值;
其中,
Figure 53759DEST_PATH_IMAGE026
取值为1时,所述实体对象
Figure 465017DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体对象 之外的实体
Figure 729777DEST_PATH_IMAGE004
匹配;
Figure 702543DEST_PATH_IMAGE026
取值为0时,所述实体对象
Figure 52753DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体 对象之外的实体
Figure 267702DEST_PATH_IMAGE004
不匹配。
第三方面,图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行基于知识处理的机器人任务规划方法,该方法包括:基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
第四方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,以执行基于知识处理的机器人任务规划方法,该方法包括:基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。
第五方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,以执行基于知识处理的机器人任务规划方法,该方法包括:基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于知识处理的机器人任务规划方法,其特征在于,所述方法包括:
基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;
利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;
根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;
其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。
2.根据权利要求1所述的基于知识处理的机器人任务规划方法,其特征在于,所述初始任务场景与目标任务场景中的实体,表面都贴有二维码标签;所述基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语之前,还包括:
检测初始任务场景/目标任务场景中的二维码标签,确定初始任务场景/目标任务场景中包含的实体。
3.根据权利要求1所述的基于知识处理的机器人任务规划方法,其特征在于,所述基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象,包括:
检索仅存在于所述初始任务场景或仅存在于所述目标任务场景中的实体,并将其作为机器人待操控的实体对象;
所述确定所述实体对象对应的动作原语,包括:
若所述实体对象存在于所述初始任务场景中且未存在于所述目标任务场景中,则所述实体对象对应的动作原语为移除所述实体对象;
若所述实体对象存在于所述目标任务场景中且未存在于所述初始任务场景中,则所述实体对象对应的动作原语为载入所述实体对象。
4.根据权利要求1所述的基于知识处理的机器人任务规划方法,其特征在于,所述实体对应的特征,包括:尺寸、颜色和形状;所述外部结构化知识库的构建过程,包括:
确定任务涉及到的实体;
将所述任务涉及到的实体映射到各个特征空间,得到所述任务涉及到的实体在各个特征空间的特征向量;
利用所述任务涉及到的实体以及所述任务涉及到的实体在各个特征空间的特征向量生成所述外部结构化知识库。
5.根据权利要求1所述的基于知识处理的机器人任务规划方法,其特征在于,所述利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体,包括:
确定所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵;
基于所述特征相似矩阵,并采用特征匹配算法,确定所述外部结构化知识库中与所述实体对象相匹配的实体。
6.根据权利要求5所述的基于知识处理的机器人任务规划方法,其特征在于,所述基于所述特征相似矩阵,并采用特征匹配算法,确定所述外部结构化知识库中与所述实体对象相匹配的实体,包括:
对于外部结构化知识库中所述实体对象之外的任一其它实体,将预存的特征权重向量和所述实体对象与所述任一其它实体的特征相似矩阵相乘,得到所述实体对象与所述任一其它实体的匹配分数;
若所述实体对象与所述任一其它实体的匹配分数大于预设分数阈值,则所述任一其它实体与所述实体对象相匹配;否则,所述任一其它实体与所述实体对象不匹配;
遍历所述外部结构化知识库,确定所述外部结构化知识库中与所述实体对象相匹配的实体;
其中,所述预存的特征权重向量,是利用感知器模型迭代训练得到的。
7.根据权利要求6所述的基于知识处理的机器人任务规划方法,其特征在于,所述实体对象与外部结构化知识库中所述实体对象之外的其它实体的特征相似矩阵,具体用下述公式表示:
Figure 662923DEST_PATH_IMAGE001
上式中,
Figure 305126DEST_PATH_IMAGE002
表示所述实体对象
Figure 142632DEST_PATH_IMAGE003
与所述外部结构化知识库中所述实体对象之外 的实体
Figure 912005DEST_PATH_IMAGE004
之间的特征相似矩阵,
Figure 636510DEST_PATH_IMAGE005
表示所述实体对象
Figure 200346DEST_PATH_IMAGE006
与所述外部结构化知识库 中所述实体对象之外的实体
Figure 39995DEST_PATH_IMAGE007
关于第
Figure 81900DEST_PATH_IMAGE008
个特征的相似度,
Figure 944069DEST_PATH_IMAGE009
Figure 678807DEST_PATH_IMAGE010
表示特征的维度数;
其中,所述
Figure 740172DEST_PATH_IMAGE011
,具体用下述公式表示:
Figure 851348DEST_PATH_IMAGE012
上式中,
Figure 550445DEST_PATH_IMAGE013
表示所述实体对象
Figure 721663DEST_PATH_IMAGE014
的第
Figure 4746DEST_PATH_IMAGE008
个特征的特征向量,
Figure 388454DEST_PATH_IMAGE015
表示所述外部结 构化知识库中所述实体对象之外的实体
Figure 207636DEST_PATH_IMAGE016
的第
Figure 284177DEST_PATH_IMAGE008
个特征的特征向量,
Figure 54555DEST_PATH_IMAGE017
表 示
Figure 241954DEST_PATH_IMAGE018
Figure 915643DEST_PATH_IMAGE015
的内积;
所述感知器模型的迭代过程,具体用下述公式表示:
Figure 428664DEST_PATH_IMAGE019
上式中,
Figure 437072DEST_PATH_IMAGE020
表示初始特征权重向量,
Figure 677429DEST_PATH_IMAGE021
表示第
Figure 720471DEST_PATH_IMAGE022
次迭代得到的特征权重向量,
Figure 883687DEST_PATH_IMAGE023
表示第
Figure 113812DEST_PATH_IMAGE024
次迭代得到的特征权重向量,
Figure 157860DEST_PATH_IMAGE025
表示
Figure 55409DEST_PATH_IMAGE026
的转置,
Figure 395385DEST_PATH_IMAGE027
表示学习率,
Figure 378385DEST_PATH_IMAGE028
表示所述实体对象
Figure 960545DEST_PATH_IMAGE029
与所述外部结构化知识库中所述实体对象之外的实体
Figure 712600DEST_PATH_IMAGE030
的匹配情 况,
Figure 489057DEST_PATH_IMAGE031
Figure 693774DEST_PATH_IMAGE032
分别为第
Figure 814045DEST_PATH_IMAGE024
次迭代第一中间变量和第二中间变量的取值;
其中,
Figure 420607DEST_PATH_IMAGE033
取值为1时,所述实体对象
Figure 882813DEST_PATH_IMAGE029
与所述外部结构化知识库中所述实体对象之外的 实体
Figure 59978DEST_PATH_IMAGE030
匹配;
Figure 252DEST_PATH_IMAGE033
取值为0时,所述实体对象
Figure 976168DEST_PATH_IMAGE029
与所述外部结构化知识库中所述实体对象之外 的实体
Figure 78116DEST_PATH_IMAGE030
不匹配。
8.一种基于知识处理的机器人任务规划装置,其特征在于,所述装置包括:
待操控实体对象及其对应的动作原语确定模块,用于基于初始任务场景与目标任务场景的实体差异,确定机器人待操控的实体对象以及所述实体对象对应的动作原语;
实体匹配模块,用于利用特征匹配算法,确定预存的外部结构化知识库中与所述实体对象相匹配的实体;
动作序列生成模块,用于根据所述与所述实体对象相匹配的实体、所述实体对象、所述实体对象对应的动作原语以及预存的动作指令函数,生成从初始任务场景到目标任务场景机器人所要执行的动作序列;
其中,所述外部结构化知识库,是由任务涉及到的实体及其对应的特征组成的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的基于知识处理的机器人任务规划方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于知识处理的机器人任务规划方法。
CN202210478258.7A 2022-05-05 2022-05-05 一种基于知识处理的机器人任务规划方法和装置 Active CN114580576B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210478258.7A CN114580576B (zh) 2022-05-05 2022-05-05 一种基于知识处理的机器人任务规划方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210478258.7A CN114580576B (zh) 2022-05-05 2022-05-05 一种基于知识处理的机器人任务规划方法和装置

Publications (2)

Publication Number Publication Date
CN114580576A CN114580576A (zh) 2022-06-03
CN114580576B true CN114580576B (zh) 2022-09-06

Family

ID=81778263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210478258.7A Active CN114580576B (zh) 2022-05-05 2022-05-05 一种基于知识处理的机器人任务规划方法和装置

Country Status (1)

Country Link
CN (1) CN114580576B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109465834A (zh) * 2019-01-04 2019-03-15 北京邮电大学 一种基于规划知识库的机械臂快速任务规划方法
CN110134081A (zh) * 2019-04-08 2019-08-16 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 一种基于机器人能力模型的控制系统
CN112313043A (zh) * 2018-06-15 2021-02-02 谷歌有限责任公司 自我监督的机器人对象交互
CN112396653A (zh) * 2020-10-31 2021-02-23 清华大学 一种目标场景导向的机器人操作策略生成方法
WO2021219812A1 (en) * 2020-04-29 2021-11-04 Christian Von Reventlow Service robot system, robot and method for operating the service robot
CN114185281A (zh) * 2021-12-14 2022-03-15 深圳大学 基于知识库的机器人仿真平台控制方法、终端及介质
CN114310883A (zh) * 2021-12-24 2022-04-12 深圳巨隆基科技有限公司 一种基于多知识库的机械臂自主装配方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7966093B2 (en) * 2007-04-17 2011-06-21 Yefim Zhuk Adaptive mobile robot system with knowledge-driven architecture
CN112364853B (zh) * 2021-01-13 2021-03-30 之江实验室 基于知识库和pddl语义设计的机器人任务执行方法
CN113821648B (zh) * 2021-11-23 2022-04-08 中国科学院自动化研究所 基于本体知识表示的机器人任务处理方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112313043A (zh) * 2018-06-15 2021-02-02 谷歌有限责任公司 自我监督的机器人对象交互
CN109465834A (zh) * 2019-01-04 2019-03-15 北京邮电大学 一种基于规划知识库的机械臂快速任务规划方法
CN110134081A (zh) * 2019-04-08 2019-08-16 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 一种基于机器人能力模型的控制系统
WO2021219812A1 (en) * 2020-04-29 2021-11-04 Christian Von Reventlow Service robot system, robot and method for operating the service robot
CN112396653A (zh) * 2020-10-31 2021-02-23 清华大学 一种目标场景导向的机器人操作策略生成方法
CN114185281A (zh) * 2021-12-14 2022-03-15 深圳大学 基于知识库的机器人仿真平台控制方法、终端及介质
CN114310883A (zh) * 2021-12-24 2022-04-12 深圳巨隆基科技有限公司 一种基于多知识库的机械臂自主装配方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Design and Implementation of Visual Robot Mission Planning;Wang X等;《IOP Conference Series Earth and Environmental Science》;20191231;第1-7页 *
基于人机协同的人形机器人实时任务规划;付艳等;《华中科技大学学报(自然科学版)》;20170131(第01期);第76-81页 *

Also Published As

Publication number Publication date
CN114580576A (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
CN110472002B (zh) 一种文本相似度获取方法和装置
CN111666919B (zh) 一种对象识别方法、装置、计算机设备和存储介质
US11640634B2 (en) Deep learning based visual compatibility prediction for bundle recommendations
CN111127364B (zh) 图像数据增强策略选择方法及人脸识别图像数据增强方法
CN111027292B (zh) 一种限定采样文本序列生成方法及其系统
Ugur et al. Refining discovered symbols with multi-step interaction experience
CN113641797A (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品
CN116841317A (zh) 一种基于图注意力强化学习的无人机集群协同对抗方法
Diao et al. Multi-label remote sensing image classification with deformable convolutions and graph neural networks
CN113705402A (zh) 视频行为预测方法、系统、电子设备及存储介质
CN114580576B (zh) 一种基于知识处理的机器人任务规划方法和装置
Katara et al. Gen2sim: Scaling up robot learning in simulation with generative models
CN113780245B (zh) 一种多场景下的物品检索方法及系统
Asyrofi et al. The improvement impact performance of face detection using yolo algorithm
CN113761151A (zh) 同义词挖掘、问答方法、装置、计算机设备和存储介质
CN111695470A (zh) 一种基于深度特征正交分解的可见光-近红外行人再识别方法
Feng et al. A Weakly-Supervised Approach for Semantic Segmentation
CN115082430B (zh) 图像分析方法、装置及电子设备
CN116227361B (zh) 一种智能体决策方法及装置
US20230385615A1 (en) Normalization scheme for self-attention neural networks
CN111008271B (zh) 一种基于神经网络的关键信息提取方法及系统
Yuan et al. Introduction to meta learning
Rajagopal et al. Deep algorithms: designs for networks
CN116150405B (zh) 一种多场景的异构数据处理方法
CN112933605B (zh) 虚拟对象控制、模型训练方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant