CN111000492B

CN111000492B - 基于知识图谱的智能扫地机行为决策方法及智能扫地机

Info

Publication number: CN111000492B
Application number: CN201911087278.6A
Authority: CN
Inventors: 王旭宁; 付维林
Original assignee: Sharkninja China Technology Co Ltd
Current assignee: Sharkninja China Technology Co Ltd
Priority date: 2019-11-08
Filing date: 2019-11-08
Publication date: 2021-10-08
Anticipated expiration: 2039-11-08
Also published as: CN111000492A

Abstract

本发明提供了一种基于知识图谱的智能扫地机行为决策方法及智能扫地机，方法包括：建立扫地机的知识图谱，所述知识图谱包括扫地机的状态信息、输入信息、执行动作信息；根据所述知识图谱建立基于网络嵌入的神经网络；通过将扫地机当前的状态信息、输入信息送至所述基于网络嵌入的神经网络，映射至指定向量空间内以特征向量表示；根据所述特征向量之间的相关性，输出扫地机的执行动作。本发明解决了现有行为决策方案的维护成本高、规则冲突、系统不可解释性等技术问题。本发明将系统模块化、透明性，强化输出结果的可靠性，避免一些低级错误的发生；能够对整个决策的过程进行分析，了解出错在哪一个环节，从而找出解决办法和方案。

Description

基于知识图谱的智能扫地机行为决策方法及智能扫地机

技术领域

本发明涉及智能家居技术领域，特别涉及一种智能扫地机，尤其涉及一种基于知识图谱的智能扫地机行为决策方法及智能扫地机。

背景技术

自动扫地机的技术实现可以分为感知定位、规划决策、执行控制三个部分。目前，自动扫地的感知技术已经不是主要的技术瓶颈，而是在于决策层的实现。

扫地机接收的信号类型多种多样，各种类型的信号又繁复多样，且需要根据每个类型的具体信号内容进行行为决策。而考虑到扫地机实际使用场景家居生活娱乐的复杂性，需要一种相对较低成本的自动化或半自动化、并且可持续优化的方案来进行扫地机的行为决策系统维护。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

本发明的一个方面提供了一种基于知识图谱的智能扫地机行为决策方法，包括：

建立扫地机的知识图谱，所述知识图谱包括扫地机的状态信息、输入信息、执行动作信息；

根据所述知识图谱建立基于网络嵌入的神经网络；

通过将扫地机当前的状态信息、输入信息送至所述基于网络嵌入的神经网络，映射至指定向量空间内以特征向量表示；

根据所述特征向量之间的相关性，输出扫地机的执行动作。

在一个示例中，所述建立扫地机的知识图谱，包括：

预先定义扫地机的输入信息、状态信息以及执行动作信息，所述执行动作信息至少包括清洁、移动、避障中的两种；

根据所述状态信息、输入信息以及执行动作信息，预先设置图谱节点与图谱节点之间的关系，以构成扫地机的知识图谱。

在一个示例中，所述根据所述知识图谱建立基于网络嵌入的神经网络，包括：

识别所述知识图谱的每个图谱节点具有的多个属性，将具有相同属性的所述图谱节点划分为一个独立的子图；

使用所述子图训练所述基于网络嵌入的神经网络，获得所述子图的图谱节点在所述指定向量空间的特征向量表示。

在一个示例中，所述根据所述特征向量之间的相关性，输出扫地机的执行动作，包括：

计算在多个所述子图中分别表示一个图谱节点的第一特征向量，以确定表示所述一个图谱节点的第二特征向量，所述第二特征向量反映所述一个图谱节点的多个所述属性；

计算所述第二特征向量之间的相似度，并将所述相似度与预先设置阈值进行比较，以输出扫地机的执行动作。

在一个示例中，所述使用所述子图训练所述基于网络嵌入的神经网络，获得所述子图的图谱节点在所述指定向量空间的特征向量表示，包括：

通过在所述子图中执行随机游走，生成相应的图谱节点序列；

使用所述图谱节点序列训练所述基于网络嵌入的神经网络，获得所述图谱节点序列对应的图谱节点在所述指定向量空间的特征向量表示。

在一个示例中，所述随机游走包括：

将指定的所述图谱节点在随机游走的指定游走距离内，按照所述图谱节点之间的边的权重和偏执，计算所述图谱节点之间的转移概率。

在一个示例中，还包括：

使用专家系统，至少结合所述知识图谱中的部分数据，根据当前扫地机的状态信息，输出专家系统计算的扫地机的执行动作；和/或

使用基于图像处理的神经网络，至少结合所述知识图谱中的部分数据，根据扫地机获取的图像，输出基于图像处理的神经网络计算的扫地机的执行动作。

在一个示例中，还包括：

将所输出的执行动作分别设置为贝叶斯网络节点；

根据所述贝叶斯网络节点，计算所输出的执行动作分别的置信度，根据所述置信度确定扫地机最终的执行动作。

在一个示例中，还包括：

根据扫地机的所述状态信息，确定当前扫地机的状态，所述扫地机的状态至少包括清扫状态、娱乐状态以及其它状态中的一种；若扫地机处于清扫状态，增大所述基于图像处理的神经网络输出的扫地机的执行动作的权重；若扫地机处于娱乐状态，增大所述基于网络嵌入的神经网络输出的扫地机的执行动作的权重；若扫地机处于其它状态，增大所述专家系统输出的扫地机的执行动作的权重；

若扫地机同时处于清扫状态和娱乐状态，判断扫地机的执行动作是否冲突，若不冲突，扫地机同时执行所述基于图像处理的神经网络输出的扫地机的执行动作、所述基于网络嵌入的神经网络输出的扫地机的执行动作；若冲突，扫地机执行基于网络嵌入的神经网络输出的扫地机的执行动作。

本发明的第二方面提供了一种基于知识图谱进行行为决策的智能扫地机，包括：机壳、控制芯片、移动轮、驱动电机、存储器，所述存储器用于存储电子指令，所述控制芯片通过执行所述电子指令，执行以下控制动作：

根据所述知识图谱建立基于网络嵌入的神经网络；

根据所述特征向量之间的相关性，输出扫地机的执行动作。

有益效果：

本发明解决了现有行为决策方案的维护成本高、规则冲突、系统不可解释性等技术问题。本发明将系统模块化、透明性，强化输出结果的可靠性，避免一些低级错误的发生；能够对整个决策的过程进行分析，了解出错在哪一个环节，从而找出解决办法和方案。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本发明基于知识图谱的智能扫地机行为决策方法的流程示意图；

图2为本发明知识图谱的示意图；

图3为本发明随机游走的示意图；

图4为本发明图谱节点序列特征学习网络结构示意图；

图5为本发明扫地机的行为决策系统框架示意图；

图6为本发明扫地机的行为决策示意图。

具体实施方式

为了更清楚的阐释本申请的整体构思，下面结合说明书附图以示例的方式进行详细说明。

根据本发明实施例的一个方面，本发明提供了一种基于知识图谱的智能扫地机行为决策方法，图1为本发明基于知识图谱的智能扫地机行为决策方法的流程示意图，如图所示，包括：

S101建立扫地机的知识图谱，所述知识图谱包括扫地机的状态信息、输入信息、执行动作信息；

S102根据所述知识图谱建立基于网络嵌入的神经网络；

S103通过将扫地机当前的状态信息、输入信息送至所述基于网络嵌入的神经网络，映射至指定向量空间内以特征向量表示；

S104根据所述特征向量之间的相关性，输出扫地机的执行动作。

本发明的实施例通过知识图谱以及基于网络嵌入的神经网络利用图论算法对知识进行建模，基于现有数据的再加工、结构化，再通过各种数据挖掘、信息抽取和知识融合技术形成一个统一的、逻辑上全局的知识图谱。相应的，本发明实施例还提供了基于知识图谱的扫地机行为决策方法，将扫地机接收的信息输入到神经网络中，执行实体映射和实体对齐操作，确定每个信号在实际世界中的实际含义，并将这些实际含义及相关的信息进行输出。

根据本发明的具体实施例，为了进一步提高知识图谱的准确性和实用性，本发明的一些实施例中使用半自动化加人工方法构建，由领域专家针对家居娱乐环境下扫地机的知识图谱做顶层设计，预先定义扫地机的输入信息、状态信息以及执行动作信息等类型，通过从百科网站上进行抓取信息，和/或通过数据仓库技术(Extract-Transform-Load，ETL)获取企业数据库内信息,以上述状态信息、输入信息以及执行动作信息，预先设置图谱节点与图谱节点之间的关系，再据此构建知识图谱。

图2为本发明知识图谱的示意图，如图所示，执行动作信息至少包括避障、清扫、收集、移动等，输入信息至少包括由扫地机主动或被动获取的各种媒体信息，其中，扫地机主动获取的媒体信息主要包括由图像传感器获取的图像信息，由距离传感器获取的距离信息等；扫地机被动获取的媒体信息主要包括语音指令和通过与扫地机连接的终端输入的控制/交互指令。具体而言，扫地在实际工作中，接收输入信息(如麦克风语音输入、摄像头图像输入、激光雷达距离输入等)时，需要根据不同的输入信息采取不同的行为决策。如：当接收到用户的语音指令“放音乐”时，扫地机需要执行放音乐行为；当接收到摄像头识别的图像信息为“瓜子壳垃圾”时，扫地机需要执行垃圾收集行为；当接收到激光雷达采集的距离信息为“前方20厘米有障碍物”时，扫地机需要执行避障行为。

根据本发明的具体实施例，根据知识图谱建立基于网络嵌入的神经网络，具体包括：识别知识图谱的每个图谱节点具有的多个属性，将具有相同属性的图谱节点划分为一个独立的子图；使用子图训练基于网络嵌入的神经网络，获得子图的图谱节点在指定向量空间的特征向量表示。通过将知识图谱依照属性划分为多个不同的子图，建立多个具有相同属性的图谱节点的关系。优选的，图3为本发明随机游走的示意图，如图所示，使用子图训练基于网络嵌入的神经网络，获得子图的图谱节点在指定向量空间的特征向量表示，还包括：通过在子图中执行随机游走，生成相应的图谱节点序列；使用图谱节点序列训练基于网络嵌入的神经网络，获得图谱节点序列对应的图谱节点在指定向量空间的特征向量表示。下面结合示例进行解释。

将构建好的知识图谱通过属性切分(假设属性数量为m)，分割为m个独立的子图。针对每个子图通过带偏执的随机游走策略生成相应节点序列S＝{u₁，u₂，...，u_n}。对于一个给定的源节点u，模拟一个固定长度为L的随机游走，u_j表示游走过程中的第j个节点，初始节点u₀＝u。节点u_j由概率分布生成，即：

其中，D表示知识图谱中边的集合，π_v，x是节点vv和xx之间的转移概率，Z是一个正则化参数。

如图3所示，随机游走遍历了边(v，x)，并停留在节点v。通过计算边(v，x)上的转移概率π_v，x来判断序列中的下一个图谱节点。计算公式为：

π_v，x＝α_pq(t，x)w_v，x；

其中，w_v，x是边上的权重，无权重时可设置一个默认值；α_pq(t，x)表示节点之间的边上的偏执，计算公式为：

其中，d_t，x∈(0，1，2)表示节点t，x之间的最小跳数。p，q是两个监督随机游走的参数。p可以控制重新访问当前节点的可能性。q允许在当前节点周围或者远离当前节点采样。通过设置合适的参数p，q可以使得采样在深度优先和广度优先之间达到平衡。

图4为本发明图谱节点序列特征学习网络结构示意图，如图所示，节点序列特征学习采用Node2Vec算法。按上述方法可以生成m个独立子图，以一个子图的节点序列为例，S＝{u₁，u₂，...，u_n}，利用基于网络嵌入的神经网络语言模型进行特征学习。目标函数为：

其中，E表示知识图谱中的节点集合；T^u表示从节点u开始生成的节点序列集合；N_t表示当前序列中节点的个数；

表示一个特征向量，由目标节点u_j的上下文节点组成。

的每一维都表示特定的上下文节点，形式上，用d维向量v_f∈R^d为序列中每一个节点建模，定义第f个节点的特征为一个d维向量v_f∈R^d。参数估计与求解过程与word2vec算法相似，通过反向传播获得误差梯度来更新模型参数，此处不再详述。

根据本发明的具体实施例，根据特征向量之间的相关性，输出扫地机的执行动作，包括：计算在多个子图中分别表示一个图谱节点的第一特征向量，以确定表示一个图谱节点的第二特征向量，第二特征向量反映一个图谱节点的多个属性；具体而言，根据上述节点特征学习，已经将知识图谱中的每个属性的节点映射到了同一个向量空间。因此可以对其进行算术平均，从而得到融合各个语义属性的表示行为和信号的第二特征向量，分别称为行为特征向量、信号特征向量：

其中，v(behavior)表示包含各个属性语义的行为特征向量，m表示行为特征的属性个数；v(signal)表示包含各个属性语义的信号特征向量，n表示信号特征的属性个数。

计算第二特征向量之间的相似度：

sim＝cos(v(behavior)，v(signal))；

可以得到相似度大小得分排序，并将相似度与预先设置阈值进行比较，以输出扫地机的执行动作。

根据本发明的具体实施例，图5为本发明扫地机的行为决策系统框架示意图，如图所示，端到端DL系统对应本发明实施例中的基于图像处理的神经网络，图谱推理网络对应本发明实施例中的基于网络嵌入的神经网络。扫地机中还嵌入有基于图像处理的神经网络和专家系统进行辅助决策。传统扫地机的行为决策采用基于规则的专家系统方法实现，基于人工维护知识库，如决策规则，让条件输入并输出相应的动作或结论的系统；或者是用和、或、非运算来复合输入、输出。但是专家系统的缺点在于：采访专家来建模所需时间较长，成本过高；知识库可能有错误，多条规则可能出现矛盾，从而造就脆弱系统。所以这种方法不适合单独用于构建扫地机自动行为的决策算法。另一种实现方法是采用基于图像处理的深度学习神经网络，该方法基于统计，适合于大数据时代，只需要大量训练就可以比较容易调校出可用的算法，因此专门用来处理复杂场景。但是深度学习受到的质疑点在于，此种方法一般是端到端的决策系统，计算过程不能被解释，没有透明度，无法调试错误。本发明实施例将扫地机的行为决策从相关推理变为因果推理，由基于规则的系统变为基于知识图谱的系统。

根据本发明的具体实施例，图6为本发明扫地机的行为决策示意图，如图6所示，系统将行为决策看作是利用当前状态信息(如坐标、工作状态等)，加上接受到的输入信息(语音输入、图像输入等)，对接下来的行为(清扫、放歌、静止等)进行决策判断的过程。为了简化问题，本发明实施例中将状态信息也看作一种信号输入。扫地机的行为状态是有限的，可以预先人为定义。而扫地机接下来的可执行行为也是有限的，由执行控制系统决定。即可以将扫地机的行为决策问题看作是如图6所示的决策行为状态机。

根据本发明的具体实施例，扫地机的决策方法还包括：使用专家系统，至少结合知识图谱中的部分数据，根据当前扫地机的状态信息，输出专家系统计算的扫地机的执行动作；专家系统通过一个有限状态自动机实现，它由有限个状态组成，当前状态接收事件，并产生相应的动作，引起状态的转移。状态、事件、转移、动作是有限状态机的四大要素。根据状态分解的连接逻辑，一般有串联式、并联式、混联式三种体系架构。

根据本发明的具体实施例，扫地机的决策方法还包括：使用基于图像处理的神经网络，至少结合知识图谱中的部分数据，根据扫地机获取的图像，输出基于图像处理的神经网络计算的扫地机的执行动作。基于图像处理的神经网络为端到端的深度学习系统，从大量的训练数据集中学习输入信号与决策行为之间的关联。通过直接输入由相机获得的各帧图像，经由神经网络决策后直接输出扫地机的行为决策结果。在本发明的一些优选的实施例中，实现方法包括长短期记忆网络(Long Short-Term Memory，LSTM)模型、卷积神经网络(Convolutional Neural Networks，CNN)模型等。

根据本发明的具体实施例，扫地机的行为决策方法还包括：将所输出的执行动作分别设置为贝叶斯网络节点；根据贝叶斯网络节点，计算所输出的执行动作分别的置信度，根据置信度确定扫地机最终的执行动作。具体而言，贝叶斯网络模块利用贝叶斯网络基本算法，将基于图像处理的神经网络、基于网络嵌入的神经网络、专家系统三者的结果判断，当作贝叶斯网络中的节点，从而进行计算，判断出置信度最高的结果。

在本发明的一些具体实施方式中，使用最优贝叶斯推理，将基于图像处理的神经网络、基于网络嵌入的神经网络和专家系统的决策结果进行加权平均。对于当前输入信号x,对于行为决策y_i∈Y有：

P(x，y_i)＝α*P_DL(x，y_i)+β*P_KG(x，y_i)+γ*P_ES(x，y_i)

其中，P_DL(x，y_i)表示基于图像处理的神经网络的预测结果，P_KG(x，y_i)表示基于网络嵌入的神经网络的预测结果，P_ES(x，y_i)表示专家系统预测结果，α，β，γ分别调节三个系统的输出结果占整体预测结果的比重，且α+β+γ＝1。并设定阈值，进而根据当前信号输入，判断下一步行为决策输出。

根据本发明的具体实施例，扫地机的行为决策方法还包括：根据扫地机的状态信息，确定当前扫地机的状态，扫地机的状态至少包括清扫状态、娱乐状态以及其它状态中的一种；若扫地机处于清扫状态，增大基于图像处理的神经网络输出的扫地机的执行动作的权重；若扫地机处于娱乐状态，增大基于网络嵌入的神经网络输出的扫地机的执行动作的权重；若扫地机处于其它状态，增大专家系统输出的扫地机的执行动作的权重；若扫地机同时处于清扫状态和娱乐状态，判断扫地机的执行动作是否冲突，若不冲突，扫地机同时执行基于图像处理的神经网络输出的扫地机的执行动作、基于网络嵌入的神经网络输出的扫地机的执行动作；若冲突，扫地机执行基于网络嵌入的神经网络输出的扫地机的执行动作。

根据本发明实施例的另一方面，本发明提供了一种基于知识图谱进行行为决策的智能扫地机，包括：机壳、控制芯片、移动轮、边刷、驱动电机、存储器，存储器用于存储电子指令，控制芯片通过执行电子指令，执行以下控制动作：

建立扫地机的知识图谱，知识图谱包括扫地机的状态信息、输入信息、执行动作信息；

根据知识图谱建立基于网络嵌入的神经网络；

通过将扫地机当前的状态信息、输入信息送至基于网络嵌入的神经网络，映射至指定向量空间内以特征向量表示；

根据特征向量之间的相关性，输出扫地机的执行动作。

具体的实现过程参见上述内容，在此不做赘述。

综上所述，本发明的实施例针对家居生活娱乐场景的扫地机的知识图谱、基于图像处理的神经网络、专家系统、基于网络嵌入的神经网络均作为一个子模块融入到系统中，基于图像处理的神经网络、专家系统、基于网络嵌入的神经网络均可直接使用知识库中的知识辅助计算。本发明解决了现有行为决策方案的维护成本高、规则冲突、系统不可解释性等技术问题。本发明将系统模块化、透明性，强化输出结果的可靠性，避免一些低级错误的发生；能够对整个决策的过程进行分析，了解出错在哪一个环节，从而找出解决办法和方案。

本发明实施例本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请中。

Claims

1.一种基于知识图谱的智能扫地机行为决策方法，其特征在于，包括：

根据所述知识图谱建立基于网络嵌入的神经网络；

根据所述特征向量之间的相关性，输出扫地机的执行动作。

2.根据权利要求1所述的方法，其特征在于，所述建立扫地机的知识图谱，包括：

根据预先定义的扫地机的状态信息、输入信息以及执行动作信息，预先设置图谱节点与图谱节点之间的关系，以构成扫地机的知识图谱。

3.根据权利要求1所述的方法，其特征在于，所述根据所述知识图谱建立基于网络嵌入的神经网络，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述特征向量之间的相关性，输出扫地机的执行动作，包括：

5.根据权利要求3所述的方法，其特征在于，所述使用所述子图训练所述基于网络嵌入的神经网络，获得所述子图的图谱节点在所述指定向量空间的特征向量表示，包括：

6.根据权利要求5所述的方法，其特征在于，所述随机游走包括：

7.根据权利要求1所述的方法，其特征在于，还包括：

8.根据权利要求7所述的方法，其特征在于，还包括：

将所输出的执行动作分别设置为贝叶斯网络节点；

9.根据权利要求7所述的方法，其特征在于，还包括：

10.一种基于知识图谱进行行为决策的智能扫地机，包括：机壳、控制芯片、移动轮、驱动电机、存储器，所述存储器用于存储电子指令，其特征在于，所述控制芯片通过执行所述电子指令，执行以下控制动作：

根据所述知识图谱建立基于网络嵌入的神经网络；

根据所述特征向量之间的相关性，输出扫地机的执行动作。