CN112597285B

CN112597285B - 一种基于知识图谱的人机交互方法及系统

Info

Publication number: CN112597285B
Application number: CN202011454372.3A
Authority: CN
Inventors: 韩国权; 黄海峰; 邱张华; 周伟
Original assignee: Taiji Computer Corp Ltd
Current assignee: Taiji Computer Corp Ltd
Priority date: 2020-12-10
Filing date: 2020-12-10
Publication date: 2021-08-10
Anticipated expiration: 2040-12-10
Also published as: CN112597285A

Abstract

本发明公开了一种基于知识图谱的人机交互的方法及系统，所述方法包括：对样本知识进行分类，构建分领域知识数据的聚类；对聚类后的知识数据，采用TransE算法将分类领域库中的知识以三元组的形式，构建有向知识图谱；通过将串行的处理方式改成网络并行处理，同时提取主题分类和融合历史会话信息，借助知识图谱中的概率知识，筛选用户真实意图进行判断，从而提高了人机交互信息的查询效率。

Description

一种基于知识图谱的人机交互方法及系统

技术领域

本发明涉及人工智能领域，具体适用于基于知识图谱的人机交互方法和系统。

背景技术

近年来，随着人工智能技术的发展，知识图谱这一技术与生活中的应用越来越近了。在各个领域都有所应用，比如机器人的人工对话，智能客户电话的机器问答等。知识图谱作为一种语义网络，可以用来表现复杂演化的实体语义关系。知识图谱拥有极强的表达能力和建模灵活性：首先，知识图谱是一种语义表示，可以对现实世界中的实体、概念、属性以及它们之间的关系进行建模；其次，知识图谱是其衍生技术的数据交换标准，其本身是一种数据建模的“协议”，相关技术涵盖知识抽取、知识集成、知识管理和知识应用等各个环节。

知识图谱之中涉及到了数据存储和处理模块两部分。现有的人机相互系统，大部分都集中在知识图谱的存储、查询和更新在内的数据管理模块，如何管理一个可更新的超大规模稀疏三阶张量。通常是将知识图谱数据的主语、谓词和宾语三个部分分别看作三个维度，每一个维度上的取值范围即知识图谱中对应位置出现的所有值，那么整个数据集就可以被一个稀疏的三阶张量表示，进而将知识图谱的存储问题也可以转换为对这个三阶张量的压缩和索引。这个三阶张量非常稀疏且分布不均匀，其中主语和宾语这两维的数量大，可以达到十亿量级，而谓词通常在几千到上万的量级。

目前而言，快速，高效，且准确地在基于如此巨大的知识图谱中辅助找到适合的信息成为研究的热点，同时如何与现有的适合知识图谱构造的应用场景如法院审判系统和合同智能审核等相结合，从而提高处理效率等也受到广泛关注。

发明内容

为解决上述技术问题至少之一，本发明提出一种人机交互的方法及系统，将串行的处理方式改成网络并行处理，同时提取主题分类和融合历史会话信息，借助知识图谱中的概率知识，筛选用户真实意图进行判断，从而提高了人机交互信息的反馈的高效和快捷。

所述方法包括：步骤S01，对训练样本知识进行分类，构建分领域知识数据的聚类；步骤S02，对聚类后的知识数据，采用TransE算法将分类领域库中的知识以三元组的形式，构建有向知识图谱；步骤S03，解析获得的会话信息，获取其中的话题分类，依据该话题分类与知识分类的聚类信息的匹配度，获得对应的知识图谱，依据该知识图谱，响应于该会话信息进行输出。

进一步，所述聚类，采用k-means聚类，首先使用映射操作并行地将原始知识数据转换为可聚类的格式，给不同服务器分配互不重复的知识数据，每个服务器根据给定的k值随机选取k个知识数据作为初始聚类中心，并对其按照顺序编号，对知识数据进行初始划分，得到k个聚类作为初始聚类中心后，对每个知识数据执行划分和下述迭代操作：每个服务器在映射阶段分别读出位于本地的知识数据，并计算每个知识数据到各初始聚类中心的距离，将其归属到最近的初始聚类中心，该步骤操作是并行进行的，再将本次聚类结果在缩减过程中返回；

缩减过程是得到所有知识数据的聚类结果，并对各服务器聚类结果进行合并后，在每个新的聚类中选取权值最大的知识数据作为新的聚类中心；

重复执行上述映射和缩减操作，直到聚类中心不再变化或达到最大迭代次数时，结束迭代，并输出每个知识数据归属的聚类信息。

进一步，所述话题分类中包括主话题和子话题，所述知识图谱中的数据包含主话题和子话题之间的关联度。

进一步，在人机交互会话时时，可以采用神经网络算法结合知识图谱进行输出。

进一步，所述神经网络算法是RNN算法或LSTM算法。

进一步，所述人机会话时，依据当前会话和历史会话信息的相关程度，决定是否在神经网络算法中引入历史参考信息。

进一步，所述人机会话时的主题提取，依据当前会话和历史会话信息进行分类，提取。

进一步，所述人机会话时，在会话意图主题不明确时，依据知识图谱的信息进行补充确认。

还提供一种基于知识图谱的人机交互系统，所述系统包括人机交互装置，所述人机交互装置包括处理器和存储器，所述存储器上存储有计算机程序，所述处理器处理上述计算机程序以执行方法。

还提供一种计算机存储介质，所述计算机存储介质上，存储有计算机程序，所述计算机程序被处理器执行，以实现方法。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是知识图谱的功能架构示意图；

图2是本申请方法的流程示意图；

图3是人机交互装置的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

如图1所示知识图谱的一种功能架构逻辑示意图，知识图谱作为一种语义网络，可以用来表现复杂演化的实体语义关系。知识图谱拥有极强的表达能力和建模灵活性：将多个词组的语义结果结合知识图谱，分析多个词组的内在关系和/或逻辑关系，生成文字信息的语义理解结果。

首先，知识图谱作为一种带标记的有向属性图，其中每个结点都有若干个属性和属性值，实体与实体之间的边表示的是结点之间的关系，边的指向方向表示了关系的方向，而边上的标记表示了关系的类型。其次，知识图谱是一种人类可识别且对机器友好的知识表示。知识图谱采用了人类容易识别的字符串来标识各元素；同时，图数据表示作为一种通用的数据结构，可以很容易地被计算机识别和处理。再次，知识图谱自带语义，蕴涵逻辑含义和规则。知识图谱中的结点对应现实世界中的实体或者概念，每条边或属性也对应现实中的一条知识。在所述知识图谱数据库中，每一个话题都是所述知识图谱里的一个或几个实体，所述知识图谱数据库包含话题与话题之间的相关度和联系。在此之上，我们可以根据定义的规则，推导出知识图谱数据中没有明确给出的知识。从而给予查询或交互的用户以回应。

所述的知识图谱表示框架和查询语言：资源描述框架(Resource DescriptionFramework，RDF)和SPARQL查询语言(SPARQL Protocol and Query Language，SPARQL)。其将资源描述框架中的基本元素格式为：<主，谓，宾>或<s，p，o>。它采用主语、谓词和宾语的方式来表示和陈述一条知识，这种表示方式简单且灵活。由于资源描述框架的英文缩写为RDF，知识图谱数据集也经常被称为RDF数据集，而其管理工具通常被称为RDF Store或Triple Store。RDF数据可以分为两个部分：显式三元组和隐含三元组。规则可作用于显式三元组，也可用于推导隐含的三元组。

所述的隐含语义信息处理基于规则的推理将增加存储、查询代价。处理方法分为两类：在在查询时，按照将推理规则将一个查询重写成多个查询，将多个词组的语义结果结合知识图谱中的知识，分析多个词组的内在关系和/或逻辑关系，生成文字信息的语义理解结果，最后汇总查询结果。

如图2所示，可选的，采用TransE算法模型将知识库中的知识以三元组形式进行表示，模型的基本思想是不断调整头实体h嵌入向量与关系向量r的方向，使二者矢量和与尾实体向量t近似相等，通过定义一个距离函数，可以是欧几里得距离，表示调整过程中的能量。由于向量具有空间平移不变特性，故TransE算法中同类型的关系向量，可在向量空间中进行平移重复利用，算法模型训练过程中采用了支持向量机当中的最大间隔法对目标函数进行最小化，目标函数的优化采用随机梯度下降法。

可选的，最大间隔法的目标函数：

其中，S是知识库中的三元组，S′是负采样的三元组，通过替换h或t所得；γ是取值大于0的间隔距离参数；梯度更新只需计算距离d(h+r，t)和d(h′+r，t′)；采用梯度下降法，使得损失函数达到最优；当模型训练完成后，得到实体和关系的向量表示；

具体优化过程是：先将所有实体和关系向量初始化，在每一次算法迭代之前，将归一化实体进行向量嵌入工作。接下来从训练集当中抽取部分三元组进行训练，并依次选取每个元组通过负采样进行取样，得到一个错误元组，使用一个确定的学习率去进行参数的梯度更新。可选的将训练样本执行分割，分给成k份，其中选择k-1分用于算法模型的训练。

可选的，构建三元组处理之前，对所述的训练集知识进行分类，构建知识领域和知识图谱之间的关系，采用，k-means聚类，首先使用映射操作并行地将原始知识数据转换为可聚类的格式，并给不同服务器分配互不重复的知识数据，这个操作步骤是用一个映射操作并行执行的，且每个服务器根据给定的k值随机选取k个知识数据作为初始聚类中心，并对其按照顺序编号，对这些知识数据进行初始划分，得到k个聚类(Cluster)作为初始聚类中心后，同时开始对每个知识数据执行划分和下述迭代操作：每个服务器在映射阶段分别读出位于本地的知识数据，并计算每个知识数据到各初始聚类中心的距离，即关系度，将其归属到最近的初始聚类中心，该步骤操作是并行进行的，再将本次聚类结果在缩减过程中返回。

缩减过程是得到所有知识数据的聚类结果，并对各服务器聚类结果进行合并后，在每个新的聚类中选取权值最大的知识数据作为新的聚类中心。

重复执行上述映射和Reduce(缩减)操作，直到聚类中心不再变化或达到最大迭代次数时，结束迭代，并输出每个知识数据归属的聚类信息。

在获取到不同知识领域的聚类信息之后，可选的，也可以采用分层分类技术，采用分层分类的技术把深度学习模型结合起来，对自然语言进行意图识别，该识别结合聚类的信息，准备判断出用户的意图信息。在会话中，采用获取用户的语言信息，语句的基本元素格式为：<主，谓，宾>或<s，p，o>。它采用主语、谓词和宾语的方式来表示和陈述的语句。

进一步，通过知识图谱查询获取到其所属的主话题和子话题，然后将该特定词汇对应的主话题和子话题作为当前人机交互的话题信息。在所述知识图谱数据库中，每一个话题都是所述知识图谱里的一个或几个实体，所述知识图谱数据库包含话题与话题之间的相关度和联系。

可选的，可以在解析出人机交互信息中的特定词汇后，首先将该特定词汇与之前对话出现的特定词汇进行比对，判断该特定词汇是否为首次出现，若为首次出现，则判断为是话题。上述交互信息是通过语义分析模块等进行的。

则该主话题和/或子话题之下，使用类似神经网络的深度学习算法，进行分类学习输出，可选的可以采用RNN算法或LSTM网络。在人机交互对话时，获取当前对话而历史存储信息中的相关度，从而防止当前对话和意图关联不密切时，而直接输入增加神经网络的噪声，导致处理效率的缓慢的。当前会话的u和历史信息中的mi的相关程度通过两个向量之间的内积表示，历史信息中的会话与当前对话的相关程度值的h；在神经网络算法的输入中是否引入历史参考信息，可采用如下公式判断是否需要历史话语信息，sig(x)＝1/1+e^-x

g＝sig(Wg*[u，h])，通过该函数产生一个0到1之间的g，当g接近0时，表示意图识别不需要参考历史信息，当g接近1，表示意图识别需要参考当前信息，Wg为加权系数，可为对角矩阵

在会话中，通过把上述对话提取特点关键词主题知识图谱查询的方式，将对话向量u和历史向量h结合进行分类，函数设置为sig(x)，使得预测概率限定在(0，1)之间，得到预测标签向量o，其维度为标签集合大小，公式如下o＝sig(W。*[u+gh])。Wo为加权系数，可为对角矩阵，*符号为向量元素相乘。

如上，采用不同聚类的方式，可以将原本串行计算过程，分配给不同的服务器进行并行计算，也极大地简化了分布式计算的底层复杂性，并向用户提供一个简单、可靠的应用接口。会话的意图识别，采用外部记忆网络结合注意力机制能够更好的利用抽样的样本话题分类，辅助识别当前会话的意图。

实施例2

基于实施例1的方法，可选的，在分析所述使用者的意图，并结合预先建立的多种类型的知识图谱与所述使用者进行交互，所述多种类型的知识图谱为根据不同领域的知识建立的知识图谱。

可选的多种类型的知识图谱包括通用事实知识图谱、常识知识图谱、个人知识图谱和服务和任务场景图谱。

在会话过程中，会出现会话语义分类意图不明确的情形，即可在语义知识图谱中，匹配得到的结果比较多。此时，需要借助于用户的历史会话信息和语义分类，进行补充可选的可将补充的信息，发送给客户以确认，也可以直接根据概率等直接选取补充的信息，进行输入或输出，通过依据用户输入的上下文信息和对应领域的相关知识图谱库中数据的关联和分类信息，对用户输入的会话信息进行歧义判断，若会话语义仅仅在语义知识图谱库中存在，而无其他义项，或语义在语义知识图谱库中不存在，则可以认为该语义不是一个歧义词项，因此不需要对该语义进行歧义澄清。

可选的，所述补充信息，会话语义信息是基于马尔科夫链的补充，基于马尔科夫逻辑网结构和参数。根据用户输入会话信息，系统对语句分析并进行激活，在知识图谱中，给定的知识库K(k1，k2，Λ，kn)，其中ki为事实三元组数据；抽取知识库中的所有关系，构成关系集合R(r1，r2，Λ，rn)；对于每个关系ri，抽取ri所对应的三元组集合Vi(v1，v2，Λ，vn)，使用Vi中的事实三元组数据构建无向图模型的关系子图Gi，采用近似推演和用户交互的方式诊断会话信息，获得候选应答信息及其后验概率，最终选取预设数目的应答信息作为分析结果并输出。

可选的，基于历史话信息中，可以存储有该历史会话信息ID的个人知识图谱信息，当该使用者在进行不同的信息输入时，可以根据该ID的个人信息的先验画像信息，进行主题领域的识别。进而根据三元组的方式，采用实体A-关系-实体B、实体A-属性-属性值这样的三元组来表征事实，结合知识图谱的有向图中的权重，子图模式挖掘领域(子话题或子领域)意图所对应元组之间隐含的依存关系，生成有用的赋值权重的诊断逻辑。从而执行不完整信息或歧义信息的补充。

本领域技术人员知晓，上述会话主要是基于计算机流程中session的含义，主要是体现出计算机交互中的流程中的相互交互。

实施例3

实施例1，2可应用的场景，可选的上述方法和系统可以应用法院审判中，依据法律知识图谱提取相关案情要素数据，把每个案件的案情要素数据组合为案情特征数组，对案情特征数组中的数据进行归一化，之后采用多维向量算法分别计算各个案件与目标案件的向量距离，距离最短的即为相似度最高的案例，依次原理由“法律知识图谱+挖掘算法+案情要素数据”构建为相似案例模型。

案情研判推送分析平台以知识图谱为核心，基于实体识别和概念认知技术构建法律认知引擎，对融合后的结构化和半结构化案件数据资源进行知识认知与挖掘分析，从而发掘案件审判特征，可依据用户输入的会话信息，即案件审判特征，并进行信息的补充，实现对在办案件进行分析匹配，自动推送适宜的案情分析、法律条款、相似案例、判决参考等信息。

上述补充信息的推理，可以采用基于神经网络的推理：利用神经网络直接建模知识图谱事实元组，得到事实元组元素的向量表示，用于进一步的推理。也可以采用混合推理的模式，采用混合规则与分布式表示以及混合神经网络与分布式表示的推理。

如图3所示，基于如上所述的示例，在一个实施例中还提供一种计算机设备/或系统，该计算机设备/系统包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，处理器执行所述程序时实现如上述各实施例中的任意一种方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性的计算机可读取存储介质中，如本发明实施例中，该程序可存储于计算机系统的存储介质中，并被该计算机系统中的至少一个处理器执行，以实现包括如上述各视频播放方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

据此，还提供一种存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现如上述各实施例中的任意一种方法。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种基于知识图谱的人机交互方法，其特征在于：所述方法包括：

步骤S01，对样本知识进行分类，构建分领域知识数据的聚类；

步骤S02，对聚类后的知识数据，采用TransE算法将分类领域库中的知识以三元组的形式，构建知识图谱；其中，采用TransE算法将分类领域库中的知识以三元组形式，构建知识图谱，包括：不断调整头实体h嵌入向量与关系向量r的方向，使二者矢量和与尾实体向量t近似相等，定义一个欧几里得距离，表示调整过程中的能量；根据向量具有空间平移不变特性，将TransE算法中同类型的关系向量，在向量空间中进行平移重复利用，TransE算法训练过程中采用支持向量机当中的最大间隔法对目标函数进行最小化，目标函数的优化采用随机梯度下降法；

步骤S03，解析获得的会话信息，获取其中的话题分类，依据该话题分类与知识分类的聚类信息的匹配度，获得对应的知识图谱，依据该对应的知识图谱，响应于该会话信息进行输出；

所述依据对应的知识图谱，响应于该会话信息进行输出中采用神经网络算法结合知识图谱执行输出，包括：根据历史会话信息与当前会话信息的相关程度值；确定是否在神经网络算法的输入中引入参考历史会话信息；

sig(x)=1/（1+e^-x）

通过函数，g=sig（Wg*[u，h]）产生一个0到1之间的g，当g接近0时，表示意图识别不需要参考历史会话信息，当g接近1，表示意图识别需要参考当前会话信息，Wg为加权系数，其为对角矩阵；其中 [u, h]表示两个向量的内积，u是当前对话向量，h是历史会话向量；

在会话主题意图不明确时，依据知识图谱的做信息补充，所述信息补充基于马尔科夫链；根据用户输入会话信息，在知识图谱中给定分类领域知识库K(k1，k2，Λ，kn)，其中ki为事实三元组数据；抽取分类领域知识库中的所有关系，构成关系集合R(r1，r2，Λ，rn)；对于每个关系ri，抽取ri所对应的三元组集合Vi(v1，v2，Λ，vn)，使用Vi中的事实三元组数据构建无向图模型的关系子图Gi，采用近似推演和用户交互的方式诊断会话信息，获得候选应答信息及其后验概率，最终选取预设数目的应答信息作为分析结果并输出；

其中，所述聚类采用k-means聚类，首先使用映射操作并行地将原始知识数据转换为可聚类的格式，给不同服务器分配互不重复的知识数据，每个服务器根据给定的k值随机选取k个知识数据作为初始聚类中心，并对其按照顺序编号，对知识数据进行初始划分，得到k个聚类作为初始聚类中心后，对每个知识数据执行划分和下述迭代操作：每个服务器在映射阶段分别读出位于本地的知识数据，并计算每个知识数据到各初始聚类中心的距离，将其归属到最近的初始聚类中心，该步骤操作是并行进行的，再将本次聚类结果在缩减过程中返回；

其中缩减过程是得到所有知识数据的聚类结果，并对各服务器聚类结果进行合并后，在每个新的聚类中选取权值最大的知识数据作为新的聚类中心；重复执行上述映射和缩减操作，直到聚类中心不再变化或达到最大迭代次数时，结束迭代，并输出每个知识数据归属的聚类信息。

2.如权利要求1所述的方法，其特征在于，所述话题分类中包括主话题和子话题，所述知识图谱中的数据包含主话题和子话题之间的关联度。

3.如权利要求2所述的方法，其特征在于，所述神经网络算法是RNN算法或LSTM算法。

4.一种基于知识图谱的人机交互系统，所述系统包括人机交互装置，所述人机交互装置包括处理器和存储器，所述存储器上存储有计算机程序，所述处理器处理上述计算机程序以执行权利要求1-3任一所述的方法。

5.一种计算机存储介质，所述计算机存储介质上，存储有计算机程序，所述计算机程序被处理器执行，以实现权利要求1-3任一所述的方法。