CN111552880B

CN111552880B - 基于知识图谱的数据处理方法、装置、介质及电子设备

Info

Publication number: CN111552880B
Application number: CN202010365862.XA
Authority: CN
Inventors: 马勇强; 许翔; 刘卉芸; 杨杰; 罗晓华
Original assignee: Hangzhou Netease Zaigu Technology Co Ltd
Current assignee: Hangzhou Netease Zaigu Technology Co Ltd
Priority date: 2020-04-30
Filing date: 2020-04-30
Publication date: 2023-06-30
Anticipated expiration: 2040-04-30
Also published as: CN111552880A

Abstract

本发明的实施方式提供了一种基于知识图谱的数据处理方法、装置、介质及电子设备，涉及自然语言处理技术领域。该方法包括：获取用户问题，并将与用户问题对应的标准问题确定为用户标准问题；对用户标准问题进行分解处理，获得对应的目标语义知识，并获取目标语义知识中的目标知识要素；根据目标知识要素从知识图谱中确定与用户标准问题关联的目标知识实体；根据目标知识实体确定与用户问题对应的关联问题。本发明实施例的技术方案在用户会话中，可以根据用户的最新问题实时动态地做出相关业务问题的推荐，通过即时捕捉用户的相关意图，提高用户的问题解决率。

Description

基于知识图谱的数据处理方法、装置、介质及电子设备

技术领域

本发明的实施方式涉及自然语言处理技术领域，更具体地，本发明的实施方式涉及基于知识图谱的数据处理方法、基于知识图谱的数据处理装置、计算机可读存储介质及电子设备。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

随着互联网技术的普及，互联网已经渗透至人们生活的方方面面，例如，越来越多的人们进行网络购物、网络直播、网络学习等活动。在一些网络客服平台中，当用户想要了解某些业务问题时，可以通过用户界面输入自己的业务问题，网络客服平台将把根据这些业务问题得到的反馈信息推送至用户。

在现有的技术方案中，一些相关技术是更多地是关心用户问题对应的问题答案，而不涉及问题推荐。另一相关技术是根据用户进入问答系统的不同入口和不同用户各自的当前状态，直接将固定的反馈信息推送给用户。

发明内容

但是，在某些应用场景下，当用户通过客服系统输入某些问题时，有时希望客服系统根据输入的用户问题，向用户推荐与之相关的其他业务问题。然而，第一种相关技术往往仅关心用户当前问题本身的回答，并未向用户推荐问题。第二种相关技术根据用户进入问答系统的不同入口和不同用户各自的当前状态将固定的问题推送给用户，无法动态调整问题推荐的内容，无法及时捕捉用户的相关意图，即无法根据用户在多轮会话中的不同用户问题及时调整并确定用户的当前意图。

由此，在现有技术中，缺乏一种根据用户在问答会话中输入的当前问题实时调整向用户推荐的相关问题的方法。

为此，非常需要一种改进的基于知识图谱的数据处理方法，以使在用户会话中，可以根据用户的最新问题实时动态地做出相关业务问题的推荐，可以即时捕捉用户的相关意图，提高用户的解决率。

在本上下文中，本发明的实施方式期望提供一种基于知识图谱的数据处理方法、基于知识图谱的数据处理装置、计算机可读存储介质及电子设备。

在本发明实施方式的第一方面中，提供了一种基于知识图谱的数据处理方法，包括：获取用户问题，并将与用户问题对应的标准问题确定为用户标准问题；对用户标准问题进行分解处理，获得对应的目标语义知识，并获取目标语义知识中的目标知识要素；根据目标知识要素从知识图谱中确定与用户标准问题关联的目标知识实体；根据目标知识实体确定与用户问题对应的关联问题。

在本发明的一个实施例中，在获取用户问题之前，所述方法还包括：确定候选标准问题集合；其中，所述候选标准问题集合包括候选标准问题；对所述候选标准问题进行知识表示转化处理，以生成所述候选标准问题的知识表示；根据所述知识表示构建所述知识图谱。

在本发明的一个实施例中，对所述候选标准问题进行知识表示转化处理，以生成所述候选标准问题的知识表示，包括：对所述候选标准问题进行分解处理，生成所述候选标准问题的语义知识；根据所述语义知识确定所述候选标准问题的问题要素和知识要素；其中，所述知识要素包括业务词、业务相关词、类目和问题类型中的至少一种；根据所述知识要素生成所述候选标准问题的知识实体；根据所述问题要素生成所述候选标准问题的候选问题实体，并确定所述候选标准问题的知识实体与所述候选问题实体之间的第一关联权重；根据所述第一关联权重生成所述候选标准问题的知识表示。

在本发明的一个实施例中，确定所述候选标准问题的知识实体与所述候选问题实体之间的第一关联权重，包括：确定所述业务词的业务优先级；获取历史查询数据；其中，所述历史查询数据包括所述候选标准问题的查询热度；根据所述业务优先级和所述查询热度确定所述第一关联权重。

在本发明的一个实施例中，根据所述目标知识要素从知识图谱中确定与所述用户标准问题关联的目标知识实体，包括：根据所述目标知识要素从所述知识图谱中确定与所述目标知识要素对应的目标知识表示；根据所述目标知识表示确定与所述用户标准问题关联的目标知识实体。

在本发明的一个实施例中，根据所述目标知识实体确定与所述用户问题对应的关联问题，包括：确定与所述目标知识实体相关联的第一问题实体；确定所述第一问题实体包括的问题要素为所述用户问题对应的关联问题。

在本发明的一个实施例中，所述第一问题实体的数量为多个，所述方法还包括：确定各所述第一问题实体的第一访问次数以及各所述第一问题实体与所述目标知识实体之间的第二关联权重；基于所述目标知识实体确定所述用户标准问题对应的标准问题实体，并确定各所述第一问题实体与所述标准问题实体之间的第一实体距离和第一公共邻居数量；根据所述第一访问次数、所述第二关联权重、所述第一实体距离和所述第一公共邻居数量对各所述第一问题实体进行排序处理，并确定经过排序处理获取的第一问题实体包括的问题要素为所述用户问题对应的关联问题。

在本发明的一个实施例中，所述用户问题的数量为多个，则所述用户标准问题的数量为多个，所述目标知识实体的数量为多个，所述第一问题实体的数量为多个，所述方法还包括：获取各所述用户问题分别对应的会话轮次编号；根据所述会话轮次编号确定各所述用户问题对应的各所述第一问题实体分别对应的第一权重；根据所述第一权重确定各所述用户问题对应的各所述目标知识实体在每轮会话中分别对应的会话轮次权重；结合所述会话轮次权重对确定出的多个所述第一问题实体进行排序处理，并确定经过排序处理获取的第一问题实体包括的问题要素为所述用户问题对应的关联问题。

在本发明的一个实施例中，结合所述会话轮次权重对确定出的多个所述第一问题实体进行排序处理，包括：确定各所述第一问题实体的第一访问次数；根据所述目标知识实体确定各所述用户标准问题对应的各标准问题实体，并确定各所述第一问题实体与各所述标准问题实体之间的第一实体距离和第一公共邻居数量；对各所述会话轮次权重进行加和处理，得到所述目标知识实体与所述第一问题实体之间的第三关联权重；根据所述第一访问次数、所述第一实体距离、所述第一公共邻居数量和所述第三关联权重对多个所述第一问题实体进行排序处理。

在本发明实施方式的第二方面中，提供了一种基于知识图谱的数据处理装置，包括：标准问题确定模块，用于获取用户问题，并将与所述用户问题对应的标准问题确定为用户标准问题；知识要素获取模块，用于对所述用户标准问题进行分解处理，获得对应的目标语义知识，并获取所述目标语义知识中的目标知识要素；知识实体确定模块，用于根据所述目标知识要素从知识图谱中确定与所述用户标准问题关联的目标知识实体；关联问题确定模块，用于根据所述目标知识实体确定与所述用户问题对应的关联问题。

在本发明的一个实施例中，基于知识图谱的数据处理装置还包括知识图谱构建模块，所述知识图谱构建模块包括：问题集合确定单元，用于确定候选标准问题集合；其中，所述候选标准问题集合包括候选标准问题；知识表示生成单元，用于对所述候选标准问题进行知识表示转化处理，以生成所述候选标准问题的知识表示；知识图谱构建单元，用于根据所述知识表示构建所述知识图谱。

在本发明的一个实施例中，所述知识表示生成单元包括：问题分解子单元，用于对所述候选标准问题进行分解处理，生成所述候选标准问题的语义知识；要素确定子单元，用于根据所述语义知识确定所述候选标准问题的问题要素和知识要素；其中，所述知识要素包括业务词、业务相关词、类目和问题类型中的至少一种；实体生成子单元，用于根据所述知识要素生成所述候选标准问题的知识实体；权重确定子单元，用于根据所述问题要素生成所述候选标准问题的候选问题实体，并确定所述候选标准问题的知识实体与所述候选问题实体之间的第一关联权重；知识表示生成子单元，用于根据所述第一关联权重生成所述候选标准问题的知识表示。

在本发明的一个实施例中，所述权重确定子单元被配置为：确定所述业务词的业务优先级；获取历史查询数据；其中，所述历史查询数据包括所述候选标准问题的查询热度；根据所述业务优先级和所述查询热度确定所述第一关联权重。

在本发明的一个实施例中，所述知识实体确定模块被配置为：根据所述目标知识要素从所述知识图谱中确定与所述目标知识要素对应的目标知识表示；根据所述目标知识表示确定与所述用户标准问题关联的目标知识实体。

在本发明的一个实施例中，所述关联问题确定模块被配置为：确定与所述目标知识实体相关联的第一问题实体；确定所述第一问题实体包括的问题要素为所述用户问题对应的关联问题。

在本发明的一个实施例中，所述基于知识图谱的数据处理装置还包括第一问题排序模块，所述第一问题排序模块被配置为：确定各所述第一问题实体的第一访问次数以及各所述第一问题实体与所述目标知识实体之间的第二关联权重；基于所述目标知识实体确定所述用户标准问题对应的标准问题实体，并确定各所述第一问题实体与所述标准问题实体之间的第一实体距离和第一公共邻居数量；根据所述第一访问次数、所述第二关联权重、所述第一实体距离和所述第一公共邻居数量对各所述第一问题实体进行排序处理，并确定经过排序处理获取的第一问题实体包括的问题要素为所述用户问题对应的关联问题。

在本发明的一个实施例中，所述基于知识图谱的数据处理装置还包括第二问题排序模块，所述第二问题排序模块被配置为：获取各所述用户问题分别对应的会话轮次编号；根据所述会话轮次编号确定各所述用户问题对应的各所述第一问题实体分别对应的第一权重；根据所述第一权重确定各所述用户问题对应的各所述目标知识实体在每轮会话中分别对应的会话轮次权重；结合所述会话轮次权重对确定出的多个所述第一问题实体进行排序处理，并确定经过排序处理获取的第一问题实体包括的问题要素为所述用户问题对应的关联问题。

在本发明的一个实施例中，所述第二问题排序模块还包括第二问题排序单元，所述第二问题排序单元被配置为：确定各所述第一问题实体的第一访问次数；根据所述目标知识实体确定各所述用户标准问题对应的各标准问题实体，并确定各所述第一问题实体与各所述标准问题实体之间的第一实体距离和第一公共邻居数量；对各所述会话轮次权重进行加和处理，得到所述目标知识实体与所述第一问题实体之间的第三关联权重；根据所述第一访问次数、所述第一实体距离、所述第一公共邻居数量和所述第三关联权重对多个所述第一问题实体进行排序处理。

在本发明实施方式的第三方面中，提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述所述的基于知识图谱的数据处理方法。

在本发明实施方式的第四方面中，提供了一种电子设备，包括：处理器；以及存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现如上述所述的基于知识图谱的数据处理方法。

根据本发明实施方式的技术方案，一方面，可以将用户问题经过相似度匹配，得到对应的用户标准问题，从知识图谱中确定出细粒度的语义知识，根据语义知识对应的知识要素确定出与用户标准问题相关的其他问题，可以实现动态地根据用户问题做出基于知识关联性的业务问题推荐。另一方面，基于知识图谱并根据用户问题确定出与用户问题相关的其他业务问题，确定出的关联问题具有较强的相关性，可以提高用户满意度，并提高问题解决率。

附图说明

通过参考附图阅读下文的详细描述，本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若干实施方式，其中：

图1示意性地示出了根据本发明的一些实施例的示例性应用场景的系统架构的示意框图；

图2示意性地示出了根据本发明的一些实施例的基于知识图谱的数据处理方法的流程示意图；

图3示意性地示出了根据本发明的一些实施例的构建知识图谱的流程示意图；

图4示意性地示出了根据本发明的一些实施例的一个标准问题对应的知识表示的示意图；

图5示意性地示出了根据本发明的一些实施例的根据候选标准问题构建的知识图谱的部分示意图；

图6示意性地示出了根据本发明的一些实施例的当用户会话中仅有一个用户问题时从知识图谱中确定关联问题的示意图；

图7示意性地示出了根据本发明的一些实施例的当用户会话中有多个用户问题时从知识图谱中确定关联问题的示意图；

图8示意性地示出了根据本发明的一些实施例的基于知识图谱的数据处理方法确定用户问题的关联问题的界面框图；

图9示意性地示出了根据本发明的一些实施例的基于知识图谱的数据处理装置的示意框图；

图10示意性地示出了根据本发明的示例实施例的存储介质的示意图；以及

图11示意性地示出了根据发明的示例实施例的电子设备的方框图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明，而并非以任何方式限制本发明的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本发明的实施方式，提出了一种基于知识图谱的数据处理方法、基于知识图谱的数据处理装置、介质和电子设备。

在本文中，需要理解的是，所涉及的术语，比如常见问题解答(Frequently AskedQuestions，FAQ)是一种实现当前网络上提供在线帮助的主要手段，通过事先组织好一些可能的常见问答，发布在网页上为用户提供咨询服务。例如，在某些业务场景中，用户可能频繁问到的业务问题包括“怎么退货”、“为什么优惠券用不了”等，这些用户问题可以表达为对应的FAQ。此外，附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

下面参考本发明的若干代表性实施方式，详细阐释本发明的原理和精神。

发明概述

智能问答系统(Intelligent Question Answering System)是以一问一答形式，精确的定位网站用户所需要的提问知识，通过与网站用户进行交互，为网站用户提供个性化的信息服务。通常，智能问答系统中可以通过建立FAQ知识库，FAQ知识库中包含了若干标准问题以及与标准问题对应的一些不同表达方式的相似问题，例如，“如何退货”为标准问题，对应的相似问题可以包括“商品我不想要了，要退”和“怎么样才能退掉这个东西”等等。智能问答系统可以根据用户输入的用户问题确定出对应的问题答案或者确定出与用户问题对应的相似问题。

在一种技术方案中，智能问答系统仅仅是关心用户当前问题本身对应的问题答案，而不具有向用户推荐相关问题的功能。因此，采用该种技术方案实现的智能问答系统，当用户想要询问多个关联度较高的问题时，仍然需要多次输入问题，造成用户操作繁琐，无法给用户带来良好的用户体验。例如，当用户输入问题1“这件卫衣还有吗”，问答系统回复“有的”，用户再次输入问题2“这件卫衣有S码吗”，采用本技术方案的问答系统，无法根据问题1向用户推荐问题2，因此，可能导致用户多次进行繁琐复杂的输入操作，影响用户的使用体验。

在另一种技术方案中，智能问答系统主要是通过结合用户进入问答系统的入口不同和用户当前状态的不同，直接确定出向该用户展示的相关问题，即此种技术方案是根据用户当前状态与用户进入入口，向用户展示固定的相关问题。然而，该技术方案无法根据用户当前问题动态调整向用户推荐的内容，无法及时捕捉用户的相关意图，无法根据用户在多轮会话中的不同用户问题及时调整并确定用户的当前意图。因此，在某些应用场景下，该智能问答系统推荐的相关问题可能出现答非所问等情况。

基于上述内容，本发明的基本思想在于，获取用户问题，并将与用户问题对应的标准问题确定为用户标准问题；对用户标准问题进行分解处理，获得对应的目标语义知识，并获取目标语义知识中的目标知识要素；根据目标知识要素从知识图谱中确定与用户标准问题关联的目标知识实体；根据目标知识实体确定与用户问题对应的关联问题。通过对用户标准问题进行分解，并基于知识图谱确定出与之关联的关联问题，可以在用户会话中，根据用户的最新问题实时动态地做出相关业务问题的推荐，通过即时捕捉用户的相关意图，提高用户的解决率。

在介绍了本发明的基本原理之后，下面具体介绍本发明的各种非限制性实施方式。

应用场景总览

首先参考图1，图1示出了可以应用本公开实施例的一种基于知识图谱的数据处理方法及装置的示例性应用场景的系统架构的示意框图。

如图1所示，系统架构100可以包括终端设备101、102、103中的一个或多个，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备，包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。

本公开实施例所提供的基于知识图谱的数据处理方法一般由服务器105执行，相应地，基于知识图谱的数据处理装置一般设置于服务器105中。但本领域技术人员容易理解的是，本公开实施例所提供的基于知识图谱的数据处理方法也可以由终端设备101、102、103执行，相应的，基于知识图谱的数据处理装置也可以设置于终端设备101、102、103中，本示例性实施例中对此不做特殊限定。举例而言，在一种示例性实施例中，可以是工作人员通过终端设备101、102、103将预构建的知识图谱和用户输入的用户问题上传至服务器105，服务器通过本公开实施例所提供的基于知识图谱的数据处理方法根据用户问题从预构建的知识图谱确定出与用户问题相关的关联问题，并将确定出的关联问题传输给终端设备101、102、103等以使终端设备101、102、103将确定出的关联问题展示给用户。

应该理解的是，图1所示的应用场景仅是本发明的实施例可以在其中得以实现的一个示例。本发明实施例的适用范围不受到该应用场景任何方面的限制。

示例性方法

下面结合图1的应用场景，参考图2来描述根据本发明示例性实施方式的基于知识图谱的数据处理方法。需要注意的是，上述应用场景仅是为了便于理解本发明的精神和原理而示出，本发明的实施方式在此方面不受任何限制。相反，本发明的实施方式可以应用于适用的任何场景。

本公开首先提供了一种基于知识图谱的数据处理方法，该方法执行主体可以是终端设备，也可以是服务器，本公开对此不做特殊限定，本示例实施例中以服务器执行该方法为例进行说明。

参照图2所示，在步骤S210中，获取用户问题，并将与用户问题对应的标准问题确定为用户标准问题。

在一些示例实施例中，用户问题可以是用户通过问答系统提供的图形用户界面(Graphical User Interface，GUI)输入的用户问题，其中，用户可以通过GUI界面自行输入用户问题，还可以通过对GUI界面上提供的用户问题进行触控操作以确定出用户问题。由于在智能问答系统中，本领域技术人员可以根据常见的FAQ建立FAQ知识库。用户标准问题可以是对相似表达的用户问题进行统一表达处理后存储在FAQ知识库中的问题，用户标准问题可以用于确定关联问题。由于不同用户对于同一问题可能有不同的表述方式，因此，在FAQ知识库中，可以定义一些常见的用户标准问题，用于进行后续的问题确定操作。例如，“如何退货”是用户标准问题，与之对应的相似的用户问题包括“商品我不想要了，要退”、“怎么样才能退掉这个东西”等等。

当获取到用户输入的用户问题时，可以通过相似匹配的方法匹配到FAQ知识库中与该用户问题最为相似的问题，进而将匹配到的最为相似的问题确定为对应的用户标准问题。举例而言，常用的相似匹配算法可以是关键词匹配算法，关键词匹配算法可以包括精确匹配、短语匹配和广泛匹配等匹配方式；相似匹配算法还可以是BM25检索算法，BM25检索算法是基于二值独立模型(Binary Independence Model，BIM)算法基础上引入单词在查询中的权值提出的算法；相似匹配也可以基于句向量(Sentence Embedding)进行，本发明对所采用的相似匹配算法不作任何特殊限定。

在步骤S220中，对用户标准问题进行分解处理，获得对应的目标语义知识，并获取目标语义知识中的目标知识要素。

在一些示例实施例中，分解处理可以是针对用户标准问题进行的语义知识分解处理操作。语义知识可以是最细粒度的语义表达和知识存储，在本发明中特指对于FAQ知识库中的标准问题进行分解处理后所生成的知识。目标语义知识可以是用户标准问题对应的语义知识。知识要素可以是语义知识所对应的相关类别要素。目标知识要素可以是用户标准问题对应的知识要素。将用户标准问题进行分解处理，得到的语义知识通常可以包括四大部分，第一部分是业务条件，第二部分是业务目标，第三部分是问题类型，第四部分是类目。举例而言，当用户标准问题为“已经退货了，什么时候退款”时，对该用户标准问题进行分解处理后，生成的目标语义知识可以包括“物流”、退货”、“成功”、“退款”、“时间”以及“钱款进度”。分别确定各目标语义知识对应的目标知识要素，则四部分内容分别为：第一，业务条件部分，业务知识点为“物流”，动作知识为“退货”，状态知识为“成功”。第二，目标业务部分，业务知识点是“退款”。第三，问题类型部分，问题类型是“时间”，第四，类目部分，类目是“钱款进度”。

对用户标准问题进行分解处理可以得到对应的目标语义知识，并确定出各目标语义知识中的目标知识要素，以便根据目标知识要素确定关联问题。

在步骤S230中，根据目标知识要素从知识图谱中确定与用户标准问题关联的目标知识实体。

在一些示例实施例中，知识图谱可以是一种图状的知识和数据的组织形式，将有相对独立的一个个数据看作图上的一个个节点(又称实体)，再使用不同类型的边将不同节点进行关联起来。在本示例实施例中，知识图谱可以存储标准问题的相关语义知识；具体的，标准问题对应的实体节点与知识点对应的实体节点可以通过边连接起来，而由于知识点是共享的，不同的标准问题的实体节点可能连接到同一个知识点的实体节点上。因此，通过知识点作为中间节点，不同的标准问题又可以进一步连接起来，即作为二阶邻居。知识实体，又称实体节点，可以是每个标准问题及其对应分解出的语义知识。目标知识实体可以是从知识图谱中确定出的用户标准问题对应的实体节点。在确定出目标知识要素后，可以根据知识图谱中存储的用户标准问题的知识表示，从知识图谱中确定出该用户标准问题的相关实体节点，即目标知识实体。

在步骤S240中，根据目标知识实体确定与用户问题对应的关联问题。

在一些示例实施例中，关联问题可以是与用户问题具有关联性的其他业务问题。确定出目标知识实体后，可以从知识图谱中确定与目标知识实体具有相同连接边的标准问题，由于这些标准问题与目标知识实体具有相同的连接边，因此，可以认为这些标准问题与用户标准问题具有较高的相关性，用户可能即将在用户会话中提出这些问题，则可以将这些标准问题作为与用户问题对应的关联问题。

参考图3，图3示意性地示出了根据本发明的一些实施例的构建知识图谱的流程示意图。

参考图3所示，步骤S310，确定候选标准问题集合；其中，候选标准问题集合包括候选标准问题。

在本示例实施例中，候选标准问题集合可以是由候选标准问题组成的问题集合。候选标准问题可以是问答系统中用户可能提问的问题所对应的标准问题。统计在各类业务场景中用户可能提问的问题，并确定出与之对应的候选标准问题，将确定出的候选标准问题共同组成候选标准问题集合。随着用户需求的不断增加，可以对问答系统进行持续的维护和更新，及时更新最新产生的用户问题并确定出对应的标准问题，将新的候选标准问题添加至候选标准问题集合中，以便满足不断更新的用户问答需求。

步骤S320，对候选标准问题进行知识表示转化处理，以生成候选标准问题的知识表示。

在本示例实施例中，知识表示转化处理可以是对候选标准问题进行语义分析、语义知识分解等处理以生成对应的知识表示的过程。知识表示可以是候选标准问题对应的语义表达，在本示例实施例中，知识表示可以是由存储候选标准问题知识点的实体节点和相关的连接边组成的对应的语义表达。在获取到候选标准问题后，可以对候选标准问题进行语义分析、语义知识分解等处理，以生成候选标准问题对应的知识表示。

在本示例实施例中，可以通过以下步骤生成候选标准问题的知识表示。

对所述候选标准问题进行分解处理，生成所述候选标准问题的语义知识；

根据所述语义知识确定所述候选标准问题的问题要素和知识要素；其中，所述知识要素包括业务词、业务相关词、类目和问题类型中的至少一种；

根据所述知识要素生成所述候选标准问题的知识实体；

根据所述问题要素生成所述候选标准问题的候选问题实体，并确定所述候选标准问题的知识实体与所述候选问题实体之间的第一关联权重；

根据所述第一关联权重生成所述候选标准问题的知识表示。

其中，问题要素可以是候选标准问题本身对应的语义要素。知识要素可以是根据候选标准问题的语义知识点确定出的语义要素。业务词可以是某一候选问题所涉及的具体业务。业务相关词可以是与业务相关的词语，业务相关词可以包括执行某一业务的相关条件、相关操作、执行状态等内容。类目可以是根据业务需要而针对FAQ设计的一种业务层级体系，例如，类目可以包括发票类目、物流类目等，发票类目下可以包括电子发票子类目等。问题类型可以是表示该候选标准问题所属的具体类型，例如，问题类型可以包括“是什么”、“为什么”、“怎么做”等多种类型。候选标准问题的知识实体可以是知识图谱中与候选标准问题对应的实体节点。候选问题实体可以是候选标准问题的问题要素对应的实体节点。第一关联权重可以是候选标准问题的知识实体与候选问题实体之间的关联权重，由于候选问题实体与相关的知识实体之间通过边连接，因此，可以确定候选问题实体与相关的知识实体之间各个不同的连接边所对应的权重作为第一关联权重。

具体的，从候选标准问题集合中确定一候选标准问题，对该候选标准问题进行分解处理，可以得到该候选标准问题对应的语义知识。对于每一个候选标准问题，可以将其拆分为三大部分：(1)业务条件和操作，可以是某业务发生了特定操作变成一定状态；(2)目标业务和操作，当业务1和业务2(业务2可以是可选的)有特定操作时，达到一定状态；(3)该候选标准问题的核心诉求类型，可以包括询问“该怎么办”，“为什么”，询问“是否正确”等。

根据语义知识可以确定出该候选标准问题对应的问题要素和知识要素。问题要素可以是候选标准问题对应的问题文本，例如，候选标准问题为“已经退货了，如何退款”，则该候选标准问题对应的问题要素可以为“已经退货了，如何退款”。由于每一个候选标准问题均可以由业务词、业务相关词、类目和问题类型等组成，因此，候选标准问题的知识要素可以包括上述中的至少一种。举例而言，候选标准问题可以包括业务词1，业务词2，操作词，状态词，条件业务词，条件操作词，条件状态词，类目以及问题类型等，其中，由于每一个标准问题必定对应一种问题类型，且属于某一类目，因此问题类型和类目是必须非空的。

另外，由于每一个候选标准问题必定至少和某一个业务相关，所以业务词1或者条件业务词必须有一个不为空；而业务词2、操作词、状态词、条件操作词以及条件状态词并非在每个候选标准问题中都出现。举例而言，参考表1，表1示例性示出了对一些候选标准问题进行分解处理后所生成的知识要素。

表1

在确定出候选标准问题的知识要素和问题要素后，可以分别根据知识要素和问题要素生成对应的知识实体和候选问题实体，即生成知识要素和问题要素分别对应的实体节点，以生成该候选标准问题的知识表示。进一步地，由于候选问题实体和与之关联的知识实体之间均对应一个正数权重，即第一关联权重，且每个知识实体与候选问题实体之间的第一关联权重可能不同，因此，可以在确定出各知识实体与候选问题实体之间的关联权重后，根据关联权重生成候选标准问题的知识表示。

在一些示例实施例中，可以通过下述步骤确定第一关联权重。

确定所述业务词的业务优先级；获取历史查询数据；其中，所述历史查询数据包括所述候选标准问题的查询热度；根据所述业务优先级和所述查询热度确定所述第一关联权重。

其中，业务优先级可以是某一业务对应的优先级别，可以根据不同的业务类别确定业务优先级。历史查询数据可以是对用户历史查询过的标准问题的查询记录进行统计分析后得到的查询数据。查询热度可以是从历史查询数据中确定出的所有用户针对某一候选标准问题的历史查询次数，某一候选标准问题的历史查询次数越多，则查询热度对应的数值越大。由于不同的业务可以对应不同的优先级别，因此，在获取到候选标准问题中的某个业务词后，可以先确定该业务词对应的业务优先级；其次，通过获取到的历史查询数据确定该候选标准问题对应的查询热度；根据业务优先级和查询热度计算第一关联权重时，可以对业务优先级和查询热度分别设置不同的计算权重，例如，可以将业务优先级的计算权重设置为0.4，可以将查询热度的计算权重设置为0.6等。对业务优先级和查询热度进行加权计算后，可以得到第一关联权重。另外，在其他的一些应用场景中，还可以根据计算需求添加第一关联权重的其他影响因素，并对不同的影响因素设置相应的计算权重，以综合各种影响因素计算第一关联权重。当计算出第一关联权重后，可以将第一关联权重添加至对应的连接边，以生成候选标准问题的知识表示。

参考图4，图4示意性地示出了根据本发明的一些实施例的一个标准问题对应的知识表示的示意图。其中，候选标准问题为“已经退货了，什么时候退款”，该候选标准问题对应的问题要素可以是候选标准问题的问题文本，即“已经退货了，什么时候退款”，根据问题要素可以生成候选问题实体410。对该候选标准问题进行分解处理后，可以得到该候选标准问题的知识要素，例如，确定出的知识要素可以包括：“业务知识点1：物流”、“业务知识点2：退款”、“动作知识：退货”、“状态知识：成功”、“问题类型：时间”、“类目：钱款进度”，根据上述知识要素可以生成知识实体421～知识实体426等。由于不同的知识实体与候选问题实体之间的连接边分别对应不同的权重，因此可以对不同的连接边配置相应的第一关联权重，例如，知识实体421～知识实体426与候选问题实体之间的第一关联权重分别为：0.3、0.7、0.7、0.6、0.6、0.8。

步骤S330，根据知识表示构建知识图谱。

对所有候选标准问题进行知识表示转化处理并生成对应的知识表示后，可以根据这些知识表示构建出知识图谱。在知识图谱中，不同的标准问题可以具有相同的知识点。参考图5，图5示意性地示出了根据本发明的一些实施例的根据候选标准问题构建的知识图谱的部分示意图。在构建的知识图谱中，候选问题实体与知识实体之间通过连接边连接，不同连接边配置了候选问题实体与知识实体之间的连接关系以及第一关联权重，其中，图5中仅示出所构建的知识图谱的部分内容，第一关联权重在图5中未示出。

在本示例实施例中，可以通过以下步骤从知识图谱中确定与所述用户标准问题关联的目标知识实体。

根据所述目标知识要素从所述知识图谱中确定与所述目标知识要素对应的目标知识表示；根据所述目标知识表示确定与所述用户标准问题关联的目标知识实体。

其中，目标知识表示可以是用户标准问题对应的知识表示，目标知识表示可以包括用户标准问题对应的标准问题实体和知识实体。在确定出用户标准问题的目标知识要素后，可以根据确定出的目标知识要素从知识图谱中确定出用户标准问题对应的目标知识表示，参考图4，例如，用户标准问题为“已经退货了，什么时候退款”，可以得到如图4中所示的目标知识表示。从得到的目标知识表示中可以确定出用户标准问题对应的目标知识实体，以便根据确定出的目标知识实体确定与用户问题对应的关联问题。

在本示例实施例中，可以通过以下步骤根据所述目标知识实体确定与所述用户问题对应的关联问题。

确定与所述目标知识实体相关联的第一问题实体；确定所述第一问题实体包括的问题要素为所述用户问题对应的关联问题。

其中，第一问题实体可以是与用户标准问题对应的目标知识实体具有连接边的问题实体，第一问题实体不包括用户标准问题对应的问题实体。关联问题可以是从知识图谱中确定出的与用户问题具有一定关联性的标准问题。

从知识图谱中确定出用户标准问题对应的目标知识实体后，可以进一步确定出与目标知识实体具有连接边的第一问题实体，并将第一问题实体中包括的问题要素作为与用户问题对应的关联问题。参考图6，在图6中，当用户提问“能不能指定时间发货”，该用户问题匹配出的用户标准问题为“可以指定时间发货吗”，可以从知识图谱中确定用户标准问题的标准问题实体610以及与标准问题实体610相连接的目标知识实体，目标知识实体包括实体节点621～实体节点625，进而确定出与目标知识实体相关联的第一问题实体，第一问题实体可以包括问题实体节点631、问题实体节点632、问题实体节点633、问题实体节点634等。确定出第一问题实体后，可以将第一问题实体中包含的问题要素作为关联问题，即与用户问题对应的关联问题包括：“什么时候发货？”、“海关清关需要多久？”、“发货后手机会有提示吗？”、“偏远地区的发货时间是什么？”等。

在一些示例实施例中，当所述第一问题实体的数量为多个时，可以采用下述步骤对确定出的多个关联问题进行排序处理。

确定各所述第一问题实体的第一访问次数以及各所述第一问题实体与所述目标知识实体之间的第二关联权重；

基于所述目标知识实体确定所述用户标准问题对应的标准问题实体，并确定各所述第一问题实体与所述标准问题实体之间的第一实体距离和第一公共邻居数量；

根据所述第一访问次数、所述第二关联权重、所述第一实体距离和所述第一公共邻居数量对各所述第一问题实体进行排序处理，并确定经过排序处理获取的第一问题实体包括的问题要素为所述用户问题对应的关联问题。

其中，第一访问次数可以是从历史查询数据中确定出的用户对第一问题实体的访问次数，例如，第一访问次数可以是1000万次、2300万次、4500万次等。第二关联权重可以是第一问题实体与目标知识实体之间对应的连接边的关联权重，第二关联权重可以是预先配置的。标准问题实体可以是用户标准问题对应的问题要素对应的实体节点。第一实体距离可以是第一问题实体与标准问题实体中间间隔的实体节点的数量。第一公共邻居数量可以是第一问题实体与标准问题实体之间具有的相同知识实体节点的数量，相同知识实体节点可以认为是第一问题实体和标准问题实体之间共有节点。

参考图6，图6示意性地示出了根据本发明的一些实施例的当用户会话中仅有一个用户问题时从知识图谱中确定关联问题的示意图。为了方便区分问题实体节点与知识实体节点，图6中将问题实体节点用粗线表示。在用户标准问题对应的第一问题实体后，首先，可以分别获取问题实体节点631～问题实体节点634的第一访问次数；并分别计算问题实体节点与各自连接的目标知识实体之间的第二关联权重，例如，问题实体节点631与目标知识实体621之间的第二关联权重可以为0.9，问题实体节点631与目标知识实体622之间的第二关联权重可以为0.8。其次，在确定出标准问题实体610之后，可以进一步确定第一问题实体与标准问题实体之间的第一实体距离和第一公共邻居数量，例如，第一问题实体631～第一问题实体634与标准问题实体610之间的第一实体距离均为1，第一问题实体631与标准问题实体610之间的公共实体节点为实体节点621和实体节点622，即第一问题实体631与标准问题实体610之间的第一公共邻居数量为2。对确定出的第一访问次数、第二关联权重、第一实体距离和第一公共邻居数量等计算因素分别进行归一化处理并设置计算权重，可以计算出各第一问题实体与标准问题实体之间的关联程度值，并按照计算出的关联程度值对多个第一问题实体进行排序，将第一问题实体中包含的问题要素作为与用户问题对应的关联问题。例如，经过计算得出，第一问题实体631中包含的问题要素“什么时候发货？”是与用户问题对应的高相关问题，在显示关联问题时，可以将该问题显示在第一位置，另外，可以将第一问题实体632与第一问题实体633中分别包含的问题要素“海关清关需要多久？”、“发货后手机会有提示吗？”作为用户问题相关联的次相关问题。在显示关联问题时，可以显示在高相关问题的后续位置，以供用户选择。

在一些示例实施例中，当用户问题的数量为多个时，可以采用下述步骤确定关联问题。

获取各所述用户问题分别对应的会话轮次编号；

根据所述会话轮次编号确定各所述用户问题对应的各所述第一问题实体分别对应的第一权重；

根据所述第一权重确定各所述用户问题对应的各所述目标知识实体在每轮会话中分别对应的会话轮次权重；

结合所述会话轮次权重对确定出的多个所述第一问题实体进行排序处理，并确定经过排序处理获取的第一问题实体包括的问题要素为所述用户问题对应的关联问题。

其中，会话轮次编号可以是某一用户问题在当前用户会话中的先后顺序。在问答系统中提问时，用户可能有多个问题，在某次会话过程中，用户提问的用户问题将被记录在会话历史数据中，根据用户提出用户问题的先后顺序，可以将用户问题分别编号为Q₁，Q₂，Q₃，Q₄，…，Q_n等，n越大则代表是某用户问题是当前会话中最新产生的问题，也就是目前用户更关心的问题。第一权重可以是根据会话轮次编号确定出的第一问题实体对应的权重。会话轮次权重可以是确定出的目标知识实体在计算过程中所采用的权重。

由于用户问题的数量为多个，因此，与用户问题对应的用户标准问题的数量为多个，目标知识实体的数量为多个，第一问题实体的数量为多个。根据用户问题提出的先后顺序可以确定各用户问题对应的会话轮次编号，例如，在会话过程中第一轮先匹配到了用户问题Q₁，则会话历史数据中包含的问题数据就是Q₁；当第二轮被匹配到用户问题Q₂的时候，会话历史数据中包含的问题数据就是Q₁、Q₂了，以此类推，可以确定出会话历史数据中包含的所有用户问题。在确定关联问题时，可以获取会话历史数据中匹配到的问题序列，并根据这些问题去预先构建的知识图谱中进行查询，确定与这些用户问题分别对应的第一问题实体，并确定与第一问题实体相关联的目标知识实体在每轮会话中对应的会话轮次权重。结合计算出的会话轮次权重对多个第一问题实体进行排序处理，可以将排序处理后的第一问题实体中包含的问题要素作为用户问题对应的关联问题。

在一些示例实施例中，结合所述会话轮次权重对确定出的多个所述第一问题实体进行排序处理可以采用下述步骤进行。

确定各所述第一问题实体的第一访问次数；

根据所述目标知识实体确定各所述用户标准问题对应的各标准问题实体，并确定各所述第一问题实体与各所述标准问题实体之间的第一实体距离和第一公共邻居数量；

对各所述会话轮次权重进行加和处理，得到所述目标知识实体与所述第一问题实体之间的第三关联权重；

根据所述第一访问次数、所述第一实体距离、所述第一公共邻居数量和所述第三关联权重对多个所述第一问题实体进行排序处理。

其中，第三关联权重可以是将目标知识实体的会话轮次权重作为考虑因素，所确定出的目标知识实体与第一问题实体之间的关联权重。

具体的，各第一问题实体的第一访问次数以及各第一问题实体与标准问题实体之间第一实体距离与第一公共邻居数量的确定方式已经在上述步骤中进行说明，此处不再赘述。当会话历史中有两轮以上的会话时，在权重计算时，将侧重关注用户会话中最新提问的用户问题，例如，当用户会话中有三个用户问题，则三个用户问题分别对应的会话轮次编号为Q₁、Q₂、Q₃，Q₃是最新的用户问题，在计算权重时，应该侧重考虑Q₃，因此可以设置Q₁，Q₂，Q₃的第一权重分别为0.1、0.2、0.7，以进行后续计算。举例而言，参考图7，图7示意性地示出了根据本发明的一些实施例的当用户会话中有多个用户问题时从知识图谱中确定关联问题的示意图。图7的历史会话中包含2个用户问题，Q₁是“可以指定时间发货吗”，Q₂是“可以指定快递发货吗”，则Q₁对应的第一问题实体可以是问题实体节点610，而Q₂对应的第一问题实体可以是问题实体节点710，根据用户问题的会话轮次编号1和2可以将Q₁、Q₂的第一权重分别设置为0.2和0.8，则与第一问题实体610相连接的目标知识实体的会话轮次权重为0.2，与第一问题实体710相连接的目标知识实体的会话轮次权重为0.8，也就是说，目标知识实体621～目标知识实体625在第一问题实体610中对应的会话轮次权重均为0.2；目标知识实体721～目标知识实体723在第一问题实体710中对应的会话轮次权重均为0.8，另外，由于目标知识实体621同时与第一问题实体710相连，因此，目标知识实体621在第一问题实体710中对应的会话轮次权重也为0.8。将各目标知识实体与不同的第一问题实体之间的会话轮次权重进行加和处理可以得到目标知识实体与第一问题实体之间的第三关联权重，由于目标知识实体622～目标知识实体625以及目标知识实体721～目标知识实体723均只与一个第一问题实体相连接，则目标知识实体622～目标知识实体625以及目标知识实体721～目标知识实体723对应的第三关联权重分别为0.2、0.2、0.2、0.2、0.8、0.8、0.8，而目标知识实体621对应第三关联权重为0.2+0.8＝1。在确定出各目标知识实体的第三关联权重后，可以分别设置第一访问次数、第一实体距离、第一公共邻居数量和第三关联权重在计算时的计算权重，以便确定各第一问题实体与标准问题实体之间的关联程度值，并对多个第一问题实体进行排序处理，将第一问题实体中包含的问题要素作为关联问题，并按照排序处理后形成的问题顺序向用户显示关联问题。在图7中，当用户输入Q₁、Q₂后，可以确定出高相关的第一问题实体730，将第一问题实体730中包含的问题要素“下单后发什么快递”作为高相关问题，将第一问题实体741和第一问题实体742中包含的问题要素作为次相关问题，并按照排序处理后的排序结果将关联问题显示给用户。

参考图8，图8示意性地示出了根据本发明的一些实施例的基于知识图谱的数据处理方法确定用户问题的关联问题的界面框图。当用户输入用户问题810，即“能不能指定时间发货？”时，问答系统除了向用户提供问题答案820之外，还可以向用户推荐多个关联问题，例如，可以在图形用户界面中显示与用户问题810相关的关联问题831、关联问题832、关联问题833，同时，当确定出的关联问题较多时，还可以设置“更多问题”虚拟按钮834，以便用户通过触控虚拟按钮834确定出更多的关联问题。

示例性装置

在介绍了本发明示例性实施方式的方法之后，接下来，参考图9对本发明示例性实施例的基于知识图谱的数据处理装置进行说明。

在图9中，基于知识图谱的数据处理装置900可以包括标准问题确定模块910、知识要素获取模块920、知识实体确定模块930以及关联问题确定模块940。其中：标准问题确定模块910用于获取用户问题，并将与用户问题对应的标准问题确定为用户标准问题；知识要素获取模块920用于对用户标准问题进行分解处理，获得对应的目标语义知识，并获取目标语义知识中的目标知识要素；知识实体确定模块930用于根据目标知识要素从知识图谱中确定与用户标准问题关联的目标知识实体；关联问题确定模块940用于根据目标知识实体确定与用户问题对应的关联问题。

在本发明的一些实施例中，所述基于知识图谱的数据处理装置900还包括知识图谱构建模块，所述知识图谱构建模块包括：问题集合确定单元，用于确定候选标准问题集合；其中，所述候选标准问题集合包括候选标准问题；知识表示生成单元，用于对所述候选标准问题进行知识表示转化处理，以生成所述候选标准问题的知识表示；知识图谱构建单元，用于根据所述知识表示构建所述知识图谱。

在本发明的一个实施例中，所述基于知识图谱的数据处理装置900还包括第一问题排序模块，所述第一问题排序模块被配置为：确定各所述第一问题实体的第一访问次数以及各所述第一问题实体与所述目标知识实体之间的第二关联权重；基于所述目标知识实体确定所述用户标准问题对应的标准问题实体，并确定各所述第一问题实体与所述标准问题实体之间的第一实体距离和第一公共邻居数量；根据所述第一访问次数、所述第二关联权重、所述第一实体距离和所述第一公共邻居数量对各所述第一问题实体进行排序处理，并确定经过排序处理获取的第一问题实体包括的问题要素为所述用户问题对应的关联问题。

在本发明的一个实施例中，所述基于知识图谱的数据处理装置900还包括第二问题排序模块，所述第二问题排序模块被配置为：获取各所述用户问题分别对应的会话轮次编号；根据所述会话轮次编号确定各所述用户问题对应的各所述第一问题实体分别对应的第一权重；根据所述第一权重确定各所述用户问题对应的各所述目标知识实体在每轮会话中分别对应的会话轮次权重；结合所述会话轮次权重对确定出的多个所述第一问题实体进行排序处理，并确定经过排序处理获取的第一问题实体包括的问题要素为所述用户问题对应的关联问题。

在本发明实施例的第三方面中，提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述第一方面所述的基于知识图谱的数据处理方法。

示例性介质

在介绍了本发明示例性实施方式的装置之后，接下来，参考图10对本发明示例性实施例的存储介质进行说明。

在一些实施例中，本发明的各个方面还可以实现为一种介质，其上存储有程序代码，当所述程序代码被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的基于知识图谱的数据处理方法中的步骤。

例如，所述设备的处理器执行所述程序代码时可以实现如图2中所述的步骤S210，获取用户问题，并将与用户问题对应的标准问题确定为用户标准问题；步骤S220，对用户标准问题进行分解处理，获得对应的目标语义知识，并获取目标语义知识中的目标知识要素；步骤S230，根据目标知识要素从知识图谱中确定与用户标准问题关联的目标知识实体；步骤S240，根据目标知识实体确定与用户问题对应的关联问题。

参考图10所示，描述了根据本发明的实施例的用于实现上述基于知识图谱的数据处理方法或者实现上述基于知识图谱的数据处理方法的程序产品1000，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备。

示例性计算设备

在介绍了本发明示例性实施方式的基于知识图谱的数据处理方法、基于知识图谱的数据处理装置以及存储介质之后，接下来，参考图11对本发明示例性实施方式的电子设备进行说明。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施例、完全的软件实施例(包括固件、微代码等)，或硬件和软件方面结合的实施例，这里可以统称为“电路”、“模块”或“系统”。

在一些可能的实施例中，根据本发明的电子设备可以至少包括至少一个处理单元、以及至少一个存储单元。其中，所述存储单元存储有程序代码，当所述程序代码被所述处理单元执行时，使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的基于知识图谱的数据处理方法中的步骤。例如，所述处理单元可以执行如图2中所示的步骤S210，获取用户问题，并将与用户问题对应的标准问题确定为用户标准问题；步骤S220，对用户标准问题进行分解处理，获得对应的目标语义知识，并获取目标语义知识中的目标知识要素；步骤S230，根据目标知识要素从知识图谱中确定与用户标准问题关联的目标知识实体；步骤S240，根据目标知识实体确定与用户问题对应的关联问题。

下面参照图11来描述根据本发明的示例实施例的电子设备1100。图11所示的电子设备1100仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图11所示，电子设备1100以通用计算设备的形式表现。电子设备1100的组件可以包括但不限于：上述至少一个处理单元1101、上述至少一个存储单元1102、连接不同系统组件(包括存储单元1102和处理单元1101)的总线1103、显示单元1107。

总线1103表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储单元1102可以包括易失性存储器形式的可读介质，例如随机存取存储器(RAM)1121和/或高速缓存存储器1122，还可以进一步包括只读存储器(ROM)1123。

存储单元1102还可以包括具有一组(至少一个)程序模块1124的程序/实用工具1125，这样的程序模块1124包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

电子设备1100也可以与一个或多个外部设备1104(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与电子设备1100交互的设备通信，和/或与使得电子设备1100能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1105进行。并且，电子设备1100还可以通过网络适配器1106与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器1106通过总线1103与电子设备1100的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备1100使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

应当注意，尽管在上文详细描述中提及了基于知识图谱的数据处理装置的若干单元/模块或子单元/模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之，上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本发明的精神和原理，但是应该理解，本发明并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

1.一种基于知识图谱的数据处理方法，其特征在于，包括：

获取用户问题，并将与所述用户问题对应的标准问题确定为用户标准问题；

对所述用户标准问题进行分解处理，获得对应的目标语义知识，并获取所述目标语义知识中的目标知识要素；

根据所述目标知识要素从知识图谱中确定与所述用户标准问题关联的目标知识实体；

根据所述目标知识实体确定与所述用户问题对应的关联问题；

所述知识图谱通过下述步骤生成：对候选标准问题进行知识表示转化处理，以生成所述候选标准问题的知识表示；根据所述知识表示构建所述知识图谱；

所述对所述候选标准问题进行知识表示转化处理，以生成所述候选标准问题的知识表示，包括：

根据所述知识要素生成所述候选标准问题的知识实体；

根据所述第一关联权重生成所述候选标准问题的知识表示。

2.根据权利要求1所述的基于知识图谱的数据处理方法，其特征在于，在所述获取用户问题之前，所述方法还包括：

确定候选标准问题集合；其中，所述候选标准问题集合包括候选标准问题。

3.根据权利要求1所述的基于知识图谱的数据处理方法，其特征在于，所述确定所述候选标准问题的知识实体与所述候选问题实体之间的第一关联权重，包括：

确定所述业务词的业务优先级；

获取历史查询数据；其中，所述历史查询数据包括所述候选标准问题的查询热度；

根据所述业务优先级和所述查询热度确定所述第一关联权重。

4.根据权利要求1所述的基于知识图谱的数据处理方法，其特征在于，所述根据所述目标知识要素从知识图谱中确定与所述用户标准问题关联的目标知识实体，包括：

根据所述目标知识要素从所述知识图谱中确定与所述目标知识要素对应的目标知识表示；

根据所述目标知识表示确定与所述用户标准问题关联的目标知识实体。

5.根据权利要求1所述的基于知识图谱的数据处理方法，其特征在于，所述根据所述目标知识实体确定与所述用户问题对应的关联问题，包括：

确定与所述目标知识实体相关联的第一问题实体；

确定所述第一问题实体包括的问题要素为所述用户问题对应的关联问题。

6.根据权利要求5所述的基于知识图谱的数据处理方法，其特征在于，所述第一问题实体的数量为多个，所述方法还包括：

7.根据权利要求5所述的基于知识图谱的数据处理方法，其特征在于，所述用户问题的数量为多个，则所述用户标准问题的数量为多个，所述目标知识实体的数量为多个，所述第一问题实体的数量为多个，所述方法还包括：

获取各所述用户问题分别对应的会话轮次编号；

8.根据权利要求7所述的基于知识图谱的数据处理方法，其特征在于，所述结合所述会话轮次权重对确定出的多个所述第一问题实体进行排序处理，包括：

确定各所述第一问题实体的第一访问次数；

9.一种基于知识图谱的数据处理装置，其特征在于，包括：

标准问题确定模块，用于获取用户问题，并将与所述用户问题对应的标准问题确定为用户标准问题；

知识要素获取模块，用于对所述用户标准问题进行分解处理，获得对应的目标语义知识，并获取所述目标语义知识中的目标知识要素；

知识实体确定模块，用于根据所述目标知识要素从知识图谱中确定与所述用户标准问题关联的目标知识实体；

关联问题确定模块，用于根据所述目标知识实体确定与所述用户问题对应的关联问题；

知识图谱构建模块，包括知识表示生成单元与知识图谱构建单元，所述知识表示生成单元，用于对候选标准问题进行知识表示转化处理，以生成所述候选标准问题的知识表示；所述知识图谱构建单元，用于根据所述知识表示构建所述知识图谱；

所述知识表示生成单元包括：

问题分解子单元，用于对所述候选标准问题进行分解处理，生成所述候选标准问题的语义知识；

要素确定子单元，用于根据所述语义知识确定所述候选标准问题的问题要素和知识要素；其中，所述知识要素包括业务词、业务相关词、类目和问题类型中的至少一种；

实体生成子单元，用于根据所述知识要素生成所述候选标准问题的知识实体；

权重确定子单元，用于根据所述问题要素生成所述候选标准问题的候选问题实体，并确定所述候选标准问题的知识实体与所述候选问题实体之间的第一关联权重；

知识表示生成子单元，用于根据所述第一关联权重生成所述候选标准问题的知识表示。

10.根据权利要求9所述的基于知识图谱的数据处理装置，其特征在于，所述知识图谱构建模块还包括：

问题集合确定单元，用于确定候选标准问题集合；其中，所述候选标准问题集合包括候选标准问题。

11.根据权利要求9所述的基于知识图谱的数据处理装置，其特征在于，所述权重确定子单元被配置为：

确定所述业务词的业务优先级；

12.根据权利要求9所述的基于知识图谱的数据处理装置，其特征在于，所述知识实体确定模块被配置为：

13.根据权利要求9所述的基于知识图谱的数据处理装置，其特征在于，所述关联问题确定模块被配置为：

确定与所述目标知识实体相关联的第一问题实体；

14.根据权利要求13所述的基于知识图谱的数据处理装置，其特征在于，所述基于知识图谱的数据处理装置还包括第一问题排序模块，所述第一问题排序模块被配置为：

15.根据权利要求13所述的基于知识图谱的数据处理装置，其特征在于，所述基于知识图谱的数据处理装置还包括第二问题排序模块，所述第二问题排序模块被配置为：

获取各所述用户问题分别对应的会话轮次编号；

16.根据权利要求15所述的基于知识图谱的数据处理装置，其特征在于，所述第二问题排序模块还包括第二问题排序单元，所述第二问题排序单元被配置为：

确定各所述第一问题实体的第一访问次数；

17.一种电子设备，其特征在于，包括：

处理器；以及

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现如权利要求1至8中任意一项所述的基于知识图谱的数据处理方法。

18.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至8中任意一项所述的基于知识图谱的数据处理方法。