CN110955764B

CN110955764B - 场景知识图谱的生成方法、人机对话方法以及相关设备

Info

Publication number: CN110955764B
Application number: CN201911133326.0A
Authority: CN
Inventors: 徐新超; 王海峰; 吴华; 刘占一
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-11-19
Filing date: 2019-11-19
Publication date: 2021-04-06
Anticipated expiration: 2039-11-19
Also published as: CN110955764A

Abstract

本申请公开了场景知识图谱的生成方法、人机对话方法以及相关设备，涉及知识图谱技术领域。具体实现方案为：获取待构建场景知识图谱的多个知识文本内容片段，针对每个知识文本内容片段，确定知识文本内容片段的场景名称；获取与场景名称对应的场景类型；根据场景类型，确定知识文本内容片段中的场景元素信息；根据各个知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱，由此，结合知识文本内容片段的场景名称、场景类型和场景元素信息生成了基于场景的场景知识图谱，从而方便了结合场景知识图谱理解各个知识之间的关系，方便后续机器结合场景知识图谱进行后续相关处理。

Description

场景知识图谱的生成方法、人机对话方法以及相关设备

技术领域

本申请涉及计算机技术领域，具体涉及知识图谱技术领域，尤其涉及场景知识图谱的生成方法、人机对话方法以及相关设备。

背景技术

知识图谱能提供高质量的结构化数据，目前已经广泛地应用于人工智能的多个领域，例如自动问答、搜索引擎以及信息抽取。典型的将常识知识图谱表示成三元组的形式。即G＝(E,R,S)，其中E＝{e1,e2,e3,...,en}是知识库中的实体集合，共包含|E|种不同的实体；R＝{r1,r2,...,rn}是知识库中的关系集合，共包含|R|种不同关系；

代表知识库中的三元组集合。三元组的基本形式主要包括实体1、关系、实体2和概念、属性、属性值等，实体是知识图谱中的最基本元素，不同的实体间存在不同的关系。概念主要指集合、类别、对象类型、事物的种类，例如人物、地理等。然而，相关技术中的知识图谱的表示形式比较难处理知识间较为复杂的关系，尤其在不同场景中可能存在的各种关系，而这种相对隐含的关系对于衡量知识的关系有较为重要的作用。例如：在生日聚餐的场景中，可能会『吹蜡烛』，『吃蛋糕』，『红酒价格』等等，在传统的知识图谱构建过程中，这些知识间基本是隔离的，从而导致机器很难来度量这些知识间的关系，因此，如何构建一种基于场景的知识图谱是目前亟需解决的问题。

发明内容

本申请提出一种场景知识图谱的生成方法、人机对话方法以及相关设备，结合知识文本内容片段的场景名称、场景类型和场景元素信息生成了基于场景的场景知识图谱，从而方便了结合场景知识图谱理解各个知识之间的关系，方便后续机器结合场景知识图谱进行后续相关处理。

本申请第一方面实施例提出了一种场景知识图谱的生成方法，包括：获取待构建场景知识图谱的多个知识文本内容片段；确定所述知识文本内容片段的场景名称；获取与所述场景名称对应的场景类型；根据所述场景类型，确定所述知识文本内容片段中的场景元素信息；根据各个所述知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱。

在本申请一个实施例中，所述确定所述知识文本内容片段的场景名称，包括：对所述知识文本内容片段进行句法分析，并根据句法分析结果，确定所述知识文本内容片段的场景名称；或者，识别出所述知识文本内容片段中的关键词，从场景库中匹配与所述关键词对应的场景名称，并匹配到的场景名称作为所述知识文本内容片段的场景名称。

在本申请一个实施例中，所述根据所述场景类型，确定所述知识文本内容片段中的场景元素信息，包括：获取与所述场景类型对应的知识表示学习模型；根据所述知识表示学习模型，确定所述知识文本内容片段中目标词语的概念信息，并将所述目标词语和所述概念信息作为所述场景元素信息。

在本申请一个实施例中，所述根据各个所述知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱，包括：对同一场景类型下相同场景名称的场景元素信息进行聚合，以得到同一场景类型下相同场景名称的场景元素信息聚合结果；根据所述场景名称、所述场景类型和所述场景元素信息聚合结果，生成所述场景知识图谱。

本申请实施例的场景知识图谱的生成方法，获取待构建场景知识图谱的多个知识文本内容片段，针对每个知识文本内容片段，确定知识文本内容片段的场景名称；获取与场景名称对应的场景类型；根据场景类型，确定知识文本内容片段中的场景元素信息；根据各个知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱，由此，结合知识文本内容片段的场景名称、场景类型和场景元素信息生成了基于场景的场景知识图谱，从而方便了结合场景知识图谱理解各个知识之间的关系，方便后续机器结合场景知识图谱进行后续相关处理。

本申请第二方面实施例提出了一种使用第一方面实施例的场景知识图谱进行人机对话方法，所述方法包括：所述方法包括：获取用户的当前话语信息；根据所述当前话语信息和所述场景知识图谱，确定激活的目标场景名称及其场景元素信息；根据所述场景元素信息和所述当前话语信息，生成所述当前话语信息的回复语句。

本申请实施例的基于场景知识图谱的人机对话方法，在与用户进行人机对话交互的过程中，结合用户的当前话语信息和场景知识图谱，确定激活的目标场景名称及其场景元素信息，并根据场景元素信息和当前话语信息，生成当前话语信息的回复语句，结合场景知识图谱中对应场景的知识进行人机对话，使得给出的回复语句更加符合场景需求，提高了人机交互的用户体验度。

在本申请一个实施例中，所述根据所述当前话语信息和所述场景知识图谱，确定激活的目标场景名称及其场景元素信息，包括：确定所述当前话语信息中的关键词信息；根据所述关键词信息，按照不同的激活类型从所述场景知识图谱中，确定激活的目标场景名称及其场景元素信息。

在本申请一个实施例中，所述根据所述关键词信息，按照不同的激活类型从所述场景知识图谱中，确定激活的目标场景名称及其场景元素信息，包括：按照不同的激活类型从所述场景知识图谱中，获取与所述关键词信息匹配的多个待激活的场景名称；从多个待激活的场景名称中确定出所述激活的目标场景名称，并从所述场景知识图谱获取所述目标场景名称的场景元素信息。

在本申请一个实施例中，所述从多个待激活的场景名称中确定出所述激活的目标场景名称，包括：获取每个所述待激活的场景名称的热度信息；根据各个所述待激活的场景名称的热度信息，选择当前热度最高的场景名称作为所述激活的目标场景名称。

在本申请一个实施例中，所述方法还包括：获取所述当前话语信息的历史对话信息；根据所述历史对话信息和所述当前话语信息，确定所述当前话语信息的场景类型；所述按照不同的激活类型从所述场景知识图谱中，获取与所述关键词信息匹配的多个待激活的场景名称，包括：按照不同的激活类型从所述场景知识图谱中，获取与所述关键词信息和场景类型匹配的多个待激活的场景名称。

本申请第三方面实施例提出了一种场景知识图谱的生成装置，包括：第一获取模块，用于获取待构建场景知识图谱的多个知识文本内容片段；第一确定模块，用于确定所述知识文本内容片段的场景名称；第一获取模块，用于获取与所述场景名称对应的场景类型；第二确定模块，用于根据所述场景类型，确定所述知识文本内容片段中的场景元素信息；图谱生成模块，用于根据各个所述知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱。

在本申请一个实施例中，所述第一确定模块，具体用于：对所述知识文本内容片段进行句法分析，并根据句法分析结果，确定所述知识文本内容片段的场景名称；或者，识别出所述知识文本内容片段中的关键词，从场景库中匹配与所述关键词对应的场景名称，并匹配到的场景名称作为所述知识文本内容片段的场景名称。

在本申请一个实施例中，所述第二确定模块，具体用于：获取与所述场景类型对应的知识表示学习模型；根据所述知识表示学习模型，确定所述知识文本内容片段中目标词语的概念信息，并将所述目标词语和所述概念信息作为所述场景元素信息。

在本申请一个实施例中，所述图谱生成模块，具体用于：对同一场景类型下相同场景名称的场景元素信息进行聚合，以得到同一场景类型下相同场景名称的场景元素信息聚合结果；根据所述场景名称、所述场景类型和所述场景元素信息聚合结果，生成所述场景知识图谱。

本申请实施例的场景知识图谱的生成装置，获取待构建场景知识图谱的多个知识文本内容片段，针对每个知识文本内容片段，确定知识文本内容片段的场景名称；获取与场景名称对应的场景类型；根据场景类型，确定知识文本内容片段中的场景元素信息；根据各个知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱，由此，结合知识文本内容片段的场景名称、场景类型和场景元素信息生成了基于场景的场景知识图谱，从而方便了结合场景知识图谱理解各个知识之间的关系，方便后续机器结合场景知识图谱进行后续相关处理。

本申请第四方面实施例提出了一种使用第一方面实施例的场景知识图谱进行人机对话装置，所述装置包括：第二获取模块，用于获取用户的当前话语信息；第三确定模块，用于根据所述当前话语信息和所述场景知识图谱，确定激活的目标场景名称及其场景元素信息；回复语句生成模块，用于根据所述场景元素信息和所述当前话语信息，生成所述当前话语信息的回复语句。

本申请实施例的基于场景知识图谱的人机对话装置，在与用户进行人机对话交互的过程中，结合用户的当前话语信息和场景知识图谱，确定激活的目标场景名称及其场景元素信息，并根据场景元素信息和当前话语信息，生成当前话语信息的回复语句，结合场景知识图谱中对应场景的知识进行人机对话，使得给出的回复语句更加符合场景需求，提高了人机交互的用户体验度。

在本申请一个实施例中，所述第三确定模块，具体用于：确定所述当前话语信息中的关键词信息；根据所述关键词信息，按照不同的激活类型从所述场景知识图谱中，确定激活的目标场景名称及其场景元素信息。

在本申请一个实施例中，所述第三确定模块，具体用于：按照不同的激活类型从所述场景知识图谱中，获取与所述关键词信息匹配的多个待激活的场景名称；从多个待激活的场景名称中确定出所述激活的目标场景名称，并从所述场景知识图谱获取所述目标场景名称的场景元素信息。

在本申请一个实施例中，所述第三确定模块，具体用于：获取每个所述待激活的场景名称的热度信息；根据各个所述待激活的场景名称的热度信息，选择当前热度最高的场景名称作为所述激活的目标场景名称。

在本申请一个实施例中，所述装置还包括：第三获取模块，用于获取所述当前话语信息的历史对话信息；第四确定模块，用于根据所述历史对话信息和所述当前话语信息，确定所述当前话语信息的场景类型；所述第三确定模块，具体用于，包括：按照不同的激活类型从所述场景知识图谱中，获取与所述关键词信息和场景类型匹配的多个待激活的场景名称。

本申请第五方面实施例提出了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请实施例的场景知识图谱的生成方法，或者，执行本申请实施例的基于场景知识图谱进行人机对话方法。

本申请第六方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本申请实施例公开的场景知识图谱的生成方法，或者，执行本申请实施例的基于场景知识图谱进行人机对话方法。

本申请第七方面实施例提出了一种场景知识图谱的生成方法，包括：获取待处理的多个知识文本内容片段；获取每个所述知识文本内容片段的场景名称、场景类型和场景元素信息；根据各个所述知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱。

上述申请中的一个实施例具有如下优点或有益效果：能够结合知识文本内容片段的场景信息创建基于场景的知识图谱。因为采用结合知识文本内容片段的场景名称、场景类型和场景元素信息生成了基于场景的场景知识图谱技术手段，所以克服了相关技术中知识图谱中知识之间隔离的技术问题，从而方便了结合场景知识图谱理解各个知识之间的关系，方便后续机器结合场景知识图谱进行后续相关处理技术效果。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请第一实施例的示意图；

图2是根据本申请第二实施例的示意图；

图3是根据本申请第三实施例的示意图；

图4是根据本申请第四实施例的示意图；

图5是根据本申请第五实施例的示意图；

图6是用来实现本申请实施例的电子设备的框图；

图7是根据本申请第六实施例的示意图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

下面参考附图描述本申请实施例的场景知识图谱的生成方法、装置和电子设备。

图1是根据本申请第一实施例的示意图。其中，需要说明的是，本实施例的场景知识图谱的生成方法的执行主体为场景知识图谱的生成装置，该装置可以由软件和/或硬件的方式实现，该装置可以配置在电子设备中，电子设备可以包括但不限于终端设备、服务器等，该实施例对此不作具体限定。

如图1所示，该场景知识图谱的生成方法可以包括：

步骤101，获取待构建场景知识图谱的多个知识文本内容片段。

其中，知识文本内容片段可以为聊天对话文本内容片段、文档内容片段等，该实施例对此不作具体限定。

步骤102，确定知识文本内容片段的场景名称。

其中，在不同应用场景中，确定知识文本内容片段的场景名称的方式不同，举例说明如下：

作为一种示例，对知识文本内容片段进行句法分析，并根据句法分析结果，确定知识文本内容片段的场景名称。

举例而言，知识文本内容片段为：秋天我想去看香山的红叶，听说这个时候的红叶最美，通过对该知识文本内容片段进行句法分析，然后，分析句子中词的词性以及语法成分，然后，结合词之间的句法关系，可确定该知识文本内容片段的场景名称为看-红叶。

作为另一种示例，可识别出知识文本内容片段中的关键词，从场景库中匹配与关键词对应的场景名称，并匹配到的场景名称作为知识文本内容片段的场景名称。

其中，场景库中保存了关键词和场景名称之间的对应关系。

作为另一种示例，可通过预先训练的分析模型，对知识文本内容片段进行分析，以确定出该知识文本内容片段的场景名称。

具体地，可对知识文本内容片段的句法特征信息，并将该句法特征信息输入到预先训练的分析模型中，以通过该分析模型确定出该知识文本内容片段的场景名称。

步骤103，获取与场景名称对应的场景类型。

具体地，在获取对应知识文本内容片段的场景名称后，可基于预先保存的场景名称与场景类型之间的对应关系，获取该场景名称对应的场景类型。

其中，场景类型可以包括但不限于经历、观点、情感、新闻资讯、知识、任务等大类。

对于每一类而言，还可以根据实际需求对其进行进步分类，例如，新闻资讯又可以分为体育新闻、科技新闻、娱乐新闻和财经新闻等，该实施例对此不作具体限定。

接上述举例，对于场景名称“看红叶”而言，其对应的场景类型为经历。

又例如，对于知识文本内容片段“我想订一家鲁菜餐馆”而言，其对应的场景名称为“预定餐馆”，其对应的场景类型为任务类型。

步骤104，根据场景类型，确定知识文本内容片段中的场景元素信息。

其中，场景元素信息包括场景元素名称及其对应的场景元素内容。

例如，对于一段关于足球比赛资讯的新闻报道，其对应的场景名称为：足球比赛，场景类型为体育资讯，其对应的场景元素信息包括：时间:2017-11-21；比赛结果为：3:1；进球队员为：杨晨、郑智。在这个示例中，时间、比赛结果、进球队员等为场景元素名称，2017-11-21为场景元素名称时间的元素内容，对应地，3:1为场景元素名称比赛结果的元素内容，“杨晨、郑智”为场景元素名称进球队员的元素内容。

又例如，对于场景名称预定餐馆而言，其对应的场景类型为：任务类型，其对应的场景元素信息包括：时间：2018-10-21，人数；5人，口味：鲁菜。

又例如，场景名称为丢钱包，其对应的场景类型为：经历，场景元素信息为：时间为2018年10月23日，地点为北京某某公交站，结果为：找到了，品牌为：某某牌子等。

在本实施例中，场景知识图谱的生成装置执行步骤104的具体过程可以为：获取与场景类型对应的知识表示学习模型；根据知识表示学习模型，确定知识文本内容片段中目标词语的概念信息，并将目标词语和概念信息作为场景元素信息。

也就是说，本实施例中，在获取与场景类型对应的知识表示学习模型后，结合知识表示学习(knowledge representation learning，KRL)模型对知识文本内容片段进行解析，并确定出知识文本内容片段中的名词信息，并确定出名词信息的角色和概念信息。

例如，知识文本内容片段为“秋天我想去看香山的红叶”，通过KRL模型对其角色标注，标注后的对应的角色和概念信息的示意，如表1所示。

表1词、角色和概念信息之间关系

词	角色	概念信息
			秋天	S-V	S-季节
我	X	X
			想	X	X
去	X	X
			看	X	X
香山	S-E	S-公园
			的	X	X
红叶	S-V	S-景点

作为另一种可能的实现方式，根据场景类型，确定知识文本内容片段中的场景元素信息可以包括：可获取与场景类型对应的场景要素抽取模型；根据场景要素抽取模型，从知识文本内容片段中抽取场景元素的分词信息，并确定分词信息的概念信息，其中，场景元素与场景类型对应。

步骤105，根据各个知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱。

在本实施例中，由于在实际应用中，可能在一段知识文本内容片段中存在的场景元素有限，为了获取同一个场景类型下相同场景名称的所有场景元素信息，在通过上述步骤102-104得到每个知识文本内容片段的场景名称、场景类型和场景元素信息之后，可对同一场景类型下相同场景名称的场景元素信息进行聚合，以得到同一场景类型下相同场景名称的场景元素信息聚合结果，然后，根据场景名称、场景类型和场景元素信息聚合结果，生成场景知识图谱。

其中，需要说明的是，本实施例中的场景知识图谱中一个场景与另一个场景之间的关系，可通过这两个场景中的相应场景元素进行关联。例如，场景1的场景名称为A，场景2的场景名称为B，假设场景1和场景2均具有场景元素1，此时，场景1和场景2之间的关系可通过场景元素1进行关联。

例如，在明星场景中，假设从知识文本内容片段A中，获知场景名称为刘德华，并且，场景元素信息1，妻子为朱丽倩，在知识文本内容片段B中获知刘德华演过的电影有天下无贼，此时，可获知场景元素信息2，电影包括天下无贼，由于这两个场景元素信息均是属于明星场景中的同一个明星，此时，可将这两个场景元素信息聚合在一起。

基于上述实施例的基础上，在创建场景知识图谱后，在利用所生成的场景知识图谱进行人机对话的过程中，还可以在进行人机对话的过程中，可结合在线所获取到的对话信息，对场景知识图谱进行更新，例如，在场景知识图谱中增加新的场景，或者，对场景知识图谱中的已有场景的场景元素信息进行更新(例如，对于已有场景增加一个新的场景元素)等。

作为一种示例性的实施方式，在根据在线所获取到的对话信息确定场景知识图谱需要增加新的场景时，可根据所获取到的人机对话信息，预测新增加场景的场景名称和场景类型，并预测新增加场景的场景元素信息，并根据新增加场景的场景名称、场景类型和场景元素信息更新场景知识图谱。

为了实现上述实施例，本申请还提出一种使用第一方面实施例的场景知识图谱进行人机对话的方法。

图2是根据本申请第二实施例的示意图。其中，需要说明的是，本实施例提供的人机对话方法的执行主体为人机对话装置，该装置可以由软件和/或硬件的方式实现，该装置可以配置在人机对话系统中，该人机对话系统可配置在终端设备、服务器等，该实施例对此不作具体限定。

如图2所示，该场景知识图谱的生成方法可以包括：

步骤201，获取用户的当前话语信息。

步骤202，根据当前话语信息和场景知识图谱，确定激活的目标场景名称及其场景元素信息。

在本申请实施例中，该人机对话装置执行步骤202的具体过程可以为：确定当前话语信息中的关键词信息；根据关键词信息，按照不同的激活类型从场景知识图谱中，确定激活的目标场景名称及其场景元素信息。

其中，激活类型可以分为直接激活类型、自联想激活类型、联想激活类型、动态激活类型和类比激活类型。

直接激活类型是指根据当前话语信息中的关键词信息作为候选场景名称，并确定场景知识图谱存在与该候选场景名称匹配的场景名称时，将匹配到的场景名称作为待激活的场景名称，或者，将匹配到的场景名称作为激活的目标场景名称。

例如，当前话语信息为“咱们聊聊刘德华”，此时，如果采用直接激活类型，此时，可确定当前话语信息中的关键词信息为“刘德华”，假设场景知识图谱中中存在场景名称为刘德华的场景节点，此时，从场景知识图谱中召回的场景为刘德华场景，并且，为了方便后续可进行人机对话交互，可从场景知识图谱中获取刘德华的场景元素信息，并结合所得到的场景元素信息与用户进行人机对话交互。

其中，自联想激活类型是指根据当前话语信息中的场景元素名称和/或元素内容，从场景知识图谱中来召回待激活的场景名称，或者激活的场景名称。

例如，当前话语信息为“最近有什么好看的电影”，通过关键词识别，可确定该当前话语信息中的关键词信息为电影，假设在场景知识图谱中，电影属于场景名为刘德华的场景元素名称，此时，采用自联想激活类型，从场景知识图谱中召回的场景名称可以为“刘德华”场景。其中，“刘德华”场景中，部分场景元素信息的示例如下：职业：演员，妻子：朱丽倩；电影：天下无贼，…，歌曲：忘情水，…等。

又例如，当前话语信息“我很喜欢刘德华”，通过关键词识别，可确定该当前话语信息中的关键词信息为刘德华，假设在场景知识图谱中，刘德华属于场景名为天下无贼的演员，此时，采用自联想激活类型，从场景知识图谱中召回的场景名称可以为“天下无贼”场景。其中，“天下无贼”场景中，部分场景元素信息的示例如下：演员：刘德华，刘若英，上映时间：2004-12-6，导演：冯小刚。

联想激活场景是指根据当前话语信息和场景知识图谱确定出一个第一场景后，激活一个关联的第二场景。

其中，第一场景和第二场景具有关联关系，关联关系可以包括但不限于时序、因果和搭配关系等。

例如，当前话语信息为我喜欢奔驰，在通过场景知识图谱确定出第一场景之后，如果场景知识图谱中在场景类型新闻事件中还存在奔驰最近的新闻事件，此时，可将奔驰最近的新闻事件作为第二场景，第一场景为：场景名称为奔驰，系列：S,C系列，国家：德国，第二场景为：奔驰最新车展，场景元素信息可以包括时间，地点等。

动态激活类型是根据当前话语信息和场景知识图谱确定出一个第一场景后，可激活与该第一场景共享的元素的第二场景。

例如，当前话语信息为我喜欢奔驰，在通过场景知识图谱确定出第一场景之后，假设场景知识图谱中保存第一场景与第二场景具有相同的品牌国家，第一场景为：场景：奔驰，系列：S,C系列，国家：德国，第二场景：场景：奥迪，系列：A,Q系列，国家：德国，如果通过采用动态激活类型，从场景知识图谱中召回的场景名称为奥迪。

类比激活类型是指当前话语信息和场景知识图谱确定出一个场景后，通过类比激活另一个相似的场景。

其中，类比分为两种情况，一种是两个场景相似，元素内容不同，另一种是两个场景不同，但是两个场景的场景元素信息相同，即，两个场景不同，场景元素值相同。

在本申请实施例中，根据关键词信息，按照不同的激活类型从场景知识图谱中，确定激活的目标场景名称及其场景元素信息，包括：按照不同的激活类型从场景知识图谱中，获取与关键词信息匹配的多个待激活的场景名称。从多个待激活的场景名称中确定出激活的目标场景名称，并从场景知识图谱获取目标场景名称的场景元素信息。

为了提高数据计算效率，进而提高给出回复语句的效率，在本申请一个实施中，还可以获取当前话语信息的历史对话信息，然后，根据历史对话信息和当前话语信息，确定当前话语信息的场景类型。

对应地，按照不同的激活类型从场景知识图谱中，获取与关键词信息匹配的多个待激活的场景名称的具体实现过程为：按照不同的激活类型从场景知识图谱中，获取与关键词信息和场景类型匹配的多个待激活的场景名称。

在本实施例中，从多个待激活的场景名称中确定出激活的目标场景名称的方式有很多中，举例说明如下：

作为一种示例，可从多个待激活的场景名称中选择一个或者多个作为激活的场景名称。

作为另一种示例，为了使得所确定出的激活的场景名称更加满足用户的当前需求，可获取每个待激活的场景名称当前的热度信息，并根据待激活的场景名称的热度信息，选择热度最高或者热度超过预设热度阈值的场景名称作为激活的目标场景名称。

步骤203，根据场景元素信息和当前话语信息，生成当前话语信息的回复语句。

为了实现上述实施例，本申请实施例还提供一种场景知识图谱的生成装置。

图3是根据本申请第二实施例的示意图。如图3所示，该场景知识图谱的生成装置100包括第一获取模块110、第一确定模块120、第一获取模块130、第二确定模块140、图谱生成模块150，其中：

第一获取模块110，用于获取待构建场景知识图谱的多个知识文本内容片段。

第一确定模块120，用于确定知识文本内容片段的场景名称。

第一获取模块130，用于获取与场景名称对应的场景类型。

第二确定模块140，用于根据场景类型，确定知识文本内容片段中的场景元素信息。

图谱生成模块150，用于根据各个知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱。

在本申请一个实施例中，第一确定模块110，具体用于：对知识文本内容片段进行句法分析，并根据句法分析结果，确定知识文本内容片段的场景名称。或者，识别出知识文本内容片段中的关键词，从场景库中匹配与关键词对应的场景名称，并匹配到的场景名称作为知识文本内容片段的场景名称。

在本申请一个实施例中，第二确定模块140，具体用于：获取与场景类型对应的知识表示学习模型。根据知识表示学习模型，确定知识文本内容片段中目标词语的概念信息，并将目标词语和概念信息作为场景元素信息。

在本申请一个实施例中，图谱生成模块150，具体用于：对同一场景类型下相同场景名称的场景元素信息进行聚合，以得到同一场景类型下相同场景名称的场景元素信息聚合结果。根据场景名称、场景类型和场景元素信息聚合结果，生成场景知识图谱。

其中，需要说明的是，前述对场景知识图谱的生成方法的解释说明也适用于本实施例的车辆场景知识图谱的生成装置，此处不再赘述。

为了实现上述实施例，本发明还提出一种使用第一方面实施例的场景知识图谱进行人机对话装置。

图4是根据本申请第四实施例的示意图。如图4所示，该基于场景知识图谱进行人机对话装置200，可以包括：

第二获取模块210，用于获取用户的当前话语信息。

第三确定模块220，用于根据当前话语信息和场景知识图谱，确定激活的目标场景名称及其场景元素信息。

回复语句生成模块230，用于根据场景元素信息和当前话语信息，生成当前话语信息的回复语句。

在本申请一个实施例中，第三确定模块220，具体用于：确定当前话语信息中的关键词信息；根据关键词信息，按照不同的激活类型从场景知识图谱中，确定激活的目标场景名称及其场景元素信息。

在本申请一个实施例中，第三确定模块220，具体用于：按照不同的激活类型从场景知识图谱中，获取与关键词信息匹配的多个待激活的场景名称；从多个待激活的场景名称中确定出激活的目标场景名称，并从场景知识图谱获取目标场景名称的场景元素信息。

在本申请一个实施例中，第三确定模块220，具体用于：获取每个待激活的场景名称的热度信息；根据各个待激活的场景名称的热度信息，选择当前热度最高的场景名称作为激活的目标场景名称。

在本申请一个实施例中，在图4所示的装置实施的基础上，如图5所示，该装置还包括：

第三获取模块240，用于获取当前话语信息的历史对话信息；

第四确定模块250，用于根据历史对话信息和当前话语信息，确定当前话语信息的场景类型；

第三确定模块220，具体用于：按照不同的激活类型从场景知识图谱中，获取与关键词信息和场景类型匹配的多个待激活的场景名称。

其中，需要说明的是，前述对基于场景知识图谱的人机对话方法实施例的解释说明也适用于本实施例的基于场景知识图谱的人机对话装置，此处不再赘述。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图6所示，是根据本申请实施例的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图6所示，该电子设备包括：一个或多个处理器601、存储器602，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。

存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中，存储器存储有可由至少一个处理器执行的指令，以使至少一个处理器执行本申请所提供的场景知识图谱的生成方法，或者，基于场景知识图谱进行人机对话方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的场景知识图谱的生成方法，或者，基于场景知识图谱进行人机对话方法。

存储器602作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的场景知识图谱的生成方法对应的程序指令/模块。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的场景知识图谱的生成方法，或者，基于场景知识图谱进行人机对话方法。

存储器602可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器602可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器602可选包括相对于处理器601远程设置的存储器，这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

电子设备还可以包括：输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接，图6中以通过总线连接为例。

输入装置603可接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

图7是根据本申请第六实施例的示意图。其中，需要说明的是，本实施例提供的场景知识图谱的生成方法的执行主体为场景知识图谱的生成装置，该装置可以由软件和/或硬件的方式实现，该装置可以配置在电子设备中，电子设备可以包括但不限于终端设备、服务器等，该实施例对此不作具体限定。

如图7所示，该场景知识图谱的生成方法可以包括：

步骤701，获取待处理的多个知识文本内容片段。

步骤702，获取每个知识文本内容片段的场景名称、场景类型和场景元素信息。

其中，在不同应用场景中，获取每个知识文本内容片段的场景名称、场景类型和场景元素信息的方式不同，例如：

作为一种可能的实现方式，可根据预先保存的对应关系，获取每个知识文本内容片段的场景名称、场景类型和场景元素信息。

其中，对应关系中保存了知识文本内容片段与场景名称、场景类型和场景元素信息之间的关系。

作为一种可能的实现方式，针对每个知识文本内容片段，确定知识文本内容片段的场景名称；获取与场景名称对应的场景类型；根据场景类型，确定知识文本内容片段中的场景元素信息。

作为另一种可能的实现方式，针对每个知识文本内容片段，可将知识文本内容片段输入到预先训练的分析模型，通过分析模型，确定出知识文本内容片段的场景名称、场景类型和场景元素信息。

步骤703，根据各个知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱。

其中，需要说明的是，前述对上述场景知识图谱的生成方法的解释说明也适用于本实施例的场景知识图谱的生成方法，相关描述可参见相关部分，此处步骤赘述。

本申请实施例的场景知识图谱的生成方法，获取待构建场景知识图谱的多个知识文本内容片段，获取每个知识文本内容片段的场景名称、场景类型和场景元素信息，以及根据各个知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱，由此，结合知识文本内容片段的场景名称、场景类型和场景元素信息生成了基于场景的场景知识图谱，从而方便了结合场景知识图谱理解各个知识之间的关系，方便后续机器结合场景知识图谱进行后续相关处理。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种场景知识图谱的生成方法，其特征在于，包括：

获取待构建场景知识图谱的多个知识文本内容片段；

确定所述知识文本内容片段的场景名称；

获取与所述场景名称对应的场景类型；

根据所述场景类型，确定所述知识文本内容片段中的场景元素信息；

根据各个所述知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱；

所述根据所述场景类型，确定所述知识文本内容片段中的场景元素信息，包括：

获取与所述场景类型对应的知识表示学习模型；

根据所述知识表示学习模型，确定所述知识文本内容片段中目标词语的概念信息，并将所述目标词语和所述概念信息作为所述场景元素信息。

2.如权利要求1所述的方法，其特征在于，所述确定所述知识文本内容片段的场景名称，包括：

对所述知识文本内容片段进行句法分析，并根据句法分析结果，确定所述知识文本内容片段的场景名称；或者，

识别出所述知识文本内容片段中的关键词，从场景库中匹配与所述关键词对应的场景名称，并匹配到的场景名称作为所述知识文本内容片段的场景名称。

3.如权利要求1-2任一项所述的方法，其特征在于，所述根据各个所述知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱，包括：

对同一场景类型下相同场景名称的场景元素信息进行聚合，以得到同一场景类型下相同场景名称的场景元素信息聚合结果；

根据所述场景名称、所述场景类型和所述场景元素信息聚合结果，生成所述场景知识图谱。

4.一种基于如权利要求1-3任一项所述的场景知识图谱进行人机对话方法，所述方法包括：

获取用户的当前话语信息；

根据所述当前话语信息和所述场景知识图谱，确定激活的目标场景名称及其场景元素信息；

根据所述场景元素信息和所述当前话语信息，生成所述当前话语信息的回复语句；

所述根据所述当前话语信息和所述场景知识图谱，确定激活的目标场景名称及其场景元素信息，包括：

确定所述当前话语信息中的关键词信息；

根据所述关键词信息，按照不同的激活类型从所述场景知识图谱中，确定激活的目标场景名称及其场景元素信息，其中，所述目标场景名称是与所述关键词信息匹配的。

5.如权利要求4所述的方法，其特征在于，所述根据所述关键词信息，按照不同的激活类型从所述场景知识图谱中，确定激活的目标场景名称及其场景元素信息，包括：

按照不同的激活类型从所述场景知识图谱中，获取与所述关键词信息匹配的多个待激活的场景名称；

从多个待激活的场景名称中确定出所述激活的目标场景名称，并从所述场景知识图谱获取所述目标场景名称的场景元素信息。

6.如权利要求5所述的方法，其特征在于，所述从多个待激活的场景名称中确定出所述激活的目标场景名称，包括：

获取每个所述待激活的场景名称的热度信息；

根据各个所述待激活的场景名称的热度信息，选择当前热度最高的场景名称作为所述激活的目标场景名称。

7.如权利要求5所述的方法，其特征在于，所述方法还包括：

获取所述当前话语信息的历史对话信息；

根据所述历史对话信息和所述当前话语信息，确定所述当前话语信息的场景类型；

所述按照不同的激活类型从所述场景知识图谱中，获取与所述关键词信息匹配的多个待激活的场景名称，包括：

按照不同的激活类型从所述场景知识图谱中，获取与所述关键词信息和场景类型匹配的多个待激活的场景名称。

8.一种场景知识图谱的生成装置，其特征在于，包括：

第一获取模块，用于获取待构建场景知识图谱的多个知识文本内容片段；

第一确定模块，用于确定所述知识文本内容片段的场景名称；

第一获取模块，用于获取与所述场景名称对应的场景类型；

第二确定模块，用于根据所述场景类型，确定所述知识文本内容片段中的场景元素信息；

图谱生成模块，用于根据各个所述知识文本内容片段的场景名称、场景类型和场景元素信息，生成场景知识图谱；

所述第二确定模块，具体用于：

获取与所述场景类型对应的知识表示学习模型；

9.如权利要求8所述的装置，其特征在于，所述第一确定模块，具体用于：

10.如权利要求8-9任一项所述的装置，其特征在于，所述图谱生成模块，具体用于：

11.一种基于如权利要求8-10任一项所述的场景知识图谱进行人机对话装置，所述装置包括：

第二获取模块，用于获取用户的当前话语信息；

第三确定模块，用于根据所述当前话语信息和所述场景知识图谱，确定激活的目标场景名称及其场景元素信息；

回复语句生成模块，用于根据所述场景元素信息和所述当前话语信息，生成所述当前话语信息的回复语句；

所述第三确定模块，具体用于：

确定所述当前话语信息中的关键词信息；

12.如权利要求11所述的装置，其特征在于，所述第三确定模块，具体用于：

13.如权利要求12所述的装置，其特征在于，所述第三确定模块，具体用于：

获取每个所述待激活的场景名称的热度信息；

14.如权利要求12所述的装置，其特征在于，所述装置还包括：

第三获取模块，用于获取所述当前话语信息的历史对话信息；

第四确定模块，用于根据所述历史对话信息和所述当前话语信息，确定所述当前话语信息的场景类型；

所述第三确定模块，具体用于，包括：

15.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-3中任一项所述的方法，或者，权利要求4-7中任一项所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-3中任一项所述的方法，或者，权利要求4-7中任一项所述的方法。

17.一种场景知识图谱的生成方法，其特征在于，包括：

获取待处理的多个知识文本内容片段；

获取每个所述知识文本内容片段的场景名称、场景类型和场景元素信息；

其中，所述场景元素信息是通过下述方式得到的：

获取与所述场景类型对应的知识表示学习模型；