CN111625658A

CN111625658A - 基于知识图谱的语音交互方法、装置、设备及存储介质

Info

Publication number: CN111625658A
Application number: CN202010735132.4A
Authority: CN
Inventors: 曹小伍; 曹景溢; 雷铭杰
Original assignee: Hangzhou Xiangyi Technology Co Ltd
Current assignee: Hangzhou Xiangyi Technology Co Ltd
Priority date: 2020-07-28
Filing date: 2020-07-28
Publication date: 2020-09-04

Abstract

本发明属于语音交互技术领域，公开了一种基于知识图谱的语音交互方法、装置、设备及存储介质。该方法通过获取用户的语音信息，通过自然语言处理算法提取语音信息的关键词；根据关键词从本地知识图谱中搜索对应的应答结果；在未搜索到应答结果时根据关键词获取目标领域；根据目标领域以及本地知识图谱构建融合知识图谱；根据关键词从融合知识图谱中搜索语音信息对应的应答结果，并将搜索的应答结果反馈给用户。本发明中在本地知识图谱中搜索不到应答结果时，根据关键词获取目标领域从而结合本地知识图谱构建融合知识图谱，扩大知识图谱的实体涵盖量更好地反馈应答结果给用户，解决了人工智能对话的知识图谱的实体涵盖量低造成对话效率低的问题。

Description

基于知识图谱的语音交互方法、装置、设备及存储介质

技术领域

本发明涉及语音交互技术领域，尤其涉及一种基于知识图谱的语音交互方法、装置、设备及存储介质。

背景技术

知识图谱又称为科学知识图谱，在图书情报界称为知识域可视化或知识领域映射地图，是显示知识发展进程与结构关系的一系列各种不同的图形，用可视化技术描述知识资源及其载体，挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。近年来，随着科技的快速发展，互联网应用广泛深入各类领域，大数据呈现爆炸式增长，海量的知识和信息分散于网络空间，人们越来越多的依赖于网络来获取信息，而互联网的信息呈现出海量、剧增和冗余等特性，为了能更好的监控和运用其中的信息，让机器能够分析文本中的事件，面向事件的语句分析研究显得越来越重要，这关系到目前慢慢兴起的人工智能对话过程的互动性。

基于知识图谱的人工智能对话系统，比传统语料检索的对话系统的优势在于其多具备了知识和常识方面的回答能力。但是这类人工智能对话系统的知识类问答质量受限于其知识图谱的实体涵盖量以及更新频率。知识图谱的实体涵盖量不够，导致人机对话时，用户问的相关知识机器人无法给出答案。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种基于知识图谱的语音交互方法、装置、设备及存储介质，旨在解决现有人工智能对话系统的知识图谱的实体涵盖量低，造成人工智能对话效率低的技术问题。

为实现上述目的，本发明提供了一种基于知识图谱的语音交互方法，所述基于知识图谱的语音交互方法包括以下步骤：

获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词；

根据所述关键词从本地知识图谱中搜索所述语音信息对应的应答结果；

在未搜索到所述应答结果时，根据所述关键词获取目标领域；

根据所述目标领域以及所述本地知识图谱构建融合知识图谱；

根据所述关键词从所述融合知识图谱中搜索所述语音信息对应的应答结果，并将搜索的应答结果反馈给用户。

优选地，所述根据所述目标领域以及所述本地知识图谱构建融合知识图谱的步骤，具体包括：

根据所述目标领域对应的知识图谱接口服务器发起图谱查询需求，获得所述目标领域的知识路由表；

根据所述知识路由表从知识融合协调器网中获取所述目标领域对应的目标知识融合协调器，其中，所述知识融合协调器网由知识融合协调器构成；

通过所述目标知识融合协调器对所述本地知识图谱的进行融合，获得融合知识图谱。

优选地，所述获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词的步骤之前，还包括：

按照预设网络结构设置预设数量的知识融合协调器；

将若干领域的知识图谱接口服务器挂载到对应的所述知识融合协调器中。

根据所述目标领域获取目标实体的实体描述信息；

根据所述实体描述信息从预设语料中获得目标语料，并根据所述目标语料构建多背景知识模型；

通过预设深度模型从所述多背景知识模型中获得所述目标实体的语义嵌入向量；

根据所述语义嵌入向量对所述多背景知识模型与所述本地知识图谱进行融合，获得融合知识图谱。

根据所述目标领域获取目标知识图谱；

基于所述本地知识图谱进行知识图谱的表示学习，获取第一初始向量；

基于所述目标知识图谱进行知识图谱的表示学习，获取第二初始向量；

基于预设参考向量集获取参考向量空间，将所述第一初始向量和所述第二初始向量分别映射到所述参考向量空间中，获取第一映射向量和第二映射向量；

根据所述第一映射向量和所述第二映射向量对所述目标知识图谱和所述本地知识图谱进行融合，获取融合知识图谱。

优选地，所述根据所述关键词从本地知识图谱中搜索所述语音信息对应的应答结果的步骤之后，还包括：

在搜索到所述应答结果时，对所述应答结果进行语意分析，获得所述应答结果的行为属性；

对所述应答结果进行意图分析，获得所述应答结果的意图属性；

当所述行为属性和所述意图属性为预设应答属性时，将所述应答结果反馈给用户。

优选地，所述自然语言处理算法包括：问句解析算法和文本关键词提取算法；

所述获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词的步骤，具体包括：

获取用户的语音信息，通过问句解析算法对所述语音信息进行分析，获得目标语句；

通过文本关键词提取算法从所述目标语句中提取关键词。

此外，为实现上述目的，本发明还提出一种基于知识图谱的语音交互装置，所述基于知识图谱的语音交互装置包括：

提取模块，用于获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词；

搜索模块，用于根据所述关键词从本地知识图谱中搜索所述语音信息对应的应答结果；

获取模块，用于在未搜索到所述应答结果时，根据所述关键词获取目标领域；

融合模块，用于根据所述目标领域以及所述本地知识图谱构建融合知识图谱；

反馈模块，用于根据所述关键词从所述融合知识图谱中搜索所述语音信息对应的应答结果，并将搜索的应答结果反馈给用户。

此外，为实现上述目的，本发明还提出一种基于知识图谱的语音交互设备，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于知识图谱的语音交互程序，所述基于知识图谱的语音交互程序配置为实现如上文所述的基于知识图谱的语音交互方法的步骤。

此外，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有基于知识图谱的语音交互程序，所述基于知识图谱的语音交互程序被处理器执行时实现如上文所述的基于知识图谱的语音交互方法的步骤。

本发明通过获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词；根据所述关键词从本地知识图谱中搜索所述语音信息对应的应答结果；在未搜索到所述应答结果时，根据所述关键词获取目标领域；根据所述目标领域以及所述本地知识图谱构建融合知识图谱；根据所述关键词从所述融合知识图谱中搜索所述语音信息对应的应答结果，并将搜索的应答结果反馈给用户。通过上述方式，在本地知识图谱中搜索不到应答结果时，根据关键词推导出目标领域从而结合本地知识图谱构建融合知识图谱，扩大了知识图谱的实体涵盖量，能更好地将应答结果反馈给用户，提升了人工智能对话系统的互动性，解决了现有人工智能对话系统的知识图谱的实体涵盖量低，造成人工智能对话效率低的技术问题。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的基于知识图谱的语音交互设备的结构示意图；

图2为本发明基于知识图谱的语音交互方法第一实施例的流程示意图；

图3为本发明基于知识图谱的语音交互方法第二实施例的流程示意图；

图4为本发明基于知识图谱的语音交互方法第三实施例的流程示意图；

图5为本发明基于知识图谱的语音交互装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的基于知识图谱的语音交互设备结构示意图。

如图1所示，该基于知识图谱的语音交互设备可以包括：处理器1001，例如中央处理器（Central Processing Unit，CPU），通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏（Display）、输入单元比如键盘（Keyboard），可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口（如无线保真（WIreless-FIdelity，WI-FI）接口）。存储器1005可以是高速的随机存取存储器（RandomAccess Memory，RAM）存储器，也可以是稳定的非易失性存储器（Non-Volatile Memory，NVM），例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对基于知识图谱的语音交互设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于知识图谱的语音交互程序。

在图1所示的基于知识图谱的语音交互设备中，网络接口1004主要用于与网络服务器进行数据通信；用户接口1003主要用于与用户进行数据交互；本发明基于知识图谱的语音交互设备中的处理器1001、存储器1005可以设置在基于知识图谱的语音交互设备中，所述基于知识图谱的语音交互设备通过处理器1001调用存储器1005中存储的基于知识图谱的语音交互程序，并执行本发明实施例提供的基于知识图谱的语音交互方法。

本发明实施例提供了一种基于知识图谱的语音交互方法，参照图2，图2为本发明一种基于知识图谱的语音交互方法第一实施例的流程示意图。

本实施例中，所述基于知识图谱的语音交互方法包括以下步骤：

步骤S10：获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词。

需要说明的是，所述自然语言处理算法可以包括：问句解析算法和文本关键词提取算法；所述获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词的步骤，具体包括：获取用户的语音信息，通过问句解析算法对所述语音信息进行分析，获得目标语句；通过文本关键词提取算法从所述目标语句中提取关键词。所述自然语言处理算法还可以包括文本分类算法、信息抽取算法等，本实施例对此不加以限制。

具体地，在获取到用户的语音信息后，首先需要分析出所述语音信息的形式，也即获取到语音信息的类型，另外，利用问句解析算法获取问句中的实体，如事件、关系、专有名词等。进一步地，利用文本关键词提取算法获取语音信息内的关键词，所述关键词可以为出现频率较高的词或短语，或先提取出出现频率较高的词之后，通过总结这些词的共同特性得到关键词。

应当理解的是，获取用户的语音信息可以通过消息采集接口采集用户的语音信息；其中，所述消息采集接口可以为语音采集接口、图像采集接口或文本采集接口。可以理解的是，用户的语音信息可以由用户下发语音提出，可以由图片承载，也可以直接以文本形式输入。也就是说，还可以获取用户的图像信息，通过图像处理技术根据所述图像信息提取关键词。所述图像处理技术可以包括图像内文本识别技术。

需要说明的是，通过自然语言处理算法根据所述语音信息提取关键词之外，还可以对所述语音信息的知识类型分类，例如按学科分类比如社会学科、心理学、生物学以及地理类等，获得所述语音信息的学科分类结果，根据学科分类结果获取对应的本地知识图谱，从而搜索所述语音信息对应的应答结果。

步骤S20：根据所述关键词从本地知识图谱中搜索所述语音信息对应的应答结果。

可以理解的是，根据所述关键词从本地知识图谱中搜索所述语音信息对应的应答结果。本地知识图谱可以为基于人工智能创建的知识图谱。利用所述关键词搜索所述本地知识图谱，得到与所述语音信息相关的知识信息，利用上述步骤提取出的关键词，对基于人工智能创建的本地知识图谱进行检索，可以获取到与所述关键词相关的准确知识信息及发散知识信息。

需要说明的是，所述根据所述关键词从本地知识图谱中搜索所述语音信息对应的应答结果的步骤之后，还可以包括：在搜索到所述应答结果时，对所述应答结果进行语意分析，获得所述应答结果的行为属性；对所述应答结果进行意图分析，获得所述应答结果的意图属性；当所述行为属性和所述意图属性为预设应答属性时，将所述应答结果反馈给用户。

具体地，获取到与所述关键词相关的准确知识信息及发散知识信息，可以将准确知识信息及发散知识信息作为所述应答结果。对所述应答结果进行语意分析，获得所述应答结果的行为属性，进行语意分析可以为进行言语行为分类，言语行为分类是指判断一句话是否为“问信息的问句”，比如“可以介绍下Y吗”；“问意见的问句”，比如“今天打伞好不好呢”；“表达愿望类陈句”，“表达喜好类陈述句”，“表达意见类陈述句”，“普通陈述句”，“肯定回答”，“否定回答”，“不清楚的回答”，“反问句”，“抱怨批评指责类”，“道歉”，“感谢”，“赞美”，“对话开场”，“终止对话”等。对所述应答结果进行意图分析，获得所述应答结果的意图属性，进行意图分析可以为进行意图分类，意图分类是指判断一句话是否为“闲聊”，比如“今天天气不错”；“知识问”，比如“小伦的主要代表作品有哪些呢”；“知识答”，比如“小伦的代表作品有《A》，《B》”；“功能性音乐类问”，比如“给我放一首音乐吧”；“功能性订票问”，比如“帮我订明天早上去北京的高铁票”等。

易于理解的是，当所述行为属性和所述意图属性为预设应答属性时，将所述应答结果反馈给用户，其中，所述预设应答属性可以为陈述句，或者为知识性答案即“知识答”，即当所述行为属性和所述意图属性为为陈述句或知识性答案时，将所述应答结果反馈给用户，所述预设应答属性还可以为预先设置的其他属性，本实施例对此不加以限制。

需要说明的是，获取到与所述关键词相关的准确知识信息及发散知识信息，可以根据准确知识信息及发散知识信息与用户的语音信息的相关程度进行筛选，将与语音信息相关性较小的知识信息进行剔除，选择出与语音信息相关性较强或相关性适中的知识信息；进一步地，可以根据预设语序将筛选出来的知识信息进行排序，生成应答结果。具体地，所述预设语序可以是预先设置的语序，也可以为在提取到用户的语音信息之后，获取该语音信息的语句语序，可将该语音信息的语句语序作为预设语序，可以更好地提升用户的语音交互体验度。

此外，当获取到用户的多个语音信息，需要作出多个应答时，可以根据相同的预设语序，对每个语音信息对应的筛选出来的知识信息进行排序，生成多个应答结果，从而保证用户获得的多个应答结果均可以采用同样的语序习惯，使用户获得良好的语音交互体验。

步骤S30：在未搜索到所述应答结果时，根据所述关键词获取目标领域。

需要说明的是，在根据所述关键词从本地知识图谱中未搜索到所述应答结果时，说明本地知识图谱中实体涵盖量低，可以根据所述关键词获取目标领域，根据所述目标领域以及所述本地知识图谱构建融合知识图谱，扩大知识图谱中实体涵盖量。

步骤S40：根据所述目标领域以及所述本地知识图谱构建融合知识图谱。

需要说明的是，可以采取以下三种融合方式中的任意一种实现根据所述目标领域以及所述本地知识图谱构建融合知识图谱，其中，构建融合知识图谱的过程还可以包括其他融合方式，本实施例对此不加以限制。

第一种融合方式为：所述根据所述目标领域以及所述本地知识图谱构建融合知识图谱的过程包括：根据所述目标领域对应的知识图谱接口服务器发起图谱查询需求，获得所述目标领域的知识路由表；根据所述知识路由表从知识融合协调器网中获取所述目标领域对应的目标知识融合协调器，其中，所述知识融合协调器网由知识融合协调器构成；通过所述目标知识融合协调器对所述本地知识图谱的进行融合，获得融合知识图谱。

需要说明的是，所述获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词的步骤之前，还包括：按照预设网络结构设置预设数量的知识融合协调器；将若干领域的知识图谱接口服务器挂载到对应的所述知识融合协调器中。其中，所述知识融合协调器是多个装置，多个所述知识融合协调器可以直连或远程连接。多个所述知识融合协调器可以呈网状、环形或星形布放；多个所述知识融合协调器中任意两个知识融合协调器之间实现路径可达，所述知识融合协调器网由知识融合协调器构成。知识融合协调器主要功能是实现跨领域的知识路由功能，在发起图谱查询需求时，反馈本知识融合协调器的下一跳接口，此下一跳接口指向与本知识融合协调器路由可达的待查询的所述目标领域的知识图谱。

具体地，根据所述目标领域对应的知识图谱接口服务器发起图谱查询需求，获得所述目标领域的知识路由表，其中，所述知识路由表为图谱查询的路由信息集合，用于在收到图谱查询需求后，向查询方反馈查询结果，查询结果即是匹配的知识路由下一跳信息，其中，所述知识路由表存在于知识融合协调器中，由知识融合协调器生成、更新，并在知识融合协调器网内进行通告；所述知识路由表中的知识路由呈条目排列，可以至少包括四列信息，每条知识路由中的信息可以定义如下：第一条知识路由可以为实体1，实体1即查询请求中的领域1知识图谱中的实体名称；第二条知识路由可以为关系，关系即领域1知识图谱中的实体和领域2知识图谱中的实体匹配关系；第三条知识路由可以为实体2，实体2即领域2知识图谱中的实体名称；第四条知识路由可以为下一跳，下一跳即领域2知识图谱接口服务器或路由可达领域2知识图谱接口服务器的知识融合协调器地址。

具体地，根据所述知识路由表从知识融合协调器网中获取所述目标领域对应的目标知识融合协调器；所述知识路由表为图谱查询的路由信息集合，用于在收到图谱查询需求后，向查询方反馈查询结果，查询结果即是匹配的知识路由下一跳信息，下一跳即所述目标领域的知识图谱接口服务器或路由可达所述目标领域的知识图谱接口服务器的知识融合协调器地址，即获取所述目标领域对应的目标知识融合协调器地址，通过所述目标知识融合协调器地址，向所述目标领域的知识图谱接口服务器发起图谱查询请求，由该目标领域的知识图谱接口服务器反馈目标知识图谱，通过该目标知识图谱与所述本地知识图谱的融合，获得融合知识图谱。

应当理解的是，可以在知识融合协调器网内进行通告，同时根据预设更新规则，更新知识路由表，更新知识路由表的过程具体可以为：在甲知识融合协调器生成甲知识路由表后，在知识融合协调器网内通告，将甲知识路由表通告至全网任一知识融合协调器；当另一乙知识融合协调器的收到来自甲知识融合协调器的甲知识路由表时，分析提取甲知识路由表中新的知识路由表信息，并更新至自身的乙知识路由表。

第二种融合方式为：所述根据所述目标领域以及所述本地知识图谱构建融合知识图谱的过程包括：根据所述目标领域获取目标实体的实体描述信息；根据所述实体描述信息从预设语料中获得目标语料，并根据所述目标语料构建多背景知识模型；通过预设深度模型从所述多背景知识模型中获得所述目标实体的语义嵌入向量；根据所述语义嵌入向量对所述多背景知识模型与所述本地知识图谱进行融合，获得融合知识图谱。

第三种融合方式为：所述根据所述目标领域以及所述本地知识图谱构建融合知识图谱的过程包括：根据所述目标领域获取目标知识图谱；基于所述本地知识图谱进行知识图谱的表示学习，获取第一初始向量；基于所述目标知识图谱进行知识图谱的表示学习，获取第二初始向量；基于预设参考向量集获取参考向量空间，将所述第一初始向量和所述第二初始向量分别映射到所述参考向量空间中，获取第一映射向量和第二映射向量；根据所述第一映射向量和所述第二映射向量对所述目标知识图谱和所述本地知识图谱进行融合，获取融合知识图谱。

步骤S50：根据所述关键词从所述融合知识图谱中搜索所述语音信息对应的应答结果，并将搜索的应答结果反馈给用户。

可以理解的是，根据所述关键词从所述融合知识图谱中搜索所述语音信息对应的应答结果，并将搜索的应答结果反馈给用户。利用所述关键词搜索所述融合知识图谱，得到与所述语音信息相关的知识信息，利用上述步骤提取出的关键词，对所述融合知识图谱进行检索，可以获取到与所述关键词相关的准确知识信息及发散知识信息，获取到与所述关键词相关的准确知识信息及发散知识信息，可以将准确知识信息及发散知识信息作为所述应答结果。

需要说明的是，所述根据所述关键词从所述融合知识图谱中搜索所述语音信息对应的应答结果，并将搜索的应答结果反馈给用户的步骤之后，还可以包括：在根据所述关键词从所述融合知识图谱中搜索到所述应答结果时，对所述应答结果进行语意分析，获得所述应答结果的行为属性；对所述应答结果进行意图分析，获得所述应答结果的意图属性；当所述行为属性和所述意图属性为预设应答属性时，将所述应答结果反馈给用户。

本实施例通过获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词；根据所述关键词从本地知识图谱中搜索所述语音信息对应的应答结果；在未搜索到所述应答结果时，根据所述关键词获取目标领域；根据所述目标领域以及所述本地知识图谱构建融合知识图谱；根据所述关键词从所述融合知识图谱中搜索所述语音信息对应的应答结果，并将搜索的应答结果反馈给用户。通过上述方式，在本地知识图谱中搜索不到应答结果时，根据关键词推导出目标领域从而结合本地知识图谱构建融合知识图谱，扩大了知识图谱的实体涵盖量，能更好地将应答结果反馈给用户，提升了人工智能对话系统的互动性，解决了现有人工智能对话系统的知识图谱的实体涵盖量低，造成人工智能对话效率低的技术问题。

参考图3，图3为本发明一种基于知识图谱的语音交互方法第二实施例的流程示意图。基于上述第一实施例，本实施例基于知识图谱的语音交互方法在所述步骤S40，具体包括：

S401：根据所述目标领域获取目标实体的实体描述信息。

需要说明的是，不是所有的实体都有描述信息，描述信息的质量也可能参差不齐。因此，对于没有描述信息或描述信息质量差的弱描述实体，提出多背景知识(multiplecontextual knowledge，MCK)辅助的模型来改进实体描述辅助的模型，主要是选择从文本语料库中获取头尾实体的背景信息作为弱描述实体的补充知识。

具体地，根据所述目标领域从知识库的实体标签中选择优质的实体描述信息，将优质的实体描述信息作为目标实体的实体描述信息，其中，优质可以为文本长度多于3个词且平均长度为69个词，最长描述不超过343个字。

S402：根据所述实体描述信息从预设语料中获得目标语料，并根据所述目标语料构建多背景知识模型。

可以理解的是，根据所述实体描述信息从预设语料中获得目标语料，并根据所述目标语料构建多背景知识模型，所述预设语料可以为Web语料，根据所述实体描述信息从预设语料中获得目标语料，选择与实体相关的优质语料作为目标语料，其中，优质可以为文本长度多于3个词且平均长度为69个词，最长描述不超过343个字。根据所述目标语料构建多背景知识模型。

具体地，通过嵌入多背景知识模型来学习知识库的嵌入表示。多背景知识模型不仅可以包括实体描述即来自知识库中目标实体的实体描述信息，还可以包括来自其他文本语料库的文本知识。多背景知识模型包括来自知识库中目标实体的实体描述信息即知识库中目标实体的实体标签，和来自其他文本语料库的文本知识，目标实体的实体描述信息为描述知识，其他文本语料库的文本知识为补充知识。

S403：通过预设深度模型从所述多背景知识模型中获得所述目标实体的语义嵌入向量。

需要说明的是，通过嵌入多背景知识模型来学习知识库的嵌入表示，预设深度模型可以为DBALSTM模型，其中，DBALSTM＝深度D+双向B+关注A+基本LSTM；通过DBALSTM模型从多背景知识模型获得相应实体的语义嵌入向量，将融合嵌入机制用于多背景知识与所述本地知识图谱的三元组的细粒度结合，完成融合多背景知识的知识图谱嵌入。

其中，DBALSTM模型中可以采用两级关注机制A选择价值量高的多背景知识，轻量级深度机制D减少网络深度和防止参数急剧增加，双向机制B捕捉语义的双向相关，基本LSTM刻画长期语义依赖关系。

具体地，采用DBALSTM模型解码多背景知识，DBALSTM模型分为3层：第一层：外部关注层中采用外部关注机制根据实体基于描述知识、补充知识的特征向量表示与基于元组的向量表示的相似度从多个多背景知识中挑选出有价值的多背景知识。第二层：在深度层使用轻量级深度机制来平衡建模质量和模型复杂性，同时使用内部关注机制来增强单个多背景知识中有价值词的权重。轻量级深度机制外部关注与内部关注形成两级关注。第三层：词表示用于将实体的描述知识和单条外部知识表示为词向量，采用“位置嵌入+词嵌入”的方式，词嵌入可以采用负采样Skipgram模型训练的鳌，并用X表示。位置嵌入可以为从当前词到头实体h和尾实体t的相对距离的组合。

S404：根据所述语义嵌入向量对所述多背景知识模型与所述本地知识图谱进行融合，获得融合知识图谱。

可以理解的是，根据所述语义嵌入向量对所述多背景知识模型与所述本地知识图谱进行融合嵌入学习，融合嵌入学习是为了自适应细粒度的结合元组知识、描述知识和外部知识，主要依据是频繁实体很大程度上依赖于元组知识，而不频繁实体很大程度上依赖于多背景知识，通过DBALSTM模型从多背景知识模型获得相应实体的语义嵌入向量，根据所述语义嵌入向量对所述多背景知识模型与所述本地知识图谱进行融合嵌入学习，将融合嵌入学习机制用于多背景知识模型与所述本地知识图谱的三元组的细粒度结合，完成融合多背景知识的知识图谱嵌入，获得融合知识图谱。

本实施例通过根据所述目标领域获取目标实体的实体描述信息；根据所述实体描述信息从预设语料中获得目标语料，并根据所述目标语料构建多背景知识模型；通过预设深度模型从所述多背景知识模型中获得所述目标实体的语义嵌入向量；根据所述语义嵌入向量对所述多背景知识模型与所述本地知识图谱进行融合，获得融合知识图谱。通过上述方式，在本地知识图谱中搜索不到应答结果时，根据关键词推导出目标领域，通过多背景知识将融合嵌入学习机制用于多背景知识模型与所述本地知识图谱的三元组的细粒度结合，完成融合多背景知识的知识图谱嵌入，获得融合知识图谱。扩大了知识图谱的实体涵盖量，能更好地将应答结果反馈给用户，提升了人工智能对话系统的互动性，解决了现有人工智能对话系统的知识图谱的实体涵盖量低，造成人工智能对话效率低的技术问题。

参考图4，图4为本发明一种基于知识图谱的语音交互方法第三实施例的流程示意图。基于上述第一实施例，本实施例基于知识图谱的语音交互方法在所述步骤S40，具体包括：

S401’：根据所述目标领域获取目标知识图谱。

需要说明的是，基于知识表示的方法，对来自不同数据源的目标知识图谱和本地知识图谱进行融合，在知识表示的基础上，根据参考知识图谱，除了能实现通常的知识图谱融合中的实体消歧和实体链接之外，还能发现单独的本地知识图谱中不存在的关系，从而进行知识的扩展。

S402’：基于所述本地知识图谱进行知识图谱的表示学习，获取第一初始向量。

可以理解的是，第一初始向量，为所述本地知识图谱中的实体或关系在第一向量空间中的向量表示结果。

需要说明的是，知识图谱的输入为非结构化数据，知识图谱可以包括多组“实体—关系—实体”的资源描述框架(Resource Description Framework，RDF)三元组形式。每一“实体—关系—实体”三元组，可以称为一个实例。为了便于进行知识图谱的融合，可以通过知识图谱的表示学习，将知识图谱中的实体和关系进行向量化，获得实体和关系在向量空间中的向量表示结果，即获得实体和关系对应的向量。

具体地，常见的知识图谱的表示学习的模型可以包括：距离模型、单层神经网络模型、能量模型、双线性模型、张量神经网络模型、矩阵分解模型和翻译模型等。例如，可以采用TransE、PTransE、TransH等翻译模型，将所述本地知识图谱中的各实例向量化，获得第一向量空间中表示所述本地知识图谱中的实体或关系的第一初始向量。

S403’：基于所述目标知识图谱进行知识图谱的表示学习，获取第二初始向量。

需要说明的是，第二初始向量，为所述目标知识图谱中的实体或关系在第二向量空间中的向量表示结果。

具体地，常见的知识图谱的表示学习的模型可以包括：距离模型、单层神经网络模型、能量模型、双线性模型、张量神经网络模型、矩阵分解模型和翻译模型等。例如，可以采用TransE、PTransE、TransH等翻译模型，分别将所述本地知识图谱中的各实例向量化，将所述目标知识图谱中的各实例向量化，获得第二向量空间中表示所述本地知识图谱中的实体或关系的第二初始向量。

S404’：基于预设参考向量集获取参考向量空间，将所述第一初始向量和所述第二初始向量分别映射到所述参考向量空间中，获取第一映射向量和第二映射向量。

可以理解的是，预设参考向量，为参考知识图谱中的实体在参考向量空间中的向量表示结果；所述本地知识图谱、所述目标知识图谱和参考知识图谱，是基于不同的数据源构建的。

需要说明的是，运用知识表示进行实体融合的方法，基本思想是通过参考向量集，对待融合的本地知识图谱和目标知识图谱中实体的向量表示的训练产生限制，将未融合的实体对训练成距离接近的向量。例如，本地知识图谱和目标知识图谱存在等价实体“抗生素”以及相同的关系“药品类型”，那么在本地知识图谱和目标知识图谱的训练过程中，“阿莫西林”和“羟氨苄青霉素”应该被表示为距离相近的向量。

需要说明的是，可以通过知识图谱的表示学习的方法，将参考知识图谱的实体和关系进行向量化，获得参考向量空间中表示参考知识图谱中的实体或关系的各参考向量。可以将基于参考知识图谱获得的各参考向量，组成最初的参考向量集。对单个知识图谱进行单独训练，即根据翻译模型对所述本地知识图谱进行训练获得各第一初始向量，根据翻译模型对所述目标知识图谱进行训练获得各第二初始向量，为了进行知识融合，需要将两个待融合的知识图谱(即所述本地知识图谱和所述目标知识图谱)中实例映射到同一个低维向量空间中。可以根据参考向量集，对各第一初始向量和各第二初始向量进行双向监督训练，将各第一初始向量和各第二初始向量映射到参考向量空间中，获取每一第一初始向量对应的第一映射向量和每一第二初始向量对应的第二映射向量。

S405’：根据所述第一映射向量和所述第二映射向量对所述目标知识图谱和所述本地知识图谱进行融合，获取融合知识图谱。

需要说明的是，根据所述第一映射向量和所述第二映射向量对所述目标知识图谱和所述本地知识图谱进行融合，获取融合知识图谱。可以基于第一映射向量和第二映射向量之间的距离，判断第一映射向量对应的所述本地知识图谱中的实体和第二映射向量应的所述目标知识图谱中的实体具有的含义是否相同或者是否存在包含关系，将具有相同的含义的所述本地知识图谱中的实体和所述目标知识图谱中的实体，确定为待融合的实体对。根据所确定的待融合的实体对，对所述本地知识图谱中的实体和所述目标知识图谱中的实体进行融合，可以获得融合知识图谱。

易于理解的是，通常的知识图谱融合方法基于实体自身的语义，判断不同知识图谱中的实体具有的含义是否相同或者是否存在包含关系，发现等价实例、等价或为包含关系等概念或属性，在此基础上进行实体消歧和实体链接，没有考虑知识图谱内部的逻辑性。而本发明实施例基于知识图谱的表示学习的方法，利用词向量的平移不变现象，在判断不同知识图谱中的实体具有的含义是否相同或者是否存在包含关系时，除了基于实体自身的语义，还基于该实体与其他实体之间的关系，因而能利用知识图谱内部的逻辑性，能增强获得的融合知识图谱内部的逻辑性和表达能力，能更好地将应答结果反馈给用户，提升了人工智能对话系统的互动性。

本实施例通过根据所述目标领域获取目标知识图谱；基于所述本地知识图谱进行知识图谱的表示学习，获取第一初始向量；基于所述目标知识图谱进行知识图谱的表示学习，获取第二初始向量；基于预设参考向量集获取参考向量空间，将所述第一初始向量和所述第二初始向量分别映射到所述参考向量空间中，获取第一映射向量和第二映射向量；根据所述第一映射向量和所述第二映射向量对所述目标知识图谱和所述本地知识图谱进行融合，获取融合知识图谱。通过上述方式，在本地知识图谱中搜索不到应答结果时，根据关键词推导出目标领域获得目标知识图谱，基于知识图谱的表示学习，利用词向量的平移不变现象，在判断不同知识图谱中的实体具有的含义是否相同或者是否存在包含关系时，除了基于实体自身的语义，还基于该实体与其他实体之间的关系，因而能利用知识图谱内部的逻辑性，能增强获得的融合知识图谱内部的逻辑性和表达能力。扩大了知识图谱的实体涵盖量，能更好地将应答结果反馈给用户，提升了人工智能对话系统的互动性，解决了现有人工智能对话系统的知识图谱的实体涵盖量低，造成人工智能对话效率低的技术问题。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有基于知识图谱的语音交互程序，所述基于知识图谱的语音交互程序被处理器执行如上文所述的基于知识图谱的语音交互方法的步骤。

由于本存储介质采用了上述所有实施例的全部技术方案，因此至少具有上述实施例的技术方案所带来的所有有益效果，在此不再一一赘述。

参照图5，图5为本发明基于知识图谱的语音交互装置第一实施例的结构框图。

如图5所示，本发明实施例中所述基于知识图谱的语音交互装置包括：提取模块10、搜索模块20、获取模块30、融合模块40以及反馈模块50；其中，

提取模块10，用于获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词。

搜索模块20，用于根据所述关键词从本地知识图谱中搜索所述语音信息对应的应答结果。

易于理解的是，当所述行为属性和所述意图属性为预设应答属性时，将所述应答结果反馈给用户，其中，所述预设应答属性可以为陈述句，或者为知识性答案即“知识答”，即当所述行为属性和所述意图属性为为陈述句或知识性答案时，将所述应答结果反馈给用户，所述预设应答属性还可以为人为设置的其他属性，本实施例对此不加以限制。

获取模块30，用于在未搜索到所述应答结果时，根据所述关键词获取目标领域。

融合模块40，用于根据所述目标领域以及所述本地知识图谱构建融合知识图谱。

反馈模块50，用于根据所述关键词从所述融合知识图谱中搜索所述语音信息对应的应答结果，并将搜索的应答结果反馈给用户。

本实施例中，基于知识图谱的语音交互装置包括：提取模块10，用于获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词；搜索模块20，用于根据所述关键词从本地知识图谱中搜索所述语音信息对应的应答结果；获取模块30，用于在未搜索到所述应答结果时，根据所述关键词获取目标领域；融合模块40，用于根据所述目标领域以及所述本地知识图谱构建融合知识图谱；反馈模块50，用于根据所述关键词从所述融合知识图谱中搜索所述语音信息对应的应答结果，并将搜索的应答结果反馈给用户。通过上述方式，在本地知识图谱中搜索不到应答结果时，根据关键词推导出目标领域从而结合本地知识图谱构建融合知识图谱，扩大了知识图谱的实体涵盖量，能更好地将应答结果反馈给用户，提升了人工智能对话系统的互动性，解决了现有人工智能对话系统的知识图谱的实体涵盖量低，造成人工智能对话效率低的技术问题。

在本发明所述基于知识图谱的语音交互装置的其他实施例或具体实现方法可参照上述各方法实施例，此处不再赘述。

应当理解的是，以上仅为举例说明，对本发明的技术方案并不构成任何限定，在具体应用中，本领域的技术人员可以根据需要进行设置，本发明对此不做限制。

需要说明的是，以上所描述的工作流程仅仅是示意性的，并不对本发明的保护范围构成限定，在实际应用中，本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的，此处不做限制。

另外，未在本实施例中详尽描述的技术细节，可参见本发明任意实施例所提供的基于知识图谱的语音交互方法，此处不再赘述。

此外，需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质（如只读存储器（Read Only Memory，ROM）/RAM、磁碟、光盘）中，包括若干指令用以使得一台终端设备（可以是手机，计算机，服务器，或者网络设备等）执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于知识图谱的语音交互方法，其特征在于，所述基于知识图谱的语音交互方法包括：

2.如权利要求1所述的基于知识图谱的语音交互方法，其特征在于，所述根据所述目标领域以及所述本地知识图谱构建融合知识图谱的步骤，具体包括：

3.如权利要求2所述的基于知识图谱的语音交互方法，其特征在于，所述获取用户的语音信息，通过自然语言处理算法根据所述语音信息提取关键词的步骤之前，还包括：

按照预设网络结构设置预设数量的知识融合协调器；

4.如权利要求1所述的基于知识图谱的语音交互方法，其特征在于，所述根据所述目标领域以及所述本地知识图谱构建融合知识图谱的步骤，具体包括：

根据所述目标领域获取目标实体的实体描述信息；

5.如权利要求1所述的基于知识图谱的语音交互方法，其特征在于，所述根据所述目标领域以及所述本地知识图谱构建融合知识图谱的步骤，具体包括：

根据所述目标领域获取目标知识图谱；

6.如权利要求1所述的基于知识图谱的语音交互方法，其特征在于，所述根据所述关键词从本地知识图谱中搜索所述语音信息对应的应答结果的步骤之后，还包括：

7.如权利要求1~6中任一项所述的基于知识图谱的语音交互方法，其特征在于，所述自然语言处理算法包括：问句解析算法和文本关键词提取算法；

通过文本关键词提取算法从所述目标语句中提取关键词。

8.一种基于知识图谱的语音交互装置，其特征在于，所述基于知识图谱的语音交互装置包括：

9.一种基于知识图谱的语音交互设备，其特征在于，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于知识图谱的语音交互程序，所述基于知识图谱的语音交互程序配置为实现如权利要求1至7中任一项所述的基于知识图谱的语音交互方法的步骤。

10.一种存储介质，其特征在于，所述存储介质上存储有基于知识图谱的语音交互程序，所述基于知识图谱的语音交互程序被处理器执行时实现如权利要求1至7任一项所述的基于知识图谱的语音交互方法的步骤。