基于知识图谱的自然语言问答方法及装置
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种基于知识图谱的自然语言问答方法及装置。
背景技术
在人工智能技术与应用大规模涌现的背景下,知识图谱数据大量涌现,为推动人工智能技术发展提供了强大驱动力。如何充分利用知识图谱的大规模高质量结构化数据是许多人工智能应用研究的重点。基于知识图谱的问答技术可以用知识图谱中的知识回答以自然语言形式提出的问题,可用于智能客服、经常问到的问题FAQ等场景。如何将自然语言问题转换成知识图谱查询语言,并通过查询图谱回答问题是知识图谱问答任务的研究重点,对于智能问答和知识图谱应用都是至关重要的技术。
现有知识图谱问答方法可以包括以下三种方式:
方式一,基于规则的问答,通过编写模板,将能够由模板匹配的自然语言问题转换成相应的知识图谱查询语言;
方式二,基于语义解析的问答,大多数方法构建自然语言的句法树,通过分析句法树转换知识图谱查询语言;
方式三,基于端到端的问答,构建复杂的深度学习模型,通过模型将自然语言问题转换成知识图谱查询语言或比较自然语言问题与知识图谱中知识的相似度。
然而,对于基于规则的问答方式,该方式需要消耗大量的人力编写模板,且由于难以靠人力穷举所有可能的问答模板,此类方法通常只能回答少量的问题句式,且泛化能力差;
对于基于语义解析的问答方式,由于该方式需要通过句法树构建查询语句,对句法分析的依赖度较高,由于自然语言自身的复杂性,句法分析在表述稍复杂的句子上就会出现错误,基于错误的句法树很大可能会构建错误的查询语句,因而无法得到正确答案,导致问答的正确率较低;
对于基于端到端的问答方式,该方式中的深度学习模型由于需要大量的训练语料导致获取难度大,且目前相关技术研究基于深度学习模型的问答正确率较低。
发明内容
本申请实施例提供一种基于知识图谱的自然语言问答方法及装置,解决了现有技术存在的上述问题,提高了自然语言的泛化能力和问答的正确率。
第一方面,提供了一种基于知识图谱的自然语言问答方法,该方法可以包括:
获取输入的自然查询语句中的至少一个实体指称文本和实体指称文本间的至少一个关系指称文本;
在预设知识图谱中,根据所述至少一个实体指称文本和所述至少一个关系指称文本,获取所述自然查询语句对应的关系图,所述关系图用于描述所述自然查询语句对应的所述至少一个实体名称和所述至少一个关系路径名称间的关联关系;
查询获取的关系图,得到所述自然查询语句的问答结果。
在一个可选的实现中,在预设知识图谱中,根据所述至少一个实体指称文本和所述至少一个关系指称文本,获取所述自然查询语句对应的关系图,包括:
在预设知识图谱中,查找所述至少一个实体指称文本中每个实体指称文本对应的实体名称,以及所述至少一个关系指称文本中每个关系指称文本对应的关系路径名称;
根据所述至少一个实体名称和至少一个关系路径名称,获取所述自然查询语句对应的关系图。
在一个可选的实现中,查询获取的关系图,得到所述自然查询语句的问答结果,包括:
采用预设的句法分析规则,对所述自然查询语句进行句法分析,得到所述自然查询语句对应的核心语句;
查询获取的关系图,得到所述核心语句的问答结果。
在一个可选的实现中,得到所述自然查询语句的问答结果之后,所述方法还包括:
向所述用户发送所述问答结果。
在一个可选的实现中,在所述预设知识图谱中,查找获取的至少一个实体名称和至少一个关系路径名称,获取所述自然查询语句对应的关系图,包括:
根据至少一个实体指称文本和至少一个关系指称文本在自然查询语句中的位置,确定在所述自然查询语句中至少一个实体指称文本的排列顺序、至少一个关系指称文本的排列顺序和所述至少一个实体名称的排列顺序;
将第一个实体指称文本对应的第一实体名称确定为起始查询实体名称,并将与所述第一实体名称相邻的关系指称文本对应的第一关系路径名称确定为起始查询关系名称;
根据所述起始查询实体名称和所述起始查询关系名称,查询所述预设知识图谱,获取起始的过程关系图,所述起始的过程关系图用于描述所述起始查询实体名称、所述起始查询关系名称和所述预设知识图谱中关联实体名称间的关联关系;
在所述预设知识图谱中查询起始的过程关系图和所述实体排列顺序中除所述第一实体名称外的当前实体间的关联关系,获取当前的过程关系图,所述当前的过程关系图用于描述所述起始的过程关系图中各个实体名称和所述当前实体名称间的关联关系;
若所述当前实体名称为所述实体名称排列顺序中的最终实体名称,则将所述最终实体名称对应的过程关系图中满足预设规则的当前的过程关系图确定为所述自然查询语句对应的关系图。
在一个可选的实现中,所述满足预设规则是指构建的过程关系图中任意两实体名称间的关系路径数不超过所述至少一个关系指称文本对应的关系路径名称总数,且构建的过程关系图中不存在所述至少一个关系指称文本对应的关系路径名称之外的关系路径名称。
在一个可选的实现中,根据预设的句法分析规则,对所述自然查询语句进行句法分析,得到所述自然查询语句对应的核心语句,包括:
根据预设的句法分析规则,对所述自然查询语句进行句法分析,得到所述自然查询语句对应的句法树,所述句法树包括所述自然查询语句的句子结构;
提取所述句法树顶层中所述自然查询语句的主谓宾结构的文本;
将所述提取的主谓宾结构的文本确定为所述自然查询语句对应的核心语句。
在一个可选的实现中,得到所述自然查询语句对应的核心语句之后,所述方法还包括:
若所述核心语句的主语不为关系路径名称,则将所述核心语句确定为目标核心语句;
若所述核心语句的主语为关系路径名称,且所述关系图包含所述关系路径名称,则将所述关系路径名称在关系图中关联的终点实体名称替换所述主语,得到目标核心语句;
若所述核心语句的主语为关系路径名称,且所述关系图不包含所述关系路径名称,则查询所述句法树中所述关系路径名称关联的起始实体名称,得到所述关系路径名称关联的起始实体名称;
根据所述起始实体名称与所述关系路径名称,查询所述预设知识图谱,获取所述关系路径名称关联的终点实体名称;
将所述终点实体名称替换所述主语,得到目标核心语句。
在一个可选的实现中,所述方法还包括:
将所述关系路径名称在所述关系图中进行补充。
在一个可选的实现中,查询构建的关系图,得到所述自然查询语句的问答结果,包括:
若所述目标核心语句的谓语为关系路径名称,则所述关系路径名称在所述关系图中关联的终点实体名称确定为问答结果;
若所述目标核心语句的谓语不为关系路径名称,则将所述目标核心语句的主语确定为问答结果。
在一个可选的实现中,若所述目标核心语句的谓语不为关系路径名称,则将所述目标核心语句的主语确定为问答结果,包括:
若所述目标核心语句的主语为实体类别名称,谓语不为关系路径名称,则将所述实体类别名称在所述关系图中对应的实体名称确定为问答结果;
若所述目标核心语句的主语为属性值,谓语不为关系路径名称,则将所述属性值确定为问答结果;
若所述目标核心语句的主语为实体名称,谓语不为关系路径名称,则将所述实体名称确定为问答结果。
第二方面,提供了一种基于知识图谱的自然语言问答装置,该装置可以包括:获取单元和查询单元;
所述获取单元,用于获取输入的自然查询语句中的至少一个实体指称文本和实体指称文本间的至少一个关系指称文本;
在预设知识图谱中,根据所述至少一个实体指称文本和所述至少一个关系指称文本,获取所述自然查询语句对应的关系图,所述关系图用于描述所述自然查询语句对应的所述至少一个实体名称和所述至少一个关系路径名称间的关联关系;
所述查询单元,用于查询获取的关系图,得到所述自然查询语句的问答结果。
在一个可选的实现中,所述获取单元,具体用于在预设知识图谱中,查找所述至少一个实体指称文本中每个实体指称文本对应的实体名称,以及所述至少一个关系指称文本中每个关系指称文本对应的关系路径名称;
根据所述至少一个实体名称和至少一个关系路径名称,获取所述自然查询语句对应的关系图。
在一个可选的实现中,所述装置还包括分析单元;
所述分析单元,用于采用预设的句法分析规则,对所述自然查询语句进行句法分析,得到所述自然查询语句对应的核心语句;
所述查询单元,具体用于查询获取的关系图,得到所述核心语句的问答结果。
在一个可选的实现中,所述装置还包括发送单元;
所述发送单元,用于向所述用户发送所述问答结果。
在一个可选的实现中,所述获取单元,具体用于根据至少一个实体指称文本和至少一个关系指称文本在自然查询语句中的位置,确定在所述自然查询语句中至少一个实体指称文本的排列顺序、至少一个关系指称文本的排列顺序和所述至少一个实体名称的排列顺序;
将第一个实体指称文本对应的第一实体名称确定为起始查询实体名称,并将与所述第一实体名称相邻的关系指称文本对应的第一关系路径名称确定为起始查询关系名称;
根据所述起始查询实体名称和所述起始查询关系名称,查询所述预设知识图谱,获取起始的过程关系图,所述起始的过程关系图用于描述所述起始查询实体名称、所述起始查询关系名称和所述预设知识图谱中关联实体名称间的关联关系;
在所述预设知识图谱中查询起始的过程关系图和所述实体排列顺序中除所述第一实体名称外的当前实体间的关联关系,获取当前的过程关系图,所述当前的过程关系图用于描述所述起始的过程关系图中各个实体名称和所述当前实体名称间的关联关系;
若所述当前实体名称为所述实体名称排列顺序中的最终实体名称,则将所述最终实体名称对应的过程关系图中满足预设规则的当前的过程关系图确定为所述自然查询语句对应的关系图。
在一个可选的实现中,所述满足预设规则是指构建的过程关系图中任意两实体名称间的关系路径数不超过所述至少一个关系指称文本对应的关系路径名称总数,且构建的过程关系图中不存在所述至少一个关系指称文本对应的关系路径名称之外的关系路径名称。
在一个可选的实现中,所述分析单元,具体用于根据预设的句法分析规则,对所述自然查询语句进行句法分析,得到所述自然查询语句对应的句法树,所述句法树包括所述自然查询语句的句子结构;
提取所述句法树顶层中所述自然查询语句的主谓宾结构的文本;
将所述提取的主谓宾结构的文本确定为所述自然查询语句对应的核心语句。
在一个可选的实现中,所述分析单元,还具体用于若所述核心语句的主语不为关系路径名称,则将所述核心语句确定为目标核心语句;
若所述核心语句的主语为关系路径名称,且所述关系图包含所述关系路径名称,则将所述关系路径名称在关系图中关联的终点实体名称替换所述主语,得到目标核心语句;
若所述核心语句的主语为关系路径名称,且所述关系图不包含所述关系路径名称,则查询所述句法树中所述关系路径名称关联的起始实体名称,得到所述关系路径名称关联的起始实体名称;
根据所述起始实体名称与所述关系路径名称,查询所述预设知识图谱,获取所述关系路径名称关联的终点实体名称;
将所述终点实体名称替换所述主语,得到目标核心语句。
在一个可选的实现中,所述装置还包括补充单元;
所述补充单元,用于将所述关系路径名称在所述关系图中进行补充。
在一个可选的实现中,所述查询单元,具体用于若所述目标核心语句的谓语为关系路径名称,则所述关系路径名称在所述关系图中关联的终点实体名称确定为问答结果;
若所述目标核心语句的谓语不为关系路径名称,则将所述目标核心语句的主语确定为问答结果。
在一个可选的实现中,所述查询单元,还具体用于若所述目标核心语句的谓语不为关系路径名称,则将所述目标核心语句的主语确定为问答结果,包括:
若所述目标核心语句的主语为实体类别名称,谓语不为关系路径名称,则将所述实体类别名称在所述关系图中对应的实体名称确定为问答结果;
若所述目标核心语句的主语为属性值,谓语不为关系路径名称,则将所述属性值确定为问答结果;
若所述目标核心语句的主语为实体名称,谓语不为关系路径名称,则将所述实体名称确定为问答结果。
第三方面,提供了一种电子设备,该电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面中任一所述的方法步骤。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一所述的方法步骤。
本发明实施例提供的基于知识图谱的自然语言问答方法在获取输入的自然查询语句中的至少一个实体指称文本和实体指称文本间的至少一个关系指称文本;在预设知识图谱中,根据至少一个实体指称文本和至少一个关系指称文本,获取自然查询语句对应的关系图,关系图用于描述自然查询语句对应的至少一个实体名称和至少一个关系路径名称间的关联关系,并查询获取的关系图,得到自然查询语句的问答结果。该方法基于知识图谱,构建与自然查询语句对应的关系图,且对自然查询语句中句法关系的依赖程度大幅度降低,提高了构建关系图的准确率,从而提高问答的正确率与自然语言的泛化能力。
附图说明
图1为本发明实施例提供的一种基于知识图谱的自然语言问答方法的流程示意图;
图2A为本发明实施例提供的一种关系图的结构示意图;
图2B为在图2A基础上提供的一种关系图的结构示意图;
图2C为在图2B基础上提供的一种关系图的结构示意图;
图2D为本发明实施例提供的另一种关系图的结构示意图;
图3A为本发明实施例提供的一种句法树的结构示意图;
图3B为本发明实施例提供的另一种句法树的结构示意图;
图3C为本发明实施例提供的再一种句法树的结构示意图;
图3D为本发明实施例提供的再一种关系图的结构示意图;
图4为本发明实施例提供的一种基于知识图谱的自然语言问答装置的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,并不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
相关名词介绍:
实体链接(Entity Linking)技术,是指将从文本中的实体指称(mention name)链接到知识库(如知识图谱)中对应的实体(entity)对象的操作技术。
关系链接(Relation Linking)技术,是指将文本中检测和识别出的实体指称项之间具有的某种语义的关系指称链接到知识库(如知识图谱)中对应的关系路径的操作技术。
句法树,用于描述文本的句子成分,以及文本中各个词语之间在句法上的搭配关系。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明实施例提供的应用知识图谱的自然语言问答方法的问答设备可以应用在服务器上,也可以应用在终端上。其中,服务器可以是应用服务器或云服务器;终端可以是移动电话、智能电话、笔记本电脑、数字广播接收器、个人数字助理(PDA)、平板电脑(PAD)等用户设备(User Equipment,UE)、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备、移动台(Mobile station,MS)、移动终端(Mobile Terminal)等。
图1为本发明实施例提供的一种基于知识图谱的自然语言问答方法的流程示意图。如图1所示,该方法可以包括:
步骤110、获取输入的自然查询语句中的至少一个实体指称文本和实体指称文本间的至少一个关系指称文本。
问答设备可以获取用户输入的自然查询语句,并识别出自然查询语句中的至少一个实体指称文本和实体指称文本间的至少一个关系指称文本。
步骤120、在预设知识图谱中,根据至少一个实体指称文本和至少一个关系指称文本,获取自然查询语句对应的关系图。
问答设备在预设知识图谱中,查找至少一个实体指称文本中每个实体指称文本对应的实体名称,以及至少一个关系指称文本中每个关系指称文本对应的关系路径名称。
问答设备可以采用预设实体链接技术,将识别出的至少一个实体指称文本链接到预设知识图谱中,获取与每个实体指称文本对应的唯一且无歧义的预设知识图谱中的实体名称;
同时,问答设备可以采用预设关系链接技术,将识别出的至少一个关系指称文本链接到预设知识图谱中,获取与每个关系指称文本对应的唯一且无歧义的预设知识图谱中的关系路径名称。
其中,上述提及的预设实体链接技术和预设关系链接技术分别是任意一种本领域技术人员熟知的实体链接技术和关系链接技术,故本申请实施例在此不做限定。
例如,“陈凯歌导演张国荣主演的电影有哪些”的自然查询语句,问答设备识别出的实体指称文本包括:“陈凯歌”、“张国荣”、“电影”,识别出的关系指称文本包括:“导演”、“主演”。
问答设备采用预设实体链接技术,分别将识别出的“陈凯歌”实体指称文本、“张国荣”实体指称文本、“电影”实体指称文本链接到预设知识图谱中,得到在预设知识图谱中与“陈凯歌”实体指称文本对应的实体名称为<陈凯歌_导演>;与“张国荣”实体指称文本对应的实体名称为<张国荣_艺人>;与“电影”实体指称文本对应的实体名称为<电影_科技艺术>。
相应的,问答设备采用预设关系链接技术,分别将识别出的“导演”关系指称文本、“主演”关系指称文本该链接到预设知识图谱中,得到在预设知识图谱中与“导演”关系指称文本对应的唯一且无歧义的关系路径名称为[<导演>];与“主演”关系指称文本对应的唯一且无歧义的关系路径名称为[<主演>]。
需要说明的是,由于<实体>—[是]—><类型>的语句中“是”的关系指称文本通常在自言语言中隐式的表达,为后续处理方便,不识别此类关系指称文本;
每个关系指称文本肯定能对应知识图谱中的一条关系路径名称。例如,当预设知识图谱中未存储[<祖父>]的关系路径名称时,关系指称文本“爷爷”对应的关系路径名称应为[<父亲>,<父亲>]。
之后,问答设备可以根据至少一个实体名称和至少一个关系路径名称,获取自然查询语句对应的关系图。
根据至少一个实体名称和至少一个关系路径名称,获取自然查询语句对应的关系图。
其中,关系图用于描述该自然查询语句对应的至少一个实体名称和至少一个关系路径名称间的关联关系。也就是说,该关系图建模了自然查询语句中的知识信息,属于预设知识图谱的子图。
问答设备可以根据至少一个实体指称文本和至少一个关系指称文本在自然查询语句中的位置,确定在自然查询语句中至少一个实体指称文本的排列顺序、至少一个关系指称文本的排列顺序和至少一个实体名称的排列顺序;
将第一个实体指称文本对应的第一实体名称确定为起始查询实体,将与第一实体名称相邻的关系指称文本对应的第一关系路径名称确定为起始查询关系名称;
根据起始查询实体名称和起始查询关系名称,查询预设知识图谱,获取起始的过程关系图。其中,起始的过程关系图用于描述起始查询实体名称、起始查询关系名称和预设知识图谱中关联实体名称间的关联关系,该关联实体名称可以是自然查询语句未涉及的实体名称,也可以是自然查询语句涉及的实体名称。
在预设知识图谱中查询起始的过程关系图和实体排列顺序中除第一实体名称外的当前实体名称间的关联关系,获取当前的过程关系图;其中,当前的过程关系图用于描述查询起始的过程关系图中各个实体名称和当前实体名称间的关联关系。
若当前实体名称为实体排列顺序中的最终实体名称,则最终实体名称对应的过程关系图中将满足预设规则的当前的过程关系图确定为自然查询语句对应的关系图。
其中,满足预设规则是指构建的过程关系图中任意两实体名称间的关系路径数不超过至少一个关系指称文本对应的关系路径名称总数,且构建的过程关系图中不存在至少一个关系指称文本对应的关系路径名称之外的关系路径名称。
需要说明的是,由于查找预设知识图谱可以得到至少一条满足要求的关系路径,即预设知识图谱中存在至少一条能够描述前一次获取的过程关系图和当前实体名称间关联关系的关系路径,故此时自然查询语句对应的关系图的数量为至少一个,也就是说,在关系图的数量为多个时,自然查询语句中对应的关系路径名称可以出现在不同的关系图中。且由于<实体>—[是]—><类型>的语句中“是”的关系指称文本通常在自言语言中隐式的表达,不将其计入关系路径名称数中,且始终将其视作关系路径名称中涉及的关系不做删除处理。
在一个例子中,以“陈凯歌导演张国荣主演的电影有哪些”的自然查询语句为例,其中,与“陈凯歌”实体指称文本对应的实体名称为<陈凯歌_导演>;
与“张国荣”实体指称文本对应的实体名称为<张国荣_艺人>;
与“电影”实体指称文本对应的实体名称为<电影_科技艺术>;
与“导演”关系指称文本对应的关系路径名称为[<导演>];
与“主演”关系指称文本对应的关系路径名称为[<主演>]。
首先将实体名称<陈凯歌_导演>确定为起始查询实体,将关系路径名称[<导演>]确定为起始查询关系,查询预设知识图谱,获取起始的过程关系图,如图2A所示,其中,该起始的过程关系图用于描述起始查询实体名称、起始查询关系名称和关联实体名称<霸王别姬_电影>、<风月_电影>间的关联关系。
然后,按照实体名称排列顺序,以起始的过程关系图中的实体名称<霸王别姬_电影>、实体名称<风月_电影>和实体名称<陈凯歌_导演>均作为新的起始实体名称,在预设知识图谱中分别查询上述每个实体名称与实体名称<张国荣_艺人>间的关联关系,获取当前的过程关系图,即得到实体名称<陈凯歌_导演>导演的实体名称<风月_电影>、实体名称<霸王别姬_电影>均是实体名称<张国荣_艺人>主演的关联关系,如图2B所示。
之后,按照实体名称排列顺序,以起始的过程关系图中的实体名称<霸王别姬_电影>、实体名称<风月_电影>、实体名称<陈凯歌_导演>和实体名称<张国荣_艺人>均作为新的起始实体名称,在预设知识图谱中分别查询上述各个实体名称与实体名称<电影_科技艺术>间的关联关系,获取新的当前的过程关系图,即得到由实体名称<陈凯歌_导演>导演的,且由实体名称<张国荣_艺人>主演的实体名称<风月_电影>、实体名称<霸王别姬_电影>均是实体名称<电影_科技艺术>类别的关联关系。且由于实体名称<电影_科技艺术>是最终实体名称,故采用预设规则对最终实体名称对应的过程关系图进行关系图筛选,将满足预设规则的关系图确定为自然查询语句对应的关系图,如图2C所示。
在另一个例子中,以“周杰伦老婆是谁”的自然查询语句为例,查找预设知识图谱得到:
与“周杰伦”实体指称文本对应的实体名称为<周杰伦>;
与“老婆”关系指称文本对应的关系路径名称为[<妻子>]。
首先将实体名称<周杰伦>确定为起始查询实体名称,将关系路径名称[<妻子>]确定为起始查询关系,查询预设知识图谱,获取起始的过程关系图,起始的过程关系图描述了起始查询实体名称、起始查询关系名称和关联实体名称<昆凌>的关联关系。由于实体名称<周杰伦>是最终实体名称,故采用预设规则对上述获取的过程关系图进行关系图筛选,将满足预设规则的关系图确定为自然查询语句对应的关系图,如图2D所示。
步骤130、查询获取的关系图,得到自然查询语句的问答结果。
可选地,为了提高准确性,在执行该步骤之前,可以根据预设的句法分析规则,对自然查询语句进行句法分析,得到自然查询语句对应的核心语句。
问答设备根据预设的句法分析规则,对自然查询语句进行句法分析,得到自然查询语句对应的句法树,其中,句法树可以包括自然查询语句的句子结构。
例如,若自然查询语句为“陈凯歌导演张国荣主演的电影有哪些”,则自然查询语句对应的句法树的结构可以如图3A所示;
若自然查询语句为“周杰伦老婆是谁”,则自然查询语句对应的句法树的结构可以如图3B所示;
若自然查询语句为“周杰伦老婆的身高是多少”,则自然查询语句对应的句法树的结构可以如图3C所示。
之后,问答设备提取句法树顶层中自然查询语句的主谓宾结构的文本,如主谓宾结构的文本为“电影,有,哪些”或“老婆,是,谁”,并将提取的主谓宾结构的文本确定为自然查询语句对应的核心语句。
其中,电影属于具体实体名称的实体类别,老婆和身高均属于关系路径名称。
可选地,若核心语句的主语不为关系路径名称,则将核心语句确定为目标核心语句,也就是说,核心语句的主语为实体类别、实体名称或属性值时,核心语句为目标核心语句。
若核心语句的主语为关系路径名称,如老婆或身高,且关系图包含关系路径名称,则将关系路径名称在关系图中关联的终点实体类别、实体名称或属性值,如实体名称<昆凌>或属性值“165cm”替换相应主语,得到目标核心语句:“昆凌,是,谁”或“165cm,是,多少”。
若核心语句的主语为关系路径名称,且关系图不包含关系路径名称,则查询句法树中关系路径名称关联的起始实体名称,得到关系路径名称关联的起始实体名称;
根据起始实体名称与关系路径名称,查询预设知识图谱,获取关系路径名称关联的终点实体名称、实体类别或属性值,并将终点实体名称、实体类别或属性值替换该主语,得到目标核心语句。
如,核心语句的主语为身高,且关系图不包含关系路径名称<身高>,则获取图3C所示的句法树中“身高”关联的起始实体名称<周杰伦>,由于身高与周杰伦间存在“老婆”,即关系路径名称[<妻子>],则在预设知识图谱中查询关系路径[<妻子><身高>]关联的属性值:“165cm”。将属性值“165cm”替换该主语,得到目标核心语句:“165cm,是,多少”。
之后,问答设备可以将该关系路径名称,如<身高>在关系图中进行补充,如图3D所示。回到步骤130,若目标核心语句的谓语为关系路径名称,则关系路径在关系图中关联的终点实体名称确定为问答结果;
若目标核心语句的谓语不为关系路径名称,则将目标核心语句的主语确定为问答结果。
其中,若目标核心语句的主语为实体类别,如“电影”,谓语不为关系路径名称,则将实体类别在关系图中对应的实体名称确定为问答结果;
若目标核心语句的主语为属性值,如165cm,谓语不为关系路径,则将属性值确定为问答结果;
若目标核心语句的主语为实体名称,谓语不为关系路径名称,则将实体名称确定为问答结果。
可选地,该问答结果可以包括但不限制于字符串、单实体名称、多实体名称、比较结果、分叉信息、列表等。
可选地,问答设备还可以向用户发送该问答结果。
本发明实施例提供的基于知识图谱的自然语言问答方法在获取输入的自然查询语句中的至少一个实体指称文本和实体指称文本间的至少一个关系指称文本;在预设知识图谱中,根据至少一个实体指称文本和至少一个关系指称文本,获取自然查询语句对应的关系图,关系图用于描述自然查询语句对应的至少一个实体名称和至少一个关系路径名称间的关联关系,并查询获取的关系图,得到自然查询语句的问答结果。该方法基于知识图谱,构建与自然查询语句对应的关系图,且对自然查询语句中句法关系的依赖程度大幅度降低,提高了构建关系图的准确率,从而提高问答的正确率与自然语言的泛化能力。
与上述方法对应的,本发明实施例还提供一种基于知识图谱的自然语言问答装置,如图4所示,该装置包括:获取单元410和查询单元420;
获取单元410,用于获取输入的自然查询语句中的至少一个实体指称文本和实体指称文本间的至少一个关系指称文本;
在预设知识图谱中,根据所述至少一个实体指称文本和所述至少一个关系指称文本,获取所述自然查询语句对应的关系图,所述关系图用于描述所述自然查询语句对应的所述至少一个实体名称和所述至少一个关系路径名称间的关联关系;
查询单元420,用于查询获取的关系图,得到所述自然查询语句的问答结果。
在一个可选的实现中,获取单元410,具体用于在预设知识图谱中,查找所述至少一个实体指称文本中每个实体指称文本对应的实体名称,以及所述至少一个关系指称文本中每个关系指称文本对应的关系路径名称;
根据所述至少一个实体名称和至少一个关系路径名称,获取所述自然查询语句对应的关系图。
在一个可选的实现中,所述装置还包括分析单元430;
分析单元430,用于采用预设的句法分析规则,对所述自然查询语句进行句法分析,得到所述自然查询语句对应的核心语句;
查询单元420,具体用于查询获取的关系图,得到所述核心语句的问答结果。
在一个可选的实现中,所述装置还包括发送单元440;
发送单元440,用于向所述用户发送所述问答结果。
在一个可选的实现中,获取单元410,具体用于根据至少一个实体指称文本和至少一个关系指称文本在自然查询语句中的位置,确定在所述自然查询语句中至少一个实体指称文本的排列顺序、至少一个关系指称文本的排列顺序和所述至少一个实体名称的排列顺序;
将第一个实体指称文本对应的第一实体名称确定为起始查询实体名称,并将与所述第一实体名称相邻的关系指称文本对应的第一关系路径名称确定为起始查询关系名称;
根据所述起始查询实体名称和所述起始查询关系名称,查询所述预设知识图谱,获取起始的过程关系图,所述起始的过程关系图用于描述所述起始查询实体名称、所述起始查询关系名称和所述预设知识图谱中关联实体名称间的关联关系;
在所述预设知识图谱中查询起始的过程关系图和所述实体排列顺序中除所述第一实体名称外的当前实体间的关联关系,获取当前的过程关系图,所述当前的过程关系图用于描述所述起始的过程关系图中各个实体名称和所述当前实体名称间的关联关系;
若所述当前实体名称为所述实体名称排列顺序中的最终实体名称,则将所述最终实体名称对应的过程关系图中满足预设规则的当前的过程关系图确定为所述自然查询语句对应的关系图。
在一个可选的实现中,所述满足预设规则是指构建的过程关系图中任意两实体名称间的关系路径数不超过所述至少一个关系指称文本对应的关系路径名称总数,且构建的过程关系图中不存在所述至少一个关系指称文本对应的关系路径名称之外的关系路径名称。
在一个可选的实现中,分析单元430,具体用于根据预设的句法分析规则,对所述自然查询语句进行句法分析,得到所述自然查询语句对应的句法树,所述句法树包括所述自然查询语句的句子结构;
提取所述句法树顶层中所述自然查询语句的主谓宾结构的文本;
将所述提取的主谓宾结构的文本确定为所述自然查询语句对应的核心语句。
在一个可选的实现中,分析单元430,还具体用于若所述核心语句的主语不为关系路径名称,则将所述核心语句确定为目标核心语句;
若所述核心语句的主语为关系路径名称,且所述关系图包含所述关系路径名称,则将所述关系路径名称在关系图中关联的终点实体名称替换所述主语,得到目标核心语句;
若所述核心语句的主语为关系路径名称,且所述关系图不包含所述关系路径名称,则查询所述句法树中所述关系路径名称关联的起始实体名称,得到所述关系路径名称关联的起始实体名称;
根据所述起始实体名称与所述关系路径名称,查询所述预设知识图谱,获取所述关系路径名称关联的终点实体名称;
将所述终点实体名称替换所述主语,得到目标核心语句。
在一个可选的实现中,所述装置还包括补充单元450;
补充单元450,用于将所述关系路径名称在所述关系图中进行补充。
在一个可选的实现中,查询单元420,具体用于若所述目标核心语句的谓语为关系路径名称,则所述关系路径名称在所述关系图中关联的终点实体名称确定为问答结果;
若所述目标核心语句的谓语不为关系路径名称,则将所述目标核心语句的主语确定为问答结果。
在一个可选的实现中,查询单元420,还具体用于若所述目标核心语句的谓语不为关系路径名称,则将所述目标核心语句的主语确定为问答结果,包括:
若所述目标核心语句的主语为实体类别名称,谓语不为关系路径名称,则将所述实体类别名称在所述关系图中对应的实体名称确定为问答结果;
若所述目标核心语句的主语为属性值,谓语不为关系路径名称,则将所述属性值确定为问答结果;
若所述目标核心语句的主语为实体名称,谓语不为关系路径名称,则将所述实体名称确定为问答结果。
本发明上述实施例提供的基于知识图谱的自然语言问答装置的各功能单元的功能,可以通过上述各方法步骤来实现,因此,本发明实施例提供的基于知识图谱的自然语言问答装置中的各个单元的具体工作过程和有益效果,在此不复赘述。
本发明实施例还提供了一种电子设备,如图5所示,包括处理器510、通信接口520、存储器530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。
存储器530,用于存放计算机程序;
处理器510,用于执行存储器530上所存放的程序时,实现如下步骤:
获取输入的自然查询语句中的至少一个实体指称文本和实体指称文本间的至少一个关系指称文本;
在预设知识图谱中,根据所述至少一个实体指称文本和所述至少一个关系指称文本,获取所述自然查询语句对应的关系图,所述关系图用于描述所述自然查询语句对应的所述至少一个实体名称和所述至少一个关系路径名称间的关联关系;
查询获取的关系图,得到所述自然查询语句的问答结果。
在一个可选的实现中,在预设知识图谱中,根据所述至少一个实体指称文本和所述至少一个关系指称文本,获取所述自然查询语句对应的关系图,包括:
在预设知识图谱中,查找所述至少一个实体指称文本中每个实体指称文本对应的实体名称,以及所述至少一个关系指称文本中每个关系指称文本对应的关系路径名称;
根据所述至少一个实体名称和至少一个关系路径名称,获取所述自然查询语句对应的关系图。
在一个可选的实现中,查询获取的关系图,得到所述自然查询语句的问答结果,包括:
采用预设的句法分析规则,对所述自然查询语句进行句法分析,得到所述自然查询语句对应的核心语句;
查询获取的关系图,得到所述核心语句的问答结果。
在一个可选的实现中,得到所述自然查询语句的问答结果之后,所述方法还包括:
向所述用户发送所述问答结果。
在一个可选的实现中,在所述预设知识图谱中,查找获取的至少一个实体名称和至少一个关系路径名称,获取所述自然查询语句对应的关系图,包括:
根据至少一个实体指称文本和至少一个关系指称文本在自然查询语句中的位置,确定在所述自然查询语句中至少一个实体指称文本的排列顺序、至少一个关系指称文本的排列顺序和所述至少一个实体名称的排列顺序;
将第一个实体指称文本对应的第一实体名称确定为起始查询实体名称,并将与所述第一实体名称相邻的关系指称文本对应的第一关系路径名称确定为起始查询关系名称;
根据所述起始查询实体名称和所述起始查询关系名称,查询所述预设知识图谱,获取起始的过程关系图,所述起始的过程关系图用于描述所述起始查询实体名称、所述起始查询关系名称和所述预设知识图谱中关联实体名称间的关联关系;
在所述预设知识图谱中查询起始的过程关系图和所述实体排列顺序中除所述第一实体名称外的当前实体间的关联关系,获取当前的过程关系图,所述当前的过程关系图用于描述所述起始的过程关系图中各个实体名称和所述当前实体名称间的关联关系;
若所述当前实体名称为所述实体名称排列顺序中的最终实体名称,则将所述最终实体名称对应的过程关系图中满足预设规则的当前的过程关系图确定为所述自然查询语句对应的关系图。
在一个可选的实现中,所述满足预设规则是指构建的过程关系图中任意两实体名称间的关系路径数不超过所述至少一个关系指称文本对应的关系路径名称总数,且构建的过程关系图中不存在所述至少一个关系指称文本对应的关系路径名称之外的关系路径名称。
在一个可选的实现中,根据预设的句法分析规则,对所述自然查询语句进行句法分析,得到所述自然查询语句对应的核心语句,包括:
根据预设的句法分析规则,对所述自然查询语句进行句法分析,得到所述自然查询语句对应的句法树,所述句法树包括所述自然查询语句的句子结构;
提取所述句法树顶层中所述自然查询语句的主谓宾结构的文本;
将所述提取的主谓宾结构的文本确定为所述自然查询语句对应的核心语句。
在一个可选的实现中,得到所述自然查询语句对应的核心语句之后,所述方法还包括:
若所述核心语句的主语不为关系路径名称,则将所述核心语句确定为目标核心语句;
若所述核心语句的主语为关系路径名称,且所述关系图包含所述关系路径名称,则将所述关系路径名称在关系图中关联的终点实体名称替换所述主语,得到目标核心语句;
若所述核心语句的主语为关系路径名称,且所述关系图不包含所述关系路径名称,则查询所述句法树中所述关系路径名称关联的起始实体名称,得到所述关系路径名称关联的起始实体名称;
根据所述起始实体名称与所述关系路径名称,查询所述预设知识图谱,获取所述关系路径名称关联的终点实体名称;
将所述终点实体名称替换所述主语,得到目标核心语句。
在一个可选的实现中,所述方法还包括:
将所述关系路径名称在所述关系图中进行补充。
在一个可选的实现中,查询构建的关系图,得到所述自然查询语句的问答结果,包括:
若所述目标核心语句的谓语为关系路径名称,则所述关系路径名称在所述关系图中关联的终点实体名称确定为问答结果;
若所述目标核心语句的谓语不为关系路径名称,则将所述目标核心语句的主语确定为问答结果。
在一个可选的实现中,若所述目标核心语句的谓语不为关系路径名称,则将所述目标核心语句的主语确定为问答结果,包括:
若所述目标核心语句的主语为实体类别名称,谓语不为关系路径名称,则将所述实体类别名称在所述关系图中对应的实体名称确定为问答结果;
若所述目标核心语句的主语为属性值,谓语不为关系路径名称,则将所述属性值确定为问答结果;
若所述目标核心语句的主语为实体名称,谓语不为关系路径名称,则将所述实体名称确定为问答结果。
上述提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
由于上述实施例中电子设备的各器件解决问题的实施方式以及有益效果可以参见图1所示的实施例中的各步骤来实现,因此,本发明实施例提供的电子设备的具体工作过程和有益效果,在此不复赘述。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的基于知识图谱的自然语言问答方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的基于知识图谱的自然语言问答方法。
本领域内的技术人员应明白,本申请实施例中的实施例可提供为方法、系统、或计算机程序产品。因此,本申请实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例中是参照根据本申请实施例中实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例中实施例进行各种改动和变型而不脱离本申请实施例中实施例的精神和范围。这样,倘若本申请实施例中实施例的这些修改和变型属于本申请实施例中权利要求及其等同技术的范围之内,则本申请实施例中也意图包含这些改动和变型在内。