CN114357180A - 知识图谱的更新方法及电子设备 - Google Patents

知识图谱的更新方法及电子设备 Download PDF

Info

Publication number
CN114357180A
CN114357180A CN202111531021.2A CN202111531021A CN114357180A CN 114357180 A CN114357180 A CN 114357180A CN 202111531021 A CN202111531021 A CN 202111531021A CN 114357180 A CN114357180 A CN 114357180A
Authority
CN
China
Prior art keywords
entity
target
vector
updated
entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111531021.2A
Other languages
English (en)
Inventor
汪铎
李�浩
赵峂
王中伟
陈维强
孙永良
李建伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Guochuang Wisdom Cloud Brain Technology Co ltd
Hisense TransTech Co Ltd
Original Assignee
Hisense TransTech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense TransTech Co Ltd filed Critical Hisense TransTech Co Ltd
Priority to CN202111531021.2A priority Critical patent/CN114357180A/zh
Publication of CN114357180A publication Critical patent/CN114357180A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供知识图谱的更新方法及电子设备。用于提高知识图谱的更新效率,包括:响应于用户发送的知识图谱更新请求,对与知识图谱更新请求相对应的目标文本进行抽取,得到各三元组;将各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别;针对任意一个目标向量,基于目标向量的类别,确定与待更新知识图谱中与目标向量的类别相同的各待更新实体;利用目标向量和各更新实体的向量,分别得到目标向量和各待更新实体的向量之间的各相似度;通过各相似度,从与目标向量相对应的各待更新实体的向量中确定出与目标向量对应的目标待更新实体;利用目标向量对应的实体对各目标更新实体进行更新,得到更新后的知识图谱。

Description

知识图谱的更新方法及电子设备
技术领域
本发明涉及知识图谱技术领域,特别涉及一种知识图谱的更新方法及电子设备。
背景技术
知识图谱主要的目的是在面对互联网高速发展以及网络数据爆炸增长的时代,增强搜索效率,完善用户体验。知识图谱凭借其卓越的语义处理技术和互联性,为信息智能应用建立基础,广泛运用于搜索、问答、情报分析等方面,促进信息技术从信息服务向知识服务发展。
目前,知识图谱的更新方式是将各三元组中的各实体向量与待更新知识图谱中的所有待更新实体进行比对,并基于比对结果对待更新知识图谱中的待更新实体进行更新。由此,导致知识图谱的更新效率较低。
发明内容
本公开示例性的实施方式中提供一种知识图谱的更新方法及电子设备,用于更新知识图谱,解决现有技术中不会对知识图谱进行更新而导致知识图谱中的信息缺失的问题。
本公开的第一方面提供一种知识图谱的更新方法,所述方法包括:
响应于用户发送的知识图谱更新请求,对与所述知识图谱更新请求相对应的目标文本进行抽取,得到各三元组;
将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别;
针对任意一个目标向量,基于所述目标向量的类别,确定与待更新知识图谱中与所述目标向量的类别相同的各待更新实体,其中,所述待更新的知识图谱为与所述知识图谱更新请求相对应的知识图谱;
利用所述目标向量和所述各待更新实体的向量,分别得到所述目标向量和所述各待更新实体的向量之间的各相似度;
通过所述各相似度,从与所述目标向量相对应的各待更新实体的向量中确定出与所述目标向量相对应的目标待更新实体;
利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱。
本实施例中通过对与知识图谱更新请求相对应的目标文本进行抽取,得到各三元组,然后将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,并针对任意一个目标向量,基于所述目标向量的类别,确定与待更新知识图谱中与所述目标向量的类别相同的各待更新实体。最后通过所述目标向量和所述各待更新实体的向量之间的各相似度,从与所述目标向量相对应的各待更新实体的向量中确定出与所述目标向量相对应的目标待更新实体;并利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱。由此,本实施例中将同类别的目标向量与待更新实体确定出相似度来对知识图谱进行更新,提高了知识图谱的更新效率。
在一个实施例中,所述将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别之前,所述方法还包括:
针对所述各三元组中的任意一个实体,利用单词转换向量word2vec模型对所述实体进行向量转换,得到所述实体对应的第一向量,并通过术语频率-逆文档频率tf-idf模型对所述实体进行加权处理,得到所述实体对应的权重;
基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量;
根据预先训练好的卷积神经网络对所述实体的属性信息进行特征提取,得到所述实体的属性信息对应的属性向量;
将所述实体的第二向量和所述属性向量进行拼接,得到所述实体的目标向量。
本实施例通过基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量,并根据预先训练好的卷积神经网络对所述实体的属性信息进行特征提取,得到所述实体的属性信息对应的属性向量,然后将所述实体的第二向量和所述属性向量进行拼接,得到所述实体的目标向量,由此使得实体的目标向量更加丰富,提高知识图谱更新的准确率。
在一个实施例中,所述基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量之后,所述方法还包括:
针对任意一个实体,根据所述实体的第二向量和所述各三元组中除所述实体之外的其他实体的第二向量,分别得到所述实体和所述其他实体的相似度;
将所述实体和所述其他实体的相似度分别与第一预设阈值进行比较,确定相似度大于所述第一预设阈值的其他目标实体,并将所述其他目标实体和所述实体添加到目标实体集合中;
通过所述目标实体集合中的各实体在所述各三元组中的总数量,得到目标实体;
利用所述目标实体对所述目标实体集合中除所述目标实体之外的其他实体所对应的三元组进行更新。
本实施例中通过各实体之间的相似度确定对同类不同名的实体进行更新替换,以此使得各三元组中的实体进行对齐,进一步提高知识图谱更新的准确率。
在一个实施例中,所述通过所述各相似度,从与所述目标向量相对应的各待更新实体的向量中确定出与所述目标向量相对应的目标待更新实体,包括:
针对任意一个目标向量,从与所述目标向量相对应的各目标待更新实体中确定出相似度大于第二预设阈值的各待更新实体;
将相似度大于第二预设阈值的各待更新实体确定为与所述目标向量相对应的目标待更新实体。
本实施例通过针对任意一个目标向量,从与所述目标向量相对应的各目标待更新实体中确定出相似度大于第二预设阈值的各待更新实体,并将相似度大于第二预设阈值的各待更新实体确定为与所述目标向量相对应的目标待更新实体。以此使得确定出目标待更新实体更加准确。
在一个实施例中,所述利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱之后,所述方法还包括:
针对所述更新后的知识图谱中的任意一个实体关系,利用预设的实体关系与补全规则的对应关系,确定与所述实体关系对应的补全规则;
基于所述补全规则,对与所述实体关系对应的各实体进行关系补全。
本实施例通过更新后的知识图谱中的各实体关系对应的补全规则对与所述实体关系对应的各实体进行关系补全。以此使得更新后的知识图谱更加准确。
在一个实施例中,所述基于所述补全规则,对与所述实体关系对应的各实体进行关系补全,包括:
若所述补全规则为第一预设规则,则从所述更新后的知识图谱的各三元组中,确定出与所述实体关系对应的各第一目标三元组;
针对任意一个第一目标三元组,利用所述第一目标三元组中的第一指定实体和第一目标实体关系,得到与所述第一指定实体对应的补全实体;其中,所述第一目标实体关系为基于所述第一预设规则和所述实体关系确定出的,且所述第一指定实体为所述第一目标三元组中的头实体或尾实体;
利用第一待补全向量和所述补全实体的向量,得到所述第一待补全向量和所述补全实体的向量的相似度;其中,所述第一待补全向量是基于所述三元组中的第二指定实体和所述第一目标实体关系得到的,所述第二指定实体为所述第一目标三元组中的头实体或尾实体,且所述第一指定实体和所述第二指定实体不相同;
若所述相似度大于第三预设阈值,则基于所述第一目标实体关系对所述第二指定实体和所述补全实体进行关系补全。
在一个实施例中,所述基于所述补全规则,对与所述实体关系对应的各实体进行关系补全,包括:
若所述补全规则为第二预设规则,则从所述更新后的知识图谱的各三元组中,确定与所述实体关系对应的各第二目标三元组;
针对任意一个第二目标三元组,利用预设算法,得到所述第二目标三元组中的尾实体和第二目标实体关系相对应的第二待补全向量;其中,所述第二目标实体关系为基于所述第二预设规则和所述三元组中的实体关系确定出的;
基于所述第二待补全向量和所述三元组中的头实体的向量,得到所述第二待补全向量和所述头实体的向量的相似度;
若所述相似度大于第四预设阈值,则基于所述第二目标实体关系对所述头实体和所述尾实体进行关系补全。
本公开第二方面提供一种电子设备,包括存储单元和处理器,其中:
所述存储单元,被配置为存储与所述知识图谱更新请求相对应的目标文本和待更新的知识图谱;
所述处理器,被配置为:
响应于用户发送的知识图谱更新请求,对与所述知识图谱更新请求相对应的目标文本进行抽取,得到各三元组;
将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别;
针对任意一个目标向量,基于所述目标向量的类别,确定与待更新知识图谱中与所述目标向量的类别相同的各待更新实体,其中,所述待更新的知识图谱为与所述知识图谱更新请求相对应的知识图谱;
利用所述目标向量和所述各待更新实体的向量,分别得到所述目标向量和所述各待更新实体的向量之间的各相似度;
通过所述各相似度,从与所述目标向量相对应的各待更新实体的向量中确定出与所述目标向量相对应的目标待更新实体;
利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱。
在一个实施例中,所述处理器,还被配置为:
所述将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别之前,针对所述各三元组中的任意一个实体,利用单词转换向量word2vec模型对所述实体进行向量转换,得到所述实体对应的第一向量,并通过术语频率-逆文档频率tf-idf模型对所述实体进行加权处理,得到所述实体对应的权重;
基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量;
根据预先训练好的卷积神经网络对所述实体的属性信息进行特征提取,得到所述实体的属性信息对应的属性向量;
将所述实体的第二向量和所述属性向量进行拼接,得到所述实体的目标向量。
在一个实施例中,所述处理器,还被配置为:
所述基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量之后,针对任意一个实体,根据所述实体的第二向量和所述各三元组中除所述实体之外的其他实体的第二向量,分别得到所述实体和所述其他实体的相似度;
将所述实体和所述其他实体的相似度分别与第一预设阈值进行比较,确定相似度大于所述第一预设阈值的其他目标实体,并将所述其他目标实体和所述实体添加到目标实体集合中;
通过所述目标实体集合中的各实体在所述各三元组中的总数量,得到目标实体;
利用所述目标实体对所述目标实体集合中除所述目标实体之外的其他实体所对应的三元组进行更新。
在一个实施例中,所述处理器执行所述通过所述各相似度,从与所述目标向量相对应的各待更新实体的向量中确定出与所述目标向量相对应的目标待更新实体,具体被配置为:
针对任意一个目标向量,从与所述目标向量相对应的各目标待更新实体中确定出相似度大于第二预设阈值的各待更新实体;
将相似度大于第二预设阈值的各待更新实体确定为与所述目标向量相对应的目标待更新实体。
在一个实施例中,所述处理器,还被配置为:
所述利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱之后,针对所述更新后的知识图谱中的任意一个实体关系,利用预设的实体关系与补全规则的对应关系,确定与所述实体关系对应的补全规则;
基于所述补全规则,对与所述实体关系对应的各实体进行关系补全。
在一个实施例中,所述处理器执行所述基于所述补全规则,对与所述实体关系对应的各实体进行关系补全,具体被配置为:
若所述补全规则为第一预设规则,则从所述更新后的知识图谱的各三元组中,确定出与所述实体关系对应的各第一目标三元组;
针对任意一个第一目标三元组,利用所述第一目标三元组中的第一指定实体和第一目标实体关系,得到与所述第一指定实体对应的补全实体;其中,所述第一目标实体关系为基于所述第一预设规则和所述实体关系确定出的,且所述第一指定实体为所述第一目标三元组中的头实体或尾实体;
利用第一待补全向量和所述补全实体的向量,得到所述第一待补全向量和所述补全实体的向量的相似度;其中,所述第一待补全向量是基于所述三元组中的第二指定实体和所述第一目标实体关系得到的,所述第二指定实体为所述第一目标三元组中的头实体或尾实体,且所述第一指定实体和所述第二指定实体不相同;
若所述相似度大于第三预设阈值,则基于所述第一目标实体关系对所述第二指定实体和所述补全实体进行关系补全。
在一个实施例中,所述处理器执行所述基于所述补全规则,对与所述实体关系对应的各实体进行关系补全,具体被配置为:
若所述补全规则为第二预设规则,则从所述更新后的知识图谱的各三元组中,确定与所述实体关系对应的各第二目标三元组;
针对任意一个第二目标三元组,利用预设算法,得到所述第二目标三元组中的尾实体和第二目标实体关系相对应的第二待补全向量;其中,所述第二目标实体关系为基于所述第二预设规则和所述三元组中的实体关系确定出的;
基于所述第二待补全向量和所述三元组中的头实体的向量,得到所述第二待补全向量和所述头实体的向量的相似度;
若所述相似度大于第四预设阈值,则基于所述第二目标实体关系对所述头实体和所述尾实体进行关系补全。
根据本公开实施例提供的第三方面,提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序用于执行如第一方面所述的方法。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本公开一个实施例中的适用场景示意图;
图2为根据本公开一个实施例的知识图谱的更新方法的流程示意图之一;
图3为根据本公开一个实施例的知识图谱的更新方法的中知识图谱示意图;
图4为根据本公开一个实施例的确定各实体的目标向量的流程示意图;
图5为根据本公开一个实施例的知识图谱的更新方法的流程示意图之二;
图6为根据本公开一个实施例的知识图谱的更新装置;
图7为根据本公开一个实施例的电子设备的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本公开实施例描述的应用场景是为了更加清楚的说明本公开实施例的技术方案,并不构成对于本公开实施例提供的技术方案的限定,本领域普通技术人员可知,随着新应用场景的出现,本公开实施例提供的技术方案对于类似的技术问题,同样适用。其中,在本公开的描述中,除非另有说明,“多个”的含义是两个或两个以上。
目前,知识图谱的更新方式是将各三元组中的各实体向量与待更新知识图谱中的所有待更新实体进行比对,并基于比对结果对待更新知识图谱中的待更新实体进行更新。由此,导致知识图谱的更新效率较低。
因此,本公开提供一种知识图谱的更新方法,通过各目标向量的类别确定出与待更新知识图谱中与所述目标向量相对应的目标待更新实体,以此利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱。解决了知识图谱的滞后性的问题,提高了知识图谱的搜索效率,并且通过各目标向量的类别来更新知识图谱,提高了知识图谱的更新效率。下面,结合附图对本公开的方案详细的进行介绍。
如图1所示,一种知识图谱的更新方法的应用场景,该应用场景中包括多个终端设备110和服务器120,图1中是以三个终端设备110为例,实际上不限制终端设备110的数量。终端设备110可为手机、平板电脑和个人计算机等。服务器120可以通过单个服务器实现,也可以通过多个服务器实现。服务器120可以通过实体服务器实现,也可以通过虚拟服务器实现。
在一种可能的应用场景中,若用户A使用终端设备110向服务器120发送知识图谱更新请求,服务器120响应于用户发送的知识图谱更新请求,对与所述知识图谱更新请求相对应的目标文本进行抽取,得到各三元组;然后服务器120将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别;针对任意一个目标向量,基于所述目标向量的类别,确定与待更新知识图谱中与所述目标向量的类别相同的各待更新实体,其中,所述待更新的知识图谱为与所述知识图谱更新请求相对应的知识图谱;利用所述目标向量和所述各更新实体的向量,分别得到所述目标向量和所述各待更新实体的向量之间的各相似度;最后服务器120通过所述各相似度,从与所述目标向量相对应的各待更新实体的向量中确定出与所述目标向量相对应的目标待更新实体,并利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱,并将更新后的知识图谱发送至终端设备110中进行显示。
如图2所示,为本公开的知识图谱的更新方法的流程示意图,可包括以下步骤:
步骤201:响应于用户发送的知识图谱更新请求,对与所述知识图谱更新请求相对应的目标文本进行抽取,得到各三元组;
其中,所述三元组包括头实体、尾实体以及实体关系,且所述实体关系为所述头实体和所述尾实体之间的关系。例如,三元组1为(对象1,丈夫,对象2),三元组2为(对象3,妻子,对象4)。则三元组1中的头实体为对象1,尾实体为对象2,实体关系为丈夫。三元组2中的头实体为对象3,尾实体为对象4,实体关系为妻子。
需要说明的是:头实体和尾实体均属于实体。下文中所提到的实体包括头实体和尾实体。且本实施中的目标文本的抽取方法为现有技术中的方法,本实施在此并不对目标文件的抽取方法进行限定。
步骤202:将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别;
其中,实体的类别为对目标文件进行抽取后得到的。
步骤203:针对任意一个目标向量,基于所述目标向量的类别,确定与待更新知识图谱中与所述目标向量的类别相同的各待更新实体,其中,所述待更新的知识图谱为与所述知识图谱更新请求相对应的知识图谱;
步骤204:利用所述目标向量和所述各待更新实体的向量,分别得到所述目标向量和所述各待更新实体的向量之间的各相似度;其中,可通过公式(1)确定目标向量和针对任一待更新实体的向量的相似度:
Figure BDA0003410743460000111
其中,P为相似度,
Figure BDA0003410743460000112
为所述目标向量,
Figure BDA0003410743460000113
为待更新实体的向量。
步骤205:通过所述各相似度,从与所述目标向量相对应的各待更新实体的向量中确定出与所述目标向量相对应的目标待更新实体;
在一个实施例中,通过以下方式确定与所述目标向量相对应的目标待更新实体:
针对任意一个目标向量,从与所述目标向量相对应的各目标待更新实体中确定出相似度大于第二预设阈值的各待更新实体;将相似度大于第二预设阈值的各待更新实体确定为与所述目标向量相对应的目标待更新实体。
例如,目标向量为对象1,若确定出对象2、对象3和对象4为与对象1的相似度大于第二预设阈值的各待更新实体,则确定出对象2、对象3和对象4为与对象1相对应的目标待更新实体。
步骤206:利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱。
例如,如图3所示,待更新的知识图谱包括的三元组分别为:(对象1,队友,对象9)、(对象2,队友,对象8)、(对象8,队友,对象3)、(对象3,队友,对象6)、(对象9,队友,对象8)。以前文为例,对象1相对应的目标待更新实体为对象2、对象3和对象4,则更新后的知识图谱对应的三元组为:(对象1,队友,对象9)、(对象1,队友,对象8)、(对象8,队友,对象1)、(对象1,队友,对象6)、(对象9,队友,对象8)。
为了使得更新后的知识图谱更加准确,在一个实施例中,如图4所示,为确定各实体的目标向量的流程示意图,可包括以下步骤:
步骤401:针对所述各三元组中的任意一个实体,利用单词转换向量word2vec模型对所述实体进行向量转换,得到所述实体对应的第一向量,并通过术语频率-逆文档频率tf-idf模型对所述实体进行加权处理,得到所述实体对应的权重;
其中,word2vec模型是词库表示方法的统称,主要包括两种模型:连续词CBOW模型(Continuous Bag-Of-Words Model,连续词袋模型)和Skip-gram。具体的模型使用可根据实际情况进行设置,本实施例在此并不进行限定。
步骤402:基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量;
在一个实施例中,若所述实体对应的第一向量包括多个子向量,则所述实体对应的权重包括多个子向量对应的权重,并针对任意一个子向量,将所述子向量与所述子向量对应权重进行相乘,得到中间向量后,将各中间向量相加,得到所述实体的第二向量。
例如,实体为第一公司,由于该实体包括多个词语,所以该实体对应的第一向量为多个子向量。即第一对应一个子向量,公司对应一个子向量。将各子向量分别与对应的权重加权求和,得到实体为第一公司所对应的第二向量。
若所述实体对应的第一向量包括一个子向量,则所述对应的权重包括一个权重,则将所述第一向量与所述权重相乘,得到所述实体对应的第二向量。
需要说明的是:本实施例中的第一向量中的子向量的权重是通过tf-idf模型得到的。
步骤403:根据预先训练好的卷积神经网络对所述实体的属性信息进行特征提取,得到所述实体的属性信息对应的属性向量;
其中,属性信息包括属性名称和属性值。本实施例中利用预先训练好的卷积神经网络对所述属性名称和属性值进行特征提取,得到所述属性名称向量和所述属性值向量,并将所述属性名称向量和所述属性值向量进行拼接,得到所述属性信息对应的属性向量。
需要说明的是,本实施例对属性向量的拼接方式可根据实际需求进行设置,本实施例在此并不进行限定。
步骤404:将所述实体的第二向量和所述属性向量进行拼接,得到所述实体的目标向量。
其中,将所述第二向量和所述属性向量进行首尾拼接,得到所述实体的目标向量。
为了节省计算资源,在一个实施例中,在执行步骤402之后,针对任意一个实体,根据所述实体的第二向量和所述各三元组中除所述实体之外的其他实体的第二向量,分别得到所述实体和所述其他实体的相似度;将所述实体和所述其他实体的相似度分别与第一预设阈值进行比较,确定相似度大于所述第一预设阈值的其他目标实体,并将所述其他目标实体和所述实体添加到目标实体集合中;通过所述目标实体集合中的各实体在所述各三元组中的总数量,得到目标实体;利用所述目标实体对所述目标实体集合中除所述目标实体之外的其他实体所对应的三元组进行更新。
其中,本实施例中确定所述实体和所述其他实体的相似度可根据公式(1)进行确定。
为了使得更新后的知识图谱更加准确,在一个实施例中,执行完步骤206之后针对所述更新后的知识图谱中的任意一个实体关系,利用预设的实体关系与补全规则的对应关系,确定与所述实体关系对应的补全规则;基于所述补全规则,对与所述实体关系对应的各实体进行关系补全。
在一个实施例中,基于所述补全规则,对与所述实体关系对应的各实体进行关系补全可包括以下两种方式:
方式一:若所述补全规则为第一预设规则,则从所述更新后的知识图谱的各三元组中,确定出与所述实体关系对应的各第一目标三元组;针对任意一个第一目标三元组,利用所述第一目标三元组中的第一指定实体和第一目标实体关系,得到与所述第一指定实体对应的补全实体;其中,所述第一目标实体关系为基于所述第一预设规则和所述实体关系确定出的,且所述第一指定实体为所述第一目标三元组中的头实体或尾实体;利用第一待补全向量和所述补全实体的向量,得到所述第一待补全向量和所述补全实体的向量的相似度;其中,所述第一待补全向量是基于所述三元组中的第二指定实体和所述第一目标实体关系得到的,所述第二指定实体为所述第一目标三元组中的头实体或尾实体,且所述第一指定实体和所述第二指定实体不相同;若所述相似度大于第三预设阈值,则基于所述第一目标实体关系对所述第二指定实体和所述补全实体进行关系补全。
其中,第一预设规则包括传递规则和替换规则,若所述第一预设规则为传递规则,则确定所述第一目标实体关系为与所述第一目标三元组中的实体关系相同。若所述第一预设规则为替换规则,则利用预设的第一目标三元组中的实体关系与第一目标实体关系的对应关系,确定与所述第一目标三元组中的实体关系相对应的第一目标实体关系。
下面分别对这两种规则的补全方式进行详细的介绍:
(1)传递规则:以实体关系为队友为例,若实体关系为队友的第一目标三元组分别为:(对象1,队友,对象2)、(对象2,队友,对象3)、(对象3,队友,对象4)……因为是传递规则,所以第一目标实体关系为队友。以三元组(对象2,队友,对象3)为例进行说明,第一指定实体为对象3,则对象3对应的向量加上队友对应的向量等于补全实体的向量。且第一指定向量为对象1,则对象1对应的向量为第一待补全向量。若第一待补全向量与补全实体的向量的相似度大于第三预设阈值,则将对象1和对象3利用队友进行关系补全,得到新的三元组(对象3,队友,对象1)。
(2)替换规则:以实体关系为儿子为例,若实体关系为儿子的第一目标三元组分别为:(对象1,儿子,对象2)、(对象2,儿子,对象3)……因为是替换规则,因为替换规则预设了实体关系和第一目标实体关系的对应关系,下面以第一目标实体关系为孙子为例进行说明。第一指定实体为对象1,则对象1对应的向量加上孙子对应的向量等于补全实体的向量。且第一指定向量为对象3,则对象3对应的向量为第一待补全向量。若第一待补全向量与补全实体的向量的相似度大于第三预设阈值,则将对象1和对象3利用孙子进行关系补全,得到新的三元组(对象1,孙子,对象3)。
方式二:若所述补全规则为第二预设规则,则从所述更新后的知识图谱的各三元组中,确定与所述实体关系对应的各第二目标三元组;针对任意一个第二目标三元组,利用预设算法,得到所述第二目标三元组中的尾实体和第二目标实体关系相对应的第二待补全向量;其中,所述第二目标实体关系为基于所述第二预设规则和所述三元组中的实体关系确定出的;基于所述第二待补全向量和所述三元组中的头实体的向量,得到所述第二待补全向量和所述头实体的向量的相似度;若所述相似度大于第四预设阈值,则基于所述第二目标实体关系对所述头实体和所述尾实体进行关系补全。
其中,第二规则包括相反规则和对称规则。若所述第二预设规则为相反规则,则利用预设的所述第二目标三元组中的实体关系与第二目标实体关系的对应关系,确定与所述第二目标三元组中的实体关系对应第二目标实体关系。若所述第二预设规则为对称规则,则将所述第二目标三元组中的实体关系确定为所述第二目标实体关系。
下面,分别对相反规则和对称规则进行介绍说明:
(1)相反规则:以实体关系为妻子为例,若实体关系为妻子的第一目标三元组分别为:(对象1,妻子,对象2)、(对象3,妻子,对象4)……因为是相反规则,所以第二目标实体关系为丈夫。对象2对应的向量加上丈夫对应的向量等于第二待补全向量。若第二待补全向量与对象1向量的相似度大于第四预设阈值,则将对象2和对象1利用丈夫进行关系补全,得到新的三元组(对象2,丈夫,对象1)。
(2)对称规则:以实体关系队友为例,则确定第二目标实体关系为队友。若队友对应的第二目标三元组为(对象1,队友,对象2)、(对象2,队友,对象3)等,以三元组(对象1,队友,对象2)为例,对象2对应的向量加上队友对应的向量等于第二待补全向量。若第二待补全向量与对象1向量的相似度大于第四预设阈值,则将对象2和对象1利用队友进行关系补全,得到新的三元组(对象2,队友,对象1)。
为了进一步的了解本公开的技术方案,下面结合图5进行详细的说明,可包括以下步骤:
步骤501:响应于用户发送的知识图谱更新请求,对与所述知识图谱更新请求相对应的目标文本进行抽取,得到各三元组;
步骤502:针对所述各三元组中的任意一个实体,利用单词转换向量word2vec模型对所述实体进行向量转换,得到所述实体对应的第一向量,并通过术语频率-逆文档频率tf-idf模型对所述实体进行加权处理,得到所述实体对应的权重;
步骤503:基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量;
步骤504:根据预先训练好的卷积神经网络对所述实体的属性信息进行特征提取,得到所述实体的属性信息对应的属性向量;
步骤505:将所述实体的第二向量和所述属性向量进行拼接,得到所述实体的目标向量;
步骤506:将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别;
步骤507:针对任意一个目标向量,基于所述目标向量的类别,确定与待更新知识图谱中与所述目标向量的类别相同的各待更新实体,其中,所述待更新的知识图谱为与所述知识图谱更新请求相对应的知识图谱;
步骤508:利用所述目标向量和所述各更新实体的向量,分别得到所述目标向量和所述各待更新实体的向量之间的各相似度;
步骤509:针对任意一个目标向量,从与所述目标向量相对应的各目标待更新实体中确定出相似度大于第二预设阈值的各待更新实体;
步骤510:将相似度大于第二预设阈值的各待更新实体确定为与所述目标向量相对应的目标待更新实体;
步骤511:利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱;
步骤512:针对所述更新后的知识图谱中的任意一个实体关系,利用预设的实体关系与补全规则的对应关系,确定与所述实体关系对应的补全规则;
步骤513:基于所述补全规则,对与所述实体关系对应的各实体进行关系补全。
基于相同的公开构思,本公开如上所述的知识图谱的更新方法还可以由一种知识图谱的更新装置实现。该知识图谱的更新装置的效果与前述方法的效果相似,在此不再赘述。
图6为根据本公开一个实施例的知识图谱的更新装置的结构示意图。
如图6所示,本公开的知识图谱的更新装置600可以包括抽取模块610、分类模块620、待更新实体确定模块630、相似度确定模块640、目标待更新实体确定模块650和更新模块660。
抽取模块610,用于响应于用户发送的知识图谱更新请求,对与所述知识图谱更新请求相对应的目标文本进行抽取,得到各三元组;
分类模块620,用于将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别;
待更新实体确定模块630,用于针对任意一个目标向量,基于所述目标向量的类别,确定与待更新知识图谱中与所述目标向量的类别相同的各待更新实体,其中,所述待更新的知识图谱为与所述知识图谱更新请求相对应的知识图谱;
相似度确定模块640,用于利用所述目标向量和所述各待更新实体的向量,分别得到所述目标向量和所述各待更新实体的向量之间的各相似度;
目标待更新实体确定模块650,用于通过所述各相似度,从与所述目标向量相对应的各待更新实体的向量中确定出与所述目标向量相对应的目标待更新实体;
第一更新模块660,用于利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱。
在一个实施例中,所述装置还包括:
目标向量确定模块670,用于所述将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别之前,针对所述各三元组中的任意一个实体,利用单词转换向量word2vec模型对所述实体进行向量转换,得到所述实体对应的第一向量,并通过术语频率-逆文档频率tf-idf模型对所述实体进行加权处理,得到所述实体对应的权重;
基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量;
根据预先训练好的卷积神经网络对所述实体的属性信息进行特征提取,得到所述实体的属性信息对应的属性向量;
将所述实体的第二向量和所述属性向量进行拼接,得到所述实体的目标向量。
在一个实施例中,所述装置还包括:
第二更新模块680,用于所述基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量之后,针对任意一个实体,根据所述实体的第二向量和所述各三元组中除所述实体之外的其他实体的第二向量,分别得到所述实体和所述其他实体的相似度;
将所述实体和所述其他实体的相似度分别与第一预设阈值进行比较,确定相似度大于所述第一预设阈值的其他目标实体,并将所述其他目标实体和所述实体添加到目标实体集合中;
通过所述目标实体集合中的各实体在所述各三元组中的总数量,得到目标实体;
利用所述目标实体对所述目标实体集合中除所述目标实体之外的其他实体所对应的三元组进行更新。
在一个实施例中,目标待更新实体确定模块650,具体用于:
针对任意一个目标向量,从与所述目标向量相对应的各目标待更新实体中确定出相似度大于第二预设阈值的各待更新实体;
将相似度大于第二预设阈值的各待更新实体确定为与所述目标向量相对应的目标待更新实体。
在一个实施例中,所述装置还包括:
关系补全模块690,所述利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱之后,针对所述更新后的知识图谱中的任意一个实体关系,利用预设的实体关系与补全规则的对应关系,确定与所述实体关系对应的补全规则;
基于所述补全规则,对与所述实体关系对应的各实体进行关系补全。
在一个实施例中,所述关系补全模块690,具体用于:
若所述补全规则为第一预设规则,则从所述更新后的知识图谱的各三元组中,确定出与所述实体关系对应的各第一目标三元组;
针对任意一个第一目标三元组,利用所述第一目标三元组中的第一指定实体和第一目标实体关系,得到与所述第一指定实体对应的补全实体;其中,所述第一目标实体关系为基于所述第一预设规则和所述实体关系确定出的,且所述第一指定实体为所述第一目标三元组中的头实体或尾实体;
利用第一待补全向量和所述补全实体的向量,得到所述第一待补全向量和所述补全实体的向量的相似度;其中,所述第一待补全向量是基于所述三元组中的第二指定实体和所述第一目标实体关系得到的,所述第二指定实体为所述第一目标三元组中的头实体或尾实体,且所述第一指定实体和所述第二指定实体不相同;
若所述相似度大于第三预设阈值,则基于所述第一目标实体关系对所述第二指定实体和所述补全实体进行关系补全。
在一个实施例中,所述关系补全模块690,具体用于:
若所述补全规则为第二预设规则,则从所述更新后的知识图谱的各三元组中,确定与所述实体关系对应的各第二目标三元组;
针对任意一个第二目标三元组,利用预设算法,得到所述第二目标三元组中的尾实体和第二目标实体关系相对应的第二待补全向量;其中,所述第二目标实体关系为基于所述第二预设规则和所述三元组中的实体关系确定出的;
基于所述第二待补全向量和所述三元组中的头实体的向量,得到所述第二待补全向量和所述头实体的向量的相似度;
若所述相似度大于第四阈值,则基于所述第二目标实体关系对所述头实体和所述尾实体进行关系补全。
在介绍了本公开示例性实施方式的一种知识图谱的更新方法及装置之后,接下来,介绍根据本公开的另一示例性实施方式的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本公开的电子设备可以至少包括至少一个处理器、以及至少一个计算机存储介质。其中,计算机存储介质存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本公开各种示例性实施方式的知识图谱的更新方法中的步骤。例如,处理器可以执行如图2中所示的步骤201-206。
下面参照图7来描述根据本公开的这种实施方式的电子设备700。图7显示的电子设备700仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700以通用电子设备的形式表现。电子设备700的组件可以包括但不限于:上述至少一个处理器701、上述至少一个计算机存储介质702、连接不同系统组件(包括计算机存储介质702和处理器701)的总线703。
总线703表示几类总线结构中的一种或多种,包括计算机存储介质总线或者计算机存储介质控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
计算机存储介质702可以包括易失性计算机存储介质形式的可读介质,例如随机存取计算机存储介质(RAM)721和/或高速缓存存储介质722,还可以进一步包括只读计算机存储介质(ROM)723。
计算机存储介质702还可以包括具有一组(至少一个)程序模块724的程序/实用工具725,这样的程序模块724包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
电子设备700也可以与一个或多个外部设备704(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与电子设备700交互的设备通信,和/或与使得该电子设备700能与一个或多个其它电子设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口705进行。并且,电子设备700还可以通过网络适配器706与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器706通过总线703与用于电子设备700的其它模块通信。应当理解,尽管图中未示出,可以结合电子设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本公开提供的一种知识图谱的更新方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本公开各种示例性实施方式的知识图谱的更新方法中的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取计算机存储介质(RAM)、只读计算机存储介质(ROM)、可擦式可编程只读计算机存储介质(EPROM或闪存)、光纤、便携式紧凑盘只读计算机存储介质(CD-ROM)、光计算机存储介质件、磁计算机存储介质件、或者上述的任意合适的组合。
本公开的实施方式的知识图谱的更新的程序产品可以采用便携式紧凑盘只读计算机存储介质(CD-ROM)并包括程序代码,并可以在电子设备上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户电子设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中,远程电子设备可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户电子设备,或者,可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘计算机存储介质、CD-ROM、光学计算机存储介质等)上实施的计算机程序产品的形式。
本公开是参照根据本公开的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读计算机存储介质中,使得存储在该计算机可读计算机存储介质中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样,倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内,则本公开也意图包含这些改动和变型在内。

Claims (10)

1.一种知识图谱的更新方法,其特征在于,所述方法包括:
响应于用户发送的知识图谱更新请求,对与所述知识图谱更新请求相对应的目标文本进行抽取,得到各三元组;
将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别;
针对任意一个目标向量,基于所述目标向量的类别,确定与待更新知识图谱中与所述目标向量的类别相同的各待更新实体,其中,所述待更新的知识图谱为与所述知识图谱更新请求相对应的知识图谱;
利用所述目标向量和所述各待更新实体的向量,分别得到所述目标向量和所述各待更新实体的向量之间的各相似度;
通过所述各相似度,从与所述目标向量相对应的各待更新实体的向量中确定出与所述目标向量相对应的目标待更新实体;
利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别之前,所述方法还包括:
针对所述各三元组中的任意一个实体,利用单词转换向量word2vec模型对所述实体进行向量转换,得到所述实体对应的第一向量,并通过术语频率-逆文档频率tf-idf模型对所述实体进行加权处理,得到所述实体对应的权重;
基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量;
根据预先训练好的卷积神经网络对所述实体的属性信息进行特征提取,得到所述实体的属性信息对应的属性向量;
将所述实体的第二向量和所述属性向量进行拼接,得到所述实体的目标向量。
3.根据权利要求2所述的方法,其特征在于,所述基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量之后,所述方法还包括:
针对任意一个实体,根据所述实体的第二向量和所述各三元组中除所述实体之外的其他实体的第二向量,分别得到所述实体和所述其他实体的相似度;
将所述实体和所述其他实体的相似度分别与第一预设阈值进行比较,确定相似度大于所述第一预设阈值的其他目标实体,并将所述其他目标实体和所述实体添加到目标实体集合中;
通过所述目标实体集合中的各实体在所述各三元组中的总数量,得到目标实体;
利用所述目标实体对所述目标实体集合中除所述目标实体之外的其他实体所对应的三元组进行更新。
4.根据权利要求1所述的方法,其特征在于,所述通过所述各相似度,从与所述目标向量相对应的各待更新实体的向量中确定出与所述目标向量相对应的目标待更新实体,包括:
针对任意一个目标向量,从与所述目标向量相对应的各目标待更新实体中确定出相似度大于第二预设阈值的各待更新实体;
将相似度大于第二预设阈值的各待更新实体确定为与所述目标向量相对应的目标待更新实体。
5.根据权利要求1所述的方法,其特征在于,所述利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱之后,所述方法还包括:
针对所述更新后的知识图谱中的任意一个实体关系,利用预设的实体关系与补全规则的对应关系,确定与所述实体关系对应的补全规则;
基于所述补全规则,对与所述实体关系对应的各实体进行关系补全。
6.根据权利要求5所述的方法,其特征在于,所述基于所述补全规则,对与所述实体关系对应的各实体进行关系补全,包括:
若所述补全规则为第一预设规则,则从所述更新后的知识图谱的各三元组中,确定出与所述实体关系对应的各第一目标三元组;
针对任意一个第一目标三元组,利用所述第一目标三元组中的第一指定实体和第一目标实体关系,得到与所述第一指定实体对应的补全实体;其中,所述第一目标实体关系为基于所述第一预设规则和所述实体关系确定出的,且所述第一指定实体为所述第一目标三元组中的头实体或尾实体;
利用第一待补全向量和所述补全实体的向量,得到所述第一待补全向量和所述补全实体的向量的相似度;其中,所述第一待补全向量是基于所述三元组中的第二指定实体和所述第一目标实体关系得到的,所述第二指定实体为所述第一目标三元组中的头实体或尾实体,且所述第一指定实体和所述第二指定实体不相同;
若所述相似度大于第三预设阈值,则基于所述第一目标实体关系对所述第二指定实体和所述补全实体进行关系补全。
7.根据权利要求5所述的方法,其特征在于,所述基于所述补全规则,对与所述实体关系对应的各实体进行关系补全,包括:
若所述补全规则为第二预设规则,则从所述更新后的知识图谱的各三元组中,确定与所述实体关系对应的各第二目标三元组;
针对任意一个第二目标三元组,利用预设算法,得到所述第二目标三元组中的尾实体和第二目标实体关系相对应的第二待补全向量;其中,所述第二目标实体关系为基于所述第二预设规则和所述三元组中的实体关系确定出的;
基于所述第二待补全向量和所述三元组中的头实体的向量,得到所述第二待补全向量和所述头实体的向量的相似度;
若所述相似度大于第四预设阈值,则基于所述第二目标实体关系对所述头实体和所述尾实体进行关系补全。
8.一种电子设备,其特征在于,包括存储单元和处理器,其中:
所述存储单元,被配置为存储与所述知识图谱更新请求相对应的目标文本和待更新的知识图谱;
所述处理器,被配置为:
响应于用户发送的知识图谱更新请求,对与所述知识图谱更新请求相对应的目标文本进行抽取,得到各三元组;
将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别;
针对任意一个目标向量,基于所述目标向量的类别,确定与待更新知识图谱中与所述目标向量的类别相同的各待更新实体,其中,所述待更新的知识图谱为与所述知识图谱更新请求相对应的知识图谱;
利用所述目标向量和所述各待更新实体的向量,分别得到所述目标向量和所述各待更新实体的向量之间的各相似度;
通过所述各相似度,从与所述目标向量相对应的各待更新实体的向量中确定出与所述目标向量相对应的目标待更新实体;
利用所述目标向量对应的实体对所述各目标更新实体进行更新,得到更新后的知识图谱。
9.根据权利要求8所述的电子设备,其特征在于,所述处理器,还被配置为:
所述将所述各三元组中的各实体的目标向量基于各实体的类别进行分类,得到各目标向量的类别之前,针对所述各三元组中的任意一个实体,利用单词转换向量word2vec模型对所述实体进行向量转换,得到所述实体对应的第一向量,并通过术语频率-逆文档频率tf-idf模型对所述实体进行加权处理,得到所述实体对应的权重;
基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量;
根据预先训练好的卷积神经网络对所述实体的属性信息进行特征提取,得到所述实体的属性信息对应的属性向量;
将所述实体的第二向量和所述属性向量进行拼接,得到所述实体的目标向量。
10.根据权利要求9所述的电子设备,其特征在于,所述处理器,还被配置为:
所述基于所述实体对应的第一向量和所述实体对应的权重,得到所述实体的第二向量之后,针对任意一个实体,根据所述实体的第二向量和所述各三元组中除所述实体之外的其他实体的第二向量,分别得到所述实体和所述其他实体的相似度;
将所述实体和所述其他实体的相似度分别与第一预设阈值进行比较,确定相似度大于所述第一预设阈值的其他目标实体,并将所述其他目标实体和所述实体添加到目标实体集合中;
通过所述目标实体集合中的各实体在所述各三元组中的总数量,得到目标实体;
利用所述目标实体对所述目标实体集合中除所述目标实体之外的其他实体所对应的三元组进行更新。
CN202111531021.2A 2021-12-14 2021-12-14 知识图谱的更新方法及电子设备 Pending CN114357180A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111531021.2A CN114357180A (zh) 2021-12-14 2021-12-14 知识图谱的更新方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111531021.2A CN114357180A (zh) 2021-12-14 2021-12-14 知识图谱的更新方法及电子设备

Publications (1)

Publication Number Publication Date
CN114357180A true CN114357180A (zh) 2022-04-15

Family

ID=81098846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111531021.2A Pending CN114357180A (zh) 2021-12-14 2021-12-14 知识图谱的更新方法及电子设备

Country Status (1)

Country Link
CN (1) CN114357180A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117290366A (zh) * 2023-08-14 2023-12-26 中国船舶集团有限公司第七〇九研究所 一种不确定性态势时空知识图谱更新方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117290366A (zh) * 2023-08-14 2023-12-26 中国船舶集团有限公司第七〇九研究所 一种不确定性态势时空知识图谱更新方法及系统

Similar Documents

Publication Publication Date Title
US20210342549A1 (en) Method for training semantic analysis model, electronic device and storage medium
US20210374542A1 (en) Method and apparatus for updating parameter of multi-task model, and storage medium
JP7076483B2 (ja) データモデルを構築する方法、装置、デバイス及び媒体
US11494559B2 (en) Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents
US11507747B2 (en) Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents
WO2022083093A1 (zh) 图谱中的概率计算方法、装置、计算机设备及存储介质
CN112507098B (zh) 问题处理方法、装置、电子设备、存储介质及程序产品
CN112749300A (zh) 用于视频分类的方法、装置、设备、存储介质和程序产品
CN113660541A (zh) 新闻视频的摘要生成方法及装置
EP3992814A2 (en) Method and apparatus for generating user interest profile, electronic device and storage medium
CN113392920B (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
CN114037059A (zh) 预训练模型、模型的生成方法、数据处理方法及装置
CN114357180A (zh) 知识图谱的更新方法及电子设备
CN113157877A (zh) 多语义识别方法、装置、设备和介质
CN117291722A (zh) 对象管理方法、相关设备及计算机可读介质
US20230274161A1 (en) Entity linking method, electronic device, and storage medium
CN108733702B (zh) 用户查询上下位关系提取的方法、装置、电子设备和介质
US20220207427A1 (en) Method for training data processing model, electronic device and storage medium
CN113569578B (zh) 一种用户意图识别方法、装置和计算机设备
CN115099875A (zh) 基于决策树模型的数据分类方法及相关设备
CN114048315A (zh) 确定文档标签的方法、装置、电子设备和存储介质
US20220318503A1 (en) Method and apparatus for identifying instruction, and screen for voice interaction
CN116737520B (zh) 一种日志数据的数据编织方法、装置、设备及存储介质
CN113971216B (zh) 数据处理方法、装置、电子设备和存储器
CN115018009B (zh) 对象描述方法、网络模型的训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220901

Address after: 266071 4th floor, building B3, Hisense R & D center, 399 Songling Road, Laoshan District, Qingdao, Shandong Province

Applicant after: QINGDAO HISENSE TRANSTECH Co.,Ltd.

Applicant after: Qingdao Guochuang Wisdom Cloud Brain Technology Co.,Ltd.

Address before: 266071 No. 151, Zhuzhou Road, Laoshan District, Shandong, Qingdao

Applicant before: QINGDAO HISENSE TRANSTECH Co.,Ltd.

TA01 Transfer of patent application right