CN115905569A - 一种基于节点自适应的小样本知识图谱补全方法和装置 - Google Patents
一种基于节点自适应的小样本知识图谱补全方法和装置 Download PDFInfo
- Publication number
- CN115905569A CN115905569A CN202211453303.XA CN202211453303A CN115905569A CN 115905569 A CN115905569 A CN 115905569A CN 202211453303 A CN202211453303 A CN 202211453303A CN 115905569 A CN115905569 A CN 115905569A
- Authority
- CN
- China
- Prior art keywords
- entity
- node
- neighbor
- vector
- small sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 239000013598 vector Substances 0.000 claims abstract description 136
- 230000002776 aggregation Effects 0.000 claims abstract description 67
- 238000004220 aggregation Methods 0.000 claims abstract description 67
- 230000003044 adaptive effect Effects 0.000 claims abstract description 36
- 238000004364 calculation method Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 19
- 230000004931 aggregating effect Effects 0.000 claims abstract description 10
- 238000003860 storage Methods 0.000 claims description 15
- 238000012512 characterization method Methods 0.000 claims description 14
- 238000010276 construction Methods 0.000 claims description 5
- 230000002457 bidirectional effect Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000006870 function Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 11
- 230000006872 improvement Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000002585 base Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于节点自适应的小样本知识图谱补全方法,包括:步骤1、为知识图谱中所有实体构建邻居序列;步骤2、将实体的邻居序列经过transformer后输入进自适应阶层分类器,从而得到该实体的自适应聚合阶层;步骤3、采用基于注意力图网络的聚合方式对实体的邻居进行聚合;步骤4、将聚合好后的头尾实体表征成关系向量,分支持集关系向量和查询关系向量;步骤5、对同一task下的支持集向量和查询向量进行相似度计算;步骤6、根据相似度计算损失函数值;步骤7、进行网络训练,直到到达设定的迭代次数;步骤8、完成训练并得到推理模型。本发明通过图网络阶层表示和阶层分类的方法实现了对高频实体和稀疏实体的良好表征,从而提升补全方法的准确性。
Description
技术领域
本发明属于数据挖掘算法应用技术领域,涉及一种基于节点自适应的小样本知识图谱补全方法。
背景技术
知识图是一种结构化的语义知识库,用于以符号的形式描述物理世界中的概念及其相互关系。现实世界中的许多知识图谱数据库,如Freebase、Wikidata、 NELL等,都是以(头实体、关系、尾实体)形式表达的三重事实。由于知识图谱的重要性,它也被引入到自然语言处理的各种下游任务中,如知识问答、对话系统、信息抽取等。知识图谱的完整性促进了这些下游任务的运行。然而,现实世界中的知识图谱数据库还远远不够完整和全面。因此,有必要通过推断新的三重事实来完善知识图谱。为了完善知识图谱数据,大多数现有的基于嵌入的知识图谱补全模型需要为每个关系提供足够的三元组作为训练数据,如TransE, RotatE和ConvE等。
然而在现实中,每个关系的三元组数量都符合长尾分布。也就是说,只有少数关系频繁出现,而大多数关系在一个知识图谱数据库中只出现几次。这种现象限制了非频繁关系学习一个良好的向量表征,从而进一步降低了知识图谱补全的性能。因此这也激发了一个新兴的研究课题,称为小样本知识图谱补全,其任务为给定一个task关系r以及所属该关系的几个实体对,从而预测该任务关系下的另一个查询实体对中的尾实体(h,r,?)。小样本知识图谱补全方法采用基于度量学习和基于模型的两种方式进行模型建构,其主要思想为将实体对表征成为小样本关系的向量表示,并将相同的小样本关系的不同向量表征进行相似度计算。为了更好的将实体对表征成关系向量表示,就需要对单个实体进行良好的表征。因此现有方法采用了图网络方法对实体的一阶邻居实体向量进行聚合从而丰富单个实体对向量表示。
但是,由于实体的邻居数量也呈现严重的长尾分布,因此大部分实体的可聚合邻居数量极少,这严重制约了实体对良好表征。因此有必要将实体对聚合阶层数扩大,但是扩大后也会导致实体在聚合邻居的过程中引入噪声从而影响自身的向量表征。并且有部分实体邻居数量较多,在只聚合一阶邻居的情况就已经能获得周围丰富的邻居信息,此时再将其聚合范围扩大会导致此类实体的表征受到噪声污染。而现有模型没有根据实体自适应的决定其聚合的邻居范围,应当对长尾分布中的头部实体的聚合范围减少,而对尾部实体对聚合范围应该扩大。从而使得每个实体都有充分的邻居信息可以聚合同时又尽量减少噪声的引入。
发明内容
本发明目的是为了实现对于小样本知识图谱的有效补全,并解决现有补全方法面临大部分实体没有充分的邻居信息用以聚合的问题,提出一种基于节点自适应的小样本知识图谱补全方法,能够实现对每个节点的聚合范围进行分类,从而缓解大部分实体没有充分的邻居信息聚合的问题,以及高频率实体聚合范围扩大导致的噪音污染问题,它在小样本知识图谱补全领域具有重要的作用。
本发明的技术关键在于,为知识图谱中所有实体构建邻居序列;并将实体的邻居序列经过transformer后输入进自适应阶层分类器,从而得到该实体的自适应聚合阶层;采用基于注意力图网络的聚合方式对实体的邻居进行聚合,其邻居拓展到第几阶由自适应阶层分类器所决定。从而实现节点的自适应聚合
一种基于节点自适应的小样本知识图谱补全方法,包括以下步骤:
步骤1、为知识图谱中所有实体构建邻居序列;
步骤2、将实体的邻居序列经过transformer后输入进自适应阶层分类器,从而得到该实体的自适应聚合阶层;
步骤3、采用基于注意力图网络的聚合方式对实体的邻居进行聚合,其邻居拓展到第几阶由自适应阶层分类器所决定;
步骤4、将聚合好后的头尾对向量通过两种方式表征成所对应task的小样本关系向量,分为支持集关系向量和查询关系向量;
步骤5、对同一task下的支持集向量和查询向量进行相似度计算;
步骤6、根据相似度计算损失函数值;
步骤7、进行网络训练,直到到达设定的迭代次数;
步骤8、完成训练后,使用训练好的模型根据头实体和关系来补全尾实体。
优选地,步骤1具体包括:为知识图谱中每个节点构建属于它的邻居序列,该序列长度为255,由自身节点e、分层节点以及一到四阶邻居节点构成,其具体组成方式见图1。其中一到四阶邻居分别选取五十个邻居节点,若节点数量不足则补padding操作,若超过规定数量则随机抽取。
优选地,步骤2具体包括:
第一层多头注意力层采用Mask操作使得一阶分层节点只聚合一阶邻居。将聚合后的一阶分层节点向量与节点e向量进行拼接,随后将其输入到自适应阶层分类器进行二分类,决定是否聚合一阶邻居。若聚合一阶邻居,则执行步骤3。若为否则节点e不聚合任何邻居,将跳过步骤3、4执行阶段。
优选地,步骤3具体包括:若步骤2中的自适应阶层分类器分类结果为聚合一阶邻居,transformer继续编码,第二层多头注意力层同样采用Mask操作使得二阶分层节点只聚合第二阶邻居,将聚合后的二阶分层节点向量与节点e向量进行拼接输入自适应阶层分类器以决定是否聚合第二阶邻居。同理,若聚合第二阶邻居则采用如同步骤2、3方法对第三阶和第四阶邻居进行分类,最终 Transformer输出节点e的自适应聚合阶层。
优选地,步骤4具体包括:将步骤3得到的自适应聚合阶层数作为节点e需要聚合的邻居范围。采用基于注意力图网络的聚合方式进行邻居聚合,将节点e的向量表征与周围邻居实体表征向量进行相似度计算,所得相似度经过Softmax 函数后即为此该邻居与节点e的注意力权重。例如步骤2得出e的自适应聚合阶层数为2,则图网络第一层聚合节点e的一阶邻居,第二层聚合节点e的二阶邻居,其公式如下:
优选地,步骤5具体包括:小样本知识图谱中采用实体对来表征关系,实体对表示为(h,t),其中将头尾实体经过步骤3得到其各自的自适应聚合阶层,再经过步骤4得到头尾实体的聚合向量表示:需要将头尾实体对表征为他们之间的关系,即该task的小样本关系。本发明设计了两种实体对编码方式:
1)双向LSTM编码
首先模型需要定义K shot,即将该小样本关系r的支持集中的实体对数量。将每个实体对的头尾实体向量进行拼接操作,得到该实体对的向量表示。将K个实体对组合成该小样本关系的实体对序列,随后将该序列输入进双向LSTM编码。最终得到的向量即为该task下支持集表征的小样本关系。将第i个task下支持集得到的关系表征表示为
2)Transformer编码
将实体对中的头尾实体的向量表示作为transformer的token输入。并在头尾实体间插入Mask,因此,其总共包含为三个token:分别为头实体,mask,关系。其刚好对应知识图谱结构中的三元组形式。最终transformer输出mask位置的向量即为该实体对表征得到的小样本关系,最终将K个实体对关系向量通过注意力权重求和,从而得到该task的支持集关系
优选地,步骤6具体包括:在小样本任务设定中,一个task分为支持集和查询集。查询集同样包含有对应的实体对,同样需要将查询集中的实体对经过步骤5表征成该task的关系向量,称之为该task的查询向量,表示为
优选地,步骤7具体包括:对同一task中的支持集关系向量与查询集关系向量进行相似度计算,由于同一task下的两类关系向量表征的是同一种小样本关系,因此它们应越相似越好,而不同task下的支持集关系向量与查询集向量的欧式距离应越远越好。因此其计算公式如下
其中,公式(3)中,γ(.,.)代表余弦相似度计算函数;公式(4)代表查询关系向量的负样本,β为正负样的分界值。其中[x]+=max(0,x)代表一个标准的hinge损失函数。为了优化模型使得L达到最小化,本发明需要以L作为损失函数对上述步骤进行迭代训练,直到其收敛到最优值。
实施本发明方法的一种基于节点自适应的小样本知识图谱补全装置,包括:
实体邻居序列构建模块,用于为知识图谱中所有实体构建邻居序列;
实体的邻居序列输送模块,用于将实体的邻居序列经过transformer后输入进自适应阶层分类器,从而得到该实体的自适应聚合阶层;
实体邻居聚合模块,用于采用基于注意力图网络的聚合方式对实体的邻居进行聚合,其邻居拓展到第几阶由自适应阶层分类器所决定;
小样本关系向量表征模块,用于将聚合好后的头尾对向量通过两种方式表征成所对应task的小样本关系向量,分为支持集关系向量和查询关系向量;
相似度计算模块,用于对同一task下的支持集向量和查询向量进行相似度计算;
损失函数值计算模块,用于根据相似度计算损失函数值;
网络训练模块,用于进行网络训练,直到到达设定的迭代次数;
尾实体补全模块,用于完成训练后,使用训练好的模型根据头实体和关系来补全尾实体。
本发明还包括一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现权利要求1-8中任一项所述的一种基于节点自适应的小样本知识图谱补全方法。
有益效果
本发明考虑到小样本知识图谱补全领域存在的稀疏实体聚合邻居信息较少的问题,提出了基于节点自适应的小样本知识图谱补全方法一应用;设计了一种节点自适应分类器,使得邻居的聚合范围由该节点和其邻居决定,而非所有实体共享同样的范围,这解决了高频率实体聚合范围增大带来的噪音污染问题,同时也避免了稀疏实体邻居聚合信息较少的问题,同时提升了频繁实体和稀疏实体的向量表征;本发明所提出的方法能够有效提高补全精度;本发明可以通过适当改进拓展到多种知识图谱补全任务中,在知识图谱领域具有一定的应用前景。
附图说明
图1是本发明一个实施例所提出的节点自适应的邻居序列构造方法示意图。
图2是本发明一个实施例所提出的一种基于节点自适应的小样本知识图谱补全方法算法执行流程示意图。
图3是本发明的一个实施例的一种基于节点自适应的小样本知识图谱补全装置的装置结构图。
图4是知识图谱结构示意图。
图5是实体链接结构示意图。
具体实施方式
面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,下述的实施例及实施方式中的特征可以相互组合。
在一个用户网页搜索场景中,基于知识图谱数据库的搜索形式将变成三元组的补全范式,例如当一个用户搜索“中国的首都是哪个城市”,即可解析出其头节点为“中国”、关系为“首都”,对该三元组进行尾节点补全即可返回该搜索答案。而在传统补全场景中,通常需要大量的三元组来对关系的向量表征进行训练,三元组由头实体,关系,尾实体组成(h,r,t),例如(中国,首都,北京),其表明中国的首都是北京。而首都这个关系,其可能包含有其他的三元组,例如(法国,首都,巴黎)。当一个关系只有很少的三元组时,我们称之为其为小样本关系。一个task由一个小样本关系的所有三元组组成,分为支持集和查询集。由于小样本关系所包含的三元组较少无法训练出良好的关系表征因此我们需要用该关系的头尾实体对来表征关系,例如可以用(中国,北京)的编码来表征首都这个关系。为了更好的表征关系,首先需要对实体进行良好的表征。而大部分稀疏实体邻居数量极少,假设北京这个实体,包含的邻居就只有中国这一个实体,它们它可利用的邻居信息就是十分稀疏的,因此,只聚合一阶邻居的情况下北京实体聚合的邻居信息较少,就无法有效的表征该实体,而当采用节点自适应分类器时可由模型自行判断该实体在聚合邻居范围扩大的前提下能够获得更好的表征向量。
图1为本发明一实施例提供的一种基于元学习的稀疏知识图谱嵌入方法的流程示意图。如图1所示,本发明实施例中的应用本发明提供一种基于节点自适应的小样本知识图谱补全算法的用户网页搜索方法,包括以下步骤:
步骤1、为知识图谱中每个节点构建属于它的邻居序列,该序列长度为255,由自身节点e、分层节点以及一到四阶邻居节点构成,其具体组成方式见图1。其中一到四阶邻居分别选取五十个邻居节点,若节点数量不足则补padding操作,若超过规定数量则随机抽取。
步骤2、将节点e长度为255的的邻居节点序列输入Transformer进行自注意力聚合,
第一层多头注意力层采用Mask操作使得一阶分层节点只聚合一阶邻居。将聚合后的一阶分层节点向量与节点e向量进行拼接,随后将其输入到自适应阶层分类器进行二分类,决定是否聚合一阶邻居。若聚合一阶邻居,则执行步骤3。若为否则节点e不聚合任何邻居,将跳过步骤3、4执行阶段。
步骤3、若步骤2中的自适应阶层分类器分类结果为聚合一阶邻居, transformer继续编码,第二层多头注意力层同样采用Mask操作使得二阶分层节点只聚合第二阶邻居,将聚合后的二阶分层节点向量与节点e向量进行拼接输入自适应阶层分类器以决定是否聚合第二阶邻居。同理,若聚合第二阶邻居则采用如同步骤2、3方法对第三阶和第四阶邻居进行分类,最终Transformer输出节点e的自适应聚合阶层。
步骤4、将步骤3得到的自适应聚合阶层数作为节点e需要聚合的邻居范围。采用基于注意力图网络的聚合方式进行邻居聚合,将节点e的向量表征与周围邻居实体表征向量进行相似度计算,所得相似度经过Softmax函数后即为此该邻居与节点e的注意力权重。例如步骤2得出e的自适应聚合阶层数为2,则图网络第一层聚合节点e的一阶邻居,第二层聚合节点e的二阶邻居,其公式如下:
步骤5、小样本知识图谱中采用实体对来表征关系,实体对表示为(h,t),其中将头尾实体经过步骤3得到其各自的自适应聚合阶层,再经过步骤4得到头尾实体的聚合向量表示:需要将头尾实体对表征为他们之间的关系,即该task的小样本关系。本发明设计了两种实体对编码方式:
1)双向LSTM编码
首先模型需要定义K shot,即将该小样本关系r的支持集中的实体对数量。将每个实体对的头尾实体向量进行拼接操作,得到该实体对的向量表示。将K个实体对组合成该小样本关系的实体对序列,随后将该序列输入进双向LSTM编码。最终得到的向量即为该task下支持集表征的小样本关系。将第i个task下支持集得到的关系表征表示为
2)Transformer编码
将实体对中的头尾实体的向量表示作为transformer的token输入。并在头尾实体间插入Mask,因此,其总共包含为三个token:分别为头实体,mask,关系。其刚好对应知识图谱结构中的三元组形式。最终transformer输出mask位置的向量即为该实体对表征得到的小样本关系,最终将K个实体对关系向量通过注意力权重求和,从而得到该task的支持集关系
步骤7、对同一task中的支持集关系向量与查询集关系向量进行相似度计算,由于同一task下的两类关系向量表征的是同一种小样本关系,因此它们应越相似越好,而不同task下的支持集关系向量与查询集向量的欧式距离应越远越好。因此其计算公式如下
其中,公式(3)中,γ(.,.)代表余弦相似度计算函数;公式(4)代表查询关系向量的负样本,β为正负样的分界值。其中[x]+=max(0,x)代表一个标准的hinge损失函数。为了优化模型使得L达到最小化,本发明需要以L作为损失函数对上述步骤进行迭代训练,直到其收敛到最优值。
步骤8、结束训练,得到训练好的模型;
步骤9、用户输入问题,通过实体链接算法得到问题的头节点和关,并将其输入训练好的知识图谱补全模型中,该模型会在知识图谱数据库中检索其可能的尾实体结果,并将其作为搜索的结果而返回。
本发明还提供了图3所示的一种对应于图1的一种基于节点自适应的小样本知识图谱补全装置的示意结构图。实施本发明方法的一种基于节点自适应的小样本知识图谱补全装置,包括:
实体邻居序列构建模块,用于为知识图谱中所有实体构建邻居序列;
实体的邻居序列输送模块,用于将实体的邻居序列经过transformer后输入进自适应阶层分类器,从而得到该实体的自适应聚合阶层;
实体邻居聚合模块,用于采用基于注意力图网络的聚合方式对实体的邻居进行聚合,其邻居拓展到第几阶由自适应阶层分类器所决定;
小样本关系向量表征模块,用于将聚合好后的头尾对向量通过两种方式表征成所对应task的小样本关系向量,分为支持集关系向量和查询关系向量;
相似度计算模块,用于对同一task下的支持集向量和查询向量进行相似度计算;
损失函数值计算模块,用于根据相似度计算损失函数值;
网络训练模块,用于进行网络训练,直到到达设定的迭代次数;
尾实体补全模块,用于完成训练后,使用训练好的模型根据头实体和关系来补全尾实体。
本发明还包括一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现权利要求1-8中任一项所述的一种基于节点自适应的小样本知识图谱补全方法。
如图1和图3所述,在硬件层面,该一种基于节点自适应的小样本知识图谱补全装置包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的数据采集的方法。当然,除了软件实现方式之外,本发明并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(ProgrammableLogic Device,PLD)(例如现场可编程门阵列(Field Programmable Gate Array,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware DescriptionLanguage,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced BooleanExpression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java HardwareDescription Language)、 Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware DescriptionLanguage) 等,目前最普遍使用的是VHDL(Very-High-Speed Integrated CircuitHardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM) 和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于节点自适应的小样本知识图谱补全方法,其特征在于,包括以下步骤:
步骤1、为知识图谱中所有实体构建邻居序列;
步骤2、将实体的邻居序列经过transformer后输入进自适应阶层分类器,从而得到该实体的自适应聚合阶层;
步骤3、采用基于注意力图网络的聚合方式对实体的邻居进行聚合,其邻居拓展到第几阶由自适应阶层分类器所决定;
步骤4、将聚合好后的头尾对向量通过两种方式表征成所对应task的小样本关系向量,分为支持集关系向量和查询关系向量;
步骤5、对同一task下的支持集向量和查询向量进行相似度计算;
步骤6、根据相似度计算损失函数值;
步骤7、进行网络训练,直到到达设定的迭代次数;
步骤8、完成训练后,使用训练好的模型根据头实体和关系来补全尾实体。
2.如权利要求1所述的一种基于节点自适应的小样本知识图谱补全方法,其特征在于,步骤1具体包括:构建邻居序列,该序列长度为255,由自身节点e、分层节点以及一到四阶邻居节点构成;其中一到四阶邻居分别选取五十个邻居节点,若节点数量不足则补padding操作,若超过规定数量则随机抽取。
3.如权利要求1所述的一种基于节点自适应的小样本知识图谱补全方法,其特征在于,步骤2具体包括:Transformer第一层多头注意力层采用Mask操作使得一阶分层节点只聚合一阶邻居;将聚合后的一阶分层节点向量与节点e向量进行拼接,随后将其输入到自适应阶层分类器进行二分类,决定是否聚合一阶邻居;若聚合一阶邻居,则执行步骤3;若为否则节点e不聚合任何邻居,将跳过步骤3、4执行阶段。
4.如权利要求1所述的一种基于节点自适应的小样本知识图谱补全方法,其特征在于,步骤3具体包括:若步骤2中的自适应阶层分类器分类结果为聚合一阶邻居,transformer继续编码,第二层多头注意力层同样采用Mask操作使得二阶分层节点只聚合第二阶邻居,将聚合后的二阶分层节点向量与节点e向量进行拼接输入自适应阶层分类器以决定是否聚合第二阶邻居;同理,若聚合第二阶邻居则采用如同步骤2、3方法对第三阶和第四阶邻居进行分类,最终Transformer输出节点e的自适应聚合阶层。
5.如权利要求1所述的一种基于节点自适应的小样本知识图谱补全方法,其特征在于,步骤4具体包括:将步骤3得到的自适应聚合阶层数作为节点e需要聚合的邻居范围;采用基于注意力图网络的聚合方式进行邻居聚合,将节点e的向量表征与周围邻居实体表征向量进行相似度计算,所得相似度经过Softmax函数后即为此该邻居与节点e的注意力权重;步骤2得出e的自适应聚合阶层数为2,则图网络第一层聚合节点e的一阶邻居,第二层聚合节点e的二阶邻居,其公式如下:
6.如权利要求1所述的一种基于节点自适应的小样本知识图谱补全方法,其特征在于,步骤5具体包括:小样本知识图谱中采用实体对来表征关系,实体对表示为(h,t),其中将头尾实体经过步骤3得到其各自的自适应聚合阶层,再经过步骤4得到头尾实体的聚合向量表示:需要将头尾实体对表征为他们之间的关系,即该task的小样本关系;设计两种实体对编码方式:
1)双向LSTM编码
首先模型需要定义K shot,即将该小样本关系r的支持集中的实体对数量;将每个实体对的头尾实体向量进行拼接操作,得到该实体对的向量表示;将K个实体对组合成该小样本关系的实体对序列,随后将该序列输入进双向LSTM编码;最终得到的向量即为该task下支持集表征的小样本关系;将第i个task下支持集得到的关系表征表示为
2)Transformer编码
7.如权利要求1所述的一种基于节点自适应的小样本知识图谱补全方法,其特征在于,步骤6具体包括:在小样本任务设定中,一个task分为支持集和查询集。查询集同样包含有对应的实体对,同样需要将查询集中的实体对经过步骤5表征成该task的关系向量,称之为该task的查询向量,表示为ri q。
9.一种基于节点自适应的小样本知识图谱补全装置,其特征在于,包括:
实体邻居序列构建模块,用于为知识图谱中所有实体构建邻居序列;
实体的邻居序列输送模块,用于将实体的邻居序列经过transformer后输入进自适应阶层分类器,从而得到该实体的自适应聚合阶层;
实体邻居聚合模块,用于采用基于注意力图网络的聚合方式对实体的邻居进行聚合,其邻居拓展到第几阶由自适应阶层分类器所决定;
小样本关系向量表征模块,用于将聚合好后的头尾对向量通过两种方式表征成所对应task的小样本关系向量,分为支持集关系向量和查询关系向量;
相似度计算模块,用于对同一task下的支持集向量和查询向量进行相似度计算;
损失函数值计算模块,用于根据相似度计算损失函数值;
网络训练模块,用于进行网络训练,直到到达设定的迭代次数;
尾实体补全模块,用于完成训练后,使用训练好的模型根据头实体和关系来补全尾实体。
10.一种计算机可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时,实现权利要求1-8中任一项所述的一种基于节点自适应的小样本知识图谱补全方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211453303.XA CN115905569B (zh) | 2022-11-21 | 2022-11-21 | 一种基于节点自适应的小样本知识图谱补全方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211453303.XA CN115905569B (zh) | 2022-11-21 | 2022-11-21 | 一种基于节点自适应的小样本知识图谱补全方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115905569A true CN115905569A (zh) | 2023-04-04 |
CN115905569B CN115905569B (zh) | 2023-11-17 |
Family
ID=86472086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211453303.XA Active CN115905569B (zh) | 2022-11-21 | 2022-11-21 | 一种基于节点自适应的小样本知识图谱补全方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115905569B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200233860A1 (en) * | 2019-01-22 | 2020-07-23 | International Business Machines Corporation | Querying knowledge graph databases |
CN115129884A (zh) * | 2022-05-31 | 2022-09-30 | 国家计算机网络与信息安全管理中心 | 基于语义交互匹配网络的知识图谱补全方法及系统 |
-
2022
- 2022-11-21 CN CN202211453303.XA patent/CN115905569B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200233860A1 (en) * | 2019-01-22 | 2020-07-23 | International Business Machines Corporation | Querying knowledge graph databases |
CN115129884A (zh) * | 2022-05-31 | 2022-09-30 | 国家计算机网络与信息安全管理中心 | 基于语义交互匹配网络的知识图谱补全方法及系统 |
Non-Patent Citations (1)
Title |
---|
普祥和 等: "结合类型感知注意力的少样本知识图谱补全", pages 1 - 5, Retrieved from the Internet <URL:http://kns.cnki.net/kcms/detail/10.1478.G2.20221101.1617.002.html> * |
Also Published As
Publication number | Publication date |
---|---|
CN115905569B (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fan et al. | Querying big graphs within bounded resources | |
CN106294684A (zh) | 词向量的文本分类方法及终端设备 | |
CN106709503B (zh) | 一种基于密度的大型空间数据聚类算法k-dbscan | |
CN108874765B (zh) | 词向量处理方法及装置 | |
CN110119505A (zh) | 词向量生成方法、装置以及设备 | |
CN114429222A (zh) | 一种模型的训练方法、装置及设备 | |
CN116681810B (zh) | 虚拟对象动作生成方法、装置、计算机设备和存储介质 | |
CN113837635A (zh) | 风险检测处理方法、装置及设备 | |
CN116151363A (zh) | 分布式强化学习系统 | |
Nguyen et al. | Learning on hypergraphs with sparsity | |
CN115878761B (zh) | 事件脉络生成方法、设备及介质 | |
CN108681490B (zh) | 针对rpc信息的向量处理方法、装置以及设备 | |
CN117953258A (zh) | 对象分类模型的训练方法、对象分类方法及装置 | |
CN110263817B (zh) | 一种基于用户账号的风险等级划分方法及装置 | |
CN115905569B (zh) | 一种基于节点自适应的小样本知识图谱补全方法和装置 | |
CN116644180A (zh) | 文本匹配模型的训练方法、训练系统和文本标签确定方法 | |
CN114861665B (zh) | 一种强化学习模型训练以及确定数据关系的方法及装置 | |
JP7041239B2 (ja) | 深層距離学習方法およびシステム | |
CN111931913B (zh) | 基于Caffe的卷积神经网络在FPGA上的部署方法 | |
CN114676132A (zh) | 一种数据表关联方法、装置、存储介质及电子设备 | |
CN114912513A (zh) | 一种模型训练的方法、识别信息的方法及装置 | |
CN115712734B (zh) | 一种基于元学习的稀疏知识图谱嵌入方法和装置 | |
CN114385827A (zh) | 面向会议知识图谱的检索方法 | |
CN115774577A (zh) | 一种Spark GraphX参数调优方法、装置、电子设备及存储介质 | |
CN116340469B (zh) | 一种同义词挖掘方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |