CN115438192A - 一种基于元学习的小样本知识图谱补全方法 - Google Patents

一种基于元学习的小样本知识图谱补全方法 Download PDF

Info

Publication number
CN115438192A
CN115438192A CN202211125241.XA CN202211125241A CN115438192A CN 115438192 A CN115438192 A CN 115438192A CN 202211125241 A CN202211125241 A CN 202211125241A CN 115438192 A CN115438192 A CN 115438192A
Authority
CN
China
Prior art keywords
entity
relation
neighborhood
embedding
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211125241.XA
Other languages
English (en)
Inventor
刘露
汪雨竹
彭涛
包铁
王上
张雪松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202211125241.XA priority Critical patent/CN115438192A/zh
Publication of CN115438192A publication Critical patent/CN115438192A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了—种基于元学习的小样本知识图谱补全方法,该基于元学习的小样本知识图谱补全方法,包含邻域关系元编码器和匹配处理器两部分组件,邻域关系元编码器将语义相似度从实体级转移到关系级,用实体间的语义相似度和邻域内的信息交互描述邻域关系对长尾关系间的作用,将获取到的关系嵌入转移至查询集中,更新关系元后,计算查询集对应的新三元组的合理性得分,解决了小样本知识图谱的补全任务,对于知识图谱中一个缺失尾实体的不完全三元组,将其中的头实体称为目标头实体,关系称为任务关系,给定任务关系对应的K个头尾实体对构成的称为参考集的集合,可以实现对缺失尾实体的预测任务。

Description

一种基于元学习的小样本知识图谱补全方法
技术领域
本发明涉及知识图谱领域,具体是一种基于元学习的小样本知识图谱补全方法。
背景技术
大型知识图谱通常比较稀疏,需要挖掘缺失的信息或补充新实体使其更加完整,对存在长尾关系的三元组中的缺失部分进行预测的任务称为小样本知识图谱补全,分为静态知识图谱补全和动态知识图谱补全,静态知识图谱补全是推断知识图谱中的隐含关系,动态知识图谱补全是补充原知识图谱中未出现过的实体或关系。
现有的知识图谱补全算法通常需要大量三元组进行训练,不适用于对应实体对数量较少的长尾关系的情况,无法直接应用于小样本问题,而针对小样本问题的相关模型主要关注于实体嵌入而非关系嵌入,忽略了关系表示在最终预测中的重要性,无法充分表示长尾关系的特性。
发明内容
本发明的目的在于提供一种基于元学习的小样本知识图谱补全方法,以解决上述背景技术提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于元学习的小样本知识图谱补全方法,包括以下步骤:
1)邻域关系元编码器:利用参考实体的邻域信息可以获取关系的有效表示,对实体和关系的信息交换进行建模;
2)匹配处理器:由参考集信息实现关系元的更新,对参考实体和关系元信息进行匹配,更新关系元。
在上述技术方案的基础上,本发明还提供以下可选技术方案:
在一种可选方案中:在步骤1)中,计算尾实体和头实体的一跳邻域实体之间的相似度度量:
φ(e,enbr)=eTW1enbr+b (1)
其中e和enbr分别表示参考集中的头实体和尾实体邻域的原始嵌入,W1和b是可训练参数,以参考集中头或尾实体和邻域实体之间的相似度作为邻域关系对任务关系的注意力,邻域内编号为i的邻域关系与任务关系之间的注意力系数αi为:
Figure BDA0003847622200000021
其中
Figure BDA0003847622200000022
是参考头尾实体对应的邻域中邻域关系和邻域实体的集合。
在一种可选方案中:将注意力系数αi作为邻域关系对任务关系的影响因子,得到参考集中序号m的一个参考实体对对应的关系元表示,称为邻域感知关系嵌入:
Figure BDA0003847622200000023
其中的
Figure BDA0003847622200000024
是随机选取的某些邻域关系嵌入,该任务关系的原始嵌入和它的邻域感知关系嵌入相加输入一个全连接层,得到第m个参考实体对对应的任务关系嵌入:
Figure BDA0003847622200000025
其中relori是由翻译距离模型中的得分函数h+r=t,转化为的r=t-h计算得到的,σ是LeakyReLU激活函数,W2是可学习参数,对K个参考实体对的嵌入结果求平均,获得关系元
Figure BDA0003847622200000026
Figure BDA0003847622200000027
在一种可选方案中:将参考实体嵌入和关系元嵌入拼接得到三元组嵌入,再通过ConvE模型中的得分函数计算三元组
Figure BDA0003847622200000028
的合理性得分:
Figure BDA0003847622200000029
其中,
Figure BDA00038476222000000210
代表邻域关系元编码器生成的关系元嵌入,
Figure BDA00038476222000000211
Figure BDA00038476222000000212
分别表示实体和关系嵌入的二维重构,之后将其输入滤波器为ω的二维卷积层,f(·)类似ReLU的激活函数,vec(·)是将张量重构为二维向量的函数。
在一种可选方案中:使用权重矩阵W3将其映射到一个K维空间中,从而和尾实体ti通过计算内积得到三元组得分,支持集的损失函数:
Figure BDA0003847622200000031
其中,[x]+=max{0,x}表示标准铰链损失函数,而
Figure BDA00038476222000000310
是由随机替换参考实体对的尾实体得到的负例参考集,γ是用于区分正例和负例之间的间隔。
在一种可选方案中:保留对支持集损失优化过程中关系元的梯度信息,将其同样作为元信息从参考集转移至查询集中,使用如下公式计算梯度元:
Figure BDA0003847622200000032
从而任务
Figure BDA0003847622200000033
Figure BDA0003847622200000034
对应的关系元就由相应的梯度元优化得到:
Figure BDA0003847622200000035
得到的更新后的关系元即可输入到第二个组件中。
在一种可选方案中:应用TransE模型中的得分函数计算三元组的匹配度得分
Figure BDA0003847622200000036
Figure BDA0003847622200000037
损失函数:
Figure BDA0003847622200000038
其中
Figure BDA0003847622200000039
是由随机替换查询集实体对中的尾实体得到的负例查询集,γ是用于区分正负查询集三元组的间隔。
相较于现有技术,本发明的有益效果如下:
基于元学习的小样本知识图谱补全方法包含邻域关系元编码器和匹配处理器两部分组件,解决了小样本知识图谱的补全任务,对于知识图谱中一个缺失尾实体的不完全三元组,将其中的头实体称为目标头实体,关系称为任务关系,给定任务关系对应的K个头尾实体对构成的称为参考集的集合,知识图谱中包含参考实体中的邻域信息,以及一个目标头实体对应的包含真实尾实体候选实体集,可以实现对缺失尾实体的预测任务。
附图说明
图1为基于元学习的小样本知识图谱补全方法的方法结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述。
如图1所示,为本发明一个实施例提供的一种基于元学习的小样本知识图谱补全方法,称为FNIF,包含邻域关系元编码器和匹配处理器两部分。
1)邻域关系元编码器
由于任务关系对应的头尾实体信息较少,为聚合实体的一跳邻域信息,获取相应的任务关系嵌入,用实体间的语义关联表示关系间的语义相似性。首先计算尾实体和头实体的一跳邻域实体之间的相似度度量:
φ(e,enbr)=eTW1enbr+b (1)
其中e和enbr分别表示参考集中的头实体(尾实体)和尾实体邻域(头实体邻域)的原始嵌入,W1和b是可训练参数,使用相同的方法计算尾实体和头实体邻域的相关性,但其中的权重矩阵不同。以参考集中头或尾实体和邻域实体之间的相似度作为邻域关系对任务关系的注意力,邻域内编号为i的邻域关系与任务关系之间的注意力系数αi为:
Figure BDA0003847622200000041
其中
Figure BDA0003847622200000042
是参考头尾实体对应的邻域中邻域关系和邻域实体的集合。为将实体间的信息交互融合到关系交互中,将上个公式得到的注意力系数αi作为邻域关系对任务关系的影响因子,从而聚合邻域关系嵌入,以聚合邻域信息,得到参考集中序号m的一个参考实体对对应的关系元表示,称为邻域感知关系嵌入:
Figure BDA0003847622200000043
其中的
Figure BDA0003847622200000044
是随机选取的某些邻域关系嵌入,之后把该任务关系的原始嵌入和它的邻域感知关系嵌入相加输入一个全连接层,得到第m个参考实体对对应的任务关系嵌入:
Figure BDA0003847622200000051
其中relori是由翻译距离模型中的得分函数h+r=t,转化为的r=t-h计算得到的,σ是LeakyReLU激活函数,W2是可学习参数,对K个参考实体对的嵌入结果求平均,获得关系元
Figure BDA0003847622200000052
Figure BDA0003847622200000053
2)匹配处理器
匹配处理器包含两个部分,它的目的是由参考集信息实现关系元的更新,首先将参考实体嵌入和关系元嵌入拼接得到三元组嵌入,再通过ConvE模型中的得分函数计算三元组
Figure BDA0003847622200000054
的合理性得分:
Figure BDA0003847622200000055
其中,
Figure BDA0003847622200000056
代表邻域关系元编码器生成的关系元嵌入,
Figure BDA0003847622200000057
Figure BDA0003847622200000058
分别表示实体和关系嵌入的二维重构,之后将其输入滤波器为ω的二维卷积层,f(·)类似ReLU的激活函数,vec(·)是将张量重构为二维向量的函数,使用权重矩阵W3将其映射到一个K维空间中,从而和尾实体ti通过计算内积得到三元组得分。下面的式子为支持集的损失函数:
Figure BDA0003847622200000059
其中,[x]+=max{0,x}表示标准铰链损失函数,而
Figure BDA00038476222000000510
是由随机替换参考实体对的尾实体得到的负例参考集,γ是用于区分正例和负例之间的间隔。
保留对支持集损失优化过程中关系元的梯度信息,将其同样作为元信息从参考集转移至查询集中,使用如下公式计算梯度元:
Figure BDA00038476222000000511
从而任务
Figure BDA00038476222000000512
Figure BDA00038476222000000513
对应的关系元就由相应的梯度元优化得到:
Figure BDA00038476222000000514
得到的更新后的关系元即可输入到第二个组件中。
匹配处理器的第二个部分中,本发明拼接查询头实体,优化后的关系元表示以及真实尾实体或随机替换到的尾实体,应用TransE模型中的得分函数计算三元组的匹配度得分s(hj,tj):
Figure BDA0003847622200000061
整个方法的损失函数的计算为:
Figure BDA0003847622200000062
其中
Figure BDA0003847622200000063
是由随机替换查询集实体对中的尾实体得到的负例查询集,γ是用于区分正负查询集三元组的间隔。
本发明上述实施例中提供了一种基于元学习的小样本知识图谱补全方法,称为FNIF,它主要应用了基于嵌入的方法,以及小样本关系学习方法。利用基于嵌入的方法学习长尾关系特征表示,小样本学习是元学习在监督学习领域的应用,应用元学习将参考集的信息转移到查询集的预测任务中,基于嵌入的模型主要关注实体和关系在低维空间中的表示,基于元学习的方法包含基于度量学习的方法、模型表示增强方法以及基于模型优化的方法。而在学习关系嵌入的过程中,用到了图注意力网络,将注意力机制应用到知识图谱中的图结构中。
FNIF方法包含邻域关系元编码器和匹配处理器两部分组件,邻域关系元编码器将语义相似度从实体级转移到关系级,用实体间的语义相似度和邻域内的信息交互描述邻域关系对长尾关系间的作用,并结合注意力机制,获取关系的高效表示。将获取到的关系嵌入转移至查询集中,更新关系元后,计算查询集对应的新三元组的合理性得分。在NELL-One和Wiki-One两个数据集上均取得了较好的表现。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。

Claims (7)

1.一种基于元学习的小样本知识图谱补全方法,其特征在于,包括以下步骤:
1)邻域关系元编码器:利用参考实体的邻域信息可以获取关系的有效表示,对实体和关系的信息交换进行建模;
2)匹配处理器:由参考集信息实现关系元的更新,对参考实体和关系元信息进行匹配,更新关系元。
2.根据权利要求1所述的基于元学习的小样本知识图谱补全方法,其特征在于,在步骤1)中,计算尾实体和头实体的一跳邻域实体之间的相似度度量:
φ(e,enbr)=eTW1enbr+b (1)
其中e和enbr分别表示参考集中的头实体和尾实体邻域的原始嵌入,W1和b是可训练参数,以参考集中头或尾实体和邻域实体之间的相似度作为邻域关系对任务关系的注意力,邻域内编号为i的邻域关系与任务关系之间的注意力系数αi为:
Figure FDA0003847622190000011
其中
Figure FDA0003847622190000012
是参考头尾实体对应的邻域中邻域关系和邻域实体的集合。
3.根据权利要求2所述的基于元学习的小样本知识图谱补全方法,其特征在于,将注意力系数αi作为邻域关系对任务关系的影响因子,得到参考集中序号m的一个参考实体对对应的关系元表示,称为邻域感知关系嵌入:
Figure FDA0003847622190000013
其中的
Figure FDA0003847622190000014
是随机选取的某些邻域关系嵌入,该任务关系的原始嵌入和它的邻域感知关系嵌入相加输入一个全连接层,得到第m个参考实体对对应的任务关系嵌入:
Figure FDA0003847622190000015
其中relori是由翻译距离模型中的得分函数h+r=t,转化为的r=t-h计算得到的,σ是LeakyReLU激活函数,W2是可学习参数,对K个参考实体对的嵌入结果求平均,获得关系元
Figure FDA0003847622190000016
Figure FDA0003847622190000021
4.根据权利要求3所述的基于元学习的小样本知识图谱补全方法,其特征在于,将参考实体嵌入和关系元嵌入拼接得到三元组嵌入,再通过ConvE模型中的得分函数计算三元组
Figure FDA0003847622190000022
的合理性得分:
Figure FDA0003847622190000023
其中,
Figure FDA0003847622190000024
代表邻域关系元编码器生成的关系元嵌入,
Figure FDA0003847622190000025
Figure FDA0003847622190000026
分别表示实体和关系嵌入的二维重构,之后将其输入滤波器为ω的二维卷积层,f(·)类似ReLU的激活函数,vec(·)是将张量重构为二维向量的函数。
5.根据权利要求4所述的基于元学习的小样本知识图谱补全方法,其特征在于,使用权重矩阵W3将其映射到一个K维空间中,从而和尾实体ti通过计算内积得到三元组得分,支持集的损失函数:
Figure FDA0003847622190000027
其中,[x]+=max{0,x}表示标准铰链损失函数,而
Figure FDA00038476221900000213
是由随机替换参考实体对的尾实体得到的负例参考集,γ是用于区分正例和负例之间的间隔。
6.根据权利要求5所述的基于元学习的小样本知识图谱补全方法,其特征在于,保留对支持集损失优化过程中关系元的梯度信息,将其同样作为元信息从参考集转移至查询集中,使用如下公式计算梯度元:
Figure FDA0003847622190000028
从而任务
Figure FDA0003847622190000029
Figure FDA00038476221900000210
对应的关系元就由相应的梯度元优化得到:
Figure FDA00038476221900000211
得到的更新后的关系元即可输入到第二个组件中。
7.根据权利要求6所述的基于元学习的小样本知识图谱补全方法,其特征在于,应用TransE模型中的得分函数计算三元组的匹配度得分
Figure FDA00038476221900000212
Figure FDA0003847622190000031
损失函数:
Figure FDA0003847622190000032
其中
Figure FDA0003847622190000033
是由随机替换查询集实体对中的尾实体得到的负例查询集,γ是用于区分正负查询集三元组的间隔。
CN202211125241.XA 2022-09-15 2022-09-15 一种基于元学习的小样本知识图谱补全方法 Pending CN115438192A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211125241.XA CN115438192A (zh) 2022-09-15 2022-09-15 一种基于元学习的小样本知识图谱补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211125241.XA CN115438192A (zh) 2022-09-15 2022-09-15 一种基于元学习的小样本知识图谱补全方法

Publications (1)

Publication Number Publication Date
CN115438192A true CN115438192A (zh) 2022-12-06

Family

ID=84249824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211125241.XA Pending CN115438192A (zh) 2022-09-15 2022-09-15 一种基于元学习的小样本知识图谱补全方法

Country Status (1)

Country Link
CN (1) CN115438192A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432750A (zh) * 2023-04-13 2023-07-14 华中师范大学 一种基于盒嵌入的少样本知识图谱补全方法
CN116629356A (zh) * 2023-05-09 2023-08-22 华中师范大学 基于编码器和高斯混合模型的少样本知识图谱补全方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432750A (zh) * 2023-04-13 2023-07-14 华中师范大学 一种基于盒嵌入的少样本知识图谱补全方法
CN116432750B (zh) * 2023-04-13 2023-10-27 华中师范大学 一种基于盒嵌入的少样本知识图谱补全方法
CN116629356A (zh) * 2023-05-09 2023-08-22 华中师范大学 基于编码器和高斯混合模型的少样本知识图谱补全方法
CN116629356B (zh) * 2023-05-09 2024-01-26 华中师范大学 基于编码器和高斯混合模型的少样本知识图谱补全方法

Similar Documents

Publication Publication Date Title
CN115438192A (zh) 一种基于元学习的小样本知识图谱补全方法
WO2022267976A1 (zh) 多模态知识图谱的实体对齐方法、装置及存储介质
CN109902183A (zh) 一种基于多样图注意力机制的知识图谱嵌入方法
CN114048331A (zh) 一种基于改进型kgat模型的知识图谱推荐方法及系统
CN113535984A (zh) 一种基于注意力机制的知识图谱关系预测方法及装置
CN112364976A (zh) 基于会话推荐系统的用户偏好预测方法
CN113609398A (zh) 一种基于异构图神经网络的社交推荐方法
CN112182424A (zh) 一种基于异构信息和同构信息网络融合的社交推荐方法
CN114065048A (zh) 基于多异构图图神经网络的物品推荐方法
CN113628059A (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
Yu et al. Data‐driven polyline simplification using a stacked autoencoder‐based deep neural network
CN112667824A (zh) 基于多语义学习的知识图谱补全方法
CN115795022A (zh) 一种基于知识图谱的推荐方法、系统、设备及存储介质
CN114911879A (zh) 一种基于图注意力网络的刑事案件知识图谱关系推理方法
Tian et al. Semantic segmentation of remote sensing image based on GAN and FCN network model
CN111506832B (zh) 一种基于块矩阵补全的异构对象补全方法
CN114579769B (zh) 小样本知识图谱补全方法、系统、设备及存储介质
CN116340635A (zh) 物品推荐方法、模型训练方法、装置及设备
CN115840853A (zh) 一种基于知识图谱和图注意力网络的课程推荐系统
CN110348469A (zh) 一种基于DeepWalk网络嵌入模型的用户相似度度量方法
CN115344698A (zh) 标签处理方法、装置、计算机设备、存储介质和程序产品
CN115455302A (zh) 一种基于优化图注意网络的知识图谱推荐方法
CN115344794A (zh) 一种基于知识图谱语义嵌入的旅游景点推荐方法
CN114637863A (zh) 一种基于传播的知识图谱推荐方法
CN115168595A (zh) 结合多阶协同信息的知识图谱推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination