CN115438192A - 一种基于元学习的小样本知识图谱补全方法 - Google Patents
一种基于元学习的小样本知识图谱补全方法 Download PDFInfo
- Publication number
- CN115438192A CN115438192A CN202211125241.XA CN202211125241A CN115438192A CN 115438192 A CN115438192 A CN 115438192A CN 202211125241 A CN202211125241 A CN 202211125241A CN 115438192 A CN115438192 A CN 115438192A
- Authority
- CN
- China
- Prior art keywords
- entity
- relation
- neighborhood
- embedding
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了—种基于元学习的小样本知识图谱补全方法,该基于元学习的小样本知识图谱补全方法,包含邻域关系元编码器和匹配处理器两部分组件,邻域关系元编码器将语义相似度从实体级转移到关系级,用实体间的语义相似度和邻域内的信息交互描述邻域关系对长尾关系间的作用,将获取到的关系嵌入转移至查询集中,更新关系元后,计算查询集对应的新三元组的合理性得分,解决了小样本知识图谱的补全任务,对于知识图谱中一个缺失尾实体的不完全三元组,将其中的头实体称为目标头实体,关系称为任务关系,给定任务关系对应的K个头尾实体对构成的称为参考集的集合,可以实现对缺失尾实体的预测任务。
Description
技术领域
本发明涉及知识图谱领域,具体是一种基于元学习的小样本知识图谱补全方法。
背景技术
大型知识图谱通常比较稀疏,需要挖掘缺失的信息或补充新实体使其更加完整,对存在长尾关系的三元组中的缺失部分进行预测的任务称为小样本知识图谱补全,分为静态知识图谱补全和动态知识图谱补全,静态知识图谱补全是推断知识图谱中的隐含关系,动态知识图谱补全是补充原知识图谱中未出现过的实体或关系。
现有的知识图谱补全算法通常需要大量三元组进行训练,不适用于对应实体对数量较少的长尾关系的情况,无法直接应用于小样本问题,而针对小样本问题的相关模型主要关注于实体嵌入而非关系嵌入,忽略了关系表示在最终预测中的重要性,无法充分表示长尾关系的特性。
发明内容
本发明的目的在于提供一种基于元学习的小样本知识图谱补全方法,以解决上述背景技术提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于元学习的小样本知识图谱补全方法,包括以下步骤:
1)邻域关系元编码器:利用参考实体的邻域信息可以获取关系的有效表示,对实体和关系的信息交换进行建模;
2)匹配处理器:由参考集信息实现关系元的更新,对参考实体和关系元信息进行匹配,更新关系元。
在上述技术方案的基础上,本发明还提供以下可选技术方案:
在一种可选方案中:在步骤1)中,计算尾实体和头实体的一跳邻域实体之间的相似度度量:
φ(e,enbr)=eTW1enbr+b (1)
其中e和enbr分别表示参考集中的头实体和尾实体邻域的原始嵌入,W1和b是可训练参数,以参考集中头或尾实体和邻域实体之间的相似度作为邻域关系对任务关系的注意力,邻域内编号为i的邻域关系与任务关系之间的注意力系数αi为:
在一种可选方案中:将注意力系数αi作为邻域关系对任务关系的影响因子,得到参考集中序号m的一个参考实体对对应的关系元表示,称为邻域感知关系嵌入:
在一种可选方案中:使用权重矩阵W3将其映射到一个K维空间中,从而和尾实体ti通过计算内积得到三元组得分,支持集的损失函数:
在一种可选方案中:保留对支持集损失优化过程中关系元的梯度信息,将其同样作为元信息从参考集转移至查询集中,使用如下公式计算梯度元:
得到的更新后的关系元即可输入到第二个组件中。
损失函数:
相较于现有技术,本发明的有益效果如下:
基于元学习的小样本知识图谱补全方法包含邻域关系元编码器和匹配处理器两部分组件,解决了小样本知识图谱的补全任务,对于知识图谱中一个缺失尾实体的不完全三元组,将其中的头实体称为目标头实体,关系称为任务关系,给定任务关系对应的K个头尾实体对构成的称为参考集的集合,知识图谱中包含参考实体中的邻域信息,以及一个目标头实体对应的包含真实尾实体候选实体集,可以实现对缺失尾实体的预测任务。
附图说明
图1为基于元学习的小样本知识图谱补全方法的方法结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述。
如图1所示,为本发明一个实施例提供的一种基于元学习的小样本知识图谱补全方法,称为FNIF,包含邻域关系元编码器和匹配处理器两部分。
1)邻域关系元编码器
由于任务关系对应的头尾实体信息较少,为聚合实体的一跳邻域信息,获取相应的任务关系嵌入,用实体间的语义关联表示关系间的语义相似性。首先计算尾实体和头实体的一跳邻域实体之间的相似度度量:
φ(e,enbr)=eTW1enbr+b (1)
其中e和enbr分别表示参考集中的头实体(尾实体)和尾实体邻域(头实体邻域)的原始嵌入,W1和b是可训练参数,使用相同的方法计算尾实体和头实体邻域的相关性,但其中的权重矩阵不同。以参考集中头或尾实体和邻域实体之间的相似度作为邻域关系对任务关系的注意力,邻域内编号为i的邻域关系与任务关系之间的注意力系数αi为:
其中是参考头尾实体对应的邻域中邻域关系和邻域实体的集合。为将实体间的信息交互融合到关系交互中,将上个公式得到的注意力系数αi作为邻域关系对任务关系的影响因子,从而聚合邻域关系嵌入,以聚合邻域信息,得到参考集中序号m的一个参考实体对对应的关系元表示,称为邻域感知关系嵌入:
2)匹配处理器
其中,代表邻域关系元编码器生成的关系元嵌入,和分别表示实体和关系嵌入的二维重构,之后将其输入滤波器为ω的二维卷积层,f(·)类似ReLU的激活函数,vec(·)是将张量重构为二维向量的函数,使用权重矩阵W3将其映射到一个K维空间中,从而和尾实体ti通过计算内积得到三元组得分。下面的式子为支持集的损失函数:
保留对支持集损失优化过程中关系元的梯度信息,将其同样作为元信息从参考集转移至查询集中,使用如下公式计算梯度元:
得到的更新后的关系元即可输入到第二个组件中。
匹配处理器的第二个部分中,本发明拼接查询头实体,优化后的关系元表示以及真实尾实体或随机替换到的尾实体,应用TransE模型中的得分函数计算三元组的匹配度得分s(hj,tj):
整个方法的损失函数的计算为:
本发明上述实施例中提供了一种基于元学习的小样本知识图谱补全方法,称为FNIF,它主要应用了基于嵌入的方法,以及小样本关系学习方法。利用基于嵌入的方法学习长尾关系特征表示,小样本学习是元学习在监督学习领域的应用,应用元学习将参考集的信息转移到查询集的预测任务中,基于嵌入的模型主要关注实体和关系在低维空间中的表示,基于元学习的方法包含基于度量学习的方法、模型表示增强方法以及基于模型优化的方法。而在学习关系嵌入的过程中,用到了图注意力网络,将注意力机制应用到知识图谱中的图结构中。
FNIF方法包含邻域关系元编码器和匹配处理器两部分组件,邻域关系元编码器将语义相似度从实体级转移到关系级,用实体间的语义相似度和邻域内的信息交互描述邻域关系对长尾关系间的作用,并结合注意力机制,获取关系的高效表示。将获取到的关系嵌入转移至查询集中,更新关系元后,计算查询集对应的新三元组的合理性得分。在NELL-One和Wiki-One两个数据集上均取得了较好的表现。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (7)
1.一种基于元学习的小样本知识图谱补全方法,其特征在于,包括以下步骤:
1)邻域关系元编码器:利用参考实体的邻域信息可以获取关系的有效表示,对实体和关系的信息交换进行建模;
2)匹配处理器:由参考集信息实现关系元的更新,对参考实体和关系元信息进行匹配,更新关系元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211125241.XA CN115438192A (zh) | 2022-09-15 | 2022-09-15 | 一种基于元学习的小样本知识图谱补全方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211125241.XA CN115438192A (zh) | 2022-09-15 | 2022-09-15 | 一种基于元学习的小样本知识图谱补全方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115438192A true CN115438192A (zh) | 2022-12-06 |
Family
ID=84249824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211125241.XA Pending CN115438192A (zh) | 2022-09-15 | 2022-09-15 | 一种基于元学习的小样本知识图谱补全方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115438192A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116432750A (zh) * | 2023-04-13 | 2023-07-14 | 华中师范大学 | 一种基于盒嵌入的少样本知识图谱补全方法 |
CN116629356A (zh) * | 2023-05-09 | 2023-08-22 | 华中师范大学 | 基于编码器和高斯混合模型的少样本知识图谱补全方法 |
-
2022
- 2022-09-15 CN CN202211125241.XA patent/CN115438192A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116432750A (zh) * | 2023-04-13 | 2023-07-14 | 华中师范大学 | 一种基于盒嵌入的少样本知识图谱补全方法 |
CN116432750B (zh) * | 2023-04-13 | 2023-10-27 | 华中师范大学 | 一种基于盒嵌入的少样本知识图谱补全方法 |
CN116629356A (zh) * | 2023-05-09 | 2023-08-22 | 华中师范大学 | 基于编码器和高斯混合模型的少样本知识图谱补全方法 |
CN116629356B (zh) * | 2023-05-09 | 2024-01-26 | 华中师范大学 | 基于编码器和高斯混合模型的少样本知识图谱补全方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115438192A (zh) | 一种基于元学习的小样本知识图谱补全方法 | |
WO2022267976A1 (zh) | 多模态知识图谱的实体对齐方法、装置及存储介质 | |
CN109902183A (zh) | 一种基于多样图注意力机制的知识图谱嵌入方法 | |
CN114048331A (zh) | 一种基于改进型kgat模型的知识图谱推荐方法及系统 | |
CN113535984A (zh) | 一种基于注意力机制的知识图谱关系预测方法及装置 | |
CN112364976A (zh) | 基于会话推荐系统的用户偏好预测方法 | |
CN113609398A (zh) | 一种基于异构图神经网络的社交推荐方法 | |
CN112182424A (zh) | 一种基于异构信息和同构信息网络融合的社交推荐方法 | |
CN114065048A (zh) | 基于多异构图图神经网络的物品推荐方法 | |
CN113628059A (zh) | 一种基于多层图注意力网络的关联用户识别方法及装置 | |
Yu et al. | Data‐driven polyline simplification using a stacked autoencoder‐based deep neural network | |
CN112667824A (zh) | 基于多语义学习的知识图谱补全方法 | |
CN115795022A (zh) | 一种基于知识图谱的推荐方法、系统、设备及存储介质 | |
CN114911879A (zh) | 一种基于图注意力网络的刑事案件知识图谱关系推理方法 | |
Tian et al. | Semantic segmentation of remote sensing image based on GAN and FCN network model | |
CN111506832B (zh) | 一种基于块矩阵补全的异构对象补全方法 | |
CN114579769B (zh) | 小样本知识图谱补全方法、系统、设备及存储介质 | |
CN116340635A (zh) | 物品推荐方法、模型训练方法、装置及设备 | |
CN115840853A (zh) | 一种基于知识图谱和图注意力网络的课程推荐系统 | |
CN110348469A (zh) | 一种基于DeepWalk网络嵌入模型的用户相似度度量方法 | |
CN115344698A (zh) | 标签处理方法、装置、计算机设备、存储介质和程序产品 | |
CN115455302A (zh) | 一种基于优化图注意网络的知识图谱推荐方法 | |
CN115344794A (zh) | 一种基于知识图谱语义嵌入的旅游景点推荐方法 | |
CN114637863A (zh) | 一种基于传播的知识图谱推荐方法 | |
CN115168595A (zh) | 结合多阶协同信息的知识图谱推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |