CN115860119A - 基于动态元学习的少样本知识图谱补全方法和系统 - Google Patents

基于动态元学习的少样本知识图谱补全方法和系统 Download PDF

Info

Publication number
CN115860119A
CN115860119A CN202211556154.XA CN202211556154A CN115860119A CN 115860119 A CN115860119 A CN 115860119A CN 202211556154 A CN202211556154 A CN 202211556154A CN 115860119 A CN115860119 A CN 115860119A
Authority
CN
China
Prior art keywords
task
relation
training
unit
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211556154.XA
Other languages
English (en)
Inventor
蔡林沁
汪铃均
王灏澜
许诺影
熊余
袁荣棣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202211556154.XA priority Critical patent/CN115860119A/zh
Publication of CN115860119A publication Critical patent/CN115860119A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于动态元学习的少样本知识图谱补全方法和系统,涉及知识图谱图补全技术领域,其技术方案要点是:基于动态元学习的少样本知识图谱补全方法和系统,在传统的基于优化的元学习补全方法的基础上引入了动态邻居编码器,在执行链接预测任务的时候,根据任务关系动态地调节实体邻居信息的权重,并将动态邻居信息融合到实体嵌入中,从而提高实体嵌入的语义表示。同时,对同一关系的不同属性建立了基于一维卷积的融合策略,使得关系嵌入能够表示各方面属性信息,进一步增强了关系表示的鲁棒性,并利用该关系嵌入对模型进行训练,显著提高了链接预测的准确性,进而达到提升知识图谱补全效果的目的。

Description

基于动态元学习的少样本知识图谱补全方法和系统
技术领域
本发明涉及知识图谱图补全技术领域,更具体地说,它涉及基于动态元学习的少样本知识图谱补全方法和系统。
背景技术
随着人工智能的发展逐渐步入认知智能的阶段,知识图谱作为一种图结构的语义网络,被运用到许多NLP的应用当中,诸如基于知识图谱的对话系统、推荐系统以及搜索引擎等。在AI时代,知识图谱是一项非常重要的技术。目前,一些成熟的知识图谱项目,比如YAGO,NELL和WIKI通常通过三元组的形式来表达其图结构,而这些图谱的构建往往依赖于极大量的三元组,因此,知识图谱往往面临着知识不全的问题,从而使得知识图谱补全成了新的研究热点。
知识图谱补全任务也被称之为链接预测任务,即已知头实体和关系,预测尾实体。传统的基于知识表示的方法,往往都需要大量的训练数据;而在知识图谱中,大量关系出现频次很低(即长尾数据);且越是低频的关系,越需要补全。针对长尾关系的补全问题称之为少样本知识图谱补全。为了解决这样的矛盾,有人提出了使用元学习方法。元学习算法可以解决少样本补全领域中样本匮乏的问题,通过支撑集学习到最具有代表性的元知识,然后将元知识迁移到查询集内,对迁移后模型的参数进行训练。近年来,主流的元学习模型分为基于优化的元学习算法和基于度量的元学习算法。基于度量的方法直接对训练数据和测试数据之间的关联进行建模,利用知识图谱的图结构对实体对进行编码,进而让模型能够学习到相同关系实体对间的关联,并基于此判断测试数据的实体对之间是否存在某关系。目前基于度量的元学习方法大多利用一跳邻居信息对实体进行编码,使得实体嵌入能够考虑到图结构信息,然后对关系实体对的语义相似性进行建模,且大多针对于静态图,没有考虑到不同任务关系与实体邻居信息的关联,或者在融合实体嵌入方面,没有考虑原关系嵌入的影响。基于优化的元学习方法相较于基于度量的方法,能够直接寻找预测一个实体对间是否含有某个关系所需要的核心信息,能够在小样本的数据集上快速收敛。
综上所述,基于度量的元学习方法需要对图结构中的实体应用语义聚合函数,还需要对同一关系下实体对的相关性进行建模,这拖慢了模型的训练速度,并不适用于实际的补全场景。基于优化的元学习方法在实体嵌入方面没有充分考虑图结构信息,也没有考虑到在执行链接预测任务的时候,任务关系和剩余关系的联系,这极大地限制了链接预测任务的准确率。
发明内容
本发明的目的是提供基于动态元学习的少样本知识图谱补全方法和系统,达到链接预测任务运算速率和准确率的目的。
本发明的上述技术目的是通过以下技术方案得以实现的:
基于动态元学习的少样本知识图谱补全方法,包括以下操作:
S1.将知识图谱中的任务划分为训练任务集、验证任务集和测试任务集;
S2.构建用于计算任务关系与实体邻居关系相关度的动态邻居编码器,以及用于融合任一关系多种属性的关系元学习器;
S3.将训练任务集中的任务输入到引入动态邻居编码器和关系元学习器的元学习框架中进行训练,得到预测模型;
S4.利用验证任务集和测试任务集的任务,对所述预测模型进行优化、测试处理后,得到用于补全知识图谱的知识图谱预测模型。
进一步的,所述任务包含一个长尾关系及所述一个长尾关系对应的三元组;且所述任务中的三元组被化分为查询集和支撑集。
进一步的,测试任务集中任务的长尾关系与训练任务集中任务的长尾关系不存在交集。
进一步的,S3,包括:利用动态邻居编码器对任务关系与实体邻居关系的相关度进行计算,得到对应的任务关系与实体邻居关系相关度;基于所述相关度,将邻居信息融入到实体嵌入中;对任务中各三元组的实体向量进行分别拼接,得到拼接后的任务。
进一步的,S3,还包括:将拼接后的任务输入到多层全连层中,以提取任务中各三元组的属性信息;将任务中各三元组的属性信息进行一维卷积,得到任务的关系元知识。
进一步的,S3,还包括:获取训练过程中训练任务集的支撑集总损失;利用支撑集总损失的反向传播获取梯度元知识;利用梯度元知识对关系元知识进行更新,得到更新后的关系元知识;利用更新后的关系元知识,对训练任务的查询集进行训练,以得到查询集的总损失;利用查询集总损失的反向传播更新可训练参数。
进一步的,利用验证任务集中任务执行early stopping策略,以优化预测模型。
基于动态元学习的少样本知识图谱补全系统,包括:分类模块,用于将知识图谱中的任务划分为训练任务集、验证任务集和测试任务集;构建模块,所述构建模块包括第一构建单元和第二构建单元;第一构建单元,用于构建计算任务关系与实体邻居关系相关度的动态邻居编码器;第二构建单元,用于构建融合任一关系多种属性的关系元学习器;输入模块,用于将训练任务集中的任务输入到引入动态邻居编码器和关系元学习器的元学习框架中;训练模块,用于对输入到引入动态邻居编码器和关系元学习器的元学习框架中的任务进行训练,得到预测模型;验证模块,所述验证模块包括优化单元和测试单元;优化单元,用于利用验证任务集中的任务对所述预测模型进行优化;测试单元,用于利用测试任务集中的任务对优化后的预测模型进行测试,以得到知识图谱预测模型;预测模块,用于利用知识图谱预测模型对待补全知识图谱进行补全。
进一步的,所述分类模块包括获取单元、第一分类单元、第二分类单元和第三分类单元;获取单元,用于获取知识图谱中的长尾关系以及长尾关系对应的三元组;第一分类单元,用于将获取单元获取的长尾关系以及长尾关系对应的三元组,分类成多个任务,其中,任务包含一个长尾关系以及与所述一个长尾关系对应的三元组;第二分类单元,用于将任务中的三元组,划分为查询集和支撑集;第三分类单元,用于将知识图谱中的任务划分为训练任务集、验证任务集和测试任务集。
进一步的,所述训练模块包括第一处理模块、第二处理模块和第三处理模块;所述第一处理模块包括第一处理单元、第二处理单元和拼接单元;第一处理单元,用于利用动态邻居编码器计算任务关系与实体邻居关系的相关度;第二处理单元,用于根据任务关系与实体邻居关系的相关度,将邻居信息融入到实体嵌入中;拼接单元,用于对各三元组融入邻居信息后的实体向量进行拼接,得到三元组拼接的任务;所述第二处理模块包括提取单元和第三处理单元;提取单元,用于提取三元组拼接后的任务中各三元组属性信息;第三处理单元用于对任务中各三元组的属性信息进行一维卷积,得到任务的关系元知识;第三处理模块包括训练单元、第四处理单元和更新单元;训练单元,用于对训练任务集的支撑集进行训练;第四处理单元,用于获取支撑集训练过程中的支撑集总损失,并利用支撑集总损失的反向传播,计算梯度元知识;更新单元,用于利用梯度元知识更新关系元知识,得到更新后的关系元知识;训练单元,还用于利用更新后的关系元知识,对训练任务的查询集进行训练;第四处理单元,还用于获取查询集训练过程中的查询集总损失,并利用查询集总损失的反向传播更新可训练参数。
与现有技术相比,本发明具有以下有益效果:
(1)相较于传统的知识图谱补全方法,能够对图谱中广泛存在的长尾关系进行建模,在数据量较少的情况下依然能够取得较好的链接预测效果,克服了传统深度学习模型需要大量训练样本的局限性。同时,能够直接提取到预测一个实体对间是否含有某个关系所需要的核心信息,相较于基于度量的元学习算法,不需要对同一关系下的实体对相关性进行建模,减少了计算任务,提高了知识图谱预测模型的运算速度。
(2)相较于传统的基于优化的元学习模型,能够考虑到任务关系与实体邻居关系的联系,利用图注意力机制动态地调节邻居关系的权重,克服了以往模型只能采用静态图结构的局限性。同时,将实体的邻居关系信息融合到实体的嵌入当中,提高了关系元知识的语义信息,进而提高了链接预测任务的准确率。
(3)关系元学习器能够考虑到同一关系的不同属性对于链接预测的影响,利用一维卷积将支撑集中的不同属性融入到最终的关系元知识当中,以提高知识图谱预测模型的鲁棒性。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本实施例中基于动态元学习的少样本知识图谱补全方法流程示意图。
图2为本实施例中基于动态元学习的少样本知识图谱补全方法元学习框架结构图;
图3为本实施例中基于动态元学习的少样本知识图谱补全方法用训练流程示意图;
图4为本实施例中基于动态元学习的少样本知识图谱补全系统结构示意图。
附图中标记及对应的零部件名称:
1-分类模块;11-获取单元;12-第一分类单元;13-第二分类单元;14-第三分类单元;2-构建模块;21-第一构建单元;22-第二构建单元;3-输入模块;4-训练模块;41-第一处理模块;42-第二处理模块;43-第三处理模块;411-第一处理单元;412-第二处理单元;413-拼接单元;421-提取单元;422-第三处理单元;431-训练单元;432-第四处理单元;433-更新单元;5-验证模块;51-优化单元;52-测试单元;6-预测模块。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1:
本实施例提供基于动态元学习的少样本知识图谱补全方法,如图1所示,包括以下操作:
Step1.将知识图谱中的任务划分为训练任务集、验证任务集和测试任务集;
所述任务包含一个长尾关系及所述一个长尾关系对应的三元组;且所述任务中的三元组被化分为查询集和支撑集,且测试任务集中任务的长尾关系与训练任务集中任务的长尾关系不存在交集。
具体地,对知识图谱进行搜集和筛选,知识图谱G由三元组的集合构成,三元组TP={(h,r,t)∈E×R×E},E表示实体的集合,R表示关系的集合,因此,知识图谱表示为G={E,R,TP}。提取知识图谱中的长尾关系以及每个长尾关系对应的三元组,将知识图谱的长尾关系和三元组划分成多个任务,每个任务都由一个长尾关系以及与该长尾关系对应的三元组构成,且每个任务中的三元组都被划分为支撑集Sr和查询集Qr
将知识图谱中的任务划分为训练任务集、验证任务集和测试任务集,其中,训练任务集中的任务用于训练元学习模型,验证任务集中任务用于执行early stopping策略,以优化元学习模型,测试任务集中的任务用于测试元学习模型最终的预测效果。
训练任务集
Figure SMS_1
的每一个任务Ti={Si,Qi}都包含某一特定关系的支撑集和查询集两部分,测试任务集Ttest与训练任务集的结构是一样的,但是测试任务集对应的关系与训练任务集对应的关系不能有任何交集。
上述长尾关系指知识图谱中关系对应三元组数量比较少的关系。
给定一个关系r∈R及其支撑集Sr={(hi,ti)∈E×E|(hi,r,ti)∈TP},已知头实体和任务关系,预测尾实体,如果|Sr|=K,则称此任务为k-shot链接预测。few-shot链接预测任务总是针对某一个特定的关系,先用支撑集Sr进行元知识的学习,然后再用查询集Qr对三元组进行预测。首先从待补全的知识图谱中定位到长尾关系,假设原知识图谱的关系对应三元组的数量最多为x,那么长尾关系对应三元组的数量可能就为0.1x-0.2x,具体的比值由知识图谱的分布来确定,如果知识图谱呈现非长尾分布,这个比值可能要略微取高一些。
Step2.构建用于计算任务关系与实体邻居关系相关度的动态邻居编码器,以及用于融合任一关系多种属性的关系元学习器;
Step3.将训练任务集中的任务输入到引入动态邻居编码器和关系元学习器的元学习框架中进行训练,得到预测模型;
本实施例中,Step3包括:利用动态邻居编码器对任务关系与实体邻居关系的相关度进行计算,得到对应的任务关系与实体邻居关系相关度;基于所述相关度,将邻居信息融入到实体嵌入中;对任务中各三元组的实体向量进行分别拼接,得到拼接后的任务。
具体地,如图2所示,采用TransE作为预训练模型,TransE是传统知识图谱补全领域中最经典的平移距离模型,其训练目标是确保头实体和关系的向量和尽可能地接近尾实体向量。通过TransE将任务集中三元组的实体和关系转换为高维空间的实体向量和关系向量,使各任务中实体和关系的嵌入表示有了丰富的语义信息,能够明显地提升模型的预测效果。
求出关系向量r。以头实体h的动态嵌入表示为例,定义头实体的一跳邻居为Nh={(rnbr,enbr)|(h,rnbr,enbr)∈G′},其中,G′为背景知识图谱,rnbr为头实体h的邻居关系,enbr为与邻居关系相连的尾实体。背景知识图谱由提取知识图谱中长尾关系三元组后,剩余的三元组构成。动态邻居编码器的目标是为了求得实体的动态嵌入表示,把TransE的实体向量作为动态邻居编码器的输入,由于TransE的训练目标是头实体向量与关系向量之和要尽可能接近尾实体向量,因此通过r=h-t得出关系的嵌入表示,r,h,t∈Rd,d表示向量的维度,关系向量和实体向量的维度是相同的。
考虑任务关系和邻居关系的联系,对不同任务关系,如家庭关系和工作关系,当对家庭成员实体进行嵌入的时候,应该分配给其邻居关系中的家庭关系更高的权重,适度降低邻居关系中工作关系的权重。
因此,本实施例采用一个双线性矩阵来计算任务关系和邻居关系的联系,定义了一个评价函数ψ来计算任务关系r和邻居关系rnbr的相关度:
ψ(r,rnbr)=rTWrnbr+b
式中的W∈Rd×d用于进行双线性点积,是待训练参数,r则通过头实体减去尾实体得到,b是偏置值。
采用基于注意力机制的归一化操作,把邻居信息融入到实体嵌入当中。具体公式如下:
Figure SMS_2
Figure SMS_3
Figure SMS_4
f(h)=σ(h+cnbr)
对相关性系数实施基于注意力机制的归一化后,得到邻居信息的权重参数αnbr。W′∈Rd×3d是可训练参数矩阵,下一步将实体向量h,背景关系向量rnbr和背景尾实体向量enbr进行拼接并送入全连接层得到向量bnbr,对bnbr进行加权求和得到最终的邻居向量cnbr,cnbr融入了实体h的一跳邻居信息。通过h+cnbr将实体本身的信息和邻居信息相融合,σ(·)代表ReLU激活函数。最终的实体嵌入不仅考虑到实体本身特征,还考虑到了一跳邻居信息的特征,具有丰富的语义信息。
Step3还包括:将拼接后的任务输入到多层全连层中,以提取任务中各三元组的属性信息;将任务中各三元组的属性信息进行一维卷积,得到任务的关系元知识。
具体地,引入关系元学习器融合同一关系的不同属性,在完成实体嵌入提升语义后,把一个三元组的头实体和尾实体向量进行拼接,能够得到该关系对应的某一属性信息。例如,关系SubpartOf,假如有两个三元组(Chongqing,SubpartOf,China)和(Chinese,SubpartOf,Language),这两个三元组都是同一关系,但是前者对应的是地理属性,而后者对应的是文化属性,任务关系的支撑集的n个三元组表示n个属性,最终我们将n个属性融合得到关系元知识
Figure SMS_5
关系元学习器采用一维卷积融合同一关系的多个属性。将语义增强后的头实体和尾实体向量进行拼接,然后把拼接后的向量送入多层全连接层,提取出三元组的属性信息。最后对属性向量实施一维卷积,得到最后的关系元知识。具体公式如下:
Figure SMS_6
Figure SMS_7
Figure SMS_8
Figure SMS_9
Figure SMS_10
表示属性向量,下标i表示支撑集k个实体对中的第i个实体对,上标l表示全连接层的第l层。假设支撑集有k个属性,将k个属性拼接成一个矩阵M∈Rd×k,对属性矩阵M实行一维卷积w∈R1×k,b′∈Rd表示偏置向量,g(·)表示ReLU激活函数。最终得到的特征图向量/>
Figure SMS_11
即为融合了多层属性信息的关系元知识。
Step3还包括:获取训练过程中训练任务集的支撑集总损失;利用支撑集总损失的反向传播获取梯度元知识;利用梯度元知识对关系元知识进行更新,得到更新后的关系元知识;利用更新后的关系元知识,对训练任务的查询集进行训练,以得到查询集的总损失;利用查询集总损失的反向传播更新可训练参数。
具体地,将训练任务集和验证任务集送入元学习框架中,并按照如图3所示训练流程示意图进行模型的训练,其中,训练任务集主要用于模型训练和参数更新,验证任务集用于执行early stopping策略,以寻找训练过程中最优的预测模型。
在基于优化的元学习算法中,需要通过支撑集提取出最需要迁移到查询集的元知识,而在少样本链接预测任务中,每个任务下的三元组都是基于同一个关系的,因此本发明选择关系作为元知识。并提出了关系元和梯度元两种元知识,利用关系元知识对训练任务集的查询集执行链接预测任务,梯度元知识加速关系元知识的更新,从而提高训练速度。
在通过支撑集求得关系元
Figure SMS_12
后,需要用到梯度元/>
Figure SMS_13
来对关系元进行快速更新。首先对Sr中支撑集实体对进行打分,本实施例采用了TransE的基于平移距离的评分函数:
Figure SMS_14
其中,||x||为向量x求L2范数,平移距离模型的思想是确保头实体与尾实体之和要尽可能地接近尾实体。接下来利用评分函数计算支撑集的总损失:
Figure SMS_15
本实施例选取合页损失函数来计算支撑集的总损失,其中,λ表示裕量,是一个可选择的超参数,s(hi,t′i)是支撑集中负样本的评分。负样本是通过随机替换尾实体得到的。
利用L(Sr)对关系元
Figure SMS_16
进行计算并更新梯度,公式如下:
Figure SMS_17
/>
Figure SMS_18
其中,β表示关系元的学习率。利用梯度元来更新关系元知识,加快了关系元知识更新的速度。
当对支撑集进行评分后,本实施例中把更新后的关系元知识
Figure SMS_19
迁移到查询集Qr={(hj,tj)},其评分函数和损失函数表示为:
Figure SMS_20
Figure SMS_21
其中,s(hj,t′j)为查询集中负样本的评分,负样本的构建同支撑集一样。计算出查询集上的损失L(Qr)后,接下来进行反向传播,计算梯度并更新所有可训练参数。
在整个训练过程中,最终目标是最小化所有任务的查询集的损失之和,其公式表示为:
Figure SMS_22
Step4.利用验证任务集和测试任务集的任务,对所述预测模型进行优化、测试处理后,得到用于补全知识图谱的知识图谱预测模型。
实施例2
本实施例提供基于动态元学习的少样本知识图谱补全系统,如图4所示,包括:分类模块1,用于将知识图谱中的任务划分为训练任务集、验证任务集和测试任务集;构建模块2,所述构建模块2包括第一构建单元21和第二构建单元22;第一构建单元21,用于构建计算任务关系与实体邻居关系相关度的动态邻居编码器;第二构建单元22,用于构建融合任一关系多种属性的关系元学习器;输入模块3,用于将训练任务集中的任务输入到引入动态邻居编码器和关系元学习器的元学习框架中;训练模块4,用于对输入到引入动态邻居编码器和关系元学习器的元学习框架中的任务进行训练,得到预测模型;验证模块5,所述验证模块5包括优化单元51和测试单元52;优化单元51,用于利用验证任务集中的任务对所述预测模型进行优化;测试单元52,用于利用测试任务集中的任务对优化后的预测模型进行测试,以得到知识图谱预测模型;预测模块6,用于利用知识图谱预测模型对待补全知识图谱进行补全。
本实施例中,所述分类模块1包括获取单元11、第一分类单元12、第二分类单元13和第三分类单元14;获取单元11,用于获取知识图谱中的长尾关系以及长尾关系对应的三元组;第一分类单元12,用于将获取单元11获取的长尾关系以及长尾关系对应的三元组,分类成多个任务,其中,任务包含一个长尾关系以及与所述一个长尾关系对应的三元组;第二分类单元13,用于将任务中的三元组,划分为查询集和支撑集;第三分类单元14,用于将知识图谱中的任务划分为训练任务集、验证任务集和测试任务集。
本实施例中,所述训练模块4包括第一处理模块41、第二处理模块42和第三处理模块43;所述第一处理模块41包括第一处理单元411、第二处理单元412和拼接单元413;第一处理单元411,用于利用动态邻居编码器计算任务关系与实体邻居关系的相关度;第二处理单元412,用于根据任务关系与实体邻居关系的相关度,将邻居信息融入到实体嵌入中;拼接单元413,用于对各三元组融入邻居信息后的实体向量进行拼接,得到三元组拼接的任务;所述第二处理模块42包括提取单元421和第三处理单元422;提取单元421,用于提取三元组拼接后的任务中各三元组属性信息;第三处理单元422用于对任务中各三元组的属性信息进行一维卷积,得到任务的关系元知识;第三处理模块43包括训练单元431、第四处理单元432和更新单元433;训练单元431,用于对训练任务集的支撑集进行训练;第四处理单元432,用于获取支撑集训练过程中的支撑集总损失,并利用支撑集总损失的反向传播,计算梯度元知识;更新单元433,用于利用梯度元知识更新关系元知识,得到更新后的关系元知识;训练单元431,还用于利用更新后的关系元知识,对训练任务的查询集进行训练;第四处理单元432,还用于获取查询集训练过程中的查询集总损失,并利用查询集总损失的反向传播更新可训练参数。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.基于动态元学习的少样本知识图谱补全方法,其特征在于,包括以下操作:
S1.将知识图谱中的任务划分为训练任务集、验证任务集和测试任务集;
S2.构建用于计算任务关系与实体邻居关系相关度的动态邻居编码器,以及用于融合任一关系多种属性的关系元学习器;
S3.将训练任务集中的任务输入到引入动态邻居编码器和关系元学习器的元学习框架中进行训练,得到预测模型;
S4.利用验证任务集和测试任务集的任务,对所述预测模型进行优化、测试处理后,得到用于补全知识图谱的知识图谱预测模型。
2.根据权利要求1所述的基于动态元学习的少样本知识图谱补全方法,其特征在于:
所述任务包含一个长尾关系及所述一个长尾关系对应的三元组;
且所述任务中的三元组被化分为查询集和支撑集。
3.根据权利要求2所述的基于动态元学习的少样本知识图谱补全方法,其特征在于:
测试任务集中任务的长尾关系与训练任务集中任务的长尾关系不存在交集。
4.根据权利要求1所述的基于动态元学习的少样本知识图谱补全方法,其特征在于,S3,包括:
利用动态邻居编码器对任务关系与实体邻居关系的相关度进行计算,得到对应的任务关系与实体邻居关系相关度;
基于所述相关度,将邻居信息融入到实体嵌入中;
对任务中各三元组的实体向量进行分别拼接,得到拼接后的任务。
5.根据权利要求4所述的基于动态元学习的少样本知识图谱补全方法,其特征在于,S3,还包括:
将拼接后的任务输入到多层全连层中,以提取任务中各三元组的属性信息;
将任务中各三元组的属性信息进行一维卷积,得到任务的关系元知识。
6.根据权利要求5所述的基于动态元学习的少样本知识图谱补全方法,其特征在于,S3,还包括:
获取训练过程中训练任务集的支撑集总损失;
利用支撑集总损失的反向传播获取梯度元知识;
利用梯度元知识对关系元知识进行更新,得到更新后的关系元知识;
利用更新后的关系元知识,对训练任务的查询集进行训练,以得到查询集的总损失;
利用查询集总损失的反向传播更新可训练参数。
7.根据权利要求1所述的基于动态元学习的少样本知识图谱补全方法,其特征在于:
利用验证任务集中任务执行early stopping策略,以优化预测模型。
8.基于动态元学习的少样本知识图谱补全系统,其特征在于,包括:
分类模块(1),用于将知识图谱中的任务划分为训练任务集、验证任务集和测试任务集;
构建模块(2),所述构建模块(2)包括第一构建单元(21)和第二构建单元(22);
第一构建单元(21),用于构建计算任务关系与实体邻居关系相关度的动态邻居编码器;
第二构建单元(22),用于构建融合任一关系多种属性的关系元学习器;
输入模块(3),用于将训练任务集中的任务输入到引入动态邻居编码器和关系元学习器的元学习框架中;
训练模块(4),用于对输入到引入动态邻居编码器和关系元学习器的元学习框架中的任务进行训练,得到预测模型;
验证模块(5),所述验证模块(5)包括优化单元(51)和测试单元(52);
优化单元(51),用于利用验证任务集中的任务对所述预测模型进行优化;
测试单元(52),用于利用测试任务集中的任务对优化后的预测模型进行测试,以得到知识图谱预测模型;
预测模块(6),用于利用知识图谱预测模型对待补全知识图谱进行补全。
9.根据权利要求8所述的基于动态元学习的少样本知识图谱补全系统,其特征在于:
所述分类模块(1)包括获取单元(11)、第一分类单元(12)、第二分类单元(13)和第三分类单元(14);
获取单元(11),用于获取知识图谱中的长尾关系以及长尾关系对应的三元组;
第一分类单元(12),用于将获取单元(11)获取的长尾关系以及长尾关系对应的三元组,分类成多个任务,其中,任务包含一个长尾关系以及与所述一个长尾关系对应的三元组;
第二分类单元(13),用于将任务中的三元组,划分为查询集和支撑集;
第三分类单元(14),用于将知识图谱中的任务划分为训练任务集、验证任务集和测试任务集。
10.根据权利要求8所述的基于动态元学习的少样本知识图谱补全系统,其特征在于:
所述训练模块(4)包括第一处理模块(41)、第二处理模块(42)和第三处理模块(43);
所述第一处理模块(41)包括第一处理单元(411)、第二处理单元(412)和拼接单元(413);
第一处理单元(411),用于利用动态邻居编码器计算任务关系与实体邻居关系的相关度;
第二处理单元(412),用于根据任务关系与实体邻居关系的相关度,将邻居信息融入到实体嵌入中;
拼接单元(413),用于对各三元组融入邻居信息后的实体向量进行拼接,得到三元组拼接的任务;
所述第二处理模块(42)包括提取单元(421)和第三处理单元(422);
提取单元(421),用于提取三元组拼接后的任务中各三元组属性信息;
第三处理单元(422)用于对任务中各三元组的属性信息进行一维卷积,得到任务的关系元知识;
第三处理模块(43)包括训练单元(431)、第四处理单元(432)和更新单元(433);
训练单元(431),用于对训练任务集的支撑集进行训练;
第四处理单元(432),用于获取支撑集训练过程中的支撑集总损失,并利用支撑集总损失的反向传播,计算梯度元知识;
更新单元(433),用于利用梯度元知识更新关系元知识,得到更新后的关系元知识;
训练单元(431),还用于利用更新后的关系元知识,对训练任务的查询集进行训练;
第四处理单元(432),还用于获取查询集训练过程中的查询集总损失,并利用查询集总损失的反向传播更新可训练参数。
CN202211556154.XA 2022-12-06 2022-12-06 基于动态元学习的少样本知识图谱补全方法和系统 Pending CN115860119A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211556154.XA CN115860119A (zh) 2022-12-06 2022-12-06 基于动态元学习的少样本知识图谱补全方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211556154.XA CN115860119A (zh) 2022-12-06 2022-12-06 基于动态元学习的少样本知识图谱补全方法和系统

Publications (1)

Publication Number Publication Date
CN115860119A true CN115860119A (zh) 2023-03-28

Family

ID=85670251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211556154.XA Pending CN115860119A (zh) 2022-12-06 2022-12-06 基于动态元学习的少样本知识图谱补全方法和系统

Country Status (1)

Country Link
CN (1) CN115860119A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116629356A (zh) * 2023-05-09 2023-08-22 华中师范大学 基于编码器和高斯混合模型的少样本知识图谱补全方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116629356A (zh) * 2023-05-09 2023-08-22 华中师范大学 基于编码器和高斯混合模型的少样本知识图谱补全方法
CN116629356B (zh) * 2023-05-09 2024-01-26 华中师范大学 基于编码器和高斯混合模型的少样本知识图谱补全方法

Similar Documents

Publication Publication Date Title
CN110119449B (zh) 一种基于序列增强胶囊网络的刑事案件罪名预测方法
CN110347932B (zh) 一种基于深度学习的跨网络用户对齐方法
CN105893483A (zh) 大数据挖掘过程模型总体框架的构造方法
CN113255895A (zh) 基于图神经网络表示学习的结构图对齐方法和多图联合数据挖掘方法
CN114565053B (zh) 基于特征融合的深层异质图嵌入模型
CN113628059A (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN112884045B (zh) 基于多视角的随机删边嵌入模型的分类方法
CN113987155B (zh) 一种融合知识图谱与大规模用户日志的会话式检索方法
CN117237559B (zh) 面向数字孪生城市的三维模型数据智能分析方法及系统
CN115860119A (zh) 基于动态元学习的少样本知识图谱补全方法和系统
CN114461943B (zh) 基于深度学习的多源poi语义匹配方法、装置及其存储介质
CN116089645A (zh) 一种基于层次化风格的条件文本-电商图片检索方法和系统
CN116206327A (zh) 一种基于在线知识蒸馏的图像分类方法
CN116452939A (zh) 基于多模态实体融合与对齐的社交媒体虚假信息检测方法
CN111930981A (zh) 一种草图检索的数据处理方法
CN113987203A (zh) 一种基于仿射变换与偏置建模的知识图谱推理方法与系统
CN116646001B (zh) 基于联合式跨域注意力模型预测药物靶标结合性的方法
CN116956214A (zh) 基于正则化集成学习的多模态细粒度论文分类方法和系统
KR20230068941A (ko) 딥러닝 학습 기법을 이용하는 유사도 기반 클러스터링 장치 및 그 방법
CN115311494A (zh) 一种利用分层训练结合标签平滑的文化资源图像分类方法
CN115391548A (zh) 基于场景图和概念网相结合的检索知识图谱库生成方法
CN112307914A (zh) 一种基于文本信息指导的开放域图像内容识别方法
CN116484053B (zh) 智能数据分析平台
CN117743694B (zh) 基于图节点特征增强的多层迁移学习跨域推荐方法及系统
CN117634486B (zh) 一种基于文本信息的指向性3d实例分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination