CN113239131B - 基于元学习的少样本知识图谱补全方法 - Google Patents

基于元学习的少样本知识图谱补全方法 Download PDF

Info

Publication number
CN113239131B
CN113239131B CN202110680623.8A CN202110680623A CN113239131B CN 113239131 B CN113239131 B CN 113239131B CN 202110680623 A CN202110680623 A CN 202110680623A CN 113239131 B CN113239131 B CN 113239131B
Authority
CN
China
Prior art keywords
meta
task
knowledge graph
training
qry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110680623.8A
Other languages
English (en)
Other versions
CN113239131A (zh
Inventor
向行
陈毅波
蒋志怡
黄鑫
蒋破荒
田建伟
朱宏宇
祝视
吕欣琪
高建良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Hunan Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Hunan Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Hunan Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Hunan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Hunan Electric Power Co Ltd, Information and Telecommunication Branch of State Grid Hunan Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202110680623.8A priority Critical patent/CN113239131B/zh
Publication of CN113239131A publication Critical patent/CN113239131A/zh
Application granted granted Critical
Publication of CN113239131B publication Critical patent/CN113239131B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于元学习的少样本知识图谱补全方法,包括获取待补全的知识图谱和对应的邻域知识图谱;对待补全的知识图谱中的实体嵌入进行初始化;将待补全的知识图谱的关系集合分为训练关系集合和测试关系集合,并选取一个关系所对应的三元组构建元训练任务或元测试任务;在若干个批次的元训练任务上训练得到少样本知识图谱补全模型;采用训练好的少样本知识图谱补全模型对元测试任务进行补全。本发明方法能够根据少量三元组就进行知识图谱补全,解决传统的基于嵌入的方法对知识图谱中的少样本关系的补全效果不好的问题,而且对邻域知识图谱的依赖性较低,鲁棒性更好,可靠性更高,效果更好。

Description

基于元学习的少样本知识图谱补全方法
技术领域
本发明属于机器学习领域,具体涉及一种基于元学习的少样本知识图谱补全方法。
背景技术
知识图谱是一种包含多种类型关系和实体的多源数据。知识图谱广泛应用于问答系统、搜索引擎、推荐系统等领域。知识图谱由大量的三元组构成,每个三元组都由头实体,关系和尾实体组成,代表现实世界中的知识。
虽然知识图谱中有大量的实体、关系和三元组,但是知识图谱普遍存在不完整的问题,因此需要补全。通过捕捉知识图谱中不同类型的关系和实体之间的联系,并汇聚多源数据中的特征,从而自动补全知识图谱,是知识图谱补全的关键问题。
知识图谱嵌入方法被广泛研究,并用于知识图谱补全。这类方法通过将知识图谱中的实体和关系映射到低维向量空间来解决这个问题。但是,这类方法依赖大量的训练三元组,然而知识图谱中很大一部分关系是仅已知少量三元组的长尾关系。因此,嵌入方法对长尾关系的效果不好,从而严重影响了知识图谱补全的效果。
发明内容
本发明的目的在于提供一种能够根据少量三元组就进行知识图谱补全,而且可靠性高、效果好的基于元学习的少样本知识图谱补全方法。
本发明提供的这种基于元学习的少样本知识图谱补全方法,包括如下步骤:
S1.获取待补全的知识图谱和对应的邻域知识图谱;所述邻域知识图谱包括待补全的知识图谱中所有实体的邻域信息;
S2.采用步骤S1获取的邻域知识图谱,对待补全的知识图谱中的实体嵌入进行初始化;
S3.将待补全的知识图谱的关系集合分为训练关系集合和测试关系集合,并从训练关系集合或测试关系集合中选取一个关系所对应的三元组构建元训练任务或元测试任务;
S4.在若干个批次的元训练任务上训练得到少样本知识图谱补全模型;
S5.采用训练好的少样本知识图谱补全模型,对元测试任务进行补全。
步骤S2所述的采用步骤S1获取的邻域知识图谱,对待补全的知识图谱中的实体嵌入进行初始化,具体为采用嵌入方法,在步骤S1获取的邻域知识图谱上训练得到待补全的知识图谱的实体的嵌入表示;且若邻域知识图谱不存在,则随机初始化待补全的知识图谱的实体的嵌入表示。
步骤S3所述的将待补全的知识图谱的关系集合分为训练关系集合和测试关系集合,并从训练关系集合或测试关系集合中选取一个关系所对应的三元组构建元训练任务或元测试任务,具体包括如下步骤:
A.将待补全的知识图谱的关系集合R分为训练关系集合Rtrain和测试关系集合Rtest
B.从训练关系集合Rtrain或测试关系集合Rtest中选取一个关系r所对应的三元组构建元训练任务Ttrain或元测试任务Ttest;所述的元训练任务Ttrain和元测试任务Ttest均包括支持集Sr和查询集Qr
C.采用如下步骤得到元训练任务Ttrain的支持集Sr
从元训练任务Ttrain的任务关系r所对应的三元组中随机选取Ns个有效三元组,然后为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元训练任务Ttrain的支持集Sr;所述的尾实体候选项集合Ch,r为已知h和r的尾实体候选集合;h为一个有效三元组的头实体;
D.采用如下步骤得到元测试任务Ttest的支持集Sr
从元测试任务Ttest的任务关系r所对应的三元组中随机选取Ns个有效三元组,然后为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元训练任务Ttrain的支持集Sr;所述的尾实体候选项集合Ch,r为已知h和r的尾实体候选集合;h为一个有效三元组的头实体;
E.采用如下步骤得到元训练任务Ttrain的查询集Qr
从剩余的三元组中,随机选取Nq个有效三元组,并为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元训练任务Ttrain的查询集Qr
F.采用如下步骤得到元测试任务Ttest的查询集Qr
从剩余的三元组中,选取一个有效三元组(h,r,t)作为待补全三元组,并穷举对应的尾实体候选项集合Ch,r中的尾实体,并替换有效三元组(h,r,t)中的尾实体,从而构建|Ch,r|个候选三元组,最终得到元测试任务Ttest的查询集Qr;其中||为集合中的元素个数;
步骤S4所述的在若干个批次的元训练任务上训练得到少样本知识图谱补全模型,具体包括如下步骤:
a.将步骤S3构建的元训练任务分成L批次的元训练阶段;
b.对于第l批次的元训练阶段,采用未训练完成的少样本知识图谱补全模型对批次内的所有元训练任务进行学习,并对模型参数进行优化更新;
c.判断步骤b得到的模型是否收敛:
若模型收敛,则得到最终的少样本知识图谱补全模型;本步骤结束;
若模型不收敛,则进入步骤d;
d.判断元训练阶段的批次数l是否达到设定值L:
若批次数l达到设定值L,则令批次数l为1,并返回步骤b再次进行训练和优化;
若批次数l未达到设定值L,则令批次数l增加1,并返回步骤b再次进行训练和优化。
步骤b所述的对于第l批次的元训练阶段,采用未训练完成的少样本知识图谱补全模型对批次内的所有元训练任务进行学习,并对模型参数进行优化更新,具体包括如下步骤:
(1)基于TransE的翻译假设,利用支持集Sr中的有效三元组的头实体和尾实体,得到任务关系的弱表示r=t-h;同时,当Ns大于1时,对Ns个三元组的弱关系表示取平均值为
Figure BDA0003122373440000041
(2)将元学习任务中的每一个三元组的头尾实体对嵌入(h,t)与步骤(1)得到的关系弱表示进行组合,得到元学习任务中的每一个三元组的矩阵表示A=[h,r,t];
(3)将步骤(2)得到的元学习任务中所有三元组的矩阵表示A输入到卷积神经网络构成的少样本知识图谱补全模型中,得到三元组模式的向量表示;通过带有残差更新机制的模式学习器,从三元组的矩阵表示中提取模式的向量表示,以矩阵A为输入,对矩阵A进行复制,获得双通道输入;首先采用1×3卷积核对输入进行卷积,然后采用1×1卷积核对输出进行降维,最后输出1×d维的三元组模式向量P;当支持集中包括至少2个三元组时,对Ns为三元组的模型向量取平均值;同时,令模式学习器的参数为θ,Pi=fθ(Ai);式中fθ()为模式学习器的模式提取函数;Ai为第i个三元组对应的矩阵表示;
(4)使用包含有效性均衡机制的模式匹配器计算查询三元组的有效性分数,将查询集中的三元组的模式向量Pqry与支持集有效三元组的模式向量Ppos和无效三元组的模式向量Pneg输入模式匹配器,分别计算三元组模式与有效模式的欧式距离d(Ppos,Pqry)(即匹配度)和三元组模式与无效模式的欧氏距离d(Pneg,Pqry)(即匹配度),从而得到查询集三元组的有效性分数scoreqry为scoreqry=d(Ppos,Pqry)-d(Pneg,Pqry);式中d(Ppos,Pqry)=||Ppos-Pqry||2,d(Pneg,Pqry)=||Pneg-Pqry||2,|| ||2为二范数;
(5)对d(Ppos,Pqry)和d(Pneg,Pqry)采用softmax函数得到查询三元组为有效的概率ppos或为无效的概率pneg;然后采用下式计算损失并更新模式学习器的参数和实体的嵌入表示:
Figure BDA0003122373440000051
Figure BDA0003122373440000052
式中LQ(fθ)为模式学习器通过查询集计算得到的损失;fθ为模式学习器的模式提取函数;yi为第i个三元组的有效性标签;log()为取任意对数操作;θnew为更新后的模式学习器参数;θ为更新前的模式学习器参数;α为给定的任务学习率;
Figure BDA0003122373440000053
为θ对应的梯度。
步骤S5所述的采用训练好的少样本知识图谱补全模型,对元测试任务进行补全,具体包括如下步骤:
1)将元测试任务的支持集中的有效三元组和无效三元组输入到模式学习器中得到关系r的有效模式Ppos和无效模式Pneg
2)将元测试任务的查询集中的三元组输入到模式学习器中得到所有三元组的模式的向量表示;再利用模式匹配器计算查询集中的三元组的有效性分数;
3)利用包含有效性均衡机制的模式匹配器计算查询集三元组的模式Pqry与有效模式Ppos的匹配度d(Ppos,Pqry),以及查询集三元组的模式Pqry与无效模式Pneg的匹配度d(Pneg,Pqry),计算三元组的有效性分数scoreqry为scoreqry=d(Ppos,Pqry)-d(Pneg,Pqry);
4)基于查询集中所有三元组的有效性分数,对当前元测试任务中的关系r进行补全:选取分数最高的候选项作为补全的三元组。
本发明提供的这种基于元学习的少样本知识图谱补全方法,能够在每种关系仅有少量已知三元组的条件下预测未知的三元组,解决传统的基于嵌入的方法对知识图谱中的少样本关系的补全效果不好的问题;通过基于神经网络的模式学习器从三元组的嵌入矩阵中学习三元组元素的共现模式,并通过比较候选三元组与参考三元组的模式相似性计算候选三元组的有效性,因此本发明对邻域知识图谱的依赖性较低,鲁棒性更好;引入了残差更新机制和有效性平衡机制,使得模型在模型训练过程中不损失实体嵌入表示的初始信息,从而学习到质量更高的实体嵌入表示,而且使得模型充分考虑候选三元组和有效三元组与无效三元组的相似度,从而更准确地计算三元组的有效性分数;因此本发明方法能够根据少量三元组就进行知识图谱补全,而且可靠性高、效果好。
附图说明
图1为本发明方法的方法流程示意图。
具体实施方式
如图1所示为本发明方法的方法流程示意图:本发明提供的这种基于元学习的少样本知识图谱补全方法,包括如下步骤:
S1.获取待补全的知识图谱和对应的邻域知识图谱;所述邻域知识图谱包括待补全的知识图谱中所有实体的邻域信息;
S2.采用步骤S1获取的邻域知识图谱,对待补全的知识图谱中的实体嵌入进行初始化;具体为采用嵌入方法,在步骤S1获取的邻域知识图谱上训练得到待补全的知识图谱的实体的嵌入表示;且若邻域知识图谱不存在,则随机初始化待补全的知识图谱的实体的嵌入表示;
S3.将待补全的知识图谱的关系集合分为训练关系集合和测试关系集合,并从训练关系集合或测试关系集合中选取一个关系所对应的三元组构建元训练任务或元测试任务;具体包括如下步骤:
A.将待补全的知识图谱的关系集合R分为训练关系集合Rtrain和测试关系集合Rtest
B.从训练关系集合Rtrain或测试关系集合Rtest中选取一个关系r所对应的三元组构建元训练任务Ttrain或元测试任务Ttest;所述的元训练任务Ttrain和元测试任务Ttest均包括支持集Sr和查询集Qr
C.采用如下步骤得到元训练任务Ttrain的支持集Sr
从元训练任务Ttrain的任务关系r所对应的三元组中随机选取Ns个有效三元组,然后为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元训练任务Ttrain的支持集Sr;所述的尾实体候选项集合Ch,r为已知h和r的尾实体候选集合;h为一个有效三元组的头实体;
D.采用如下步骤得到元测试任务Ttest的支持集Sr
从元测试任务Ttest的任务关系r所对应的三元组中随机选取Ns个有效三元组,然后为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元训练任务Ttrain的支持集Sr;所述的尾实体候选项集合Ch,r为已知h和r的尾实体候选集合;h为一个有效三元组的头实体;
E.采用如下步骤得到元训练任务Ttrain的查询集Qr
从剩余的三元组中,随机选取Nq个有效三元组,并为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元训练任务Ttrain的查询集Qr
F.采用如下步骤得到元测试任务Ttest的查询集Qr
从剩余的三元组中,选取一个有效三元组(h,r,t)作为待补全三元组,并穷举对应的尾实体候选项集合Ch,r中的尾实体,并替换有效三元组(h,r,t)中的尾实体,从而构建|Ch,r|个候选三元组,最终得到元测试任务Ttest的查询集Qr;其中| |为集合中的元素个数;
S4.在若干个批次的元训练任务上训练得到少样本知识图谱补全模型;具体包括如下步骤:
a.将步骤S3构建的元训练任务分成L批次的元训练阶段;
b.对于第l批次的元训练阶段,采用未训练完成的少样本知识图谱补全模型对批次内的所有元训练任务进行学习,并对模型参数进行优化更新;具体包括如下步骤:
(1)基于TransE的翻译假设,利用支持集Sr中的有效三元组的头实体和尾实体,得到任务关系的弱表示r=t-h;同时,当Ns大于1时,对Ns个三元组的弱关系表示取平均值为
Figure BDA0003122373440000091
(2)将元学习任务中的每一个三元组的头尾实体对嵌入(h,t)与步骤(1)得到的关系弱表示进行组合,得到元学习任务中的每一个三元组的矩阵表示A=[h,r,t];
(3)将步骤(2)得到的元学习任务中所有三元组的矩阵表示A输入到卷积神经网络构成的少样本知识图谱补全模型中,得到三元组模式的向量表示;通过带有残差更新机制的模式学习器,从三元组的矩阵表示中提取模式的向量表示,以矩阵A为输入,对矩阵A进行复制,获得双通道输入;首先采用1×3卷积核对输入进行卷积,然后采用1×1卷积核对输出进行降维,最后输出1×d维的三元组模式向量P;当支持集中包括至少2个三元组时,对Ns为三元组的模型向量取平均值;同时,令模式学习器的参数为θ,Pi=fθ(Ai);式中fθ()为模式学习器的模式提取函数;Ai为第i个三元组对应的矩阵表示;
(4)使用包含有效性均衡机制的模式匹配器计算查询三元组的有效性分数,将查询集中的三元组的模式向量Pqry与支持集有效三元组的模式向量Ppos和无效三元组的模式向量Pneg输入模式匹配器,分别计算三元组模式与有效模式的欧式距离即匹配度d(Ppos,Pqry)和三元组模式与无效模式的欧氏距离即匹配度d(Pneg,Pqry),从而得到查询集三元组的有效性分数scoreqry为scoreqry=d(Ppos,Pqry)-d(Pneg,Pqry);式中d(Ppos,Pqry)=||Ppos-Pqry||2,d(Pneg,Pqry)=||Pneg-Pqry||2,|| ||2为二范数;
(5)对d(Ppos,Pqry)和d(Pneg,Pqry)采用softmax函数得到查询三元组为有效的概率ppos或为无效的概率pneg;然后采用下式计算损失并更新模式学习器的参数和实体的嵌入表示:
Figure BDA0003122373440000101
Figure BDA0003122373440000102
式中LQ(fθ)为模式学习器通过查询集计算得到的损失;fθ为模式学习器的模式提取函数;yi为第i个三元组的有效性标签;log()为取任意对数操作;θnew为更新后的模式学习器参数;θ为更新前的模式学习器参数;α为给定的任务学习率;
Figure BDA0003122373440000103
为θ对应的梯度。
c.判断步骤b得到的模型是否收敛:
若模型收敛,则得到最终的少样本知识图谱补全模型;本步骤结束;
若模型不收敛,则进入步骤d;
d.判断元训练阶段的批次数l是否达到设定值L:
若批次数l达到设定值L,则令批次数l为1,并返回步骤b再次进行训练和优化;
若批次数l未达到设定值L,则令批次数l增加1,并返回步骤b再次进行训练和优化;
S5.采用训练好的少样本知识图谱补全模型,对元测试任务进行补全;具体包括如下步骤:
1)将元测试任务的支持集中的有效三元组和无效三元组输入到模式学习器中得到关系r的有效模式Ppos和无效模式Pneg
2)将元测试任务的查询集中的三元组输入到模式学习器中得到所有三元组的模式的向量表示;再利用模式匹配器计算查询集中的三元组的有效性分数;
3)利用包含有效性均衡机制的模式匹配器计算查询集三元组的模式Pqry与有效模式Ppos的匹配度d(Ppos,Pqry),以及查询集三元组的模式Pqry与无效模式Pneg的匹配度d(Pneg,Pqry),计算三元组的有效性分数scoreqry为scoreqry=d(Ppos,Pqry)-d(Pneg,Pqry);
4)基于查询集中所有三元组的有效性分数,对当前元测试任务中的关系r进行补全:选取分数最高的候选项作为补全的三元组。

Claims (5)

1.一种基于元学习的少样本知识图谱补全方法,包括如下步骤:
S1.获取待补全的知识图谱和对应的邻域知识图谱;所述邻域知识图谱包括待补全的知识图谱中所有实体的邻域信息;
S2.采用步骤S1获取的邻域知识图谱,对待补全的知识图谱中的实体嵌入进行初始化;
S3.将待补全的知识图谱的关系集合分为训练关系集合和测试关系集合,并从训练关系集合或测试关系集合中选取一个关系所对应的三元组构建元训练任务或元测试任务;具体包括如下步骤:
A.将待补全的知识图谱的关系集合R分为训练关系集合Rtrain和测试关系集合Rtest
B.从训练关系集合Rtrain或测试关系集合Rtest中选取一个关系r所对应的三元组构建元训练任务Ttrain或元测试任务Ttest;所述的元训练任务Ttrain和元测试任务Ttest均包括支持集Sr和查询集Qr
C.采用如下步骤得到元训练任务Ttrain的支持集
Figure FDA0003552913940000011
从元训练任务Ttrain的任务关系r所对应的三元组中随机选取Ns个有效三元组,然后为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元训练任务Ttrain的支持集
Figure FDA0003552913940000012
所述的尾实体候选项集合Ch,r为已知h和r的尾实体候选集合;h为一个有效三元组的头实体;
D.采用如下步骤得到元测试任务Ttest的支持集
Figure FDA0003552913940000013
从元测试任务Ttest的任务关系r所对应的三元组中随机选取Ns个有效三元组,然后为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元测试任务Ttest的支持集
Figure FDA0003552913940000021
所述的尾实体候选项集合Ch,r为已知h和r的尾实体候选集合;h为一个有效三元组的头实体;
E.采用如下步骤得到元训练任务Ttrain的查询集
Figure FDA0003552913940000022
从剩余的三元组中,随机选取Nq个有效三元组,并为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元训练任务Ttrain的查询集
Figure FDA0003552913940000023
F.采用如下步骤得到元测试任务Ttest的查询集
Figure FDA0003552913940000024
从剩余的三元组中,选取一个有效三元组(h,r,t)作为待补全三元组,并穷举对应的尾实体候选项集合Ch,r中的尾实体,并替换有效三元组(h,r,t)中的尾实体,从而构建|Ch,r|个候选三元组,最终得到元测试任务Ttest的查询集
Figure FDA0003552913940000025
其中| |为集合中的元素个数;
S4.在若干个批次的元训练任务上训练得到少样本知识图谱补全模型;
S5.采用训练好的少样本知识图谱补全模型,对元测试任务进行补全。
2.根据权利要求1所述的基于元学习的少样本知识图谱补全方法,其特征在于步骤S2所述的采用步骤S1获取的邻域知识图谱,对待补全的知识图谱中的实体嵌入进行初始化,具体为采用嵌入方法,在步骤S1获取的邻域知识图谱上训练得到待补全的知识图谱的实体的嵌入表示;且若邻域知识图谱不存在,则随机初始化待补全的知识图谱的实体的嵌入表示。
3.根据权利要求2所述的基于元学习的少样本知识图谱补全方法,其特征在于步骤S4所述的在若干个批次的元训练任务上训练得到少样本知识图谱补全模型,具体包括如下步骤:
a.将步骤S3构建的元训练任务分成L批次的元训练阶段;
b.对于第l批次的元训练阶段,采用未训练完成的少样本知识图谱补全模型对批次内的所有元训练任务进行学习,并对模型参数进行优化更新;
c.判断步骤b得到的模型是否收敛:
若模型收敛,则得到最终的少样本知识图谱补全模型;本步骤结束;
若模型不收敛,则进入步骤d;
d.判断元训练阶段的批次数l是否达到设定值L:
若批次数l达到设定值L,则令批次数l为1,并返回步骤b再次进行训练和优化;
若批次数l未达到设定值L,则令批次数l增加1,并返回步骤b再次进行训练和优化。
4.根据权利要求3所述的基于元学习的少样本知识图谱补全方法,其特征在于步骤b所述的对于第l批次的元训练阶段,采用未训练完成的少样本知识图谱补全模型对批次内的所有元训练任务进行学习,并对模型参数进行优化更新,具体包括如下步骤:
(1)基于TransE的翻译假设,利用支持集Sr中的有效三元组的头实体和尾实体,得到任务关系的弱表示r=t-h;同时,当Ns大于1时,对Ns个三元组的弱关系表示取平均值为
Figure FDA0003552913940000031
(2)将元学习任务中的每一个三元组的头尾实体对嵌入(h,t)与步骤(1)得到的关系弱表示进行组合,得到元学习任务中的每一个三元组的矩阵表示A=[h,r,t];
(3)将步骤(2)得到的元学习任务中所有三元组的矩阵表示A输入到卷积神经网络构成的少样本知识图谱补全模型中,得到三元组模式的向量表示;通过带有残差更新机制的模式学习器,从三元组的矩阵表示中提取模式的向量表示,以矩阵A为输入,对矩阵A进行复制,获得双通道输入;首先采用1×3卷积核对输入进行卷积,然后采用1×1卷积核对输出进行降维,最后输出1×d维的三元组模式向量P;当支持集中包括至少2个三元组时,对Ns为三元组的模型向量取平均值;同时,令模式学习器的参数为θ,Pi=fθ(Ai);式中fθ()为模式学习器的模式提取函数;Ai为第i个三元组对应的矩阵表示;
(4)使用包含有效性均衡机制的模式匹配器计算查询三元组的有效性分数,将查询集中的三元组的模式向量Pqry与支持集有效三元组的模式向量Ppos和无效三元组的模式向量Pneg输入模式匹配器,分别计算三元组模式与有效模式的欧式距离d(Ppos,Pqry)和三元组模式与无效模式的欧氏距离d(Pneg,Pqry),从而得到查询集三元组的有效性分数scoreqry为scoreqry=d(Ppos,Pqry)-d(Pneg,Pqry);式中d(Ppos,Pqry)=||Ppos-Pqry||2,d(Pneg,Pqry)=||Pneg-Pqry||2,|| ||2为二范数;
(5)对d(Ppos,Pqry)和d(Pneg,Pqry)采用softmax函数得到查询三元组为有效的概率ppos或为无效的概率pneg;然后采用下式计算损失并更新模式学习器的参数和实体的嵌入表示:
Figure FDA0003552913940000041
Figure FDA0003552913940000042
式中LQ(fθ)为模式学习器通过查询集计算得到的损失;fθ为模式学习器的模式提取函数;yi为第i个三元组的有效性标签;log()为取任意对数操作;θnew为更新后的模式学习器参数;θ为更新前的模式学习器参数;α为给定的任务学习率;
Figure FDA0003552913940000043
为θ对应的梯度。
5.根据权利要求4所述的基于元学习的少样本知识图谱补全方法,其特征在于步骤S5所述的采用训练好的少样本知识图谱补全模型,对元测试任务进行补全,具体包括如下步骤:
1)将元测试任务的支持集中的有效三元组和无效三元组输入到模式学习器中得到关系r的有效模式Ppos和无效模式Pneg
2)将元测试任务的查询集中的三元组输入到模式学习器中得到所有三元组的模式的向量表示;再利用模式匹配器计算查询集中的三元组的有效性分数;
3)利用包含有效性均衡机制的模式匹配器计算查询集三元组的模式Pqry与有效模式Ppos的匹配度d(Ppos,Pqry),以及查询集三元组的模式Pqry与无效模式Pneg的匹配度d(Pneg,Pqry),计算三元组的有效性分数scoreqry为scoreqry=d(Ppos,Pqry)-d(Pneg,Pqry);
4)基于查询集中所有三元组的有效性分数,对当前元测试任务中的关系r进行补全:选取分数最高的候选项作为补全的三元组。
CN202110680623.8A 2021-06-18 2021-06-18 基于元学习的少样本知识图谱补全方法 Active CN113239131B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110680623.8A CN113239131B (zh) 2021-06-18 2021-06-18 基于元学习的少样本知识图谱补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110680623.8A CN113239131B (zh) 2021-06-18 2021-06-18 基于元学习的少样本知识图谱补全方法

Publications (2)

Publication Number Publication Date
CN113239131A CN113239131A (zh) 2021-08-10
CN113239131B true CN113239131B (zh) 2022-04-29

Family

ID=77140318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110680623.8A Active CN113239131B (zh) 2021-06-18 2021-06-18 基于元学习的少样本知识图谱补全方法

Country Status (1)

Country Link
CN (1) CN113239131B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114385831B (zh) * 2022-01-14 2024-06-18 重庆邮电大学 一种基于特征提取的知识图谱关系预测方法
CN114579769B (zh) * 2022-05-07 2022-09-06 中国科学技术大学 小样本知识图谱补全方法、系统、设备及存储介质
CN115712734B (zh) * 2022-11-21 2023-10-03 之江实验室 一种基于元学习的稀疏知识图谱嵌入方法和装置
CN116304083B (zh) * 2023-01-13 2023-09-15 北京控制工程研究所 性能-故障关系图谱的关系预测方法及装置
CN117273129B (zh) * 2023-10-11 2024-04-05 上海峻思寰宇数据科技有限公司 一种行为图谱创建生成方法及系统
CN117540799B (zh) * 2023-10-20 2024-04-09 上海歆广数据科技有限公司 一种个案图谱创建生成方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10083250B2 (en) * 2013-05-22 2018-09-25 International Business Machines Corporation Simplification of large networks and graphs
CN109992670B (zh) * 2019-04-04 2021-04-09 西安交通大学 一种基于知识图谱邻域结构的图谱完备化方法
CN111523669A (zh) * 2020-03-06 2020-08-11 国网浙江省电力有限公司电力科学研究院 一种基于知识图谱元信息的少次关系模型训练方法
CN111291139B (zh) * 2020-03-17 2023-08-22 中国科学院自动化研究所 基于注意力机制的知识图谱长尾关系补全方法
CN111260064A (zh) * 2020-04-15 2020-06-09 中国人民解放军国防科技大学 基于元知识的知识图谱的知识推理方法、系统以及介质

Also Published As

Publication number Publication date
CN113239131A (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
CN113239131B (zh) 基于元学习的少样本知识图谱补全方法
CN113378632A (zh) 一种基于伪标签优化的无监督域适应行人重识别算法
CN110766044B (zh) 一种基于高斯过程先验指导的神经网络训练方法
CN111079847B (zh) 一种基于深度学习的遥感影像自动标注方法
CN110619059B (zh) 一种基于迁移学习的建筑物标定方法
CN113326731A (zh) 一种基于动量网络指导的跨域行人重识别算法
CN110210625A (zh) 基于迁移学习的建模方法、装置、计算机设备和存储介质
Barman et al. Shape: A novel graph theoretic algorithm for making consensus-based decisions in person re-identification systems
CN112232395B (zh) 一种基于联合训练生成对抗网络的半监督图像分类方法
CN113628059A (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN115471700A (zh) 一种基于知识传输的图像分类模型训练方法及分类方法
CN112364747A (zh) 一种有限样本下的目标检测方法
CN117152459A (zh) 图像检测方法、装置、计算机可读介质及电子设备
CN116258938A (zh) 基于自主进化损失的图像检索与识别方法
CN116128944A (zh) 一种基于特征交互和可靠对应关系估计的三维点云配准方法
CN113705092B (zh) 基于机器学习的疾病预测方法及装置
CN115376159A (zh) 一种基于多模态信息的跨外观行人重识别方法
CN114267060A (zh) 基于不确定抑制网络模型的人脸年龄识别方法及系统
CN117333908A (zh) 基于姿态特征对齐的跨模态行人重识别方法
CN117173702A (zh) 基于深度特征图融合的多视图多标记学习方法
CN112465016A (zh) 基于最优劣距的部分多标记学习方法
Bai et al. A unified deep learning model for protein structure prediction
CN113469270B (zh) 基于分解多目标差分进化超像素的半监督直觉聚类方法
CN115169436A (zh) 一种基于模糊局部判别分析的数据降维方法
CN113963235A (zh) 一种跨类别图像识别模型重用方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant