CN112364108A - 一种基于时空架构的时序知识图谱补全方法 - Google Patents

一种基于时空架构的时序知识图谱补全方法 Download PDF

Info

Publication number
CN112364108A
CN112364108A CN202011265517.5A CN202011265517A CN112364108A CN 112364108 A CN112364108 A CN 112364108A CN 202011265517 A CN202011265517 A CN 202011265517A CN 112364108 A CN112364108 A CN 112364108A
Authority
CN
China
Prior art keywords
entity
knowledge
embedded representation
feature
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011265517.5A
Other languages
English (en)
Other versions
CN112364108B (zh
Inventor
邵杰
张嘉昇
梁爽
邓智毅
申恒涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Artificial Intelligence Research Institute Yibin
Original Assignee
Sichuan Artificial Intelligence Research Institute Yibin
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Artificial Intelligence Research Institute Yibin filed Critical Sichuan Artificial Intelligence Research Institute Yibin
Priority to CN202011265517.5A priority Critical patent/CN112364108B/zh
Publication of CN112364108A publication Critical patent/CN112364108A/zh
Application granted granted Critical
Publication of CN112364108B publication Critical patent/CN112364108B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于时空架构的时序知识图谱补全方法,其特征在于,包括以下步骤:将待补全时序知识图谱按照其知识的时间标注划分为若干静态的知识集合,并通过每个集合中的知识分别构建若干知识网络,得到若干快照;构建多面图注意力网络,并将快照输入多面图注意力网络,获取实体在每个快照下的静态嵌入表示;构建自适应时序注意力机制,根据实体的静态嵌入表示并使用自适应时序注意力机制获取实体的最终嵌入表示;通过实体的最终嵌入表示计算待补全时序知识图谱中知识的置信度,并通过置信度预测待补全时序知识图谱中的缺失内容。本发明具有更高的扩展性与灵活性,能够与任意静态的补全方法相结合来进行时序知识图谱的补全任务。

Description

一种基于时空架构的时序知识图谱补全方法
技术领域
本发明属于知识图谱技术领域,具体涉及一种基于时空架构的时序知识图谱补全方法。
背景技术
时序知识图谱作为一种动态知识库系统,由于其在诸多现实领域具有良好的应用价值与可观的应用前景而在近年来备受关注。然而,由于抽取手段的限制与数据来源的复杂性,现有的大规模时序知识图谱依然面临着严重的不完整问题,其中的大量知识是缺失的。因此,旨在预测时序知识图谱中缺失知识的时序知识图谱补全任务成为了该领域近年来重要的研究课题。
静态知识图谱嵌入表示技术旨在将知识图谱中的元素映射到低维向量空间,由于其在静态知识图谱补全任务中的高效性而得到了广泛的关注。受到这类方法的启发,近年来一些工作尝试通过时序知识图谱嵌入表示技术来解决时序知识图谱的补全问题,主要包括四类,其中基于时序关系依赖的方法旨在利用关系之间的客观发生顺序(如对于一个人而言,“生于”应当发生于“死于”之前)来提高知识补全的准确性;基于时间超平面的方法通过将不同时间下的知识映射到不同的超平面上来分别对每个时间的知识进行补全;基于历时实体嵌入的方法将实体的嵌入表示看作一个与时间相关的非线性函数,并根据该嵌入表示衡量知识的置信度;基于张量分解的方法则利用邻接矩阵的低秩分解来预测时序知识图谱中的缺失知识。
尽管现有工作已经在时序知识图谱补全任务上取得了不错的成绩,然而现有工作有两个明显的不足:(1)首先,现有工作都将时序知识图谱当作一组独立的知识,进而独立地处理每个知识并分别为每个知识中的元素学习相应的嵌入表示。这种方式导致无法捕获时序知识图谱中丰富的图结构信息。时序知识图谱作为一种动态的异构网络,其固有的图结构信息能够反映不同的实体之间的复杂关系,从而体现出不同知识之间的内在相关性。(2)其次,现有工作大都独立地处理不同时刻的知识,这导致现有工作无法捕获不同时间的知识之间的相关性。事实上不同时间的知识之间具有密切的因果联系,忽略知识之间的时序相关性导致这些模型无法有效利用过去的相关知识并为当前的缺失知识做出准确的预测。因此,现有的基于表示学习的时序知识图谱补全方法的表现还远远不能令人满意。
发明内容
为了解决现有技术中的上述不足,不同于以往的方法单独地处理每个知识,本发明从时空数据建模的视角来学习时序知识图谱的嵌入表示并用于其补全任务。具体而言,本发明的创新点在于:首先,基于每个实体的自中心结构设计了一种全新的多面图注意力网络(Multi-Faceted Graph Attention Network),相比于传统的图神经网络,它能够更为有效地捕获实体在每个快照中的结构信息。其次,我们提出了一种新的自适应时序注意力机制(Adaptive Temporal Attention Mechanism),它能够灵活高效地建模实体嵌入表示在时间维度上的相关性。最后,我们的发明具有高度的灵活性与可扩展性,能够与任意的静态方法结合用于时序知识图谱的补全任务。综上,我们所提供的基于时空架构的时序知识图谱补全方法可以有效解决现有技术中存在的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于时空架构的时序知识图谱补全方法,包括以下步骤:
S1、将待补全时序知识图谱按照其知识的时间标注划分为若干静态的知识集合{G1,G2,...,G|τ|},并通过每个集合中的知识分别构建若干知识网络,得到若干快照,|τ|表示时间标注个数;
S2、构建多面图注意力网络,并将快照输入多面图注意力网络,获取实体在每个快照下的静态嵌入表示
Figure BDA0002775970850000031
S3、构建自适应时序注意力机制,根据实体的静态嵌入表示并使用自适应时序注意力机制获取实体的最终嵌入表示
Figure BDA0002775970850000032
S4、通过实体的最终嵌入表示计算待补全时序知识图谱中知识的置信度,并通过置信度预测待补全时序知识图谱中的缺失内容,完成时序知识图谱补全。
进一步地,所述步骤S2中多面图注意力网络包括依次连接的输入层和判断单元,所述判断单元分别与三元特征计算单元、组特征计算单元、路径特征计算单元和第二全连接单元连接,所述三元特征计算单元、组特征计算单元和路径特征计算单元分别与第一注意力聚合单元、第二注意力聚合单元和第三注意力聚合单元一一对应连接,所述第一注意力聚合单元、第二注意力聚合单元和第三注意力聚合单元均依次通过特征联合单元和第一全连接单元与输出层连接,所述第二全连接层计算单元与输出层连接;
所述判断单元用于判断快照是否存在与其相关的知识;所述三元特征计算单元、组特征计算单元和路径特征计算单元分别用于计算三元特征、组特征和路径特征;所述第一注意力聚合单元、第二注意力聚合单元和第三注意力聚合单元均用于聚合特征;所述特征联合单元用于联合特征;所述第一全连接单元和第二全连接单元均用于计算实体的嵌入表示以及将实体的关系映射至与实体嵌入表示相同的向量空间中;所述输出层用于输出嵌入表示结果。
进一步地,所述步骤S2中获取实体在每个快照下的静态嵌入表示的具体方法为:
S2.1、将快照Gt输入多面图注意力网络,t=1,2,...,|τ|;
S2.2、判断快照Gt中是否存在描述实体e的知识,若是,则进入步骤S2.3,否则直接计算快照Gt下实体e的嵌入表示,并进入步骤S2.6;
S2.3、基于实体e的自中心网络获取快照Gt中实体e的三元特征、组特征和路径特征,并计算每种特征对实体e的重要性指标;
S2.4、根据三元特征、组特征、路径特征以及每种特征的重要性指标,通过加权平均的方式聚合每种特征,得到最终特征向量;
S2.5、将三种最终特征向量联合,并将联合向量通过一个全连接层处理,获取实体e在快照Gt中的静态嵌入表示;
S2.6、将实体e的关系映射至与其嵌入表示相同的向量空间中,完成嵌入表示计算流程。
进一步地,所述步骤S2.3中快照Gt的三元特征
Figure BDA0002775970850000041
组特征
Figure BDA0002775970850000042
和路径特征
Figure BDA0002775970850000043
具体为:
Figure BDA0002775970850000044
其中,ri表示实体e与其邻居实体ei的关系ri的初始嵌入表示,ei表示实体e的邻居实体ei的初始嵌入表示,⊙表示循环乘积操作,MAXPOOL()表示最大池化操作,e1,e2,...,ek均表示实体的初始嵌入表示,k表示实体e所在组包含的实体个数,i=1,2,...,|Nt(e)|,|Nt(e)|表示实体e在快照中的邻居总数,j=1,2,...,|gt(e)|,|gt(e)|表示快照Gt中的自中心网络所包含的组的总个数;Wo表示第一映射矩阵,[:]表示向量拼接操作,r1i和r2i表示快照Gt中实体e与其邻居实体ei之间路径所涉及的两个关系r1i和r2i的初始嵌入表示;
所述步骤S2.3中每种特征对实体e的重要性指标
Figure BDA0002775970850000045
为:
Figure BDA0002775970850000051
其中,d表示三元特征、组特征或路径特征,m=1,2,...,Nd,n=1,2,...,Nd,Nd表示对应的特征组中特征的个数,eT表示实体e的初始嵌入表示e的转置,U表示第二映射矩阵,其用于计算两个向量之间的相关性;exp表示指数函数;
所述步骤S2.5中最终特征向量为:
Figure BDA0002775970850000052
所述实体e在快照Gt存在相关知识时,实体e的嵌入表示
Figure BDA0002775970850000053
为:
Figure BDA0002775970850000054
所述实体e在快照Gt不存在相关知识时,实体e的嵌入表示
Figure BDA0002775970850000055
为:
Figure BDA0002775970850000056
其中,W表示第一全连接单元中的映射矩阵,Went表示第二全连接单元中的映射矩阵,b表示第一全连接单元中的偏置向量,bent表示第二全连接单元中的偏置向量,
Figure BDA0002775970850000057
Figure BDA0002775970850000058
分别表示三元特征、组特征或路径特征的最终特征向量,σ表示激活函数;
所述步骤S2.6中将实体e的关系映射至与其嵌入表示相同的向量空间中的函数为:
Z=Wrel·R
其中,Z表示映射后的关系嵌入矩阵,R表示关系的初始嵌入矩阵,Wrel表示第三映射矩阵。
进一步地,所述步骤S3中根据实体的嵌入表示并使用自适应时序注意力机制获取实体的最终嵌入表示
Figure BDA0002775970850000059
的具体方法为:
S3.1、通过自适应遮罩函数获取t时刻的实体嵌入表示
Figure BDA00027759708500000510
对于之前每个时间tx的注意力遮罩;
S3.2、根据注意力遮罩,获取实体e在t时刻和tx时刻的嵌入式表示的相关性;
S3.3、根据步骤S3.2获取的相关性,获取实体e在t时刻的最终嵌入表示
Figure BDA0002775970850000061
所述t时刻和tx时刻均为待补全时序知识图谱中知识的时间标注。
进一步地,所述步骤S3.1中注意力遮罩函数me(t,tx)为
Figure BDA0002775970850000062
所述
Figure BDA0002775970850000063
表示自适应衰减系数,其具体为:
Figure BDA0002775970850000064
其中,λ表示基础衰减系数,
Figure BDA0002775970850000065
表示实体e在快照
Figure BDA0002775970850000066
中的邻居个数;
所述步骤S3.2中相关性
Figure BDA0002775970850000067
具体为:
Figure BDA0002775970850000068
其中,tx=1,2,...,|τ|,
Figure BDA0002775970850000069
Figure BDA00027759708500000610
分别表示tx和tk时刻的实体e的嵌入表示,W1表示第四映射矩阵,W2表示第五映射矩阵,αT表示注意力向量,T表示转置,σ表示激活函数;
所述步骤S3.3中最终嵌入表示
Figure BDA00027759708500000611
为:
Figure BDA00027759708500000612
进一步地,所述步骤S4包括以下步骤:
S4.1、将所有实体组成实体集,并将知识中缺失实体的位置换成逐一替换为实体集中的实体,得到若干候选知识;
S4.2、计算每个候选知识的置信度,并将置信度按从小到大的顺序排列,选取置信度最大的候选知识作为补全后的知识,完成时序知识图谱补全。
进一步地,所述步骤S4.2中置信度f为:
Figure BDA0002775970850000071
其中,zr表示关系r的嵌入表示,
Figure BDA0002775970850000072
表示实体e的最终嵌入表示,
Figure BDA0002775970850000073
表示实体o的最终嵌入表示,e和o均表示实体,r表示实体e和o的关系,t表示时间,||||2表示求取二范数。
本发明的有益效果为:
(1)本发明基于节点的自中心结构设计了一个多面图注意力网络,基于该网络,能够有效地捕获时序知识图谱的结构信息并发掘知识之间的内在联系,从而有利于得到更为准确的缺失知识预测结果。
(2)本发明基于自适应时序注意力机制有效地建模知识在时间维度上的相关性,从而能够利用过去的相关知识为当前的缺失知识提供更为准确的预测。
(3)本发明具有更高的扩展性与灵活性,能够与任意静态的补全方法相结合来进行时序知识图谱的补全任务。
附图说明
图1为本发明提出的一种基于时空架构的时序知识图谱补全方法流程图。
图2为本发明中多面图注意力网络示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
下面结合附图详细说明本发明的实施例。
在本实施例中,以电影时序知识图谱为例,进行电影时序知识图谱补全。
如图1所示,一种基于时空架构的时序知识图谱补全方法,包括以下步骤:
S1、将待补全电影时序知识图谱按照其知识的时间标注划分为若干静态的电影知识集合{G1,G2,...,G|τ|},并通过每个集合中的知识分别构建若干电影知识网络,得到若干快照,|τ|表示时间标注个数;
S2、构建多面图注意力网络(Multi-Faceted Graph Attention Network),并将快照输入多面图注意力网络,获取实体在每个快照下的静态嵌入表示
Figure BDA0002775970850000081
S3、构建自适应时序注意力机制(Adaptive Temporal Attention Mechanism),根据实体的静态嵌入表示并使用自适应时序注意力机制获取实体的最终嵌入表示
Figure BDA0002775970850000082
S4、通过实体的最终嵌入表示计算待补全电影时序知识图谱中知识的置信度,并通过置信度预测待补全电影时序知识图谱中的缺失内容,完成时序知识图谱补全。
如图2所示,所述步骤S2中多面图注意力网络包括依次连接的输入层和判断单元,所述判断单元分别与三元特征计算单元、组特征计算单元、路径特征计算单元和第二全连接单元连接,所述三元特征计算单元、组特征计算单元和路径特征计算单元分别与第一注意力聚合单元、第二注意力聚合单元和第三注意力聚合单元一一对应连接,所述第一注意力聚合单元、第二注意力聚合单元和第三注意力聚合单元均依次通过特征联合单元和第一全连接单元与输出层连接,所述第二全连接层计算单元与输出层连接;
所述判断单元用于判断快照是否存在与其相关的知识;所述三元特征计算单元、组特征计算单元和路径特征计算单元分别用于计算三元特征、组特征和路径特征;所述第一注意力聚合单元、第二注意力聚合单元和第三注意力聚合单元均用于聚合特征;所述特征联合单元用于联合特征;所述第一全连接单元和第二全连接单元均用于计算实体的嵌入表示以及将实体的关系映射至与实体嵌入表示相同的向量空间中;所述输出层用于输出嵌入表示结果。
在本实施例中,第一全连接单元和第二全连接单元均为全连接层。
所述步骤S2中获取实体在每个快照下的静态嵌入表示的具体方法为:
S2.1、将快照Gt输入多面图注意力网络,t=1,2,...,|τ|;
S2.2、判断快照Gt中是否存在描述实体e的知识,若是,则进入步骤S2.3,否则直接计算快照Gt下实体e的嵌入表示,并进入步骤S2.6;
S2.3、基于实体e的自中心网络获取快照Gt中实体e的三元特征、组特征和路径特征,并计算每种特征对实体e的重要性指标;
S2.4、根据三元特征、组特征、路径特征以及每种特征的重要性指标,通过加权平均的方式聚合每种特征,得到最终特征向量;
S2.5、将三种最终特征向量联合,并将联合向量通过一个全连接层处理,获取实体e在快照Gt中的静态嵌入表示;
S2.6、将实体e的关系映射至与其嵌入表示相同的向量空间中,完成嵌入表示计算流程。
所述步骤S2.3中快照Gt的三元特征
Figure BDA0002775970850000091
组特征
Figure BDA0002775970850000092
和路径特征
Figure BDA0002775970850000093
具体为:
Figure BDA0002775970850000101
其中,ri表示实体e与其邻居实体ei的关系ri的初始嵌入表示,ei表示实体e的邻居实体ei的初始嵌入表示,⊙表示循环乘积操作,MAXPOOL()表示最大池化操作,e1,e2,...,ek均表示实体的初始嵌入表示,k表示实体e所在组包含的实体个数,i=1,2,...,|Nt(e)|,|Nt(e)|表示实体e在快照中的邻居总数,j=1,2,...,|gt(e)|,|gt(e)|表示快照Gt中的自中心网络所包含的组的总个数;Wo表示第一映射矩阵,[:]表示向量拼接操作,r1i和r2i表示快照Gt中实体e与其邻居实体ei之间路径所涉及的两个关系r1i和r2i的初始嵌入表示。
对于每一个邻居实体ei我们的模型随机选取一条长度为2的由实体e到该实体ei的路径(e,r1i,r2i,ei)。
所述步骤S2.3中每种特征对实体e的重要性指标
Figure BDA0002775970850000102
为:
Figure BDA0002775970850000103
其中,d表示三元特征、组特征或路径特征,m=1,2,...,Nd,n=1,2,...,Nd,Nd表示对应的特征组中特征的个数,eT表示实体e的初始嵌入表示e的转置,U表示第二映射矩阵,其用于计算两个向量之间的相关性;exp表示指数函数;
所述步骤S2.5中最终特征向量为:
Figure BDA0002775970850000104
所述实体e在快照Gt存在相关知识时,实体e的嵌入表示
Figure BDA0002775970850000105
为:
Figure BDA0002775970850000106
所述实体e在快照Gt不存在相关知识时,实体e的嵌入表示
Figure BDA0002775970850000107
为:
Figure BDA0002775970850000111
其中,W表示第一全连接单元中的映射矩阵,Went表示第二全连接单元中的映射矩阵,b表示第一全连接单元中的偏置向量,bent表示第二全连接单元中的偏置向量,
Figure BDA0002775970850000112
Figure BDA0002775970850000113
分别表示三元特征、组特征或路径特征的最终特征向量,σ表示激活函数;
所述步骤S2.6中将实体e的关系映射至与其嵌入表示相同的向量空间中的函数为:
Z=Wrel·R
其中,Z表示映射后的关系嵌入矩阵,R表示关系的初始嵌入矩阵,Wrel表示第三映射矩阵。
所述步骤S3中根据实体的嵌入表示并使用自适应时序注意力机制获取实体的最终嵌入表示
Figure BDA0002775970850000114
的具体方法为:
S3.1、通过自适应遮罩函数获取t时刻的实体嵌入表示
Figure BDA0002775970850000115
对于之前每个时间tx的注意力遮罩;
S3.2、根据注意力遮罩,获取实体e在t时刻和tx时刻的嵌入式表示的相关性;
S3.3、根据步骤S3.2获取的相关性,获取实体e在t时刻的最终嵌入表示
Figure BDA0002775970850000116
所述t时刻和tx时刻均为待补全电影时序知识图谱中知识的时间标注。
所述步骤S3.1中注意力遮罩函数me(t,tx)为
Figure BDA0002775970850000117
所述
Figure BDA0002775970850000118
表示自适应衰减系数,其具体为:
Figure BDA0002775970850000121
其中,λ表示基础衰减系数,
Figure BDA0002775970850000122
表示实体e在快照
Figure BDA0002775970850000123
中的邻居个数;
所述步骤S3.2中相关性
Figure BDA0002775970850000124
具体为:
Figure BDA0002775970850000125
其中,tx=1,2,...,|τ|,
Figure BDA0002775970850000126
Figure BDA0002775970850000127
分别表示tx和tk时刻的实体e的嵌入表示,W1表示第四映射矩阵,W2表示第五映射矩阵,αT表示注意力向量,T表示转置,σ表示激活函数;
在本实施例中,激活函数为tanh()或relu()。
所述步骤S3.3中最终嵌入表示
Figure BDA0002775970850000128
为:
Figure BDA0002775970850000129
所述步骤S4包括以下步骤:
S4.1、将所有实体组成实体集,并将知识中缺失实体的位置换成逐一替换为实体集中的实体,得到若干候选知识;
S4.2、计算每个候选知识的置信度,并将置信度按从小到大的顺序排列,选取置信度最大的候选知识作为补全后的知识,完成电影时序知识图谱补全。
所述步骤S4.2中置信度f为:
Figure BDA00027759708500001210
其中,zr表示关系r的嵌入表示,
Figure BDA00027759708500001211
表示实体e的最终嵌入表示,
Figure BDA00027759708500001212
表示实体o的最终嵌入表示,e和o均表示实体,r表示实体e和o的关系,t表示时间,||||2表示求取二范数。
如表1所示,本发明在现实世界数据集ICEWS14上的补全任务效果优于现有的方法,表中所有指标均为越高越好。
表1:实验结果对比
方法 平均倒数排名 首位比例% 前十比例%
基于时序关系依赖的方法 0.263 10.1 66.2
基于时间超平面的方法 0.252 10.5 62.4
基于历时实体嵌入的方法 0.501 43.3 70.4
基于张量分解的方法 0.562 46.8 73.4
本发明 0.629 50.5 85.1
本发明的有益效果为:
(1)本发明基于节点的自中心结构设计了一个多面图注意力网络,基于该网络,能够有效地捕获时序知识图谱的结构信息并发掘知识之间的内在联系,从而有利于得到更为准确的缺失知识预测结果。
(2)本发明基于自适应时序注意力机制有效地建模知识在时间维度上的相关性,从而能够利用过去的相关知识为当前的缺失知识提供更为准确的预测。
(3)本发明具有更高的扩展性与灵活性,能够与任意静态的补全方法相结合来进行时序知识图谱的补全任务。

Claims (8)

1.一种基于时空架构的时序知识图谱补全方法,其特征在于,包括以下步骤:
S1、将待补全时序知识图谱按照其知识的时间标注划分为若干静态的知识集合{G1,G2,...,G|τ|},并通过每个集合中的知识分别构建若干知识网络,得到若干快照,|τ|表示时间标注个数;
S2、构建多面图注意力网络,并将快照输入多面图注意力网络,获取实体在每个快照下的静态嵌入表示
Figure FDA0002775970840000011
S3、构建自适应时序注意力机制,根据实体的静态嵌入表示并使用自适应时序注意力机制获取实体的最终嵌入表示
Figure FDA0002775970840000012
S4、通过实体的最终嵌入表示计算待补全时序知识图谱中知识的置信度,并通过置信度预测待补全时序知识图谱中的缺失内容,完成时序知识图谱补全。
2.根据权利要求1所述的基于时空架构的时序知识图谱补全方法,其特征在于,所述步骤S2中多面图注意力网络包括依次连接的输入层和判断单元,所述判断单元分别与三元特征计算单元、组特征计算单元、路径特征计算单元和第二全连接单元连接,所述三元特征计算单元、组特征计算单元和路径特征计算单元分别与第一注意力聚合单元、第二注意力聚合单元和第三注意力聚合单元一一对应连接,所述第一注意力聚合单元、第二注意力聚合单元和第三注意力聚合单元均依次通过特征联合单元和第一全连接单元与输出层连接,所述第二全连接层计算单元与输出层连接;
所述判断单元用于判断快照是否存在与其相关的知识;所述三元特征计算单元、组特征计算单元和路径特征计算单元分别用于计算三元特征、组特征和路径特征;所述第一注意力聚合单元、第二注意力聚合单元和第三注意力聚合单元均用于聚合特征;所述特征联合单元用于联合特征;所述第一全连接单元和第二全连接单元均用于计算实体的嵌入表示以及将实体的关系映射至与实体嵌入表示相同的向量空间中;所述输出层用于输出嵌入表示结果。
3.根据权利要求2所述的基于时空架构的时序知识图谱补全方法,其特征在于,所述步骤S2中获取实体在每个快照下的静态嵌入表示的具体方法为:
S2.1、将快照Gt输入多面图注意力网络,t=1,2,...,|τ|;
S2.2、判断快照Gt中是否存在描述实体e的知识,若是,则进入步骤S2.3,否则直接计算快照Gt下实体e的嵌入表示,并进入步骤S2.6;
S2.3、基于实体e的自中心网络获取快照Gt中实体e的三元特征、组特征和路径特征,并计算每种特征对实体e的重要性指标;
S2.4、根据三元特征、组特征、路径特征以及每种特征的重要性指标,通过加权平均的方式聚合每种特征,得到最终特征向量;
S2.5、将三种最终特征向量联合,并将联合向量通过一个全连接层处理,获取实体e在快照Gt中的静态嵌入表示;
S2.6、将实体e的关系映射至与其嵌入表示相同的向量空间中,完成嵌入表示计算流程。
4.根据权利要求3所述的基于时空架构的时序知识图谱补全方法,其特征在于,所述步骤S2.3中快照Gt的三元特征
Figure FDA0002775970840000021
组特征
Figure FDA0002775970840000022
和路径特征
Figure FDA0002775970840000023
具体为:
Figure FDA0002775970840000024
其中,ri表示实体e与其邻居实体ei的关系ri的初始嵌入表示,ei表示实体e的邻居实体ei的初始嵌入表示,⊙表示循环乘积操作,MAXPOOL()表示最大池化操作,e1,e2,...,ek均表示实体的初始嵌入表示,k表示实体e所在组包含的实体个数,i=1,2,...,|Nt(e)|,|Nt(e)|表示实体e在快照中的邻居总数,j=1,2,...,|gt(e)|,|gt(e)|表示快照Gt中的自中心网络所包含的组的总个数;Wo表示第一映射矩阵,[:]表示向量拼接操作,r1i和r2i表示快照Gt中实体e与其邻居实体ei之间路径所涉及的两个关系r1i和r2i的初始嵌入表示;
所述步骤S2.3中每种特征对实体e的重要性指标
Figure FDA0002775970840000031
为:
Figure FDA0002775970840000032
其中,d表示三元特征、组特征或路径特征,m=1,2,...,Nd,n=1,2,...,Nd,Nd表示对应的特征组中特征的个数,eT表示实体e的初始嵌入表示e的转置,U表示第二映射矩阵,其用于计算两个向量之间的相关性;exp表示指数函数;
所述步骤S2.5中最终特征向量为:
Figure FDA0002775970840000033
所述实体e在快照Gt存在相关知识时,实体e的嵌入表示
Figure FDA0002775970840000034
为:
Figure FDA0002775970840000035
所述实体e在快照Gt不存在相关知识时,实体e的嵌入表示
Figure FDA0002775970840000036
为:
Figure FDA0002775970840000037
其中,W表示第一全连接单元中的映射矩阵,Went表示第二全连接单元中的映射矩阵,b表示第一全连接单元中的偏置向量,bent表示第二全连接单元中的偏置向量,
Figure FDA0002775970840000038
Figure FDA0002775970840000039
分别表示三元特征、组特征或路径特征的最终特征向量,σ表示激活函数;
所述步骤S2.6中将实体e的关系映射至与其嵌入表示相同的向量空间中的函数为:
Z=Wrel·R
其中,Z表示映射后的关系嵌入矩阵,R表示关系的初始嵌入矩阵,Wrel表示第三映射矩阵。
5.根据权利要求4所述的基于时空架构的时序知识图谱补全方法,其特征在于,所述步骤S3中根据实体的嵌入表示并使用自适应时序注意力机制获取实体的最终嵌入表示
Figure FDA0002775970840000041
的具体方法为:
S3.1、通过自适应遮罩函数获取t时刻的实体嵌入表示
Figure FDA0002775970840000042
对于之前每个时间tx的注意力遮罩;
S3.2、根据注意力遮罩,获取实体e在t时刻和tx时刻的嵌入式表示的相关性;
S3.3、根据步骤S3.2获取的相关性,获取实体e在t时刻的最终嵌入表示
Figure FDA0002775970840000043
所述t时刻和tx时刻均为待补全时序知识图谱中知识的时间标注。
6.根据权利要求5所述的基于时空架构的时序知识图谱补全方法,其特征在于,所述步骤S3.1中注意力遮罩函数me(t,tx)为
Figure FDA0002775970840000044
所述
Figure FDA0002775970840000045
表示自适应衰减系数,其具体为:
Figure FDA0002775970840000046
其中,λ表示基础衰减系数,
Figure FDA0002775970840000047
表示实体e在快照
Figure FDA0002775970840000048
中的邻居个数;
所述步骤S3.2中相关性
Figure FDA0002775970840000049
具体为:
Figure FDA00027759708400000410
其中,tx=1,2,...,|τ|,
Figure FDA00027759708400000411
Figure FDA00027759708400000412
分别表示tx和tk时刻的实体e的嵌入表示,W1表示第四映射矩阵,W2表示第五映射矩阵,αT表示注意力向量,T表示转置,σ表示激活函数;
所述步骤S3.3中最终嵌入表示
Figure FDA0002775970840000051
为:
Figure FDA0002775970840000052
7.根据权利要求6所述的基于时空架构的时序知识图谱补全方法,其特征在于,所述步骤S4包括以下步骤:
S4.1、将所有实体组成实体集,并将知识中缺失实体的位置换成逐一替换为实体集中的实体,得到若干候选知识;
S4.2、计算每个候选知识的置信度,并将置信度按从小到大的顺序排列,选取置信度最大的候选知识作为补全后的知识,完成时序知识图谱补全。
8.根据权利要求7所述的基于时空架构的时序知识图谱补全方法,其特征在于,所述步骤S4.2中置信度f为:
Figure FDA0002775970840000053
其中,zr表示关系r的嵌入表示,
Figure FDA0002775970840000054
表示实体e的最终嵌入表示,
Figure FDA0002775970840000055
表示实体o的最终嵌入表示,e和o均表示实体,r表示实体e和o的关系,t表示时间,|| ||2表示求取二范数。
CN202011265517.5A 2020-11-13 2020-11-13 一种基于时空架构的时序知识图谱补全方法 Active CN112364108B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011265517.5A CN112364108B (zh) 2020-11-13 2020-11-13 一种基于时空架构的时序知识图谱补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011265517.5A CN112364108B (zh) 2020-11-13 2020-11-13 一种基于时空架构的时序知识图谱补全方法

Publications (2)

Publication Number Publication Date
CN112364108A true CN112364108A (zh) 2021-02-12
CN112364108B CN112364108B (zh) 2021-06-15

Family

ID=74516231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011265517.5A Active CN112364108B (zh) 2020-11-13 2020-11-13 一种基于时空架构的时序知识图谱补全方法

Country Status (1)

Country Link
CN (1) CN112364108B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190654A (zh) * 2021-05-08 2021-07-30 北京工业大学 一种基于实体联合嵌入和概率模型的知识图谱补全方法
CN113505536A (zh) * 2021-07-09 2021-10-15 兰州理工大学 一种优化的基于时空图卷积网络的交通流预测模型
CN115292523A (zh) * 2022-08-04 2022-11-04 中国科学院空天信息创新研究院 一种基于图表示学习的时空信息推理方法
CN115391553A (zh) * 2022-08-23 2022-11-25 西北工业大学 一种自动搜索时序知识图谱补全模型的方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160188385A1 (en) * 2014-12-31 2016-06-30 International Business Machines Corporation Optimized system for analytics (graphs and sparse matrices) operations
CN108763237A (zh) * 2018-03-21 2018-11-06 浙江大学 一种基于注意力机制的知识图谱嵌入方法
CN109785968A (zh) * 2018-12-27 2019-05-21 东软集团股份有限公司 一种事件预测方法、装置、设备及程序产品
CN109902183A (zh) * 2019-02-13 2019-06-18 北京航空航天大学 一种基于多样图注意力机制的知识图谱嵌入方法
CN110737763A (zh) * 2019-10-18 2020-01-31 成都华律网络服务有限公司 一种融合知识图谱和深度学习的中文智能问答系统及方法
CN111159425A (zh) * 2019-12-30 2020-05-15 浙江大学 一种基于历史关系和双图卷积网络的时态知识图谱表示方法
CN111209408A (zh) * 2019-12-23 2020-05-29 华东师范大学 一种基于混合翻译模型的带时间知识图谱嵌入方法
CN111291139A (zh) * 2020-03-17 2020-06-16 中国科学院自动化研究所 基于注意力机制的知识图谱长尾关系补全方法
CN111651557A (zh) * 2020-05-09 2020-09-11 清华大学深圳国际研究生院 一种自动化文本生成方法、装置及计算机可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160188385A1 (en) * 2014-12-31 2016-06-30 International Business Machines Corporation Optimized system for analytics (graphs and sparse matrices) operations
CN108763237A (zh) * 2018-03-21 2018-11-06 浙江大学 一种基于注意力机制的知识图谱嵌入方法
CN109785968A (zh) * 2018-12-27 2019-05-21 东软集团股份有限公司 一种事件预测方法、装置、设备及程序产品
CN109902183A (zh) * 2019-02-13 2019-06-18 北京航空航天大学 一种基于多样图注意力机制的知识图谱嵌入方法
CN110737763A (zh) * 2019-10-18 2020-01-31 成都华律网络服务有限公司 一种融合知识图谱和深度学习的中文智能问答系统及方法
CN111209408A (zh) * 2019-12-23 2020-05-29 华东师范大学 一种基于混合翻译模型的带时间知识图谱嵌入方法
CN111159425A (zh) * 2019-12-30 2020-05-15 浙江大学 一种基于历史关系和双图卷积网络的时态知识图谱表示方法
CN111291139A (zh) * 2020-03-17 2020-06-16 中国科学院自动化研究所 基于注意力机制的知识图谱长尾关系补全方法
CN111651557A (zh) * 2020-05-09 2020-09-11 清华大学深圳国际研究生院 一种自动化文本生成方法、装置及计算机可读存储介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
JIE CHEN ET AL.: ""Movie fill in the blank by joint learning from video and text with adaptive temporal attention"", 《PATTERN RECOGNITION LETTERS》 *
JIE CHEN ET AL.: ""Movie fill in the blank with adaptive temporal attention and description update"", 《CIKM’17》 *
WOOJEONG JIN ET AL.: ""Recurrent Event Network Global Structure Inference over Temporal Knowledge Graph"", 《ARXIV:1904.05530V4 [CS.LG]》 *
丁建辉等: ""知识图谱补全算法综述"", 《信息通信技术》 *
汪荣贵等: ""多级注意力特征网络的小样本学习"", 《电子与信息学报》 *
马江涛: ""基于社交网络的知识图谱构建技术研究"", 《中国博士学位论文全文数据库信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190654A (zh) * 2021-05-08 2021-07-30 北京工业大学 一种基于实体联合嵌入和概率模型的知识图谱补全方法
CN113505536A (zh) * 2021-07-09 2021-10-15 兰州理工大学 一种优化的基于时空图卷积网络的交通流预测模型
CN115292523A (zh) * 2022-08-04 2022-11-04 中国科学院空天信息创新研究院 一种基于图表示学习的时空信息推理方法
CN115292523B (zh) * 2022-08-04 2023-09-22 中国科学院空天信息创新研究院 一种基于图表示学习的时空信息推理方法
CN115391553A (zh) * 2022-08-23 2022-11-25 西北工业大学 一种自动搜索时序知识图谱补全模型的方法
CN115391553B (zh) * 2022-08-23 2023-10-13 西北工业大学 一种自动搜索时序知识图谱补全模型的方法

Also Published As

Publication number Publication date
CN112364108B (zh) 2021-06-15

Similar Documents

Publication Publication Date Title
CN112364108B (zh) 一种基于时空架构的时序知识图谱补全方法
Ma et al. Multi-dimensional graph convolutional networks
WO2021169367A1 (zh) 一种基于多层注意力的推荐方法
CN112529168B (zh) 一种基于gcn的属性多层网络表示学习方法
CN113781527B (zh) 一种基于多交互时空图网络的行人轨迹预测方法和系统
CN112733656A (zh) 基于多流空间注意力图卷积sru网络的骨架动作识别方法
CN111966823A (zh) 一种面向标签噪声的图节点分类方法
Lyu et al. Memorize, factorize, or be naive: Learning optimal feature interaction methods for CTR prediction
Chen et al. Generative dynamic link prediction
CN108960293A (zh) 基于fm算法的ctr预估方法及系统
CN114780767A (zh) 一种基于深度卷积神经网络的大规模图像检索方法及系统
Yao et al. ModeRNN: Harnessing spatiotemporal mode collapse in unsupervised predictive learning
CN116975686A (zh) 训练学生模型的方法、行为预测方法和装置
CN117391816A (zh) 一种异质图神经网络推荐方法、装置及设备
Li et al. Ds-net++: Dynamic weight slicing for efficient inference in cnns and transformers
CN112860977A (zh) 一种基于卷积神经网络的链路预测方法
CN116523001A (zh) 电网薄弱线路识别模型构建方法、装置和计算机设备
CN116148864A (zh) 一种基于DyConvGRU和Unet的预测细化结构的雷达回波外推方法
CN113297575B (zh) 一种基于自编码器的多通道图垂直联邦模型防御方法
Yin et al. Multi-head self-attention recommendation model based on feature interaction enhancement
CN112836511B (zh) 基于协同关系的知识图谱上下文嵌入方法
CN115510948A (zh) 一种基于鲁棒图分类的区块链钓鱼检测方法
Dutta et al. Better prediction of humidity using artificial neural network
CN114898136A (zh) 一种基于特征自适应的小样本图像分类方法
CN114529325A (zh) 一种基于Darts的点击率预估模型自动化生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant