CN112231469A - 一种3drte时间知识图谱的三维旋转嵌入方法 - Google Patents

一种3drte时间知识图谱的三维旋转嵌入方法 Download PDF

Info

Publication number
CN112231469A
CN112231469A CN202011114740.XA CN202011114740A CN112231469A CN 112231469 A CN112231469 A CN 112231469A CN 202011114740 A CN202011114740 A CN 202011114740A CN 112231469 A CN112231469 A CN 112231469A
Authority
CN
China
Prior art keywords
time
entity
rotation
model
3drte
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011114740.XA
Other languages
English (en)
Inventor
汪璟玢
张旺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202011114740.XA priority Critical patent/CN112231469A/zh
Publication of CN112231469A publication Critical patent/CN112231469A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种3DRTE时间知识图谱的三维旋转嵌入方法,定义时间知识图谱TKG,给定实体集合E,关系集合R,时间戳集合T,一个TKG表示为时间事实四元组的集合,令已知的时间事实集合为G,则TKGC的目的就是在现有知识G的基础上推导出W;建立3DRTE模型,包括利用自注意力机制处理时间戳的各个片段带来的信息和利用四元数的旋转特性,将实体在融合了时间的关系的作用下,旋转建模在了三维空间中,从而获得了蕴含时间和关系的实体表示即完成模型建立;将得到的模型使用损失函数进行训练,并进行数据验证,最终实现补全时间知识图的目的。本发明通过自注意力机制处理关系和时间戳的联合序列,自适应地学习关系和时间的联合特征表示,从而更有助于补全的性能。

Description

一种3DRTE时间知识图谱的三维旋转嵌入方法
技术领域
本发明涉及知识图谱下的知识表示与推理技术,特别是一种3DRTE时间知识图谱的三维旋转嵌入方法。
背景技术
根据模型考虑时间信息的有无,可以将现有的技术分为两类:
KGC:以Trans为代表的翻译模型及其改进TranH、TranR等,这类模型通常应用简单的距离函数来衡量三元组的可靠程度。其中,最新的研究成果RotatE尤为成功,它归纳了三种常见的关系模式,并利用欧拉定理的思路将关系建模为复数平面上的旋转。之后,Zhang等人提出了QuatE的四元数嵌入模型。由于四元数比复数拥有更多的旋转自由度,QuatE在标准链路预测任务上的性能得到了很大提升。虽然QuatE是语义匹配模型,但仍然证明了其保留了其中两种模式:对称性(反对称性)、可逆性。
TKGC:一类直观且有效的方案就是在传统KGC上进行相应的时间扩展,比如,TTranE和HyTE分别在TransE和TransH上实施了时间扩展;García-Durán等人通过LSTM的方法编码出了关系和时间的交互,实现了在DistMult等模型上的扩展;RishabGoel等人借助于NLP上的共时词嵌入,提出了共时实体嵌入的扩展方法。
目前大多数的TKGC方法都是在传统嵌入模型上的扩展,这似乎是有效的。然而,传统的嵌入方法在得分函数上暴露出很大的弊端,即无法处理关系的三种基本模式。如果在传统方法上进行时序扩展,必定会影响模型的表达能力(例如TransE存在的无法处理关系对称性的问题,这仍然存在于TTransE和TA-ransE等模型中)。另外,本发明还认为时间戳的每个符号带来的增益是参差不齐的,比起使用LSTM这样的序列化计算方法,还应该让关系自适应地考虑时间戳的各个片段带来的收益,从而更有效的融合时间信息。
发明内容
有鉴于此,本发明的目的是提供一种3DRTE时间知识图谱的三维旋转嵌入方法,提出的3DRTE(Three Dimensional Rotation Time Embedding)模型能够有效地融合时间信息,给知识图补全带来更大的可靠性。
本发明采用以下方案实现:一种3DRTE时间知识图谱的三维旋转嵌入方法,包括以下步骤:
步骤S1:定义时间知识图谱TKG,给定实体集合E,关系集合R,时间戳集合T,一个TKG表示为时间事实四元组(s,r,o,t)的集合
Figure BDA0002729204110000021
其中s,o∈E表示实体,r∈R表示关系;令已知的时间事实集合为G,且
Figure BDA0002729204110000022
则TKGC(时间知识图谱补全)的目的就是在现有知识G的基础上推导出W,即在给定已知事实集合G的情况下补全出TKG的全貌W;
步骤S2:建立3DRTE模型,包括利用自注意力机制处理时间戳的各个片段带来的信息和利用四元数的旋转特性,将实体在融合了时间的关系的作用下,旋转建模在了三维空间中,从而获得实体在关系旋转下的得分函数,即完成模型建立;
步骤S3:将步骤S2中得到的模型使用损失函数进行训练,并进行数据验证,最终实现补全时间知识图的目的。
进一步地,所述步骤S2中所述利用3DRTE模型中的自注意力机制处理时间戳的各个片段带来的信息的具体内容为:
给定一个时间知识四元组(s,r,o,t),仅考虑关系r和时间t,因此令它们的维度都是k;对于关系r,它来自关系的嵌入矩阵
Figure BDA0002729204110000031
其中N表示整个知识图谱中关系类型的个数;对于时间t,它是一个由l个token组成的时间戳,对每个token,都从矩阵
Figure BDA0002729204110000032
获得它们的表示,其中L表示知识图谱中时间token类型的个数;为了让关系自适应于每一个时间token带来的信息,引入自注意力(self-attention)机制处理关系-时间序列;自注意力通过计算每一个token对关系的影响程度,从而有选择性的融合特征;具体计算过程如下:首先,将关系和时间序列拼接作为整个计算图的输入I,即
I=[r;t1;t2......;tl] (1)
把I分别输入进三个参数矩阵WU、WK、WV,经过线性变换得到查询(Query)矩阵U、键(Key)矩阵K以及值(Value)矩阵V,即
Figure BDA0002729204110000033
之后,为了计算每个查询矩阵U对每个键矩阵K的权重,先将K转置得到KT,与U作矩阵乘法之后,经过softmax的激活,得到每个时间token对关系r的权重矩阵
Figure BDA0002729204110000041
最后,将V乘以
Figure BDA0002729204110000042
即得到最后的输出矩阵O,公式化为:
O=V×softmax(KT×U) (3)
只取O的第一行作为输出,即融合了时序信息的关系表示rt
进一步地,步骤S2中所述利用3DRTE模型中的四元数的旋转特性获得实体在关系旋转下的得分函数具体内容为:
从每一个维度即从1到k,k表示嵌入向量的维度,其调整为(128,256,512),考虑实体和关系的交互;首先,头实体s和尾实体o都被表示成一组(x,y,z)坐标;对于关系r,根据公式s=ror-1中的几何意义,将其表示为给实体带来空间旋转的四元数Qr∈H;令旋转角θ∈[-π,π],则四元数表示为
Figure BDA0002729204110000043
施加两个假设Qr的实部为零且a2+b2+c2=1,使得四元数的作用对应一种特定的空间旋转,用以进一步计算
Figure BDA0002729204110000044
之所以第一项用的是既定θ的一半,是因为Qr会将三维点旋转到四维空间中,为了使得到的点仍在三维,从而保持与尾实体的特征匹配,则需再施加一个
Figure BDA0002729204110000045
的旋转,即
Figure BDA0002729204110000046
则实体s在关系r作用下的三维旋转表示为
Figure BDA0002729204110000047
然后,通过l2范数计算旋转后头实体坐标与尾实体坐标的距离,作为评估每一维度的得分,即
Figure BDA0002729204110000051
最后,一个三元组(s,r,o)的得分来自每个维度得分的和,即
Figure BDA0002729204110000052
对关系四元数嵌入r∈Hk的每个部分进行时间融合,即
rt=(ft(p),ft(q),ft(u),ft(v)) (9)
其中函数ft:Rk→Rk表示公式(3),将关系与时间进行融合,
Figure BDA0002729204110000053
分别是r的实部和虚部表示;最终的得分函数如下:
Figure BDA0002729204110000054
其中
Figure BDA0002729204110000055
表示r经过t融合后的旋转四元数嵌入。
进一步地,所述公式s=ror-1的几何意义为:
给定一个三元组(s,r,o),基于这样的一个三维旋转假设:
s=ror-1 (11)
其中s,o∈Zk表示实体s,o的嵌入,r∈Hk表示关系r的嵌入将实体投影到三元数的高维空间中,即实体的每一个维度都对应于空间中的一个点,并利用四元数Quaternion将关系建模为实体在空间中的旋转。
进一步地,步骤S3中所述的损失函数为:使用了RotatE中的自对抗负采样损失函数;
Figure BDA0002729204110000061
其中,γ是固定边界超参,σ表示sigmoid激活函数,四元组(s'i,r,o'i,t)是第i个负例,且
Figure BDA0002729204110000062
表示负采样四元组的概率分布,α是采样温度;
接着,使用Adam作为优化算法,并使用栅格检索法来寻找超参数,用以达到学习实体、关系和时间嵌入矩阵的目的;提供三个基准数据集进行链路实体预测验证,它们分别是ICEWS14、ICEWS05-15和GDELT,都划分成了训练集、验证集、测试集;对每个测试四元组,利用KG(知识图)中的全部实体,去替换其头实体或者尾实体,来产生新的四元组,遵循(filter)过滤的设置,过滤掉其中已经在训练集中出现过的四元组;利用公式(10)来对每个新四元组评分,对这些分数升序排序之后,得到每个四元组的排名;引入三项指标来评估排序结果的正确性:
平均排名MR:即每个正确实体在预测结果中的排名的平均值,越小的MR说明模型预测的准确性越高;
平均倒数排名MRR:即每个正确实体在预测结果中的排名倒数的平均值,越大的MRR越好;
前k名的命中率hit@k,取k的值为1,3,10:即每个正确实体在前k名的命中比重,越大说明结果越好;
经过损失函数训练模型后得到高评估指标的模型F之后,将模型应用于G中,遍历G中的所有实体和关系,组合成(s,r,?,t)的查询对,同时过滤掉已经出现在G中的查询,最后得到的集合作为查询集;对于查询集中的每一个查询,通过F预测出它对应的尾实体t,这样每一个查询都得到了补全,变成了四元组,将它们加入G,最后得到W。
与现有技术相比,本发明具有以下有益效果:
(1)现有的模型大多数忽略了知识的时间特性,因此往往在部分时间敏感的环境中得不到有效利用,而本发明提出的模型能够有效地融合时间信息,给知识图补全带来更大的可靠性。
(2)现有的结合了时间知识的补全模型,很多都是对传统嵌入模型的扩展。传统嵌入模型往往因其得分函数的性质使得模型本身不能有效地处理关系的基本模式(对称/反对称性、自反性、组合性)。而本发明提出的方法是基于四元数的三维旋转假设,该假设满足了这些基本关系模式。
(3)现有的一些模型的时间融合策略,往往没有考虑到时间戳各个片段带来的收益。本发明考虑到这一点,通过自注意力机制处理关系和时间戳的联合序列,自适应地学习关系和时间的联合特征表示,从而更有助于补全的性能。
附图说明
图1为本发明实施例的3DRTE的总体结构图。
图2为本发明实施例的关系-时间融合的计算过程。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供一种3DRTE时间知识图谱的三维旋转嵌入方法,包括以下步骤:
步骤S1:定义时间知识图谱TKG,给定实体集合E,关系集合R,时间戳集合T,一个TKG表示为时间事实四元组(s,r,o,t)的集合
Figure BDA0002729204110000081
其中s,o∈E表示实体,r∈R表示关系;令已知的时间事实集合为G,且
Figure BDA0002729204110000082
则TKGC的目的就是在现有知识G的基础上推导出W,即在给定已知事实集合G的情况下补全出TKG的全貌W;
步骤S2:建立3DRTE模型,包括利用自注意力机制处理时间戳的各个片段带来的信息和利用四元数的旋转特性,将实体在融合了时间的关系的作用下,旋转建模在了三维空间中,从而获得实体在关系旋转下的得分函数,即完成模型建立;
步骤S3:将步骤S2中得到的模型使用损失函数进行训练,并进行数据验证,最终实现补全时间知识图的目的。
在本实施例中,所述步骤S2中所述利用3DRTE模型中的自注意力机制处理时间戳的各个片段带来的信息的具体内容为:
给定一个时间知识四元组(s,r,o,t),在本实施例中仅考虑关系r和时间t,因此令它们的维度都是k;对于关系r,它来自关系的嵌入矩阵
Figure BDA0002729204110000091
其中N表示整个知识图谱中关系类型的个数;对于时间t,它是一个由l个token组成的时间戳,对每个token,都从矩阵
Figure BDA0002729204110000092
获得它们的表示,其中L表示知识图谱中时间token类型的个数;为了让关系自适应于每一个时间token带来的信息,引入自注意力(self-attention)机制处理关系-时间序列;自注意力通过计算每一个token对关系的影响程度,从而有选择性的融合特征;具体计算过程如下:(如图2所示)
首先,将关系和时间序列拼接作为整个计算图的输入I,即
I=[r;t1;t2......;tl] (1)
把I分别输入进三个参数矩阵WU、WK、WV,经过简单的线性变换得到查询(Query)矩阵U、键(Key)矩阵K以及值(Value)矩阵V,即
Figure BDA0002729204110000093
之后,为了计算每个查询矩阵U对每个键矩阵K的权重,先将K转置得到KT,与U作矩阵乘法之后,经过softmax的激活,得到每个时间token对关系r的权重矩阵
Figure BDA0002729204110000094
最后,将V乘以
Figure BDA0002729204110000095
即得到最后的输出矩阵O,公式化为:
O=V×softmax(KT×U) (3)
只取O的第一行作为输出,即融合了时序信息的关系表示rt
在本实施例中,步骤S2中所述利用3DRTE模型中的四元数的旋转特性获得实体在关系旋转下的得分函数具体内容为:
从每一个维度即从1到k,k表示嵌入向量的维度,其调整为(128,256,512),考虑实体和关系的交互;首先,头实体s和尾实体o都被表示成一组(x,y,z)坐标;对于关系r,根据公式s=ror-1中的几何意义,将其表示为给实体带来空间旋转的四元数Qr∈H;令旋转角θ∈[-π,π],则四元数表示为:
Figure BDA0002729204110000101
施加两个假设Qr的实部为零且a2+b2+c2=1,使得四元数的作用对应一种特定的空间旋转,用以进一步计算
Figure BDA0002729204110000102
之所以第一项用的是既定θ的一半,是因为Qr会将三维点旋转到四维空间中,为了使得到的点仍在三维,从而保持与尾实体的特征匹配,则需再施加一个Q-1的r旋转,即
Figure BDA0002729204110000103
则实体s在关系r作用下的三维旋转表示为
Figure BDA0002729204110000104
然后,通过l2范数计算旋转后头实体坐标与尾实体坐标的距离,作为评估每一维度的得分,即
Figure BDA0002729204110000111
最后,一个三元组(s,r,o)的得分来自每个维度得分的和,即
Figure BDA0002729204110000112
对关系四元数嵌入r∈Hk的每个部分进行时间融合,即
rt=(ft(p),ft(q),ft(u),ft(v)) (9)
其中函数ft:Rk→Rk表示公式(3),将关系与时间进行融合,
Figure BDA0002729204110000113
分别是r的实部和虚部表示;最终的得分函数如下:
Figure BDA0002729204110000114
其中
Figure BDA0002729204110000115
表示r经过t融合后的旋转四元数嵌入。
在本实施例中,所述公式s=ror-1的几何意义为:
给定一个三元组(s,r,o),基于这样的一个三维旋转假设:
s=ror-1 (11)
其中s,o∈Zk表示实体s,o的嵌入,r∈Hk表示关系r的嵌入(在本实施例中,粗体符号表示相对应的嵌入表示)。将实体投影到三元数的高维空间中,即实体的每一个维度都对应于空间中的一个点,并利用四元数Quaternion将关系建模为实体在空间中的旋转。
在本实施例中,步骤S3中所述的损失函数为:使用了RotatE中的自对抗负采样损失函数;
Figure BDA0002729204110000116
其中,γ是固定边界超参,σ表示sigmoid激活函数,四元组(s'i,r,o'i,t)是第i个负例,且
Figure BDA0002729204110000121
表示负采样四元组的概率分布,α是采样温度;
接着,使用Adam作为优化算法,并使用栅格检索法来寻找超参数,用以达到学习实体、关系和时间嵌入矩阵的目的;提供三个基准数据集进行链路实体预测验证,它们分别是ICEWS14、ICEWS05-15和GDELT,都划分成了训练集、验证集、测试集;对每个测试四元组,利用KG(知识图)中的全部实体,去替换其头实体或者尾实体,来产生新的四元组,遵循(filter)过滤的设置,过滤掉其中已经在训练集中出现过的四元组;利用公式(10)来对每个新四元组评分,对这些分数升序排序之后,得到每个四元组的排名;引入三项指标来评估排序结果的正确性:
平均排名MR:即每个正确实体在预测结果中的排名的平均值,越小的MR说明模型预测的准确性越高;
平均倒数排名MRR:即每个正确实体在预测结果中的排名倒数的平均值,越大的MRR越好;
前k名的命中率hit@k,取k的值为1,3,10:即每个正确实体在前k名的命中比重,越大说明结果越好;
经过损失函数训练模型后得到高评估指标的模型F之后,将模型应用于G中,遍历G中的所有实体和关系,组合成(s,r,?,t)的查询对,同时过滤掉已经出现在G中的查询,最后得到的集合作为查询集;对于查询集中的每一个查询,通过F预测出它对应的尾实体t,这样每一个查询都得到了补全,变成了四元组,将它们加入G,最后得到W。
实验表明,在各项指标上都优于其他现有的模型,因此,认为本实施例能够有效补全知识图谱。
较佳的,在本实施例中,
定义(四元数Quaternion)由爱尔兰数学家哈密顿在1843年发明的数学概念。与简单的复数类似,四元数是由实数加上三个虚数单位i、j、k组成,即四元数可表示为Q=a+bi+cj+dk,其中a,b,c,d都是实数。四元数的其他主要相关运算如下:
共轭(Conjugate):
Figure BDA0002729204110000131
范数(Norm):
Figure BDA0002729204110000132
乘法(Multiplication):四元数的乘法满足各个部分之间的乘法分配律,乘法不满足交换律,但是满足结合律。四元数Q1乘以Q2,在几何意义上可以理解为先以Q1的大小放缩,然后施加一种特殊的四维旋转,即
Figure BDA0002729204110000133
逆(Inverse):一个非零四元数Q的逆为
Figure BDA0002729204110000134
显然Q·Q-1=1。
较佳的,本实施例为了建模关系的三种基本模式,同时又能够高效地融入知识的时间增益,本实施例提出了一种全新的时间知识嵌入模型ThreeDimensionalRotationTimeEmbedding(3DRTE)。该模型的总体结构如图1所示。首先,为了充分建模时间特定的关系,引入自注意力融合关系和时间;其次,对于每一个维度,我们将实体视为三维空间中的点,借助四元数建模关系,使得实体在关系的作用下进行三维旋转。
较佳的,在本实施例中:
①在时间知识图谱的背景下,提出了三维空间旋转的嵌入方法(3DRTE)。
②本实施例提出利用自注意力机制处理时间戳的各个片段带来的信息,它能够有效增强关系的表示。
③本实施例借助了四元数的旋转特性,将实体在融合了时间的关系的作用下,旋转建模在了三维空间中,从而获得了蕴含时间和关系的实体表示,最终达到了补全时间知识图的目的。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (5)

1.一种3DRTE时间知识图谱的三维旋转嵌入方法,其特征在于:包括以下步骤:
步骤S1:定义时间知识图谱TKG,给定实体集合E,关系集合R,时间戳集合T,一个TKG表示为时间事实四元组(s,r,o,t)的集合
Figure FDA0002729204100000011
其中s,o∈E表示实体,r∈R表示关系;令已知的时间事实集合为G,且
Figure FDA0002729204100000012
则TKGC的目的就是在现有知识G的基础上推导出W,即在给定已知事实集合G的情况下补全出TKG的全貌W;
步骤S2:建立3DRTE模型,包括利用自注意力机制处理时间戳的各个片段带来的信息和利用四元数的旋转特性,将实体在融合了时间的关系的作用下,旋转建模在了三维空间中,从而获得实体在关系旋转下的得分函数,即完成模型建立;
步骤S3:将步骤S2中得到的模型使用损失函数进行训练,并进行数据验证,最终实现补全时间知识图的目的。
2.根据权利要求1所述的一种3DRTE时间知识图谱的三维旋转嵌入方法,其特征在于:所述步骤S2中所述利用3DRTE模型中的自注意力机制处理时间戳的各个片段带来的信息的具体内容为:
给定一个时间知识四元组(s,r,o,t),仅考虑关系r和时间t,因此令它们的维度都是k;对于关系r,它来自关系的嵌入矩阵
Figure FDA0002729204100000013
其中N表示整个知识图谱中关系类型的个数;对于时间t,它是一个由l个token组成的时间戳,对每个token,都从矩阵
Figure FDA0002729204100000014
获得它们的表示,其中L表示知识图谱中时间token类型的个数;为了让关系自适应于每一个时间token带来的信息,引入自注意力机制处理关系-时间序列;自注意力通过计算每一个token对关系的影响程度,从而有选择性的融合特征;具体计算过程如下:
首先,将关系和时间序列拼接作为整个计算图的输入I,即
I=[r;t1;t2......;tl] (1)
把I分别输入进三个参数矩阵WU、WK、WV,经过线性变换得到查询矩阵U、键矩阵K以及值矩阵V,即
Figure FDA0002729204100000021
之后,为了计算每个查询矩阵U对每个键矩阵K的权重,先将K转置得到KT,与U作矩阵乘法之后,经过softmax的激活,得到每个时间token对关系r的权重矩阵
Figure FDA0002729204100000022
最后,将V乘以
Figure FDA0002729204100000023
即得到最后的输出矩阵O,公式化为:
O=V×softmax(KT×U) (3)
只取O的第一行作为输出,即融合了时序信息的关系表示rt
3.根据权利要求1所述的一种3DRTE时间知识图谱的三维旋转嵌入方法,其特征在于:步骤S2中所述利用3DRTE模型中的四元数的旋转特性获得实体在关系旋转下的得分函数具体内容为:
从每一个维度即从1到k,k表示嵌入向量的维度,其调整为(128,256,512),考虑实体和关系的交互;首先,头实体s和尾实体o都被表示成一组(x,y,z)坐标;对于关系r,根据公式s=ror-1中的几何意义,将其表示为给实体带来空间旋转的四元数Qr∈H;令旋转角θ∈[-π,π],则四元数表示为
Figure FDA0002729204100000031
施加两个假设Qr的实部为零且a2+b2+c2=1,使得四元数的作用对应一种特定的空间旋转,用以进一步计算
Figure FDA0002729204100000032
之所以第一项用的是既定θ的一半,是因为Qr会将三维点旋转到四维空间中,为了使得到的点仍在三维,从而保持与尾实体的特征匹配,则需再施加一个
Figure FDA0002729204100000033
的旋转,即
Figure FDA0002729204100000034
则实体s在关系r作用下的三维旋转表示为
Figure FDA0002729204100000035
然后,通过l2范数计算旋转后头实体坐标与尾实体坐标的距离,作为评估每一维度的得分,即
Figure FDA0002729204100000036
最后,一个三元组(s,r,o)的得分来自每个维度得分的和,即
Figure FDA0002729204100000037
对关系四元数嵌入r∈Hk的每个部分进行时间融合,即
rt=(ft(p),ft(q),ft(u),ft(v)) (9)
其中函数ft:Rk→Rk表示公式(3),将关系与时间进行融合,
Figure FDA0002729204100000038
分别是r的实部和虚部表示;最终的得分函数如下:
Figure FDA0002729204100000041
其中
Figure FDA0002729204100000042
表示r经过t融合后的旋转四元数嵌入。
4.根据权利要求3所述的一种3DRTE时间知识图谱的三维旋转嵌入方法,其特征在于:所述公式s=ror-1的几何意义为:
给定一个三元组(s,r,o),基于这样的一个三维旋转假设:
s=ror-1 (11)
其中s,o∈Zk表示实体s,o的嵌入,r∈Hk表示关系r的嵌入将实体投影到三元数的高维空间中,即实体的每一个维度都对应于空间中的一个点,并利用四元数Quaternion将关系建模为实体在空间中的旋转。
5.根据权利要求1所述的一种3DRTE时间知识图谱的三维旋转嵌入方法,其特征在于:步骤S3中所述的损失函数为:使用了RotatE中的自对抗负采样损失函数;
Figure FDA0002729204100000043
其中,γ是固定边界超参,σ表示sigmoid激活函数,四元组(s'i,r,o'i,t)是第i个负例,且
Figure FDA0002729204100000044
表示负采样四元组的概率分布,α是采样温度;
接着,使用Adam作为优化算法,并使用栅格检索法来寻找超参数,用以达到学习实体、关系和时间嵌入矩阵的目的;提供三个基准数据集进行链路实体预测验证,它们分别是ICEWS14、ICEWS05-15和GDELT,都划分成了训练集、验证集、测试集;对每个测试四元组,利用KG中的全部实体,去替换其头实体或者尾实体,来产生新的四元组,遵循过滤的设置,过滤掉其中已经在训练集中出现过的四元组;利用公式(10)来对每个新四元组评分,对这些分数升序排序之后,得到每个四元组的排名;引入三项指标来评估排序结果的正确性:
平均排名MR:即每个正确实体在预测结果中的排名的平均值,越小的MR说明模型预测的准确性越高;
平均倒数排名MRR:即每个正确实体在预测结果中的排名倒数的平均值,越大的MRR越好;
前k名的命中率hit@k,取k的值为1,3,10:即每个正确实体在前k名的命中比重,越大说明结果越好;
经过损失函数训练模型后得到高评估指标的模型F之后,将模型应用于G中,遍历G中的所有实体和关系,组合成(s,r,?,t)的查询对,同时过滤掉已经出现在G中的查询,最后得到的集合作为查询集;对于查询集中的每一个查询,通过F预测出它对应的尾实体t,这样每一个查询都得到了补全,变成了四元组,将它们加入G,最后得到W。
CN202011114740.XA 2020-10-16 2020-10-16 一种3drte时间知识图谱的三维旋转嵌入方法 Pending CN112231469A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011114740.XA CN112231469A (zh) 2020-10-16 2020-10-16 一种3drte时间知识图谱的三维旋转嵌入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011114740.XA CN112231469A (zh) 2020-10-16 2020-10-16 一种3drte时间知识图谱的三维旋转嵌入方法

Publications (1)

Publication Number Publication Date
CN112231469A true CN112231469A (zh) 2021-01-15

Family

ID=74118792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011114740.XA Pending CN112231469A (zh) 2020-10-16 2020-10-16 一种3drte时间知识图谱的三维旋转嵌入方法

Country Status (1)

Country Link
CN (1) CN112231469A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254661A (zh) * 2021-04-09 2021-08-13 浙江工业大学 一种引入实体上下文的三维旋转知识图谱嵌入方法
CN113946695A (zh) * 2021-12-20 2022-01-18 山东新希望六和集团有限公司 动物系谱的生成方法、装置及计算机设备
CN117093727A (zh) * 2023-10-16 2023-11-21 湖南董因信息技术有限公司 基于时间关系感知的时序知识图谱补全方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254661A (zh) * 2021-04-09 2021-08-13 浙江工业大学 一种引入实体上下文的三维旋转知识图谱嵌入方法
CN113254661B (zh) * 2021-04-09 2022-09-23 浙江工业大学 一种引入实体上下文的三维旋转知识图谱嵌入方法
CN113946695A (zh) * 2021-12-20 2022-01-18 山东新希望六和集团有限公司 动物系谱的生成方法、装置及计算机设备
CN113946695B (zh) * 2021-12-20 2022-04-22 山东新希望六和集团有限公司 动物系谱的生成方法、装置及计算机设备
CN117093727A (zh) * 2023-10-16 2023-11-21 湖南董因信息技术有限公司 基于时间关系感知的时序知识图谱补全方法
CN117093727B (zh) * 2023-10-16 2024-01-05 湖南董因信息技术有限公司 基于时间关系感知的时序知识图谱补全方法

Similar Documents

Publication Publication Date Title
CN112231469A (zh) 一种3drte时间知识图谱的三维旋转嵌入方法
CN107871014A (zh) 一种基于深度融合哈希的大数据跨模态检索方法及系统
CN111126488A (zh) 一种基于双重注意力的图像识别方法
CN110826338B (zh) 一种单选择门与类间度量的细粒度语义相似识别的方法
CN113254549B (zh) 人物关系挖掘模型的训练方法、人物关系挖掘方法及装置
CN111563192B (zh) 实体对齐方法、装置、电子设备及存储介质
CN113628059B (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN112416956B (zh) 一种基于bert和独立循环神经网络的问句分类方法
CN104598611A (zh) 对搜索条目进行排序的方法及系统
CN110807509A (zh) 一种基于贝叶斯神经网络的深度知识追踪方法
CN112256971A (zh) 一种序列推荐方法及计算机可读存储介质
CN113987196A (zh) 一种基于知识图谱蒸馏的知识图谱嵌入压缩方法
CN117196763A (zh) 基于时序感知自注意力和对比学习的商品序列推荐方法
CN115049397A (zh) 识别社交网络中的风险账户的方法及装置
CN114971066A (zh) 融合遗忘因素和学习能力的知识追踪方法及系统
CN111259264A (zh) 一种基于生成对抗网络的时序评分预测方法
CN116306780B (zh) 一种动态图链接生成方法
CN117150069A (zh) 基于全局与局部语义对比学习的跨模态检索方法及系统
CN115526293B (zh) 一种顾及语义和结构信息的知识图谱推理方法
CN115174268B (zh) 基于结构化正则项的入侵检测方法
CN112836511B (zh) 基于协同关系的知识图谱上下文嵌入方法
Liu et al. Model design and parameter optimization of CNN for side-channel cryptanalysis
CN110727705B (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
CN113449047A (zh) 知识图谱补全方法与装置
CN113780027A (zh) 一种基于增广图卷积的多标签物体识别方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210115