CN112231469A - 一种3drte时间知识图谱的三维旋转嵌入方法 - Google Patents
一种3drte时间知识图谱的三维旋转嵌入方法 Download PDFInfo
- Publication number
- CN112231469A CN112231469A CN202011114740.XA CN202011114740A CN112231469A CN 112231469 A CN112231469 A CN 112231469A CN 202011114740 A CN202011114740 A CN 202011114740A CN 112231469 A CN112231469 A CN 112231469A
- Authority
- CN
- China
- Prior art keywords
- time
- entity
- rotation
- model
- 3drte
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000007246 mechanism Effects 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 8
- 230000009471 action Effects 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 29
- 238000012360 testing method Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 230000001174 ascending effect Effects 0.000 claims description 3
- 238000013524 data verification Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种3DRTE时间知识图谱的三维旋转嵌入方法,定义时间知识图谱TKG,给定实体集合E,关系集合R,时间戳集合T,一个TKG表示为时间事实四元组的集合,令已知的时间事实集合为G,则TKGC的目的就是在现有知识G的基础上推导出W;建立3DRTE模型,包括利用自注意力机制处理时间戳的各个片段带来的信息和利用四元数的旋转特性,将实体在融合了时间的关系的作用下,旋转建模在了三维空间中,从而获得了蕴含时间和关系的实体表示即完成模型建立;将得到的模型使用损失函数进行训练,并进行数据验证,最终实现补全时间知识图的目的。本发明通过自注意力机制处理关系和时间戳的联合序列,自适应地学习关系和时间的联合特征表示,从而更有助于补全的性能。
Description
技术领域
本发明涉及知识图谱下的知识表示与推理技术,特别是一种3DRTE时间知识图谱的三维旋转嵌入方法。
背景技术
根据模型考虑时间信息的有无,可以将现有的技术分为两类:
KGC:以Trans为代表的翻译模型及其改进TranH、TranR等,这类模型通常应用简单的距离函数来衡量三元组的可靠程度。其中,最新的研究成果RotatE尤为成功,它归纳了三种常见的关系模式,并利用欧拉定理的思路将关系建模为复数平面上的旋转。之后,Zhang等人提出了QuatE的四元数嵌入模型。由于四元数比复数拥有更多的旋转自由度,QuatE在标准链路预测任务上的性能得到了很大提升。虽然QuatE是语义匹配模型,但仍然证明了其保留了其中两种模式:对称性(反对称性)、可逆性。
TKGC:一类直观且有效的方案就是在传统KGC上进行相应的时间扩展,比如,TTranE和HyTE分别在TransE和TransH上实施了时间扩展;García-Durán等人通过LSTM的方法编码出了关系和时间的交互,实现了在DistMult等模型上的扩展;RishabGoel等人借助于NLP上的共时词嵌入,提出了共时实体嵌入的扩展方法。
目前大多数的TKGC方法都是在传统嵌入模型上的扩展,这似乎是有效的。然而,传统的嵌入方法在得分函数上暴露出很大的弊端,即无法处理关系的三种基本模式。如果在传统方法上进行时序扩展,必定会影响模型的表达能力(例如TransE存在的无法处理关系对称性的问题,这仍然存在于TTransE和TA-ransE等模型中)。另外,本发明还认为时间戳的每个符号带来的增益是参差不齐的,比起使用LSTM这样的序列化计算方法,还应该让关系自适应地考虑时间戳的各个片段带来的收益,从而更有效的融合时间信息。
发明内容
有鉴于此,本发明的目的是提供一种3DRTE时间知识图谱的三维旋转嵌入方法,提出的3DRTE(Three Dimensional Rotation Time Embedding)模型能够有效地融合时间信息,给知识图补全带来更大的可靠性。
本发明采用以下方案实现:一种3DRTE时间知识图谱的三维旋转嵌入方法,包括以下步骤:
步骤S1:定义时间知识图谱TKG,给定实体集合E,关系集合R,时间戳集合T,一个TKG表示为时间事实四元组(s,r,o,t)的集合其中s,o∈E表示实体,r∈R表示关系;令已知的时间事实集合为G,且则TKGC(时间知识图谱补全)的目的就是在现有知识G的基础上推导出W,即在给定已知事实集合G的情况下补全出TKG的全貌W;
步骤S2:建立3DRTE模型,包括利用自注意力机制处理时间戳的各个片段带来的信息和利用四元数的旋转特性,将实体在融合了时间的关系的作用下,旋转建模在了三维空间中,从而获得实体在关系旋转下的得分函数,即完成模型建立;
步骤S3:将步骤S2中得到的模型使用损失函数进行训练,并进行数据验证,最终实现补全时间知识图的目的。
进一步地,所述步骤S2中所述利用3DRTE模型中的自注意力机制处理时间戳的各个片段带来的信息的具体内容为:
给定一个时间知识四元组(s,r,o,t),仅考虑关系r和时间t,因此令它们的维度都是k;对于关系r,它来自关系的嵌入矩阵其中N表示整个知识图谱中关系类型的个数;对于时间t,它是一个由l个token组成的时间戳,对每个token,都从矩阵获得它们的表示,其中L表示知识图谱中时间token类型的个数;为了让关系自适应于每一个时间token带来的信息,引入自注意力(self-attention)机制处理关系-时间序列;自注意力通过计算每一个token对关系的影响程度,从而有选择性的融合特征;具体计算过程如下:首先,将关系和时间序列拼接作为整个计算图的输入I,即
I=[r;t1;t2......;tl] (1)
把I分别输入进三个参数矩阵WU、WK、WV,经过线性变换得到查询(Query)矩阵U、键(Key)矩阵K以及值(Value)矩阵V,即
之后,为了计算每个查询矩阵U对每个键矩阵K的权重,先将K转置得到KT,与U作矩阵乘法之后,经过softmax的激活,得到每个时间token对关系r的权重矩阵最后,将V乘以即得到最后的输出矩阵O,公式化为:
O=V×softmax(KT×U) (3)
只取O的第一行作为输出,即融合了时序信息的关系表示rt。
进一步地,步骤S2中所述利用3DRTE模型中的四元数的旋转特性获得实体在关系旋转下的得分函数具体内容为:
从每一个维度即从1到k,k表示嵌入向量的维度,其调整为(128,256,512),考虑实体和关系的交互;首先,头实体s和尾实体o都被表示成一组(x,y,z)坐标;对于关系r,根据公式s=ror-1中的几何意义,将其表示为给实体带来空间旋转的四元数Qr∈H;令旋转角θ∈[-π,π],则四元数表示为
施加两个假设Qr的实部为零且a2+b2+c2=1,使得四元数的作用对应一种特定的空间旋转,用以进一步计算之所以第一项用的是既定θ的一半,是因为Qr会将三维点旋转到四维空间中,为了使得到的点仍在三维,从而保持与尾实体的特征匹配,则需再施加一个的旋转,即
则实体s在关系r作用下的三维旋转表示为
然后,通过l2范数计算旋转后头实体坐标与尾实体坐标的距离,作为评估每一维度的得分,即
最后,一个三元组(s,r,o)的得分来自每个维度得分的和,即
对关系四元数嵌入r∈Hk的每个部分进行时间融合,即
rt=(ft(p),ft(q),ft(u),ft(v)) (9)
进一步地,所述公式s=ror-1的几何意义为:
给定一个三元组(s,r,o),基于这样的一个三维旋转假设:
s=ror-1 (11)
其中s,o∈Zk表示实体s,o的嵌入,r∈Hk表示关系r的嵌入将实体投影到三元数的高维空间中,即实体的每一个维度都对应于空间中的一个点,并利用四元数Quaternion将关系建模为实体在空间中的旋转。
进一步地,步骤S3中所述的损失函数为:使用了RotatE中的自对抗负采样损失函数;
其中,γ是固定边界超参,σ表示sigmoid激活函数,四元组(s'i,r,o'i,t)是第i个负例,且
表示负采样四元组的概率分布,α是采样温度;
接着,使用Adam作为优化算法,并使用栅格检索法来寻找超参数,用以达到学习实体、关系和时间嵌入矩阵的目的;提供三个基准数据集进行链路实体预测验证,它们分别是ICEWS14、ICEWS05-15和GDELT,都划分成了训练集、验证集、测试集;对每个测试四元组,利用KG(知识图)中的全部实体,去替换其头实体或者尾实体,来产生新的四元组,遵循(filter)过滤的设置,过滤掉其中已经在训练集中出现过的四元组;利用公式(10)来对每个新四元组评分,对这些分数升序排序之后,得到每个四元组的排名;引入三项指标来评估排序结果的正确性:
平均排名MR:即每个正确实体在预测结果中的排名的平均值,越小的MR说明模型预测的准确性越高;
平均倒数排名MRR:即每个正确实体在预测结果中的排名倒数的平均值,越大的MRR越好;
前k名的命中率hit@k,取k的值为1,3,10:即每个正确实体在前k名的命中比重,越大说明结果越好;
经过损失函数训练模型后得到高评估指标的模型F之后,将模型应用于G中,遍历G中的所有实体和关系,组合成(s,r,?,t)的查询对,同时过滤掉已经出现在G中的查询,最后得到的集合作为查询集;对于查询集中的每一个查询,通过F预测出它对应的尾实体t,这样每一个查询都得到了补全,变成了四元组,将它们加入G,最后得到W。
与现有技术相比,本发明具有以下有益效果:
(1)现有的模型大多数忽略了知识的时间特性,因此往往在部分时间敏感的环境中得不到有效利用,而本发明提出的模型能够有效地融合时间信息,给知识图补全带来更大的可靠性。
(2)现有的结合了时间知识的补全模型,很多都是对传统嵌入模型的扩展。传统嵌入模型往往因其得分函数的性质使得模型本身不能有效地处理关系的基本模式(对称/反对称性、自反性、组合性)。而本发明提出的方法是基于四元数的三维旋转假设,该假设满足了这些基本关系模式。
(3)现有的一些模型的时间融合策略,往往没有考虑到时间戳各个片段带来的收益。本发明考虑到这一点,通过自注意力机制处理关系和时间戳的联合序列,自适应地学习关系和时间的联合特征表示,从而更有助于补全的性能。
附图说明
图1为本发明实施例的3DRTE的总体结构图。
图2为本发明实施例的关系-时间融合的计算过程。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供一种3DRTE时间知识图谱的三维旋转嵌入方法,包括以下步骤:
步骤S1:定义时间知识图谱TKG,给定实体集合E,关系集合R,时间戳集合T,一个TKG表示为时间事实四元组(s,r,o,t)的集合其中s,o∈E表示实体,r∈R表示关系;令已知的时间事实集合为G,且则TKGC的目的就是在现有知识G的基础上推导出W,即在给定已知事实集合G的情况下补全出TKG的全貌W;
步骤S2:建立3DRTE模型,包括利用自注意力机制处理时间戳的各个片段带来的信息和利用四元数的旋转特性,将实体在融合了时间的关系的作用下,旋转建模在了三维空间中,从而获得实体在关系旋转下的得分函数,即完成模型建立;
步骤S3:将步骤S2中得到的模型使用损失函数进行训练,并进行数据验证,最终实现补全时间知识图的目的。
在本实施例中,所述步骤S2中所述利用3DRTE模型中的自注意力机制处理时间戳的各个片段带来的信息的具体内容为:
给定一个时间知识四元组(s,r,o,t),在本实施例中仅考虑关系r和时间t,因此令它们的维度都是k;对于关系r,它来自关系的嵌入矩阵其中N表示整个知识图谱中关系类型的个数;对于时间t,它是一个由l个token组成的时间戳,对每个token,都从矩阵获得它们的表示,其中L表示知识图谱中时间token类型的个数;为了让关系自适应于每一个时间token带来的信息,引入自注意力(self-attention)机制处理关系-时间序列;自注意力通过计算每一个token对关系的影响程度,从而有选择性的融合特征;具体计算过程如下:(如图2所示)
首先,将关系和时间序列拼接作为整个计算图的输入I,即
I=[r;t1;t2......;tl] (1)
把I分别输入进三个参数矩阵WU、WK、WV,经过简单的线性变换得到查询(Query)矩阵U、键(Key)矩阵K以及值(Value)矩阵V,即
之后,为了计算每个查询矩阵U对每个键矩阵K的权重,先将K转置得到KT,与U作矩阵乘法之后,经过softmax的激活,得到每个时间token对关系r的权重矩阵最后,将V乘以即得到最后的输出矩阵O,公式化为:
O=V×softmax(KT×U) (3)
只取O的第一行作为输出,即融合了时序信息的关系表示rt。
在本实施例中,步骤S2中所述利用3DRTE模型中的四元数的旋转特性获得实体在关系旋转下的得分函数具体内容为:
从每一个维度即从1到k,k表示嵌入向量的维度,其调整为(128,256,512),考虑实体和关系的交互;首先,头实体s和尾实体o都被表示成一组(x,y,z)坐标;对于关系r,根据公式s=ror-1中的几何意义,将其表示为给实体带来空间旋转的四元数Qr∈H;令旋转角θ∈[-π,π],则四元数表示为:
施加两个假设Qr的实部为零且a2+b2+c2=1,使得四元数的作用对应一种特定的空间旋转,用以进一步计算之所以第一项用的是既定θ的一半,是因为Qr会将三维点旋转到四维空间中,为了使得到的点仍在三维,从而保持与尾实体的特征匹配,则需再施加一个Q-1的r旋转,即
则实体s在关系r作用下的三维旋转表示为
然后,通过l2范数计算旋转后头实体坐标与尾实体坐标的距离,作为评估每一维度的得分,即
最后,一个三元组(s,r,o)的得分来自每个维度得分的和,即
对关系四元数嵌入r∈Hk的每个部分进行时间融合,即
rt=(ft(p),ft(q),ft(u),ft(v)) (9)
在本实施例中,所述公式s=ror-1的几何意义为:
给定一个三元组(s,r,o),基于这样的一个三维旋转假设:
s=ror-1 (11)
其中s,o∈Zk表示实体s,o的嵌入,r∈Hk表示关系r的嵌入(在本实施例中,粗体符号表示相对应的嵌入表示)。将实体投影到三元数的高维空间中,即实体的每一个维度都对应于空间中的一个点,并利用四元数Quaternion将关系建模为实体在空间中的旋转。
在本实施例中,步骤S3中所述的损失函数为:使用了RotatE中的自对抗负采样损失函数;
其中,γ是固定边界超参,σ表示sigmoid激活函数,四元组(s'i,r,o'i,t)是第i个负例,且
表示负采样四元组的概率分布,α是采样温度;
接着,使用Adam作为优化算法,并使用栅格检索法来寻找超参数,用以达到学习实体、关系和时间嵌入矩阵的目的;提供三个基准数据集进行链路实体预测验证,它们分别是ICEWS14、ICEWS05-15和GDELT,都划分成了训练集、验证集、测试集;对每个测试四元组,利用KG(知识图)中的全部实体,去替换其头实体或者尾实体,来产生新的四元组,遵循(filter)过滤的设置,过滤掉其中已经在训练集中出现过的四元组;利用公式(10)来对每个新四元组评分,对这些分数升序排序之后,得到每个四元组的排名;引入三项指标来评估排序结果的正确性:
平均排名MR:即每个正确实体在预测结果中的排名的平均值,越小的MR说明模型预测的准确性越高;
平均倒数排名MRR:即每个正确实体在预测结果中的排名倒数的平均值,越大的MRR越好;
前k名的命中率hit@k,取k的值为1,3,10:即每个正确实体在前k名的命中比重,越大说明结果越好;
经过损失函数训练模型后得到高评估指标的模型F之后,将模型应用于G中,遍历G中的所有实体和关系,组合成(s,r,?,t)的查询对,同时过滤掉已经出现在G中的查询,最后得到的集合作为查询集;对于查询集中的每一个查询,通过F预测出它对应的尾实体t,这样每一个查询都得到了补全,变成了四元组,将它们加入G,最后得到W。
实验表明,在各项指标上都优于其他现有的模型,因此,认为本实施例能够有效补全知识图谱。
较佳的,在本实施例中,
定义(四元数Quaternion)由爱尔兰数学家哈密顿在1843年发明的数学概念。与简单的复数类似,四元数是由实数加上三个虚数单位i、j、k组成,即四元数可表示为Q=a+bi+cj+dk,其中a,b,c,d都是实数。四元数的其他主要相关运算如下:
乘法(Multiplication):四元数的乘法满足各个部分之间的乘法分配律,乘法不满足交换律,但是满足结合律。四元数Q1乘以Q2,在几何意义上可以理解为先以Q1的大小放缩,然后施加一种特殊的四维旋转,即
较佳的,本实施例为了建模关系的三种基本模式,同时又能够高效地融入知识的时间增益,本实施例提出了一种全新的时间知识嵌入模型ThreeDimensionalRotationTimeEmbedding(3DRTE)。该模型的总体结构如图1所示。首先,为了充分建模时间特定的关系,引入自注意力融合关系和时间;其次,对于每一个维度,我们将实体视为三维空间中的点,借助四元数建模关系,使得实体在关系的作用下进行三维旋转。
较佳的,在本实施例中:
①在时间知识图谱的背景下,提出了三维空间旋转的嵌入方法(3DRTE)。
②本实施例提出利用自注意力机制处理时间戳的各个片段带来的信息,它能够有效增强关系的表示。
③本实施例借助了四元数的旋转特性,将实体在融合了时间的关系的作用下,旋转建模在了三维空间中,从而获得了蕴含时间和关系的实体表示,最终达到了补全时间知识图的目的。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (5)
1.一种3DRTE时间知识图谱的三维旋转嵌入方法,其特征在于:包括以下步骤:
步骤S1:定义时间知识图谱TKG,给定实体集合E,关系集合R,时间戳集合T,一个TKG表示为时间事实四元组(s,r,o,t)的集合其中s,o∈E表示实体,r∈R表示关系;令已知的时间事实集合为G,且则TKGC的目的就是在现有知识G的基础上推导出W,即在给定已知事实集合G的情况下补全出TKG的全貌W;
步骤S2:建立3DRTE模型,包括利用自注意力机制处理时间戳的各个片段带来的信息和利用四元数的旋转特性,将实体在融合了时间的关系的作用下,旋转建模在了三维空间中,从而获得实体在关系旋转下的得分函数,即完成模型建立;
步骤S3:将步骤S2中得到的模型使用损失函数进行训练,并进行数据验证,最终实现补全时间知识图的目的。
2.根据权利要求1所述的一种3DRTE时间知识图谱的三维旋转嵌入方法,其特征在于:所述步骤S2中所述利用3DRTE模型中的自注意力机制处理时间戳的各个片段带来的信息的具体内容为:
给定一个时间知识四元组(s,r,o,t),仅考虑关系r和时间t,因此令它们的维度都是k;对于关系r,它来自关系的嵌入矩阵其中N表示整个知识图谱中关系类型的个数;对于时间t,它是一个由l个token组成的时间戳,对每个token,都从矩阵获得它们的表示,其中L表示知识图谱中时间token类型的个数;为了让关系自适应于每一个时间token带来的信息,引入自注意力机制处理关系-时间序列;自注意力通过计算每一个token对关系的影响程度,从而有选择性的融合特征;具体计算过程如下:
首先,将关系和时间序列拼接作为整个计算图的输入I,即
I=[r;t1;t2......;tl] (1)
把I分别输入进三个参数矩阵WU、WK、WV,经过线性变换得到查询矩阵U、键矩阵K以及值矩阵V,即
之后,为了计算每个查询矩阵U对每个键矩阵K的权重,先将K转置得到KT,与U作矩阵乘法之后,经过softmax的激活,得到每个时间token对关系r的权重矩阵最后,将V乘以即得到最后的输出矩阵O,公式化为:
O=V×softmax(KT×U) (3)
只取O的第一行作为输出,即融合了时序信息的关系表示rt。
3.根据权利要求1所述的一种3DRTE时间知识图谱的三维旋转嵌入方法,其特征在于:步骤S2中所述利用3DRTE模型中的四元数的旋转特性获得实体在关系旋转下的得分函数具体内容为:
从每一个维度即从1到k,k表示嵌入向量的维度,其调整为(128,256,512),考虑实体和关系的交互;首先,头实体s和尾实体o都被表示成一组(x,y,z)坐标;对于关系r,根据公式s=ror-1中的几何意义,将其表示为给实体带来空间旋转的四元数Qr∈H;令旋转角θ∈[-π,π],则四元数表示为
施加两个假设Qr的实部为零且a2+b2+c2=1,使得四元数的作用对应一种特定的空间旋转,用以进一步计算之所以第一项用的是既定θ的一半,是因为Qr会将三维点旋转到四维空间中,为了使得到的点仍在三维,从而保持与尾实体的特征匹配,则需再施加一个的旋转,即
则实体s在关系r作用下的三维旋转表示为
然后,通过l2范数计算旋转后头实体坐标与尾实体坐标的距离,作为评估每一维度的得分,即
最后,一个三元组(s,r,o)的得分来自每个维度得分的和,即
对关系四元数嵌入r∈Hk的每个部分进行时间融合,即
rt=(ft(p),ft(q),ft(u),ft(v)) (9)
4.根据权利要求3所述的一种3DRTE时间知识图谱的三维旋转嵌入方法,其特征在于:所述公式s=ror-1的几何意义为:
给定一个三元组(s,r,o),基于这样的一个三维旋转假设:
s=ror-1 (11)
其中s,o∈Zk表示实体s,o的嵌入,r∈Hk表示关系r的嵌入将实体投影到三元数的高维空间中,即实体的每一个维度都对应于空间中的一个点,并利用四元数Quaternion将关系建模为实体在空间中的旋转。
5.根据权利要求1所述的一种3DRTE时间知识图谱的三维旋转嵌入方法,其特征在于:步骤S3中所述的损失函数为:使用了RotatE中的自对抗负采样损失函数;
其中,γ是固定边界超参,σ表示sigmoid激活函数,四元组(s'i,r,o'i,t)是第i个负例,且
表示负采样四元组的概率分布,α是采样温度;
接着,使用Adam作为优化算法,并使用栅格检索法来寻找超参数,用以达到学习实体、关系和时间嵌入矩阵的目的;提供三个基准数据集进行链路实体预测验证,它们分别是ICEWS14、ICEWS05-15和GDELT,都划分成了训练集、验证集、测试集;对每个测试四元组,利用KG中的全部实体,去替换其头实体或者尾实体,来产生新的四元组,遵循过滤的设置,过滤掉其中已经在训练集中出现过的四元组;利用公式(10)来对每个新四元组评分,对这些分数升序排序之后,得到每个四元组的排名;引入三项指标来评估排序结果的正确性:
平均排名MR:即每个正确实体在预测结果中的排名的平均值,越小的MR说明模型预测的准确性越高;
平均倒数排名MRR:即每个正确实体在预测结果中的排名倒数的平均值,越大的MRR越好;
前k名的命中率hit@k,取k的值为1,3,10:即每个正确实体在前k名的命中比重,越大说明结果越好;
经过损失函数训练模型后得到高评估指标的模型F之后,将模型应用于G中,遍历G中的所有实体和关系,组合成(s,r,?,t)的查询对,同时过滤掉已经出现在G中的查询,最后得到的集合作为查询集;对于查询集中的每一个查询,通过F预测出它对应的尾实体t,这样每一个查询都得到了补全,变成了四元组,将它们加入G,最后得到W。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011114740.XA CN112231469A (zh) | 2020-10-16 | 2020-10-16 | 一种3drte时间知识图谱的三维旋转嵌入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011114740.XA CN112231469A (zh) | 2020-10-16 | 2020-10-16 | 一种3drte时间知识图谱的三维旋转嵌入方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112231469A true CN112231469A (zh) | 2021-01-15 |
Family
ID=74118792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011114740.XA Pending CN112231469A (zh) | 2020-10-16 | 2020-10-16 | 一种3drte时间知识图谱的三维旋转嵌入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112231469A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254661A (zh) * | 2021-04-09 | 2021-08-13 | 浙江工业大学 | 一种引入实体上下文的三维旋转知识图谱嵌入方法 |
CN113946695A (zh) * | 2021-12-20 | 2022-01-18 | 山东新希望六和集团有限公司 | 动物系谱的生成方法、装置及计算机设备 |
CN117093727A (zh) * | 2023-10-16 | 2023-11-21 | 湖南董因信息技术有限公司 | 基于时间关系感知的时序知识图谱补全方法 |
-
2020
- 2020-10-16 CN CN202011114740.XA patent/CN112231469A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254661A (zh) * | 2021-04-09 | 2021-08-13 | 浙江工业大学 | 一种引入实体上下文的三维旋转知识图谱嵌入方法 |
CN113254661B (zh) * | 2021-04-09 | 2022-09-23 | 浙江工业大学 | 一种引入实体上下文的三维旋转知识图谱嵌入方法 |
CN113946695A (zh) * | 2021-12-20 | 2022-01-18 | 山东新希望六和集团有限公司 | 动物系谱的生成方法、装置及计算机设备 |
CN113946695B (zh) * | 2021-12-20 | 2022-04-22 | 山东新希望六和集团有限公司 | 动物系谱的生成方法、装置及计算机设备 |
CN117093727A (zh) * | 2023-10-16 | 2023-11-21 | 湖南董因信息技术有限公司 | 基于时间关系感知的时序知识图谱补全方法 |
CN117093727B (zh) * | 2023-10-16 | 2024-01-05 | 湖南董因信息技术有限公司 | 基于时间关系感知的时序知识图谱补全方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112231469A (zh) | 一种3drte时间知识图谱的三维旋转嵌入方法 | |
CN107871014A (zh) | 一种基于深度融合哈希的大数据跨模态检索方法及系统 | |
CN111126488A (zh) | 一种基于双重注意力的图像识别方法 | |
CN110826338B (zh) | 一种单选择门与类间度量的细粒度语义相似识别的方法 | |
CN113254549B (zh) | 人物关系挖掘模型的训练方法、人物关系挖掘方法及装置 | |
CN111563192B (zh) | 实体对齐方法、装置、电子设备及存储介质 | |
CN113628059B (zh) | 一种基于多层图注意力网络的关联用户识别方法及装置 | |
CN112416956B (zh) | 一种基于bert和独立循环神经网络的问句分类方法 | |
CN104598611A (zh) | 对搜索条目进行排序的方法及系统 | |
CN110807509A (zh) | 一种基于贝叶斯神经网络的深度知识追踪方法 | |
CN112256971A (zh) | 一种序列推荐方法及计算机可读存储介质 | |
CN113987196A (zh) | 一种基于知识图谱蒸馏的知识图谱嵌入压缩方法 | |
CN117196763A (zh) | 基于时序感知自注意力和对比学习的商品序列推荐方法 | |
CN115049397A (zh) | 识别社交网络中的风险账户的方法及装置 | |
CN114971066A (zh) | 融合遗忘因素和学习能力的知识追踪方法及系统 | |
CN111259264A (zh) | 一种基于生成对抗网络的时序评分预测方法 | |
CN116306780B (zh) | 一种动态图链接生成方法 | |
CN117150069A (zh) | 基于全局与局部语义对比学习的跨模态检索方法及系统 | |
CN115526293B (zh) | 一种顾及语义和结构信息的知识图谱推理方法 | |
CN115174268B (zh) | 基于结构化正则项的入侵检测方法 | |
CN112836511B (zh) | 基于协同关系的知识图谱上下文嵌入方法 | |
Liu et al. | Model design and parameter optimization of CNN for side-channel cryptanalysis | |
CN110727705B (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
CN113449047A (zh) | 知识图谱补全方法与装置 | |
CN113780027A (zh) | 一种基于增广图卷积的多标签物体识别方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210115 |