CN115526293A - 一种顾及语义和结构信息的知识图谱推理方法 - Google Patents

一种顾及语义和结构信息的知识图谱推理方法 Download PDF

Info

Publication number
CN115526293A
CN115526293A CN202211193222.0A CN202211193222A CN115526293A CN 115526293 A CN115526293 A CN 115526293A CN 202211193222 A CN202211193222 A CN 202211193222A CN 115526293 A CN115526293 A CN 115526293A
Authority
CN
China
Prior art keywords
node
current node
entity
information
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211193222.0A
Other languages
English (en)
Other versions
CN115526293B (zh
Inventor
周艳
朱英华
王家琦
唐岭军
包颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Planning And Natural Resources Data Management Center
University of Electronic Science and Technology of China
Original Assignee
Shenzhen Planning And Natural Resources Data Management Center
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Planning And Natural Resources Data Management Center, University of Electronic Science and Technology of China filed Critical Shenzhen Planning And Natural Resources Data Management Center
Publication of CN115526293A publication Critical patent/CN115526293A/zh
Application granted granted Critical
Publication of CN115526293B publication Critical patent/CN115526293B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/027Frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种顾及语义和结构信息的知识图谱推理方法,其包括以下步骤:生成目标知识图谱中当前节点i的实体描述信息的特征矩阵;获取当前节点i的关系为r的邻域中实体节点的特征向量;获取目标知识图谱中不同关系的邻域实体节点对当前节点i的规范化权重系数;基于当前节点i的关系为r的邻域中实体节点的特征向量和当前节点i的实体描述信息的特征矩阵获取当前节点i的顾及节点特征和语义信息的特征向量;获取当前节点i的结构信息;将当前节点i的顾及语义信息的特征向量和结构信息进行特征融合,得到当前节点i的综合隐性特征向量,进行知识推理。本发明解决了现有技术在学习信息过程中未能获取到图谱结构信息和节点实体描述信息的问题。

Description

一种顾及语义和结构信息的知识图谱推理方法
技术邻域
本发明属于知识图谱推理技术领域,尤其涉及一种顾及语义和结构信息的知识图谱推理方法。
背景技术
知识推理是在已建好的知识图谱基础上进一步挖掘隐含的知识,对知识图谱的内容进行丰富和扩展。目前,知识推理方法可以归纳为以下几种方法:基于路径、基于张量分解、基于向量空间、以及以图卷积神经网络(GCN)为代表的深度学习。基于路径的推理方法是利用链接两个实体间的路径来判断它们之间潜在的关系,能够深层次地反映出现实世界事务之间的联系;基于张量分解的方法是将高维的多关系数据通过张量分解后,降低数据维数和复杂度;基于向量空间的方法是将构成知识图谱的实体、关系、属性和值进行向量表示,映射进本征向量空间并在该空间内进行推导;以GCN为代表的深度学习,核心是引入深度学习思想,将知识图谱上的推理过程转化为深度学习问题。
基于GCN的推理,是利用神经网络直接建模知识图谱事实元组,得到事实元组元素的向量表示,用于进一步的推理。关系图卷积神经网络(R-GCN)是将GCN扩展到有向图中,利用知识图谱中的关系信息进行知识推理。R-GCN使用特定于关系的共享权重机制,即卷积核权重的确定取决于边的类型和方向,但是对邻域实体信息学习过程中使用了统一的归一化常数作为权重,未对实体间的相关性进行考虑。并且,R-GCN对邻域实体信息学习过程中只能获取知识图谱的节点特征信息,未能收集节点包含的实体描述信息;结构信息在计算中消失了,结构只是起到平滑和聚合的作用,而真正发挥作用的是节点上的特征。
发明内容
针对现有技术中的上述不足,本发明解决现有技术在学习信息过程中未能获取到图谱的结构信息和节点的实体描述信息的问题。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种顾及语义和结构信息的知识图谱推理方法,其包括以下步骤:
S1、获取目标知识图谱,生成目标知识图谱中当前节点i的实体描述信息的特征矩阵;获取当前节点i的关系为r的邻域中实体节点的特征向量;
S2、通过注意力机制获取目标知识图谱中不同关系的邻域实体节点对当前节点i的规范化权重系数;
S3、将当前节点i的关系为r的邻域中实体节点的特征向量和当前节点i的实体描述信息的特征矩阵作为图卷积层的输入,得到当前节点i的顾及节点特征和语义信息的特征向量;
S4、提取当前节点i周围K-hop的节点和其邻域的实体和关系,得到当前节点i的结构信息;
S5、将当前节点i的顾及节点特征和语义信息的特征向量和当前节点i的结构信息进行特征融合,得到当前节点i的综合隐性特征向量,进而得到目标知识图谱中所有节点的综合隐性特征向量;
S6、将节点的综合隐性特征向量用于知识推理,得到推理结果。
进一步地,步骤S1的具体方法包括以下子步骤:
S1-1、获取目标知识图谱,对目标知识图谱中的实体节点和关系类型进行编号;其中目标知识图谱中包含R种关系和N个实体节点;
S1-2、通过Doc2Vec工具包中PV-DM模型对当前节点i及与当前节点i的关系为r的邻域中实体节点的描述信息进行处理,得到当前节点i的实体描述信息的特征向量mi,以及关系r下当前节点i的实体描述信息的特征矩阵M(r)
Figure BDA0003869805180000031
进而得到与当前节点i的所有关系下的实体描述信息的特征矩阵;其中
Figure BDA0003869805180000032
为关系r下当前节点i的邻域中第j个实体节点的实体描述信息的特征向量;
Figure BDA0003869805180000033
为关系r下当前节点i的邻域中实体节点的总数。
进一步地,步骤S2的具体方法包括以下子步骤:
S2-1、根据实体节点编号顺序,生成实体嵌入矩阵X;
S2-2、根据公式:
Figure BDA0003869805180000034
对实体嵌入矩阵X通过可学习共享线性变换矩阵W(r)进行线性变换,得到关系r下的中间表示矩阵G;其中gN表示第N个实体节点的中间表示向量;
S2-3、根据公式:
Figure BDA0003869805180000035
通过注意力机制获取关系r下当前节点i与邻域中第j个实体节点的相关系数
Figure BDA0003869805180000036
为当前节点i自身的线性变换结果;a(·)表示注意力机制的内积操作;LeakyReLU(·)表示LeakyReLU非线性转换;W为转置参数,用于将长向量转成短向量;
S2-4、根据公式:
Figure BDA0003869805180000037
获取关系r下邻域实体节点j对当前节点i的规范化权重系数
Figure BDA0003869805180000038
进而得到不同关系的邻域实体节点对当前节点i的规范化权重系数;
Figure BDA0003869805180000039
表示关系r下当前节点i与邻域中第k*个实体节点的相关系数;exp(·)为以自然常数e为底的指数函数;softmax(·)表示softmax函数。
进一步地,步骤S3的具体方法为:
将当前节点i的关系为r的邻域中实体节点的特征向量输入图卷积层,将当前节点i的实体描述信息的特征矩阵输入图卷积层,根据公式:
Figure BDA0003869805180000041
Figure BDA0003869805180000042
获取通过L层图卷积层得到的当前节点i的顾及节点特征和语义信息的特征向量
Figure BDA0003869805180000043
其中σ{·}表示激活函数;Wr
Figure BDA0003869805180000044
均为转换矩阵;
Figure BDA0003869805180000045
表示关系r下当前节点i的实体描述信息的特征矩阵M(r)在第L-1次卷积后的结果;
Figure BDA0003869805180000046
表示通过L-1层图卷积层得到的当前节点i的顾及节点特征和语义信息的特征向量;
Figure BDA0003869805180000047
表示通过第1层图卷积层得到的当前节点i的顾及节点特征和语义信息的特征向量;
Figure BDA0003869805180000048
表示关系r下当前节点i的邻域实体节点j的特征向量;
Figure BDA0003869805180000049
表示
Figure BDA00038698051800000410
通过L-1层图卷积层得到的结果。
进一步地,步骤S4的具体方法包括以下子步骤:
S4-1、提取当前节点i周围K-hop的节点作为结构子图A;
S4-2、获取结构子图A中的所有顶点,得到顶点集V;
S4-3、通过L层改进的Graph SAGE网络来对结构子图A中第i*个顶点进行结构信息的提取,得到第i*个顶点的隐藏信息
Figure BDA00038698051800000411
S4-4、根据公式:
Figure BDA00038698051800000412
获取当前节点i的结构信息
Figure BDA00038698051800000413
其中V表示当前节点i对应的结构子图A的顶点总数。
进一步地,步骤S4-1的具体方法为:
选取目标头节点i实体节点和尾实体节点周围的1跳到3跳的子图作为结构子图A。
进一步地,步骤S4-3的具体方法包括以下子步骤:
S4-3-1、根据公式:
Figure BDA0003869805180000051
通过L层改进的Graph SAGE网络对结构子图A进行AGGREGATE聚合,得到第i*个顶点的聚合信息
Figure BDA0003869805180000052
其中
Figure BDA0003869805180000053
表示第i*个顶点的初始特征向量
Figure BDA0003869805180000054
在通过L-1层改进的GraphSAGE网络聚合后的结果;N(i*)表示自当前节点i周围跳数小于k的邻域节点;AGGREGATEk(·)表示AGGREGATE聚合函数;
S4-3-2、根据公式:
Figure BDA0003869805180000055
进行CONCAT操作,得到第i*个顶点的隐藏信息
Figure BDA0003869805180000056
其中L=1时,
Figure BDA0003869805180000057
为当前节点i的初始特征向量;ReLU(·)表示ReLU函数;WL为权重矩阵。
进一步地,步骤S5的具体方法为:
根据公式:
Figure BDA0003869805180000058
获取当前节点i的综合隐性特征向量fi,进而得到目标知识图谱中所有节点的综合隐性特征向量;其中
Figure BDA0003869805180000059
表示矩阵乘法运算;
Figure BDA00038698051800000510
为当前节点i的结构信息;
Figure BDA00038698051800000511
为当前节点i的顾及节点特征和语义信息的特征向量。
本发明的有益效果为:
(1)解决了R-GCN在获取信息时,对邻域实体信息的学习中未能有效利用图谱的结构信息和节点的实体描述信息的问题,更加完善获取知识图谱所包含的丰富信息,增加了知识推理结果的准确性;
(2)考虑了实体间的相关性,为邻域中的不同节点指定不同权重,从而有效衡量不同邻域节点对当前节点的影响程度。
附图说明
图1为本方法的流程示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术邻域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术邻域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,该顾及语义和结构信息的知识图谱推理方法包括以下步骤:
S1、获取目标知识图谱,生成目标知识图谱中当前节点i的实体描述信息的特征矩阵;获取当前节点i的关系为r的邻域中实体节点的特征向量;
S2、通过注意力机制获取目标知识图谱中不同关系的邻域实体节点对当前节点i的规范化权重系数;
S3、将当前节点i的关系为r的邻域中实体节点的特征向量和当前节点i的实体描述信息的特征矩阵作为图卷积层的输入,得到当前节点i的顾及节点特征和语义信息的特征向量;
S4、提取当前节点i周围K-hop的节点和其邻域的实体和关系,得到当前节点i的结构信息;
S5、将当前节点i的顾及节点特征和语义信息的特征向量和当前节点i的结构信息进行特征融合,得到当前节点i的综合隐性特征向量,进而得到目标知识图谱中所有节点的综合隐性特征向量;
S6、将节点的综合隐性特征向量用于知识推理,得到推理结果。
步骤S1的具体方法包括以下子步骤:
S1-1、获取目标知识图谱,对目标知识图谱中的实体节点和关系类型进行编号;其中目标知识图谱中包含R种关系和N个实体节点;
S1-2、通过Doc2Vec工具包中PV-DM模型对当前节点i及与当前节点i的关系为r的邻域中实体节点的描述信息进行处理,得到当前节点i的实体描述信息的特征向量mi,以及关系r下当前节点i的实体描述信息的特征矩阵M(r)
Figure BDA0003869805180000071
进而得到与当前节点i的所有关系下的实体描述信息的特征矩阵;其中
Figure BDA0003869805180000072
为关系r下当前节点i的邻域中第j个实体节点的实体描述信息的特征向量;
Figure BDA0003869805180000073
为关系r下当前节点i的邻域中实体节点的总数。
步骤S2的具体方法包括以下子步骤:
S2-1、根据实体节点编号顺序,生成实体嵌入矩阵X;
S2-2、根据公式:
Figure BDA0003869805180000074
对实体嵌入矩阵X通过可学习共享线性变换矩阵W(r)进行线性变换,得到关系r下的中间表示矩阵G;其中gN表示第N个实体节点的中间表示向量;
S2-3、根据公式:
Figure BDA0003869805180000075
通过注意力机制获取关系r下当前节点i与邻域中第j个实体节点的相关系数
Figure BDA0003869805180000076
为当前节点i自身的线性变换结果;a(·)表示注意力机制的内积操作;LeakyReLU(·)表示LeakyReLU非线性转换;W为转置参数,用于将长向量转成短向量;
S2-4、根据公式:
Figure BDA0003869805180000081
获取关系r下邻域实体节点j对当前节点i的规范化权重系数
Figure BDA0003869805180000082
进而得到不同关系的邻域实体节点对当前节点i的规范化权重系数;
Figure BDA0003869805180000083
表示关系r下当前节点i与邻域中第k*个实体节点的相关系数;exp(·)为以自然常数e为底的指数函数;softmax(·)表示softmax函数。
,步骤S3的具体方法为:将当前节点i的关系为r的邻域中实体节点的特征向量输入图卷积层,将当前节点i的实体描述信息的特征矩阵输入图卷积层,根据公式:
Figure BDA0003869805180000084
Figure BDA0003869805180000085
获取通过L层图卷积层得到的当前节点i的顾及节点特征和语义信息的特征向量
Figure BDA0003869805180000086
其中σ{·}表示激活函数;Wr
Figure BDA0003869805180000087
均为转换矩阵;
Figure BDA0003869805180000088
表示关系r下当前节点i的实体描述信息的特征矩阵M(r)在第L-1次卷积后的结果;
Figure BDA0003869805180000089
表示通过L-1层图卷积层得到的当前节点i的顾及节点特征和语义信息的特征向量;
Figure BDA00038698051800000810
表示通过第1层图卷积层得到的当前节点i的顾及节点特征和语义信息的特征向量;
Figure BDA00038698051800000811
表示关系r下当前节点i的邻域实体节点j的特征向量;
Figure BDA00038698051800000812
表示
Figure BDA00038698051800000813
通过L-1层图卷积层得到的结果。
步骤S4的具体方法包括以下子步骤:
S4-1、提取当前节点i周围K-hop的节点作为结构子图A;
S4-2、获取结构子图A中的所有顶点,得到顶点集V;
S4-3、通过L层改进的Graph SAGE网络来对结构子图A中第i*个顶点进行结构信息的提取,得到第i*个顶点的隐藏信息
Figure BDA0003869805180000091
S4-4、根据公式:
Figure BDA0003869805180000092
获取当前节点i的结构信息
Figure BDA0003869805180000093
其中V表示当前节点i对应的结构子图A的顶点总数。
步骤S4-1的具体方法为:选取目标头节点i实体节点和尾实体节点周围的1跳到3跳的子图作为结构子图A。
步骤S4-3的具体方法包括以下子步骤:
S4-3-1、根据公式:
Figure BDA0003869805180000094
通过L层改进的Graph SAGE网络对结构子图A进行AGGREGATE聚合,得到第i*个顶点的聚合信息
Figure BDA0003869805180000095
其中
Figure BDA0003869805180000096
表示第i*个顶点的初始特征向量
Figure BDA0003869805180000097
在通过L-1层改进的GraphSAGE网络聚合后的结果;N(i*)表示自当前节点i周围跳数小于k的邻域节点;AGGREGATEk(·)表示AGGREGATE聚合函数;
S4-3-2、根据公式:
Figure BDA0003869805180000098
进行CONCAT操作,得到第i*个顶点的隐藏信息
Figure BDA0003869805180000099
其中L=1时,
Figure BDA00038698051800000910
为当前节点i的初始特征向量;ReLU(·)表示ReLU函数;WL为权重矩阵。
步骤S5的具体方法为:根据公式:
Figure BDA00038698051800000911
获取当前节点i的综合隐性特征向量fi,进而得到目标知识图谱中所有节点的综合隐性特征向量;其中
Figure BDA0003869805180000101
表示矩阵乘法运算;
Figure BDA0003869805180000102
为当前节点i的结构信息;
Figure BDA0003869805180000103
为当前节点i的顾及节点特征和语义信息的特征向量。
在具体实施过程中,a(·)是2倍
Figure BDA0003869805180000104
长度,即与
Figure BDA0003869805180000105
Figure BDA0003869805180000106
拼接起来的长度一样。结构信息,是只在对当前节点周围信息进行表示信息的聚合收集,而不是对整个图谱中所有的信息进行收集。在整个图谱中,每一个节点都有特征信息、实体描述信息,但是结构信息是需要邻居节点构成子图才能体现。相对于现有技术R-GCN,本发明的核心改进点是:在原本获取节点特征信息基础上,可以学习到节点包含的丰富的实体描述信息、知识图谱的结构信息;核心改进物理层面原理:R-GCN对邻域实体信息学习过程中能获取知识图谱的节点特征信息,未能收集节点包含的实体描述信息;结构信息在计算中消失了,结构只是起到平滑和聚合的作用,而真正发挥作用的是节点上的特征。本发明通过顾及结构和语义的图卷积神经网络(SR-GCN),解决了在学习信息过程中,现有技术未能获取到图谱的结构信息和节点的实体描述信息的技术问题。本发明在特征提取过程中,充分利用知识图谱包含的信息,提取更全面有用的特征,从而对邻域实体信息学习效果更好,进而提高推理的准确度。
在本发明的一个实施例中,本发明涉及的知识推理任务包括实体分类和链接预测。其中实体分类的具体方法为:
将已知实体类别的节点的具体类别和综合隐性特征向量作为训练数据,对分类模型进行训练,将分类模型输出的分类结果和实际类别进行最小化交叉熵损失计算,并根据损失值对分类模型的参数进行优化,使得损失最小,得到训练后的分类模型。将未知实体类别的节点的综合隐性特征向量作为训练后的分类模型的输入,将训练后的分类模型的输出作为未知实体类别的节点的类别,进而完成实体分类。
链接预测的具体方法为:
A1、根据当前节点i的实体集合信息和关系集合信息,构造当前节点i的关系稀疏矩阵,其中关系稀疏矩阵的行数、列数、值分别代表知识图谱中的所有实体、与当前实体相关联的边数、该边的关系类型,进而得到关系特征向量wr
A2、选择打分函数ComplEx:链接预测其实是预测一个三元组(subject,relation,object),subject和object均为实体,relation为关系,通过一个打分函数f(s,r,o)来判断(subject,relation,object)是否符合要求。R-GCN利用DistMult作为打分函数,但DistMult不能很好地处理非对称关系。ComplEx模型将DistMult推广到复域中,利用嵌入的复共轭处理KG中的不对称关系,通过分离综合隐性特征向量hs的实部和虚部,能够准确描述实体间的对称关系和反对称关系,打分函数的表达式为:
f(s,r,o)=Re(<wr,hs,h0>)=
<Re(wr),Re(hs),Re(h0)>+
<Re(wr),Im(hs),Im(h0)>+
<Im(wr),Re(hs),Im(h0)>-
<Im(wr),Im(hs),Re(h0)>
其中,Re(wr)、Im(wr)分别表示(subject,relation,object)中关系特征向量的对称虚部、反对称虚部;Re(hs)、Im(hs)是(subject,relation,object)中相对应的实体特征向量的实部和虚部;
A3、通过交叉熵损失函数对打分结果进行优化:考虑负采样的训练方式:对于观测样本,随机修改某些正三元组的头实体或尾实体作为训练的负样本,使正负样本比例为1∶1,并通过交叉熵损失函数对打分结果进行优化:
Figure BDA0003869805180000121
其中T为所有正负样本集合;y为指示器,y=1对应正三元组,y=0对应负三元组;σ为逻辑sigmoid函数。
综上所述,本发明解决了现有技术在学习信息过程中未能获取到图谱的结构信息和节点的实体描述信息的问题。

Claims (8)

1.一种顾及语义和结构信息的知识图谱推理方法,其特征在于,包括以下步骤:
S1、获取目标知识图谱,生成目标知识图谱中当前节点i的实体描述信息的特征矩阵;获取当前节点i的关系为r的邻域中实体节点的特征向量;
S2、通过注意力机制获取目标知识图谱中不同关系的邻域实体节点对当前节点i的规范化权重系数;
S3、将当前节点i的关系为r的邻域中实体节点的特征向量和当前节点i的实体描述信息的特征矩阵作为图卷积层的输入,得到当前节点i的顾及节点特征和语义信息的特征向量;
S4、提取当前节点i周围K-hop的节点和其邻域的实体和关系,得到当前节点i的结构信息;
S5、将当前节点i的顾及节点特征和语义信息的特征向量和当前节点i的结构信息进行特征融合,得到当前节点i的综合隐性特征向量,进而得到目标知识图谱中所有节点的综合隐性特征向量;
S6、将节点的综合隐性特征向量用于知识推理,得到推理结果。
2.根据权利要求1所述的顾及语义和结构信息的知识图谱推理方法,其特征在于,步骤S1的具体方法包括以下子步骤:
S1-1、获取目标知识图谱,对目标知识图谱中的实体节点和关系类型进行编号;其中目标知识图谱中包含R种关系和N个实体节点;
S1-2、通过Doc2Vec工具包中PV-DM模型对当前节点i及与当前节点i的关系为r的邻域中实体节点的描述信息进行处理,得到当前节点i的实体描述信息的特征向量mi,以及关系r下当前节点i的实体描述信息的特征矩阵M(r)
Figure FDA0003869805170000011
进而得到与当前节点i的所有关系下的实体描述信息的特征矩阵;其中
Figure FDA0003869805170000021
为关系r下当前节点i的邻域中第j个实体节点的实体描述信息的特征向量;
Figure FDA0003869805170000022
为关系r下当前节点i的邻域中实体节点的总数。
3.根据权利要求2所述的顾及语义和结构信息的知识图谱推理方法,其特征在于,步骤S2的具体方法包括以下子步骤:
S2-1、根据实体节点编号顺序,生成实体嵌入矩阵X;
S2-2、根据公式:
Figure FDA0003869805170000023
对实体嵌入矩阵X通过可学习共享线性变换矩阵W(r)进行线性变换,得到关系r下的中间表示矩阵G;其中gN表示第N个实体节点的中间表示向量;
S2-3、根据公式:
Figure FDA0003869805170000024
通过注意力机制获取关系r下当前节点i与邻域中第j个实体节点的相关系数
Figure FDA0003869805170000025
Figure FDA0003869805170000026
为当前节点i自身的线性变换结果;a(·)表示注意力机制的内积操作;LeakyReLU(·)表示LeakyReLU非线性转换;W为转置参数,用于将长向量转成短向量;
S2-4、根据公式:
Figure FDA0003869805170000027
获取关系r下邻域实体节点j对当前节点i的规范化权重系数
Figure FDA0003869805170000028
进而得到不同关系的邻域实体节点对当前节点i的规范化权重系数;
Figure FDA0003869805170000029
表示关系r下当前节点i与邻域中第k*个实体节点的相关系数;exp(·)为以自然常数e为底的指数函数;softmax(·)表示softmax函数。
4.根据权利要求1所述的顾及语义和结构信息的知识图谱推理方法,其特征在于,步骤S3的具体方法为:
将当前节点i的关系为r的邻域中实体节点的特征向量输入图卷积层,将当前节点i的实体描述信息的特征矩阵输入图卷积层,根据公式:
Figure FDA0003869805170000031
Figure FDA0003869805170000032
获取通过L层图卷积层得到的当前节点i的顾及节点特征和语义信息的特征向量
Figure FDA0003869805170000033
其中σ{·}表示激活函数;Wr
Figure FDA0003869805170000034
均为转换矩阵;
Figure FDA0003869805170000035
表示关系r下当前节点i的实体描述信息的特征矩阵M(r)在第L-1次卷积后的结果;
Figure FDA0003869805170000036
表示通过L-1层图卷积层得到的当前节点i的顾及节点特征和语义信息的特征向量;
Figure FDA0003869805170000037
表示通过第1层图卷积层得到的当前节点i的顾及节点特征和语义信息的特征向量;
Figure FDA0003869805170000038
表示关系r下当前节点i的邻域实体节点j的特征向量;
Figure FDA0003869805170000039
表示
Figure FDA00038698051700000310
通过L-1层图卷积层得到的结果。
5.根据权利要求1所述的顾及语义和结构信息的知识图谱推理方法,其特征在于,步骤S4的具体方法包括以下子步骤:
S4-1、提取当前节点i周围K-hop的节点作为结构子图A;
S4-2、获取结构子图A中的所有顶点,得到顶点集V;
S4-3、通过L层改进的Graph SAGE网络来对结构子图A中第i*个顶点进行结构信息的提取,得到第i*个顶点的隐藏信息
Figure FDA00038698051700000311
S4-4、根据公式:
Figure FDA00038698051700000312
获取当前节点i的结构信息
Figure FDA0003869805170000041
其中V表示当前节点i对应的结构子图A的顶点总数。
6.根据权利要求5所述的顾及语义和结构信息的知识图谱推理方法,其特征在于,步骤S4-1的具体方法为:
选取目标头节点i实体节点和尾实体节点周围的1跳到3跳的子图作为结构子图A。
7.根据权利要求5所述的顾及语义和结构信息的知识图谱推理方法,其特征在于,步骤S4-3的具体方法包括以下子步骤:
S4-3-1、根据公式:
Figure FDA0003869805170000042
通过L层改进的Graph SAGE网络对结构子图A进行AGGREGATE聚合,得到第i*个顶点的聚合信息
Figure FDA0003869805170000043
其中
Figure FDA0003869805170000044
表示第i*个顶点的初始特征向量
Figure FDA0003869805170000045
在通过L-1层改进的Graph SAGE网络聚合后的结果;N(i*)表示自当前节点i周围跳数小于k的邻域节点;AGGREGATEk(·)表示AGGREGATE聚合函数;
S4-3-2、根据公式:
Figure FDA0003869805170000046
进行CONCAT操作,得到第i*个顶点的隐藏信息
Figure FDA0003869805170000047
其中L=1时,
Figure FDA0003869805170000048
为当前节点i的初始特征向量;ReLU(·)表示ReLU函数;WL为权重矩阵。
8.根据权利要求1所述的顾及语义和结构信息的知识图谱推理方法,其特征在于,步骤S5的具体方法为:
根据公式:
Figure FDA0003869805170000049
获取当前节点i的综合隐性特征向量fi,进而得到目标知识图谱中所有节点的综合隐性特征向量;其中
Figure FDA0003869805170000051
表示矩阵乘法运算;
Figure FDA0003869805170000052
为当前节点i的结构信息;
Figure FDA0003869805170000053
为当前节点i的顾及节点特征和语义信息的特征向量。
CN202211193222.0A 2022-09-13 2022-09-28 一种顾及语义和结构信息的知识图谱推理方法 Active CN115526293B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202211112286 2022-09-13
CN2022111122863 2022-09-13

Publications (2)

Publication Number Publication Date
CN115526293A true CN115526293A (zh) 2022-12-27
CN115526293B CN115526293B (zh) 2024-06-21

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116701664A (zh) * 2023-08-08 2023-09-05 安徽智享云科技有限公司 一种基于bim的多目标施工数据共享传输方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113010691A (zh) * 2021-03-30 2021-06-22 电子科技大学 一种基于图神经网络的知识图谱推理关系预测方法
CN113254663A (zh) * 2021-04-21 2021-08-13 浙江工业大学 一种融合图卷积与翻译模型的知识图谱联合表示学习方法
CN113486190A (zh) * 2021-06-21 2021-10-08 北京邮电大学 一种融合实体图像信息和实体类别信息的多模态知识表示方法
CN113780002A (zh) * 2021-08-13 2021-12-10 北京信息科技大学 基于图表示学习和深度强化学习的知识推理方法及装置
US20220147836A1 (en) * 2020-11-06 2022-05-12 Huazhong University Of Science And Technology Method and device for text-enhanced knowledge graph joint representation learning
CN114580638A (zh) * 2022-02-14 2022-06-03 中国人民解放军战略支援部队信息工程大学 基于文本图增强的知识图谱表示学习方法及系统
CN114611384A (zh) * 2022-02-25 2022-06-10 北京工业大学 基于图神经网络的医学知识图谱节点重要性评估方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220147836A1 (en) * 2020-11-06 2022-05-12 Huazhong University Of Science And Technology Method and device for text-enhanced knowledge graph joint representation learning
CN113010691A (zh) * 2021-03-30 2021-06-22 电子科技大学 一种基于图神经网络的知识图谱推理关系预测方法
CN113254663A (zh) * 2021-04-21 2021-08-13 浙江工业大学 一种融合图卷积与翻译模型的知识图谱联合表示学习方法
CN113486190A (zh) * 2021-06-21 2021-10-08 北京邮电大学 一种融合实体图像信息和实体类别信息的多模态知识表示方法
CN113780002A (zh) * 2021-08-13 2021-12-10 北京信息科技大学 基于图表示学习和深度强化学习的知识推理方法及装置
CN114580638A (zh) * 2022-02-14 2022-06-03 中国人民解放军战略支援部队信息工程大学 基于文本图增强的知识图谱表示学习方法及系统
CN114611384A (zh) * 2022-02-25 2022-06-10 北京工业大学 基于图神经网络的医学知识图谱节点重要性评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KEXI JI, ETAL.: "Graph Attention Networks With Local Structure Awareness for Knowledge Graph Completion", IEEE ACCESS, vol. 8, 14 December 2020 (2020-12-14), pages 224860 - 224870, XP011827644, DOI: 10.1109/ACCESS.2020.3044343 *
黄超: "基于图神经网络的知识推理研究与应用", 中国优秀硕士学位论文全文数据库 (信息科技辑), 15 January 2022 (2022-01-15), pages 1 - 109 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116701664A (zh) * 2023-08-08 2023-09-05 安徽智享云科技有限公司 一种基于bim的多目标施工数据共享传输方法及系统

Similar Documents

Publication Publication Date Title
CN111159425B (zh) 基于历史关系和双图卷积网络的时态知识图谱表示方法
CN109271522B (zh) 基于深度混合模型迁移学习的评论情感分类方法及系统
CN113590900A (zh) 一种融合动态知识图谱的序列推荐方法
CN112488791A (zh) 一种基于知识图谱卷积算法的个性化推荐方法
CN107480213B (zh) 基于时序文本网络的社区检测与用户关系预测方法
CN105024886B (zh) 一种基于用户元数据的快速Web服务QoS预测方法
CN116340524B (zh) 一种基于关系自适应网络的小样本时态知识图谱补全方法
CN111078876A (zh) 一种基于多模型集成的短文本分类方法和系统
CN111259264B (zh) 一种基于生成对抗网络的时序评分预测方法
CN116842260A (zh) 一种基于图神经网络多空间交互建模的知识增强推荐方法
CN115049062A (zh) 一种基于知识学习的数学应用题智能解题方法及系统
CN111340187A (zh) 基于对抗注意力机制的网络表征方法
CN110222737A (zh) 一种基于长短时记忆网络的搜索引擎用户满意度评估方法
Wang et al. EPNE: Evolutionary pattern preserving network embedding
CN115526293B (zh) 一种顾及语义和结构信息的知识图谱推理方法
US20230055980A1 (en) Systems and methods for inductive anomaly detection for attributed networks
CN115526293A (zh) 一种顾及语义和结构信息的知识图谱推理方法
CN116050523A (zh) 一种基于混合知识图的注意力引导增强的常识推理框架
CN116662564A (zh) 一种基于深度矩阵分解与知识图谱的服务推荐方法
CN114842247B (zh) 基于特征累加的图卷积网络半监督节点分类方法
CN112836511B (zh) 基于协同关系的知识图谱上下文嵌入方法
CN115063251A (zh) 基于关系强度与反馈机制的社交传播动态网络表示方法
CN113779385A (zh) 基于复杂网络图嵌入的好友关注度度量排序方法及系统
CN110851732A (zh) 基于非负矩阵三因子分解的属性网络半监督社团发现的方法
Weller et al. Evidential relational-graph convolutional networks for entity classification in knowledge graphs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant