CN112148892A - 动态知识图谱的知识补全方法、装置和计算机设备 - Google Patents

动态知识图谱的知识补全方法、装置和计算机设备 Download PDF

Info

Publication number
CN112148892A
CN112148892A CN202011022372.6A CN202011022372A CN112148892A CN 112148892 A CN112148892 A CN 112148892A CN 202011022372 A CN202011022372 A CN 202011022372A CN 112148892 A CN112148892 A CN 112148892A
Authority
CN
China
Prior art keywords
entity
representation
sample
vector representation
entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011022372.6A
Other languages
English (en)
Other versions
CN112148892B (zh
Inventor
朱承
丁兆云
朱席席
谢辉
刘斌
黄松平
朱先强
周鋆
汤罗浩
刘毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202011022372.6A priority Critical patent/CN112148892B/zh
Publication of CN112148892A publication Critical patent/CN112148892A/zh
Application granted granted Critical
Publication of CN112148892B publication Critical patent/CN112148892B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种动态知识图谱的知识补全方法、装置和计算机设备。所述方法包括:获取网络空间领域的动态知识图谱中实体的结构信息和属性信息,根据结构信息和属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示;根据样本头实体的增量式表示和对应的出边,得到样本头实体向量表示,以及获取样本尾实体的样本尾实体向量表示;确定样本实体向量表示和样本尾实体向量表示的关系表示;根据关系表示以及输入的查询头实体,输出推测尾实体。采用本方法能够提高动态知识图谱补全的效率。

Description

动态知识图谱的知识补全方法、装置和计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种动态知识图谱的知识补全方法、装置和计算机设备。
背景技术
动态知识图谱补全主要包括两个步骤:(1)动态知识图谱增量式表示学习;(2)动态知识图谱新知识补全。
动态知识图谱增量式表示学习:
随着网络空间的建设和网络技术的发展,网络数据量不断增大、网络传输速度不断提升,网络空间处在时刻快速变化的过程中。一方面,为了刻画网络空间的动态性,网络空间领域知识图谱应当动态变化,然而随着网络空间领域知识图谱规模的增大,加入新实体或删除旧实体后,重新训练知识嵌入的计算成本越来越高。另一方面,在大数据时代,对安全防御的响应速度要求越来越高,在实际的应用中可能一项分析或决策任务是以秒或毫秒为单位的,这就对网络空间的知识推理速度提出了更高的要求,而知识推理的结果依赖于实体和关系的嵌入表示,因此对动态变化的网络空间领域知识图谱的表示学习应当具有较高的时间效率。
动态知识图谱新知识补全:
一方面网络空间知识图谱本身受到完整性的制约,通过知识图谱中已有的知识推理出新的知识,并将其补充到知识图谱中,称之为知识图谱补全,是知识图谱研究的重要内容;另一方面,随着人们对网络空间研究和观察的不断深入以及网络空间本身动态性的特点,会不断地向知识图谱中加入新的关系类型。新关系类型的训练实例往往是非常稀疏的,由于覆盖的实体非常少,现有的知识图谱补全方法很往往难以捕捉到这种新关系的模式。
发明内容
基于此,有必要针对上述技术问题,提供一种能够解决动态知识图谱补全困难的动态知识图谱的知识补全方法、装置和计算机设备。
一种动态知识图谱的知识补全方法,所述方法包括:
获取网络空间领域的动态知识图谱中实体的结构信息和属性信息,根据所述结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示;
根据样本头实体的增量式表示和对应的出边,得到样本头实体向量表示,以及获取样本尾实体的样本尾实体向量表示;
确定所述样本实体向量表示和所述样本尾实体向量表示的关系表示;
根据所述关系表示以及输入的查询头实体,输出推测尾实体。
在其中一个实施例中,还包括:根据动态知识图谱中的实体,构建共享基实体库;
根据所述共享基实体库中的基实体的向量确定实体的结构信息为:
Figure BDA0002701056720000021
其中,
Figure BDA0002701056720000022
表示基实体,SBES表示共享基实体库,K表示取选择共享基实体库中的基实体的数量,es表示结构信息。
在其中一个实施例中,还包括:对所述共享基实体库中的基实体进行排序,得到共享基实体序列;
根据所述共享基实体序列以及实体对应的属性,确定实体的属性信息为:
Figure BDA0002701056720000023
其中,
Figure BDA0002701056720000024
表示共享基实体序列中基实体的属性向量表示,
Figure BDA0002701056720000025
表示实体对应的属性,et表示属性信息。
在其中一个实施例中,还包括:根据所述结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示为:
ejoint=α×es+(1-α)×et
其中,α表示超参数。
在其中一个实施例中,还包括:根据预先设置的应用图神经网络模型,生成实体向量表示为:
Figure BDA0002701056720000031
ωe表示实体e的实体向量表示,
Figure BDA0002701056720000032
为应用图神经网络模型的参数,Nε={(rk,ek)|(e,rk,ek)∈G}表示知识图谱中实体e的出边,vr表示关系的嵌入表示,ve表示实体e的增量式表示;
根据所述实体向量表示,学习得到样本头实体hr的样本头实体向量表示
Figure BDA0002701056720000033
和样本尾实体tr的样本尾实体向量表示
Figure BDA0002701056720000034
在其中一个实施例中,还包括:确定所述样本实体向量表示和所述样本尾实体向量表示的关系表示为:
Figure BDA0002701056720000035
其中,
Figure BDA0002701056720000036
表示关系表示,
Figure BDA0002701056720000037
为应用图神经网络模型的参数。
在其中一个实施例中,还包括:根据查询头实体,构建认知图;所述认知图中节点的隐藏信息为认知图中所有节点的信息;
根据所述关系表示和所述认知图,进行动态知识图谱补全。
一种动态知识图谱的知识补全装置,所述装置包括:
表示模块,用于获取网络空间领域的动态知识图谱中实体的结构信息和属性信息,根据所述结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示;
向量表示模块,用于根据样本头实体的增量式表示和对应的出边,得到样本头实体向量表示,以及获取样本尾实体的样本尾实体向量表示;
关系确定模块,用于确定所述样本实体向量表示和所述样本尾实体向量表示的关系表示;
补全模块,用于根据所述关系表示以及输入的查询头实体,输出推测尾实体。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取网络空间领域的动态知识图谱中实体的结构信息和属性信息,根据所述结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示;
根据样本头实体的增量式表示和对应的出边,得到样本头实体向量表示,以及获取样本尾实体的样本尾实体向量表示;
确定所述样本实体向量表示和所述样本尾实体向量表示的关系表示;
根据所述关系表示以及输入的查询头实体,输出推测尾实体。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取网络空间领域的动态知识图谱中实体的结构信息和属性信息,根据所述结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示;
根据样本头实体的增量式表示和对应的出边,得到样本头实体向量表示,以及获取样本尾实体的样本尾实体向量表示;
确定所述样本实体向量表示和所述样本尾实体向量表示的关系表示;
根据所述关系表示以及输入的查询头实体,输出推测尾实体。
上述动态知识图谱的知识补全方法、装置、计算机设备和存储介质,通过学习动态知识图谱中实体的增量式表示,无需重新训练动态知识图谱的嵌入表示,从而可以提高知识补全的效率,另外在具体进行动态知识图谱的补全时,只是要少量的样本,例如一组实体对,分别学习到样本头实体和样本尾实体的向量表示,从而进一步得到向量表示的关系表示,从而利用关系表示,在输入查询实体时,可以查询到出边对应的尾实体,从而进行知识图谱的补全。
附图说明
图1为一个实施例中动态知识图谱的知识补全方法的流程示意图;
图2为一个实施例中知识补全步骤的流程示意图;
图3为一个实施例中动态知识图谱的知识补全装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种动态知识图谱的知识补全方法,包括以下步骤:
步骤102,获取网络空间领域的动态知识图谱中实体的结构信息和属性信息,根据结构信息和属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示。
动态知识图谱是网络空间领域构建的知识图谱,动态知识图谱中的实体是通过对网络空间领域的知识进行实体识别和关系识别得到的,动态知识图谱指的是网络不断更新变化的知识图谱,更新变化具体可以是加入新实体或删除旧实体,知识图谱的变化,一方面影响着知识图谱中实体的嵌入,同时由于新加入关系类型的实例往往是非常稀疏,导致知识图谱的补全面临着问题。
针对上述动态知识图谱的特点,首先学习一种无须重新训练知识图谱的嵌入方式,即,根据结构信息和属性信息,通过超参数对实体进行融合。
步骤104,根据样本头实体的增量式表示和对应的出边,得到样本头实体向量表示,以及获取样本尾实体的样本尾实体向量表示。
出边指的是实体引出的边,出边表示还没与尾实体相连。样本头实体向量表示融合了其出边的信息,样本尾实体向量表示也融入了其出边信息。
步骤106,确定样本实体向量表示和样本尾实体向量表示的关系表示。
综合上述向量表示,可以得到关系表示,关系表示融入了大量知识图谱的信息,因此在少量样本的情况下,也可以对实体进行推测。
步骤108,根据关系表示以及输入的查询头实体,输出推测尾实体。
上述动态知识图谱的知识补全方法中,通过学习动态知识图谱中实体的增量式表示,无需重新训练动态知识图谱的嵌入表示,从而可以提高知识补全的效率,另外在具体进行动态知识图谱的补全时,只是要少量的样本,例如一组实体对,分别学习到样本头实体和样本尾实体的向量表示,从而进一步得到向量表示的关系表示,从而利用关系表示,在输入查询实体时,可以查询到出边对应的尾实体,从而进行知识图谱的补全。
在其中一个实施例中,根据动态知识图谱中的实体,构建共享基实体库,根据共享基实体库中的基实体的向量确定实体的结构信息为:
Figure BDA0002701056720000061
其中,
Figure BDA0002701056720000062
表示基实体,SBES表示共享基实体库,K表示取选择共享基实体库中的基实体的数量,es表示结构信息。
具体的,选择知识图谱中已有的实体作为联系新实体与旧实体之间的共享基实体库,不仅通过新实体的文本描述信息,还通过新实体的其他属性信息与原有知识图谱中的旧实体产生关联,用基实体库中的共享基实体序列(Shared Base Entity Series,SBES)来表征新实体的结构信息。
在另一个实施例中,对共享基实体库中的基实体进行排序,得到共享基实体序列,根据共享基实体序列以及实体对应的属性,确定实体的属性信息为:
Figure BDA0002701056720000063
其中,
Figure BDA0002701056720000064
表示共享基实体序列中基实体的属性向量表示,
Figure BDA0002701056720000065
表示实体对应的属性,et表示属性信息。
具体的,首先对共享相同属性的基实体序列中的每个实体和新实体进行属性值的距离计算,认为两者的属性值越相似,则两者的语义距离越近,例如对于计算机网络中硬件设备的尺寸属性,若新实体的高为10cm,那么我们认为在语义空间中,其距离高属性为15cm的基实体比高属性为1m的基实体关系更接近。基于这样的假设,将新实体按照属性维度对基实体进行排序(序列数应当等同于新实体的属性数),对每个属性序列取其前K个基实体,每个属性序列中基实体的排序越靠前,说明基实体的该项属性和新实体越接近,其应当对新实体在该属性维度的贡献越大。
在另一个实施例中,根据结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示为:
ejoint=α×es+(1-α)×et
其中,α表示超参数。
具体的,考虑网络空间领域知识图谱的动态性问题,就是在知识图谱中自动添新实体后,可以增量式的学习新实体的向量表示。它本质上是一个零样本学习问题。在零样本学习中,源域(source domain)与目标域(target domain)之间的关联决定了算法的泛化能力。相对应的,在动态知识图谱补全任务中,可以将In-KG实体(知识图谱中的实体)作为源域,Out-of-KG实体(新实体)作为目标域。因此,这个任务的关键在于增强In-KG实体与Out-of-KG实体之间的关联。
知识图谱中主要包含两类语义信息,一类是知识图谱的结构信息,具体而言就是知识图谱中的实体和关系信息;另一类是属性信息,具体而言包括实体和关系的各种属性以及文本描述等信息。事实上,实体的其他属性信息同样重要,同样蕴含了丰富的语义信息,例如在网络空间安全知识图谱中,一个硬件设备的尺寸信息、版本等都可以为知识表示提供有价值的信息。用es表示结构向量,用et表示属性向量。这两种向量各有优势:结构向量能捕获隐藏在三元组中的结构信息,而属性向量则可以从实体的属性中获得有价值的信息。
由于两种向量从不同角度对实体的语义进行了刻画,将它们融合在一起作为最终的联合向量。融合的方式是利用超参数进行线性融合:
ejoint=α×es+(1-α)×et
其中ejoint为知识嵌入的联合向量表示,α结构向量的权重,是一个超参数,值域范围为[0,1]。
对于三元组(h,r,t),分别使用
Figure BDA0002701056720000071
Figure BDA0002701056720000072
表示头实体和尾实体的联合嵌入,用向量r表示关系向量。为了验证联合向量的有效性以及可扩展性,将其应用到经典的表示学习算法TransH中,最终形成的能量函数如下:
Figure BDA0002701056720000081
其中||L1/L2分别表示L1范数和L2范数,wr代表关系r的超平面。
在其中一个实施例中,以数据高效的方式发现新关系的事实可以联系one-shot学习,图像分类任务中已经提出了相关的方法,尝试在只给出新类别的一个或几个实例时,能够识别出新类别的对象。类似地,针对知识图谱的新知识one-shot学习,它的目标是仅给出一个训练实例的情况下来揭示新关系的事实。
具体的,知识图谱可以表示为三元组的集合
Figure BDA0002701056720000082
在知识图谱中,one-shot的知识推理问题可以形式化为:给定一个新关系类型
Figure BDA0002701056720000083
的少量实体对
Figure BDA0002701056720000084
期望去预测包含新关系的三元组中缺失的实体
Figure BDA0002701056720000085
在这里主要考虑只给定一个包含新关系的三元组的情况,即m=1。但是这里的方法也可以扩展到少量样本的情况,在此不做具体限制。给定关系r的支撑实体对(hr,tr)和查询头实体
Figure BDA0002701056720000086
定义
Figure BDA0002701056720000087
为正确结果的概率。θ是模型参数,代表了从已有事实中学到的先验知识。训练的目标是最大化这个概率。
Figure BDA0002701056720000088
这里的Dr={(h,t)|(h,r,t)∈G}是关系r的实体对集合。
前面提到one-shot关系学习框架有两个模块组成,如图2所示。第一个模块称为归纳模块,它将一个实体对(hr,tr)基于它们的潜在关系,映射到一个连续向量表示
Figure BDA0002701056720000089
对查询关系只给出一个训练实例时,用神经网络学习的映射比直接优化具有更好地泛化能力。第二个步骤叫做推理模块,给定一个
Figure BDA00027010567200000810
和一个头实体
Figure BDA00027010567200000811
来预测尾实体
Figure BDA00027010567200000812
与人类的推理过程类似,推理模块通过在认知图上迭代扩展和推理,将隐式检索和显式推理结合起来。下面详细阐述两个模块。
在其中一个实施例中,根据预先设置的应用图神经网络模型,生成实体向量表示为:
Figure BDA0002701056720000091
ωe表示实体e的实体向量表示,
Figure BDA0002701056720000092
为应用图神经网络模型的参数,Nε={(rk,ek)|(e,rk,ek)∈G}表示知识图谱中实体e的出边,vr表示关系的嵌入表示,ve表示实体e的增量式表示,根据实体向量表示,学习得到样本头实体hr的样本头实体向量表示
Figure BDA0002701056720000093
和样本尾实体tr的样本尾实体向量表示
Figure BDA0002701056720000094
具体的,接两个实体的路径数量可以随着路径长度的增加呈指数增长。在给定一对实体的情况下,利用先验知识不能有效地缩小搜索空间。因此,应用图神经网络(GNN)生成向量表示,在向量表示空间中应用一个神经网络推断出实体对之间的关系。给定一个实体e,GNN从实体嵌入和它的邻居集合生成它的实体向量。
在另一个实施例中,确定样本实体向量表示和样本尾实体向量表示的关系表示为:
Figure BDA0002701056720000095
其中,
Figure BDA0002701056720000096
表示关系表示,
Figure BDA0002701056720000097
为应用图神经网络模型的参数。
在其中一个实施例中,根据查询头实体,构建认知图;认知图中节点的隐藏信息为认知图中所有节点的信息;根据关系表示和认知图,进行动态知识图谱补全。
具体的,推理由两个迭代过程组成:从知识图谱中检索信息和对收集到的信息进行推理。使用一种称为认知图的独特结构来存储检索到的信息和推理结果。认知图(记为g)是原知识图谱的一个子图,其节点具有隐藏表示,隐藏的表示代表了对g中所有实体的理解。初始状态下,g中只包含了查询实体
Figure BDA0002701056720000098
并将其标记为未探测的点。与以往基于路径的推理方法相比,认知图有两个优点。一方面,图结构允许更灵活的信息流,另一方面,如果将正确答案组织为一个图而不是路径,则搜索的效率会更高。
为了从G中检索相关证据,在每个步骤i中,从子图中选择一个未探测的节点ei,用ei的部分传出边来拓展G,并标记ei为已探测点。给定最新的探测实体ei,可能的动作集合Ai包括ei在原知识图谱中的传出边。具体地,Ai={(r,e)|(ei,r,e)∈G}。
在推理模块中,将深度学习应用于关系推理,它比基于规则的推理具有更好的泛化能力。具体的推理过程如表1所示。
表4新关系类型one-shot知识推理算法
Figure BDA0002701056720000101
其中,V表示节点集合,E表示边集合。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种动态知识图谱的知识补全装置,包括:表示模块302、向量表示模块304、关系确定模块306和补全模块308,其中:
表示模块302,用于获取网络空间领域的动态知识图谱中实体的结构信息和属性信息,根据所述结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示;
向量表示模块304,用于根据样本头实体的增量式表示和对应的出边,得到样本头实体向量表示,以及获取样本尾实体的样本尾实体向量表示;
关系确定模块306,用于确定所述样本实体向量表示和所述样本尾实体向量表示的关系表示;
补全模块308,用于根据所述关系表示以及预先输入的查询头实体,输出推测尾实体。
在其中一个实施例中,表示模块302还用于根据动态知识图谱中的实体,构建共享基实体库;根据所述共享基实体库中的基实体的向量确定实体的结构信息为:
Figure BDA0002701056720000111
其中,
Figure BDA0002701056720000112
表示基实体,SBES表示共享基实体库,K表示取选择共享基实体库中的基实体的数量,es表示结构信息。
在其中一个实施例中,表示模块302还用于对所述共享基实体库中的基实体进行排序,得到共享基实体序列;根据所述共享基实体序列以及实体对应的属性,确定实体的属性信息为:
Figure BDA0002701056720000121
其中,
Figure BDA0002701056720000122
表示共享基实体序列中基实体的属性向量表示,
Figure BDA0002701056720000123
表示实体对应的属性,et表示属性信息。
在其中一个实施例中,表示模块302还用于根据所述结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示为:
ejoint=α×es+(1-α)×et
其中,α表示超参数。
在其中一个实施例中,向量表示模块304还用于根据预先设置的应用图神经网络模型,生成实体向量表示为:
Figure BDA0002701056720000124
ωe表示实体e的实体向量表示,
Figure BDA0002701056720000125
为应用图神经网络模型的参数,Nε={(rk,ek)|(e,rk,ek)∈G}表示知识图谱中实体e的出边,vr表示关系的嵌入表示,ve表示实体e的增量式表示;根据所述实体向量表示,学习得到样本头实体hr的样本头实体向量表示
Figure BDA0002701056720000126
和样本尾实体tr的样本尾实体向量表示
Figure BDA0002701056720000127
在其中一个实施例中,向量表示模块304还用于确定所述样本实体向量表示和所述样本尾实体向量表示的关系表示为:
Figure BDA0002701056720000128
其中,
Figure BDA0002701056720000129
表示关系表示,
Figure BDA00027010567200001210
为应用图神经网络模型的参数。
在其中一个实施例中,补全模块308还用于根据查询头实体,构建认知图;所述认知图中节点的隐藏信息为认知图中所有节点的信息;根据所述关系表示和所述认知图,进行动态知识图谱补全。
关于动态知识图谱的知识补全装置的具体限定可以参见上文中对于动态知识图谱的知识补全方法的限定,在此不再赘述。上述动态知识图谱的知识补全装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种动态知识图谱的知识补全方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述实施例中方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种动态知识图谱的知识补全方法,其特征在于,所述方法包括:
获取网络空间领域的动态知识图谱中实体的结构信息和属性信息,根据所述结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示;
根据样本头实体的增量式表示和对应的出边,得到样本头实体向量表示,以及获取样本尾实体的样本尾实体向量表示;
确定所述样本实体向量表示和所述样本尾实体向量表示的关系表示;
根据所述关系表示以及输入的查询头实体,输出推测尾实体。
2.根据权利要求1所述的方法,其特征在于,所述获取网络空间领域的动态知识图谱中实体的结构信息,包括:
根据网络空间领域的动态知识图谱中的实体,构建共享基实体库;
根据所述共享基实体库中的基实体的向量确定实体的结构信息为:
Figure FDA0002701056710000011
其中,
Figure FDA0002701056710000012
表示基实体,SBES表示共享基实体库,K表示取选择共享基实体库中的基实体的数量,es表示结构信息。
3.根据权利要求2所述的方法,其特征在于,所述获取网络空间领域的动态知识图谱中实体的属性信息,包括:
对所述共享基实体库中的基实体进行排序,得到共享基实体序列;
根据所述共享基实体序列以及实体对应的属性,确定实体的属性信息为:
Figure FDA0002701056710000013
其中,
Figure FDA0002701056710000014
表示共享基实体序列中基实体的属性向量表示,
Figure FDA0002701056710000015
表示实体对应的属性,et表示属性信息。
4.根据权利要求3所述的方法,其特征在于,根据所述结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示,包括:
根据所述结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示为:
ejoint=α×es+(1-α)×et
其中,α表示超参数。
5.根据权利要求1至4任意一项所述的方法,其特征在于,根据样本头实体的增量式表示和对应的出边,得到样本头实体向量表示,以及获取样本尾实体的样本尾实体向量表示,包括:
根据预先设置的应用图神经网络模型,生成实体向量表示为:
Figure FDA0002701056710000021
ωe表示实体e的实体向量表示,
Figure FDA0002701056710000022
为应用图神经网络模型的参数,Nε={(rk,ek)|(e,rk,ek)∈G}表示知识图谱中实体e的出边,vr表示关系的嵌入表示,ve表示实体e的增量式表示;
根据所述实体向量表示,学习得到样本头实体hr的样本头实体向量表示
Figure FDA0002701056710000023
和样本尾实体tr的样本尾实体向量表示
Figure FDA0002701056710000024
6.根据权利要求5所述的方法,其特征在于,确定所述样本实体向量表示和所述样本尾实体向量表示的关系表示,包括:
确定所述样本实体向量表示和所述样本尾实体向量表示的关系表示为:
Figure FDA0002701056710000025
其中,
Figure FDA0002701056710000026
表示关系表示,
Figure FDA0002701056710000027
为应用图神经网络模型的参数。
7.根据权利要求6所述的方法,其特征在于,根据所述关系表示以及预先输入的查询头实体,输出推测尾实体,包括:
根据查询头实体,构建认知图;所述认知图中节点的隐藏信息为认知图中所有节点的信息;
根据所述关系表示和所述认知图,进行动态知识图谱补全。
8.一种动态知识图谱的知识补全装置,其特征在于,所述装置包括:
表示模块,用于获取网络空间领域的动态知识图谱中实体的结构信息和属性信息,根据所述结构信息和所述属性信息,通过超参数对实体进行融合,得到动态知识图谱中实体的增量式表示;
向量表示模块,用于根据样本头实体的增量式表示和对应的出边,得到样本头实体向量表示,以及获取样本尾实体的样本尾实体向量表示;
关系确定模块,用于确定所述样本实体向量表示和所述样本尾实体向量表示的关系表示;
补全模块,用于根据所述关系表示以及预先输入的查询头实体,输出推测尾实体。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202011022372.6A 2020-09-25 2020-09-25 动态知识图谱的知识补全方法、装置和计算机设备 Active CN112148892B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011022372.6A CN112148892B (zh) 2020-09-25 2020-09-25 动态知识图谱的知识补全方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011022372.6A CN112148892B (zh) 2020-09-25 2020-09-25 动态知识图谱的知识补全方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN112148892A true CN112148892A (zh) 2020-12-29
CN112148892B CN112148892B (zh) 2024-05-14

Family

ID=73897108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011022372.6A Active CN112148892B (zh) 2020-09-25 2020-09-25 动态知识图谱的知识补全方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN112148892B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836511A (zh) * 2021-01-27 2021-05-25 北京计算机技术及应用研究所 基于协同关系的知识图谱上下文嵌入方法
CN112860904A (zh) * 2021-04-06 2021-05-28 哈尔滨工业大学 一种融入外部知识的生物医疗关系抽取方法
CN113961724A (zh) * 2021-12-22 2022-01-21 山东新希望六和集团有限公司 动物系谱的更新方法、装置及计算机设备
CN114579769A (zh) * 2022-05-07 2022-06-03 中国科学技术大学 小样本知识图谱补全方法、系统、设备及存储介质
CN115599927A (zh) * 2022-11-08 2023-01-13 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)(Cn) 一种基于度量学习的时序知识图谱补全方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9158847B1 (en) * 2011-07-19 2015-10-13 Kyndi Inc. Cognitive memory encoding networks for fast semantic indexing storage and retrieval
CN108509654A (zh) * 2018-04-18 2018-09-07 上海交通大学 动态知识图谱的构建方法
CN110147450A (zh) * 2019-05-06 2019-08-20 北京科技大学 一种知识图谱的知识补全方法及装置
CN110851613A (zh) * 2019-09-09 2020-02-28 中国电子科技集团公司电子科学研究院 基于实体概念的知识图谱补全、推演、存储方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9158847B1 (en) * 2011-07-19 2015-10-13 Kyndi Inc. Cognitive memory encoding networks for fast semantic indexing storage and retrieval
CN108509654A (zh) * 2018-04-18 2018-09-07 上海交通大学 动态知识图谱的构建方法
CN110147450A (zh) * 2019-05-06 2019-08-20 北京科技大学 一种知识图谱的知识补全方法及装置
CN110851613A (zh) * 2019-09-09 2020-02-28 中国电子科技集团公司电子科学研究院 基于实体概念的知识图谱补全、推演、存储方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836511A (zh) * 2021-01-27 2021-05-25 北京计算机技术及应用研究所 基于协同关系的知识图谱上下文嵌入方法
CN112836511B (zh) * 2021-01-27 2024-01-30 北京计算机技术及应用研究所 基于协同关系的知识图谱上下文嵌入方法
CN112860904A (zh) * 2021-04-06 2021-05-28 哈尔滨工业大学 一种融入外部知识的生物医疗关系抽取方法
CN113961724A (zh) * 2021-12-22 2022-01-21 山东新希望六和集团有限公司 动物系谱的更新方法、装置及计算机设备
CN114579769A (zh) * 2022-05-07 2022-06-03 中国科学技术大学 小样本知识图谱补全方法、系统、设备及存储介质
CN114579769B (zh) * 2022-05-07 2022-09-06 中国科学技术大学 小样本知识图谱补全方法、系统、设备及存储介质
CN115599927A (zh) * 2022-11-08 2023-01-13 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)(Cn) 一种基于度量学习的时序知识图谱补全方法及系统

Also Published As

Publication number Publication date
CN112148892B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
CN112148892A (zh) 动态知识图谱的知识补全方法、装置和计算机设备
CN110929047B (zh) 关注邻居实体的知识图谱推理方法和装置
Dias et al. Concept lattices reduction: Definition, analysis and classification
Wang et al. Relational deep learning: A deep latent variable model for link prediction
Wu et al. Learning large neighborhood search policy for integer programming
Skowron et al. Interactive information systems: Toward perception based computing
CN113239168B (zh) 一种基于知识图谱嵌入预测模型的可解释性方法和系统
Xu et al. Robust network enhancement from flawed networks
CN111597352B (zh) 结合本体概念和实例的网络空间知识图谱推理方法和装置
Mauá et al. Thirty years of credal networks: Specification, algorithms and complexity
Zhou et al. Betweenness centrality-based community adaptive network representation for link prediction
Liu et al. A numerical method to solve a fuzzy differential equation via differential inclusions
CN114707641A (zh) 双视角图神经网络模型的训练方法、装置、设备及介质
Hüllermeier Similarity-based inference as evidential reasoning
Skulimowski Universal intelligence, creativity, and trust in emerging global expert systems
Zhu et al. Selective and incremental fusion for fuzzy and uncertain data based on probabilistic graphical model
Zhou et al. Research on personalized e-learning based on decision tree and RETE algorithm
Shamsinejadbabaki et al. Causality-based cost-effective action mining
CN111813949B (zh) 联合查询的网络空间知识图谱推理方法和装置
Xiao et al. A New Learning Resource Retrieval Method Based on Multi-knowledge Association Mining.
CN111475668A (zh) 针对复杂关系描述的图片视觉推理方法、设备及存储介质
Nadimpalli et al. Towards personalized learning paths in adaptive learning management systems: bayesian modelling of psychological theories
Goyal Graph embedding algorithms for attributed and temporal graphs
Bielak et al. Retrofitting structural graph embeddings with node attribute information
Beliakov et al. Learning Stable Weights for Data of Varying Dimension.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant