CN114064928A - 一种知识图谱的知识推理方法、装置、设备及存储介质 - Google Patents
一种知识图谱的知识推理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114064928A CN114064928A CN202111407135.6A CN202111407135A CN114064928A CN 114064928 A CN114064928 A CN 114064928A CN 202111407135 A CN202111407135 A CN 202111407135A CN 114064928 A CN114064928 A CN 114064928A
- Authority
- CN
- China
- Prior art keywords
- rule
- graph
- knowledge
- inference
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Animal Behavior & Ethology (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种知识图谱的知识推理方法,包括:获取初始知识图谱,并根据初始知识图谱生成备选规则;对备选规则进行判别,确定置信度大于设定阈值的合格规则;根据合格规则对初始知识图谱进行推理补全,获取新的节点及对应关系,并添加至图谱知识集中。本发明实施例提供的知识图谱的知识推理方法,通过将规则推理方法与图神经网络推理方法进行结合,从而形成基于生成对抗模型的混合推理框架设计混合推理框架实现混合推理,并利用基于层次结构的链接预测方法对节点和关系进行预测,结合了不同推理方法的优点,既提高了知识推理的泛化能力与计算效率,也保证了推理结果的准确性与可解释性。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种知识图谱的知识推理方法、装置、设备及存储介质。
背景技术
知识推理是指基于已知的事实或知识推断得出未知的事实或知识的过程,知识图谱推理的任务是根据知识图谱中已有的知识推理出新的知识或识别出错误的知识。知识推理作为人类问题求解的主要方法,一直以来备受关注。一般来说,知识推理包括两种主要的方法:一种是基于规则的传统知识推理模式;另一种是基于图神经网络的推理方法。
传统的基于规则的推理具有良好的准确率,但是通常需要花费大量的专家成本来构建业务规则,且构建的业务规则通常仅适用于特定的场景,泛化能力弱;且在大规模的多模态知识图谱场景中,其效率也容易成为瓶颈。基于神经网络的单步推理试图利用神经网络强大的学习能力建模知识图谱事实元组,获得很好的推理能力和泛化能力,但是准确性和合理性难以保证,神经网络固有的可解释性问题也依然存在于知识图谱的应用中,如何恰当地解释神经网络的推理能力是一大问题。
发明内容
本发明实施例提供了一种知识图谱的知识推理方法、装置、设备及存储介质,实现了同时具有良好泛化能力、计算效率及准确性的知识推理。
第一方面,本发明实施例提供了一种知识图谱的知识推理方法,包括:
获取初始知识图谱,并根据所述初始知识图谱生成备选规则;
对所述备选规则进行判别,确定置信度大于设定阈值的合格规则;
根据所述合格规则对所述初始知识图谱进行推理补全,获取新的节点及对应关系,并添加至图谱知识集中。
进一步地,根据所述初始知识图谱生成备选规则,包括:
提取所述初始知识图谱中的图像和文本,并表征成节点;
对所述节点对应的实体向量和关系向量分别进行初始化,生成实体嵌入向量和关系嵌入向量;
提取所述实体嵌入向量和关系嵌入向量中的各三元组序列,并输入长短期记忆模型,获得所述备选规则;所述三元组序列中包括两个实体嵌入向量与对应的关系嵌入向量。
进一步地,提取所述初始知识图谱中的图像和文本,并表征成节点,包括:
提取所述初始知识图谱中的图像,根据所述图像生成图像描述;
提取所述初始知识图谱中的文本,对所述文本与图像描述进行语义解析,将解析得到的实体和属性确定为所述节点。
进一步地,对所述备选规则进行判别,确定置信度大于设定阈值的合格规则,包括:
对所述初始知识图谱进行规则推理,确定新规则;
根据所述新规则确定各所述备选规则的置信度,将置信度大于所述设定阈值的备选规则确定为所述合格规则。
进一步地,对所述初始知识图谱进行规则推理,确定新规则,包括:
确定所述初始知识图谱对应的规则转换逻辑;
根据所述规则转换逻辑,从所述初始知识图谱中学习出所述新规则。
进一步地,根据所述新规则确定所述备选规则的置信度,包括:
根据规则推理算法与学习推理算法生成判别器,并将所述新规则确定为所述判别器中的真值;
将所述备选规则依次输入所述判别器,所述判别器的输出为对应各所述备选规则的置信度。
进一步地,根据所述合格规则对所述初始知识图谱进行推理补全,获取新的节点及对应关系,包括:
根据所述合格规则,提取所述初始知识图谱中具有相同关系的子图;
将所述初始知识图谱及子图输入链接预测模型,输出预测的所述新的节点及对应关系。
第二方面,本发明实施例还提供了一种知识图谱的知识推理装置,包括:
备选规则生成模块,用于获取初始知识图谱,并根据所述初始知识图谱生成备选规则;
合格规则确定模块,用于对所述备选规则进行判别,确定置信度大于设定阈值的合格规则;
推理模块,用于根据所述合格规则对所述初始知识图谱进行推理补全,获取新的节点及对应关系,并添加至图谱知识集中。
可选的,备选规则生成模块还用于:
提取所述初始知识图谱中的图像和文本,并表征成节点;
对所述节点对应的实体向量和关系向量分别进行初始化,生成实体嵌入向量和关系嵌入向量;
提取所述实体嵌入向量和关系嵌入向量中的各三元组序列,并输入长短期记忆模型,获得所述备选规则;所述三元组序列中包括两个实体嵌入向量与对应的关系嵌入向量。
可选的,备选规则生成模块还用于:
提取所述初始知识图谱中的图像,根据所述图像生成图像描述;
提取所述初始知识图谱中的文本,对所述文本与图像描述进行语义解析,将解析得到的实体和属性确定为所述节点。
可选的,合格规则确定模块还用于:
对所述初始知识图谱进行规则推理,确定新规则;
根据所述新规则确定各所述备选规则的置信度,将置信度大于所述设定阈值的备选规则确定为所述合格规则。
可选的,合格规则确定模块还用于:
确定所述初始知识图谱对应的规则转换逻辑;
根据所述规则转换逻辑,从所述初始知识图谱中学习出所述新规则。
可选的,合格规则确定模块还用于:
根据规则推理算法与学习推理算法生成判别器,并将所述新规则确定为所述判别器中的真值;
将所述备选规则依次输入所述判别器,所述判别器的输出为对应各所述备选规则的置信度。
可选的,推理模块还用于:
根据所述合格规则,提取所述初始知识图谱中具有相同关系的子图;
将所述初始知识图谱及子图输入链接预测模型,输出预测的所述新的节点及对应关系。
第三方面,本发明实施例还提供了一种知识图谱的知识推理计算机设备,包括:
存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例任一所述的知识图谱的知识推理方法。
第四方面,本发明实施例还提供了一种知识图谱的知识推理存储介质,其上存储有计算机程序,该程序被处理装置执行时实现如本发明实施例任一所述的知识图谱的知识推理方法。
本发明实施例首先获取初始知识图谱,并根据初始知识图谱生成备选规则;然后对备选规则进行判别,确定置信度大于设定阈值的合格规则;最后根据合格规则对初始知识图谱进行推理补全,获取新的节点及对应关系,并添加至图谱知识集中。本发明实施例提供的知识图谱的知识推理方法,通过将规则推理方法与图神经网络推理方法进行结合,利用图神经网络作为生成器生成备选规则,并输入规则推理方法构建的判别器中进行判别,从而形成基于生成对抗模型的混合推理框架设计混合推理框架实现混合推理,并利用基于层次结构的链接预测方法对节点和关系进行预测,结合了不同推理方法的优点,既提高了知识推理的泛化能力与计算效率,也保证了推理结果的准确性与可解释性。
附图说明
图1是本发明实施例一中的一种知识图谱的知识推理方法流程图;
图2是本发明实施例二中的一种知识图谱的知识推理方法流程图;
图3是本发明实施例二中的一种图像数据的图神经网络推理过程示意图;
图4是本发明实施例二中的一种基于生成对抗模型的混合推理过程示意图;
图5a是本发明实施例二中的一种知识图谱子图示意图;
图5b是本发明实施例二中的一种子图层级结构示意图;
图6是本发明实施例三中的一种知识图谱的知识推理装置结构示意图;
图7是本发明实施例四中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种知识图谱的知识推理方法流程图,本实施例可适用于根据知识图谱进行知识推理的情况,该方法可以由知识图谱的知识推理装置来执行,该装置可由硬件和/或软件组成,并一般可集成在具有知识图谱的知识推理功能的设备中,该设备可以是服务器或服务器集群等电子设备。如图1所示,具体包括如下步骤:
步骤110、获取初始知识图谱,并根据初始知识图谱生成备选规则。
其中,知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。初始知识图谱为未经推理的原始知识图谱,通过本实施例中的方法对其进行推理可以获取新的知识。备选规则为根据初始知识图谱生成的,从旧规则的实体关系信息学习出的新规则。
在本实施例中,知识图谱中可能包含多种形式的数据,如图像数据和文本数据等,这样的知识图谱可以称为多模态知识图谱。知识图谱中可以包含多个节点和关系,每个节点可以对应一个实体,实体之间可以通过一条或多条路径连接,每条路径对应一个关系。根据初始知识图谱生成备选规则的方式可以是,从多模态知识图谱中获取实体对之间的多跳连接路径,并将实体对之间的多条路径通过聚合函数来获取统一的整体表征,从而生成新规则,即备选规则。
可选的,可以利用设定的算法和模型,处理知识图谱结构中不同边关系对节点的影响,通过对知识图谱进行链路预测和实体分类,从初始知识图谱的旧规则的实体关系信息中进行节点之间关系的学习,最终实现备选规则的生成。
步骤120、对备选规则进行判别,确定置信度大于设定阈值的合格规则。
在本实施例中,生成备选规则后,可以对备选规则进行置信度的计算,评估备选规则的质量好坏,将质量好的规则作为合格规则输出。
可选的,可以利用基于逻辑规则的推理方法建立判别器,针对初始知识图谱的数据特性设计规则的自动化推理规则转换逻辑,并可以采用基于逻辑的多模态图谱的自动规则推理技术,从备选规则中学习出置信度较高的规则。
其中,基于逻辑规则的推理过程可以如下所示:
举例说明,假设初始知识图谱中包含节点Alice和Bob,节点之间的关系为has-son(Alice,Bob),针对关系“has-son”和“has-child”之间的转换关系,可以得到“has-son”是“has-child”的子关系,因此可以推理出Alice是Bob是子女,即可以得到新的关系has-child(Alice,Bob)。还可以通过实体的类别属性信息,设计类别转换逻辑。例如,对于实体Alice,其具有属性mother,而mother是women的子属性,则可以得到Alice的属性为women。以上即为逻辑的规则推理过程样例。
步骤130、根据合格规则对初始知识图谱进行推理补全,获取新的节点及对应关系,并添加至图谱知识集中。
在本实施例中,初始知识图谱中可能有隐含的节点和关系而未在图谱中示出,确定合格规则之后,可以对初始知识图谱进行推理补全,推理出新的节点及其关系,这些新的节点和关系即为根据知识图谱中的已有知识推理出的新知识。进一步地,推理出的新知识可以与知识图谱中原有的旧知识一起,添加至图谱知识集中。
可选的,可以根据层次结构对多模态知识图谱进行链接预测,从而得到新的节点和关系。其中,知识图谱中的层次结构类似关系路径,包含了丰富的推理模式,从而可以提升链接预测等任务的效果。层次结构是指实体被一个关系组织成层的结构。不同的层意味着不同的顺序,对于每个实体,其他实体都在上面、下面或同一层中,含义因关系而异。层次结构可以分为两类,单步层次结构和多步层次结构。一条关系路径是由某个头实体出发到达某个尾实体之间所经过的所有关系组合而成。一个单步层次结构是一个层次结构的子图,单步层次结构中的实体分布在两个不同的层次上,并通过单步关系进行链接,其尾实体有着共同的父节点;多步层次结构中的实体分布在不同的层次上,通过关系路径链接,这些路径有着相同的头实体和尾实体。根据层次结构对知识图谱进行解析,通过层次关系组合在一起的实体在其嵌入空间中的分布会有着比较明显的区分,这种限制可以很好地被用到链接预测任务中,从而预测出新的节点和关系。
本发明实施例首先获取初始知识图谱,并根据初始知识图谱生成备选规则;然后对备选规则进行判别,确定置信度大于设定阈值的合格规则;最后根据合格规则对初始知识图谱进行推理补全,获取新的节点及对应关系,并添加至图谱知识集中。本发明实施例提供的知识图谱的知识推理方法,通过将规则推理方法与图神经网络推理方法进行结合,利用图神经网络作为生成器生成备选规则,并输入规则推理方法构建的判别器中进行判别,从而形成基于生成对抗模型的混合推理框架设计混合推理框架实现混合推理,并利用基于层次结构的链接预测方法对节点和关系进行预测,结合了不同推理方法的优点,既提高了知识推理的泛化能力与计算效率,也保证了推理结果的准确性与可解释性。
实施例二
图2为本发明实施例二提供的一种知识图谱的知识推理方法流程图,本实施例可适用于根据知识图谱进行知识推理的情况。如图2所示,具体包括如下步骤:
步骤210、获取初始知识图谱,提取初始知识图谱中的图像和文本,并表征成节点。
在本实施例中,对于初始知识图谱,可以利用图神经网络算法,从多模态知识图谱中获取实体对之间的多跳连接路径,该路径由三元组序列表示,即两个实体及其对应关系,实体对之间的多条路径可以通过聚合函数来获取统一的整体表征得到备选规则。
初始知识图谱可以为多模态知识图谱,即其中包含不同形式的数据,如图像数据和文本数据。可选的,提取初始知识图谱中的图像和文本,并表征成节点的方式可以是:提取初始知识图谱中的图像,根据图像生成图像描述;提取初始知识图谱中的文本,对文本与图像描述进行语义解析,将解析得到的实体和属性确定为节点。
具体的,对于图像数据,可以利用设定算法进行处理。优选地,可以采用Faster-RCNN算法,提取视觉区域,然后利用图像描述生成器生成图像描述。然后将生成的图像描述与文本数据利用语义解析工具处理,以得到的实体和属性作为节点。任意两节点间都存在边,用于修饰区域间的空间关系,优选的,可以以语义关系修饰两节点间的边。
步骤220、对节点对应的实体向量和关系向量分别进行初始化,生成实体嵌入向量和关系嵌入向量。
其中,对应节点对应的实体和关系,利用设定算法可以得到实体和关系的嵌入式表示,即生成实体嵌入向量和关系嵌入向量。基于图神经网络的推理技术可以使用图卷积神经网络(GCN)对多模态图谱进行表征,得到实体的嵌入向量,因此实体可以获取相邻实体的知识。
可选的,关系表征模型可以使用TransE算法,核心在于头实体向量加关系向量等于尾实体向量。可以使用GCN模型对得到的实体向量做初始化,关系向量则可以使用one-hot方式来初始化。然后将其输入到TransE算法中对其进行微调,训练到模型收敛得到最终的实体和关系的嵌入表示。
步骤230、提取实体嵌入向量和关系嵌入向量中的各三元组序列,并输入长短期记忆模型,获得备选规则。
其中,三元组序列中包括两个实体嵌入向量与对应的关系嵌入向量。长短期记忆模型(LSTM)是一种时间循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的,在本实施例中可以利用LSTM获得实体之间的不同序列中的表征,从而确定知识图谱中的规则。
在本实施例中,从多模态知识图谱中可以获取实体对之间的多跳连接路径,该路径由三元组序列表示,其中实体嵌入和关系嵌入向量则为上述步骤获得的表示嵌入。
可选的,将两个实体对之间的多条三元组序列依次输入长短期记忆模型(LSTM)获得两个实体的不同序列中的表征,再将三元组序列标识的实体对之间的多跳连接路径通过聚合函数来获取统一的整体表征,确定备选规则。
图3是本实施中的一种图像数据的图神经网络推理过程示意图,如图所示,对于图像数据,首先通过Faster-RCNN算法,提取视觉区域,再将该视觉区域作为对象,利用图像描述生成器生成图像描述,图像描述中包括机箱、风扇、梯子等。进一步地,通过语义解析将图像中的实体表征成节点,最后生成实体嵌入向量和关系嵌入向量之后,提取实体对之间的多跳连接路径并以可视图的形式表现出来。
步骤240、对初始知识图谱进行规则推理,确定新规则。
在本实施例中,基于规则的推理技术可以通过自动化的规则学习方法,从大规模知识图谱中学习出置信度较高的规则,并且应用于推理任务。
可选的,对初始知识图谱进行规则推理,确定新规则的方式可以是:确定初始知识图谱对应的规则转换逻辑;根据规则转换逻辑,从初始知识图谱中学习出新规则。
具体的,可以利用基于逻辑规则的推理方法,根据初始知识图谱中的规则转换逻辑,学习出新规则,该新规则可以作为对备选规则进行判别的依据,用于对备选规则的置信度进行评判,从而确定其中的合格规则。
优选地,可以采用AMIE算法生成新规则。AMIE算法的全称是基于不完备知识库的关联规则挖掘算法(Association Rule Mining under Incomplete Evidence),通过依次学习预测每种关系的规则,对于每种关系,从规则体为空的规则开始,通过三种操作扩展规则体部分,保留支持度大于阈值的候选(闭式)规则。这三种操作分别为:
添加悬挂边:悬挂边是指边的一端是一个未出现过的变量,而另一端(变量或常量)是在规则中出现过的;
添加实例边:实例边与悬挂边类似,边的一端也是在规则中出现过的变量或常量,但另一端是未出现过的常量,也就是知识库中的实体;
添加闭合边:闭合边则是连接两个已经存在于规则中的元素(变量或常量)的边。
步骤250、根据新规则确定各备选规则的置信度,将置信度大于设定阈值的备选规则确定为合格规则。
在本实施例中,可以利用规则推理与学习推理算法生成判别器,并将规则推理算法生成的新规则作为判别依据,对前述步骤中利用图神经网络算法生成的备选规则进行置信度判别。
可选的,根据新规则确定备选规则的置信度的方式可以是:根据规则推理算法与学习推理算法生成判别器,并将新规则确定为判别器中的真值;将备选规则依次输入判别器,判别器的输出为对应各备选规则的置信度。
具体的,利用图神经网络算法生成备选规则,基于逻辑规则的推理算法作为判别器识别图神经网络的输出规则的置信度,通过生成对抗学习思想实现混合推理,实现基于生成对抗模型的混合推理框架。图4是本发明实施例提供的一种基于生成对抗模型的混合推理过程示意图,如图所示,可以利用图神经网络算法作为规则的生成器,基于初始知识图谱生成多个备选规则,然后将备选规则输入规则推理算法与学习推理算法生成判别器中。其中,规则推理算法与学习推理算法均为基于逻辑规则的推理算法,该种算法生成的新规则准确性较高,可以作为判别器中的真值对备选规则进行判别,使判别器输出备选规则的置信度,并根据设定的置信度阈值,将置信度大于设定置信度阈值的备选规则确定为合格规则。
进一步地,还可以利用基于逻辑规则的推理算法对备选规则进行标注,将含有标注的数据送到图神经网络算法模型中用于神经网络训练,进一步提高图神经网络算法的推理准确性。具体的,基于多模态知识图谱构建图神经网络学习RGCN推理模型,根据标注数据更新知识图谱中的实体表示后,可以利用长短期记忆网络(LSTM)为候选路径打分,从而选出最佳的推理路径,从路径上的实体链条中推理出新的备选规则。
步骤260、根据合格规则,提取初始知识图谱中具有相同关系的子图。
在本实施例中,获取合格规则之后,可以进一步利用层次约束知识进行多模态知识图谱的链接预测,从而获取新的知识。知识图谱中的层次结构类似关系路径,包含了丰富的推理模式,从而可以提升链接预测等任务的效果。层次结构是指实体被一个关系组织成层的结构。不同的层意味着不同的顺序,对于每个实体,其他实体都在上面、下面或同一层中,含义因关系而异。层次关系是产生层次结构和将实体分配到不同层次的关系。可以利用设定的层次结构模型,将知识图谱输入模型中,输出具有相同关系的子图。
可选的,进行层次约束的链接预测需要首先提取出知识图谱中具有相同关系的子图,图5a和图5b分别为本实施例提供的一种知识图谱子图示意图和子图层级结构示意图,如图所示,图中实线表示层次关系,虚线表示非层次关系。图5b是从图5a中提取的三层层次结构。
步骤270、将初始知识图谱及子图输入链接预测模型,输出预测的新的节点及对应关系,并添加至图谱知识集中。
在本实施例中,可以将层次结构分为两类,单步层次结构和多步层次结构。一个单步层次结构是一个层次结构的子图,单步层次结构中的实体分布在两个不同的层次上,并通过单步关系进行链接,其尾实体有着共同的父节点。多步层次结构中的实体分布在不同的层次上,通过关系路径链接,这些路径有着相同的头实体和尾实体。通过层次关系组合在一起的实体在其嵌入空间中的分布会有着比较明显的区分,这种限制可以很好地被用到链接预测任务中,通过建立链接预测模型,将知识图谱即具有相同关系的子图输入模型中,模型的输出为预测的节点或关系。进一步地,预测得到的节点及关系即通过初始知识图谱进行知识推理得到的新知识,可以将其添加至图谱知识集中。
本发明实施例首先获取初始知识图谱,提取初始知识图谱中的图像和文本,并表征成节点,然后对节点对应的实体向量和关系向量分别进行初始化,生成实体嵌入向量和关系嵌入向量,再提取实体嵌入向量和关系嵌入向量中的各三元组序列,并输入长短期记忆模型,获得备选规则,再对初始知识图谱进行规则推理,确定新规则,再根据新规则确定各备选规则的置信度,将置信度大于设定阈值的备选规则确定为合格规则,再根据合格规则,提取初始知识图谱中具有相同关系的子图,最后将初始知识图谱及子图输入链接预测模型,输出预测的新的节点及对应关系,并添加至图谱知识集中。本发明实施例提供的知识图谱的知识推理方法,通过将规则推理方法与图神经网络推理方法进行结合,利用图神经网络作为生成器生成备选规则,并输入规则推理方法构建的判别器中进行判别,从而形成基于生成对抗模型的混合推理框架设计混合推理框架实现混合推理,并利用基于层次结构的链接预测方法对节点和关系进行预测,结合了不同推理方法的优点,既提高了知识推理的泛化能力与计算效率,也保证了推理结果的准确性与可解释性。
实施例三
图6为本发明实施例三提供的一种知识图谱的知识推理装置结构示意图。如图6所示,该装置包括:备选规则生成模块310,合格规则确定模块320,推理模块330。
备选规则生成模块310,用于获取初始知识图谱,并根据初始知识图谱生成备选规则。
可选的,备选规则生成模块310还用于:
提取初始知识图谱中的图像和文本,并表征成节点;对节点对应的实体向量和关系向量分别进行初始化,生成实体嵌入向量和关系嵌入向量;提取实体嵌入向量和关系嵌入向量中的各三元组序列,并输入长短期记忆模型,获得备选规则;其中,三元组序列中包括两个实体嵌入向量与对应的关系嵌入向量。
可选的,备选规则生成模块310还用于:
提取初始知识图谱中的图像,根据图像生成图像描述;提取初始知识图谱中的文本,对文本与图像描述进行语义解析,将解析得到的实体和属性确定为所述节点。
合格规则确定模块320,用于对备选规则进行判别,确定置信度大于设定阈值的合格规则。
可选的,合格规则确定模块320还用于:
对初始知识图谱进行规则推理,确定新规则;根据新规则确定各备选规则的置信度,将置信度大于设定阈值的备选规则确定为合格规则。
可选的,合格规则确定模块320还用于:
确定初始知识图谱对应的规则转换逻辑;根据规则转换逻辑,从初始知识图谱中学习出新规则。
可选的,合格规则确定模块320还用于:
根据规则推理算法与学习推理算法生成判别器,并将新规则确定为判别器中的真值;将备选规则依次输入判别器,判别器的输出为对应各备选规则的置信度。
推理模块330,用于根据合格规则对初始知识图谱进行推理补全,获取新的节点及对应关系,并添加至图谱知识集中。
可选的,推理模块330还用于:
根据合格规则,提取初始知识图谱中具有相同关系的子图;将初始知识图谱及子图输入链接预测模型,输出预测的新的节点及对应关系。
上述装置可执行本公开前述所有实施例所提供的方法,具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本公开前述所有实施例所提供的方法。
实施例四
图7为本发明实施例四提供的一种计算机设备的结构示意图。图7示出了适于用来实现本发明实施方式的计算机设备412的框图。图7显示的计算机设备412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备412是典型的知识图谱的知识推理计算设备。
如图7所示,计算机设备412以通用计算设备的形式表现。计算机设备412的组件可以包括但不限于:一个或者多个处理器416,存储装置428,连接不同系统组件(包括存储装置428和处理器416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
计算机设备412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备412访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置428可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)430和/或高速缓存存储器432。计算机设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储装置428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块426的程序436,可以存储在例如存储装置428中,这样的程序模块426包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块426通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备412也可以与一个或多个外部设备414(例如键盘、指向设备、摄像头、显示器424等)通信,还可与一个或者多个使得用户能与该计算机设备412交互的设备通信,和/或与使得该计算机设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,计算机设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(Local AreaNetwork,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器420通过总线418与计算机设备412的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备412使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of IndependentDisks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器416通过运行存储在存储装置428中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的知识图谱的知识推理方法。
实施例五
本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理装置执行时实现如本发明实施例中的知识图谱的知识推理方法。本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取初始知识图谱,并根据初始知识图谱生成备选规则;对备选规则进行判别,确定置信度大于设定阈值的合格规则;根据合格规则对初始知识图谱进行推理补全,获取新的节点及对应关系,并添加至图谱知识集中。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络连接到用户计算机,包括局域网(LAN)或广域网(WAN),或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种知识图谱的知识推理方法,其特征在于,包括:
获取初始知识图谱,并根据所述初始知识图谱生成备选规则;
对所述备选规则进行判别,确定置信度大于设定阈值的合格规则;
根据所述合格规则对所述初始知识图谱进行推理补全,获取新的节点及对应关系,并添加至图谱知识集中。
2.根据权利要求1所述的方法,其特征在于,根据所述初始知识图谱生成备选规则,包括:
提取所述初始知识图谱中的图像和文本,并表征成节点;
对所述节点对应的实体向量和关系向量分别进行初始化,生成实体嵌入向量和关系嵌入向量;
提取所述实体嵌入向量和关系嵌入向量中的各三元组序列,并输入长短期记忆模型,获得所述备选规则;所述三元组序列中包括两个实体嵌入向量与对应的关系嵌入向量。
3.根据权利要求2所述的方法,其特征在于,提取所述初始知识图谱中的图像和文本,并表征成节点,包括:
提取所述初始知识图谱中的图像,根据所述图像生成图像描述;
提取所述初始知识图谱中的文本,对所述文本与图像描述进行语义解析,将解析得到的实体和属性确定为所述节点。
4.根据权利要求1所述的方法,其特征在于,对所述备选规则进行判别,确定置信度大于设定阈值的合格规则,包括:
对所述初始知识图谱进行规则推理,确定新规则;
根据所述新规则确定各所述备选规则的置信度,将置信度大于所述设定阈值的备选规则确定为所述合格规则。
5.根据权利要求4所述的方法,其特征在于,对所述初始知识图谱进行规则推理,确定新规则,包括:
确定所述初始知识图谱对应的规则转换逻辑;
根据所述规则转换逻辑,从所述初始知识图谱中学习出所述新规则。
6.根据权利要求4所述的方法,其特征在于,根据所述新规则确定所述备选规则的置信度,包括:
根据规则推理算法与学习推理算法生成判别器,并将所述新规则确定为所述判别器中的真值;
将所述备选规则依次输入所述判别器,所述判别器的输出为对应各所述备选规则的置信度。
7.根据权利要求1所述的方法,其特征在于,根据所述合格规则对所述初始知识图谱进行推理补全,获取新的节点及对应关系,包括:
根据所述合格规则,提取所述初始知识图谱中具有相同关系的子图;
将所述初始知识图谱及子图输入链接预测模型,输出预测的所述新的节点及对应关系。
8.一种知识图谱的知识推理装置,其特征在于,包括:
备选规则生成模块,用于获取初始知识图谱,并根据所述初始知识图谱生成备选规则;
合格规则确定模块,用于对所述备选规则进行判别,确定置信度大于设定阈值的合格规则;
推理模块,用于根据所述合格规则对所述初始知识图谱进行推理补全,获取新的节点及对应关系,并添加至图谱知识集中。
9.一种计算机设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-7任一所述的知识图谱的知识推理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现如权利要求1-7中任一所述的知识图谱的知识推理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111407135.6A CN114064928A (zh) | 2021-11-24 | 2021-11-24 | 一种知识图谱的知识推理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111407135.6A CN114064928A (zh) | 2021-11-24 | 2021-11-24 | 一种知识图谱的知识推理方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114064928A true CN114064928A (zh) | 2022-02-18 |
Family
ID=80275872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111407135.6A Pending CN114064928A (zh) | 2021-11-24 | 2021-11-24 | 一种知识图谱的知识推理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114064928A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114741460A (zh) * | 2022-06-10 | 2022-07-12 | 山东大学 | 基于规则间关联的知识图谱数据扩展方法及系统 |
CN114925190A (zh) * | 2022-05-30 | 2022-08-19 | 南瑞集团有限公司 | 一种基于规则推理与gru神经网络推理的混合推理方法 |
CN115796826A (zh) * | 2022-11-01 | 2023-03-14 | 河北东来工程技术服务有限公司 | 一种船舶安全管控的管理方法、系统、装置和存储介质 |
-
2021
- 2021-11-24 CN CN202111407135.6A patent/CN114064928A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114925190A (zh) * | 2022-05-30 | 2022-08-19 | 南瑞集团有限公司 | 一种基于规则推理与gru神经网络推理的混合推理方法 |
CN114925190B (zh) * | 2022-05-30 | 2023-08-04 | 南瑞集团有限公司 | 一种基于规则推理与gru神经网络推理的混合推理方法 |
CN114741460A (zh) * | 2022-06-10 | 2022-07-12 | 山东大学 | 基于规则间关联的知识图谱数据扩展方法及系统 |
CN114741460B (zh) * | 2022-06-10 | 2022-09-30 | 山东大学 | 基于规则间关联的知识图谱数据扩展方法及系统 |
CN115796826A (zh) * | 2022-11-01 | 2023-03-14 | 河北东来工程技术服务有限公司 | 一种船舶安全管控的管理方法、系统、装置和存储介质 |
CN115796826B (zh) * | 2022-11-01 | 2023-08-04 | 河北东来工程技术服务有限公司 | 一种船舶安全管控的管理方法、系统、装置和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liang et al. | Explaining the black-box model: A survey of local interpretation methods for deep neural networks | |
CN114064928A (zh) | 一种知识图谱的知识推理方法、装置、设备及存储介质 | |
CN109783666A (zh) | 一种基于迭代精细化的图像场景图谱生成方法 | |
US11687716B2 (en) | Machine-learning techniques for augmenting electronic documents with data-verification indicators | |
CN111914156A (zh) | 自适应标签感知的图卷积网络跨模态检索方法、系统 | |
US11416743B2 (en) | Swarm fair deep reinforcement learning | |
KR20220047228A (ko) | 이미지 분류 모델 생성 방법 및 장치, 전자 기기, 저장 매체, 컴퓨터 프로그램, 노변 장치 및 클라우드 제어 플랫폼 | |
US20210056353A1 (en) | Joint representation learning from images and text | |
CN114357105A (zh) | 地理预训练模型的预训练方法及模型微调方法 | |
WO2021012263A1 (en) | Systems and methods for end-to-end deep reinforcement learning based coreference resolution | |
US9436912B1 (en) | Symmetric schema instantiation method for use in a case-based reasoning system | |
US11341598B2 (en) | Interpretation maps with guaranteed robustness | |
CN115238582A (zh) | 知识图谱三元组的可靠性评估方法、系统、设备及介质 | |
CN115829058A (zh) | 训练样本处理方法、跨模态匹配方法、装置、设备和介质 | |
US11989628B2 (en) | Machine teaching complex concepts assisted by computer vision and knowledge reasoning | |
US20240028828A1 (en) | Machine learning model architecture and user interface to indicate impact of text ngrams | |
Xu et al. | A question-guided multi-hop reasoning graph network for visual question answering | |
CN116975578A (zh) | 逻辑规则网络模型训练方法、装置、设备、程序及介质 | |
CN115271207A (zh) | 一种基于门控图神经网络的序列关系预测方法以及装置 | |
CN114898184A (zh) | 模型训练方法、数据处理方法、装置及电子设备 | |
CN115440384A (zh) | 一种基于多任务学习的医疗知识图谱的处理方法及系统 | |
Lu | Design of visual communication based on deep learning approaches | |
Ho | NBDT: Neural-backed decision trees | |
Zarringhalam et al. | Semisupervised Vector Quantization in Visual SLAM Using HGCN | |
CN112698977A (zh) | 服务器故障定位方法方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |