CN114547325A - 一种概率超图驱动的地学知识图谱推理优化系统和方法 - Google Patents

一种概率超图驱动的地学知识图谱推理优化系统和方法 Download PDF

Info

Publication number
CN114547325A
CN114547325A CN202210039658.8A CN202210039658A CN114547325A CN 114547325 A CN114547325 A CN 114547325A CN 202210039658 A CN202210039658 A CN 202210039658A CN 114547325 A CN114547325 A CN 114547325A
Authority
CN
China
Prior art keywords
hypergraph
geoscience
edge
super
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210039658.8A
Other languages
English (en)
Other versions
CN114547325B (zh
Inventor
谢潇
鄂超
伍庭晨
贾慧彤
李方方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Digsur Science And Technology Co ltd
Original Assignee
Beijing Digsur Science And Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Digsur Science And Technology Co ltd filed Critical Beijing Digsur Science And Technology Co ltd
Priority to CN202210039658.8A priority Critical patent/CN114547325B/zh
Publication of CN114547325A publication Critical patent/CN114547325A/zh
Application granted granted Critical
Publication of CN114547325B publication Critical patent/CN114547325B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种概率超图驱动的地学知识图谱推理优化系统和方法,属于地理大数据分析技术领域。该系统包括地学知识图谱输入模块、地学本体设定模块、超图模型构建模块、超图自编码器模块、地学知识图普推理优化模块;该方法包括:地学知识图谱结构拆解;知识数据超图模型构建;超图信息传递概率计算;地学知识图谱推理优化:本发明通过采用多对多的图节点超边规则,改变地学知识图谱图结构形状,由于采用多对多的图节点超边规则,显著表达地理知识间的共性和异性关系,使得隐性的地学过程现象和关联,由非结构化的计算或推理变得可结构化地计算或推理,解决了本领域长期以来不能解决多对多的地学知识图谱网络结构问题的疑难问题。

Description

一种概率超图驱动的地学知识图谱推理优化系统和方法
技术领域
本发明属于地理大数据分析技术领域,特别涉及一种概率超图驱动的地学知识图谱推理优化系统和方法。
背景技术
人工智能发展到今天能解决很多问题、但是也有很多问题很难理解:怎样让机器能够真正理解人的语言,目前还做得很不够。进一步规划机器学习发展路径已经成为当今的热点。机器学习目前还只是停留在计算智能、感知智能上,怎样让机器能有认知能力、模仿人去认知一些事物、提高机器学习的认识能力是一个新的课题,知识图谱就是填补人机鸿沟的很重要的方法。
知识图谱是描述真实世界中存在的各种实体、或概念、及其关系的语义网络图,所述语义网络图模拟人的语言记忆和联想方式,直接而明确地表达概念的语义关系,可利用语义网络的结构关系检索和推理,效率高、通过节点和关系的特殊图结构数据为真实世界的各个场景直观建模;语义网络在辅助智能问答、物联网设备互联、可解释性人工智能等多个方面展现出丰富的应用价值:
地学知识图谱的广泛应用可以推动地球科学与信息科学、数据科学的交叉融合,促进学科发展。具体的,地学知识图谱可以应用在工程全生命周期管理、高精度地质时间轴构建、地学大数据综合分析以及智能地图编辑与制图控制等多个地学领域场景。
随着卷积神经网络在图像、声音、文本等数据上的应用发展,人们尝试将一般概念的卷积神经网络应用于图结构这类几何数据中,于是,图卷积神经网络应运而生。图卷积神经网络大量应用于生物化学等领域,将一个化学结构或一个蛋白质抽象为一个图,图中的节点是更小的分子,边代表键或者相互作用;集中于对于分子拓扑结构的建模,许多的化学结构和性质能够体现在图本身的结构特性上。相比传统的图数据的研究,使用图卷积神经网络对这些分子结构的刻画能够显著地帮助到包括新药发现、药物分类等任务。
然而,不同于生物化学等领域分子结构网络这类节点间作用关系单一的同质信息网络,所述节点间作用关系单一,第一,是指传统分子结构网络节点之间的关系是一对一或者一对多的关系;第二,虽然传统分子结构网络定义了一对一或者一对多的关系,但并没有给每一个连接关系定义语义关系,也就是,只知道它们之间是连接的、但并不知道是基于什么内容的连接,比如,两个节点之间的连接是包含的关系还是细分的关系并不知道。而地学知识图谱的复杂性在于:第一,其知识实体之间的关系往往是较为复杂的多对多的多元关联关系,在运用简单图卷积网络进行建模时,如果简单地把多对多的连接关系转换为一对一或者一对多的关系,将导致丢失很多有用的信息;第二,除了多对多的关系以外,还要给每一个关系设定语义,否则就不能完整地表达地学知识图谱的设计思想。
总之,现有应用图卷积神经网络的技术,不能解决多对多的地学知识图谱网络结构问题,也不能解决给每种地学知识图谱关系定义语义的问题。
发明内容
本发明针对现有技术的不足,提出一种概率超图驱动的地学知识图谱推理优化系统和方法,目的在于解决现有应用图卷积神经网络的技术,不能解决多对多的地学知识图谱网络结构问题,也不能给每种地学知识图谱关系定义语义的问题。
本发明为解决其技术问题采用以下技术方案:
一种概率超图驱动的地学知识图谱推理优化系统,其特征在于:包括地学知识图谱模块、地学本体设定模块、超图模型构建模块、超图自编码器模块、以及地学知识图普推理优化模块;所述超图自编码器模块包括超图信息计算模块、以及超图信息传递模块;
所述地学知识图谱模块分别向地学本体设定模块、以及超图模型构建模块发送基础地学知识图谱信息;
所述地学本体设定模块从地学知识图谱模块获得相关信息、并根据该相关信息抽象出地学内的概念层次结构、并将抽象出的地学内的概念层次结构发送给超图模型构建模块;
所述超图模型拆分模块根据地学知识图谱信息和地学本体设定模块的信息,对地学知识图谱进行拆分,拆分后组成具有超边、超边关系、节点关系的超图模型,从而构建超图模型;所述超图属于一种集合,而并非实体和边的关系,超图是将同一个概念的实体、或同一个上级的实体集合起来称为超图;所述超边就是由二个或二个以上具有同一个本体的节点组成的集合;所述超边关系就是一个超边和另一个超边之间的关系;所述节点关系就是一个节点或实体和另一个节点或实体之间的关系;
所述超图自编码器的超图信息计算模块接收超图模型构建模块的存储信息、并根据存储的超边数据、超边关系数据、有限节点数据及节点关系数据,结合通用的邻接矩阵构造函数算法转化为超图邻接矩阵M,在此基础上搜索超图模型数据存储模块的超边语义索引、超边关系语义索引、节点语义索引、节点关系语义索引,构造超图语义矩阵X,并将超图邻接矩阵M、以及超图语义矩阵X作为超图信息传递模块的输入;
所述超图自编码器的超图信息传递模块包括超图编码器、超图解码器,所述超图编码器用于学习和挖掘超图模型的深层特征,所述超图解码器用于重构超图邻接矩阵,通过超图编码器、超图解码器将推理优化后的知识图谱输出给地学知识图普推理优化模块。
所述超图模型数据存储模块,包括:超边数据表、超边关系数据表、有限节点数据表、节点关系数据表、文本语义数据表;所述超边数据表存储超边索引、超边语义;所述超边关系数据表存储超边关系索引、超边关系语义;所述有限节点数据表存储有限节点索引、所述超边索引、节点语义;所述节点关系数据表存储节点关系索引、节点关系语义;所述文本语义数据表存储文本索引、文本语义;所述文本索引包括超边语义索引、超边关系语义索引、节点语义索引、节点关系语义索引;所述文本语义包括超边语义、超边关系语义、节点语义、节点关系语义。
所述超图信息计算模块包括超图邻接矩阵M和超图语义矩阵X,所述超图邻接矩阵M用于同时表征超图的节点和超边、节点与节点、超边和超边之间的关系,所述超图语义矩阵X用于表征超图建模实体的语义信息、以及节点和超边、节点与节点、超边和超边之间的关系的语义信息。
所述超图编码器结合超图模型和图卷积算法,设计l层超图卷积层,其中 l由超边数目确定,将超图结构和信息嵌入到低维空间中,输出经过l层卷积后对应节点特征向量
Figure RE-GDA0003618396520000041
Figure RE-GDA0003618396520000042
其中,fHGCN为超图卷积函数,输入位于超边ε中节点的特征向量
Figure RE-GDA0003618396520000043
超图模型的邻接矩阵M、语义矩阵X,其中
Figure RE-GDA0003618396520000051
初始为N维单位向量,通过超图卷积进行计算更新,σReLU为激活函数线性整流函数,
Figure RE-GDA0003618396520000052
是维度为N×N邻接矩阵与单位矩阵的和,⊙为训练过程中不断更新的卷积核,其初始值为随机给出;分别对每组超边中的n节点进行编码,得到n项隐层特征,作为超图解码器的输入。
所述超图解码器经过编码器得到的隐层特征将会作为解码器的输入,首先对n项特征进行内积,获得代表计算更新后的超图邻接矩阵;整合所有计算更新后的超边信息,进一步对所有超边的邻接矩阵进行内积,重建整个超图的邻接矩阵;同时,建立损失函数对所有超边进行训练,同时以减小误差loss 为依据,调整卷积核参数。
所述超图模型包括:
1)超边集合ε:超边指三个或三个以上节点构成的关系,将本体节点及属性作为超边的建立规则;
2)有限节点集合v:指符合超边规则的超图节点集合。
一种地学知识图谱推理优化方法,该方法基于一种超图模型的异质信息网络结构,该异质信息网络结构将地学知识图谱的知识体系和逻辑架构,拆分为顶层本体和下层事实的异质信息网络,称为“本体-事实”异质信息网络;其特征在于:包括以下步骤:
步骤一,地学知识图谱结构拆解:输入地学知识图谱数据,根据其知识体系和逻辑架构、以及地学本体设定模块数据,将其拆解为“本体-事实”知识网络;所述异质信息网络指包含具有一种或多种类型的节点和边,表示为:
G{O,F}=(V{O,F},E{O,F})
其中V,E分别为节点和边的集合;
步骤二,知识数据超图模型构建:构建以本体网络为超边集合、事实网络为有限节点集合的超图模型
Figure RE-GDA0003618396520000061
以本体概念VO及其属性构建超边集合ε={ε12,…,εi},以事实网络节点VF构建超图有限节点集υ={υ12,…,υn},对于任意一条超边εi∈ε是节点集υ的一个子集;故超图模型为:
Figure RE-GDA0003618396520000062
步骤三,超图信息传递概率计算:利用超图模型邻接矩阵M和概率矩阵X训练超图自编码器,用于计算节点间隐式连接;所述超图自编码器由超图编码器(Encoder)和超图解码器(Decoder)两部分组成,所述超图编码器也称超图卷积编码器,所述超图解码器也称作超图内积解码器,输入目标超图的超图邻接矩阵M和超图语义矩阵X,经过超图卷积编码器和超图内积解码器后输出重构的超图邻接矩阵M,用于表征通过学习得到的节点间隐式连接。
步骤四,地学知识图谱推理优化:通过上述对现有地学知识图谱的拆解和超图模型的构建与计算,实现从原始知识信息中挖掘潜在的高阶关联关系,优化地学图谱的可推理能力。
本发明的优点效果
1、本发明通过改变地学知识图谱图结构的形状,由传统的一对一、一对多的图节点关系,改变为多对多的图节点关系,由于采用多对多的图节点超边规则,显著表达地理知识间的共性和异性关系,使得隐性的地学过程现象和关联,由非结构化的计算或推理变得可结构化地计算或推理,保障了地学知识图谱的全生命周期发展和延续。解决了本领域长期以来不能解决多对多的地学知识图谱网络结构问题的疑难问题。
2、本发明通过建立地学本体设定数据表、本文语义数据表、超边数据表、超边关系数据表、有限节点数据表、节点关系数据表,给超图模型的节点和节点、节点和超边、超边和超边之间的关系都赋予了语义,直接而明确地表达概念的语义关系,可利用语义网络的结构关系检索和推理,效率高、通过节点和关系的特殊图结构数据为真实世界的各个场景直观建模;语义网络在辅助智能问答、物联网设备互联、可解释性人工智能等多个方面展现出丰富的应用价值,解决了现有技术用于生物化学等领域分子结构网络的图卷积网络不能给每种关系赋予语义的疑难问题。
附图说明
图1为本发明系统框图;
图2为本发明超图模型数据存储模块框图;
图2-1为本发明地学知识拆解与超图模型构建原理图;
图2-2为本发明超图自编码器原理图;
图3为本发明实例图;
图3-1为本发明图3中地学知识图谱的局部放大图;
图3-2为本发明图3中地学本体、以及拆解和构建超图模型的局部放大图;
图3-3为本发明图3的中的地学知识图谱推理优化局部放大图;
图4为本发明方法流程图。
具体实施方式
本发明设计原理
一、创新地提出基于地学本体的超边构建规则。超边构建规则的优势在于:能够显著表达地理知识间的共性和异性关系;当用同一个超边表达超边内的节点时,能够显著表达共性,当用不同超边表达不同超边内的节点是,能够显著表达异性。
二、进一步的提出适用于地学知识超图的超图卷积神经网络模块。由于显著第表达了共性和异性的关系,便于图卷积神经网络的超图编码器学习超图模型的局部异构特征、以及挖掘超图模型的局部同构特征,也便于图卷积神经网络的超图解码器在此基础上,预测某超边内节点和另一超边内节点的隐层连接。
三、超边规则在图卷积神经网络的超图编码器中的应用:超图编码器中的超图卷积过程中,1)学习超边之间的关系特征,超边关系作为地学本体中概念关联关系表达,由于有了超边关系,能够优先确定任意两超边内部节点之间是否应当存在指向显著的连接关系;2)学习各超边内节点之间的关系特征,节点关系来源于知识图谱知识实体的原始连接关系;通过多层卷积计算后,获得同时表征上述超边关系、节点关系特征的隐层特征,即是超图模型的局部结构特征;如超图编码器分析出超边<遥感数据,遥感数据属性>和
四、超边规则在图卷积神经网络的超图解码器中的应用:超图解码器中的超图内积过程:
1)通过输入的隐层特征,通过向量内积机制,最大程度还原超边关系和节点关系特征:如超边<遥感数据,遥感数据属性>“包含”基于woridview3de <光学卫星数据,光学卫星数据属性>,及节点“卫星分辨率”“细分”“0.4米”;
2)在确定这一关系事实的基础上,以超边关系作为优先约束,进一步通过损失函数控制节点与节点之间的新关系建立,具体为基于已有节点关系“卫星分辨率”“细分”“0.4米”,同时考虑局部结构和语义信息计算“卫星分辨率”“细分”“worldview3”和“卫星分辨率”“细分”“0.3米”这两种关系的存在概率,显然,和“卫星分辨率”“细分”“0.3米”概率大于和“卫星分辨率”“细分”“worldview3”的概率,最终通过矩阵内积,输出“卫星分辨率”“细分”“0.3米”,这种包含节点新关系的重构邻接矩阵,作为知识图谱的更新标准。
总结:从编码到解码过程,即是基于超图模型、学习超图模型的局部异构特征,挖掘超图模型的局部同构特征的过程,在此基础上,预测某超边内节点和另一超边内节点的隐层连接。
基于以上原理,本发明设计了一种概率超图驱动的地学知识图谱推理优化系统。
一种概率超图驱动的地学知识图谱推理优化系统如图1所示,包括地学知识图谱模块、地学本体设定模块、超图模型构建模块、超图自编码器模块、以及地学知识图普推理优化模块;所述超图自编码器模块包括超图信息计算模块、以及超图信息传递模块;所述超图模型构建模块包括超图模型拆分模块、超图模型存储模块;
所述地学知识图谱模块分别向地学本体设定模块、以及超图模型构建模块发送基础地学知识图谱信息;
所述地学本体设定模块从地学知识图谱模块获得相关信息、并根据该相关信息抽象出地学内的概念层次结构、并将抽象出的地学内的概念层次结构发送给超图模型构建模块;
如图1、图2-1所示,所述超图模型拆分模块根据地学知识图谱模块和地学本体设定模块发送的信息,对地学知识图谱进行拆分,拆分后组成具有超边、超边关系、节点关系的超图模型,从而构建超图模型如图2-1所示;所述超图属于一种集合,而并非实体和边的关系,超图是将同一个概念的实体、或同一个上级的实体集合起来称为超图;所述超边就是由二个或二个以上具有同一个本体的节点组成的集合;所述超边关系就是一个超边和另一个超边之间的关系;所述节点关系就是一个节点或实体和另一个节点或实体之间的关系;
如图2-1所示,右下角为构建的超图模型
Figure RE-GDA0003618396520000101
它是由多个具有同一概念的有限节点和超边集合组成的,右下角的超图模型中有3个超边,超边和超边之间用不同深浅的颜色区分;每个超边由二个或二个以上具有同一个本体的节点组成的集合;图2-1中的有限节点来自于“本体-事实”中事实网络的实体,图中的超边来自于“本体-事实”中本体网络的“概念”。
如图2-2所示,所述超图自编码器的超图信息计算模块接收超图模型构建模块的存储信息、并根据存储的超边数据、超边关系数据、有限节点数据及节点关系数据,结合通用的邻接矩阵构造函数算法转化为超图邻接矩阵M,在此基础上搜索上述数据中的语义索引,构造超图语义矩阵X,并将超图邻接矩阵M、以及超图语义矩阵X作为超图信息传递模块的输入;所述语义索引包括超边语义索引、超边关系语义索引、节点语义索引、节点关系语义索引。
如图2-2所示,所述超图自编码器的超图信息传递模块包括超图编码器、超图解码器,所述超图编码器用于学习和挖掘超图模型的深层特征,所述超图解码器用于重构超图邻接矩阵,通过超图编码器、超图解码器将推理优化后的知识图谱输出给地学知识图普推理优化模块。
如图3所示,图3的最右侧的图就是超图解码器重构超图邻接矩阵M以后的效果,重构超图邻接矩阵M以前,有限节点0.3米与节点卫星分辨率没有关联关系,重构以后,建立了关联关系。超图解码器之所以将0.3米与节点卫星分辨率建立了关连关系,是因为超图编码器通过学习和挖掘超图模型的深层特征,将0.3米、0.5米、0.4米归类为同一个超边,超图编码器再将这个结果发送给超图解码器,超图解码器根据超图编码器挖掘的特征对超图邻接矩阵M进行重构。
所述超图模型数据存储模块如图2所示,包括:超边数据表、超边关系数据表、有限节点数据表、节点关系数据表、文本语义数据表;所述超边数据表存储超边索引、超边语义;所述超边关系数据表存储超边关系索引、超边关系语义;所述有限节点数据表存储有限节点索引、所述超边索引、节点语义;所述节点关系数据表存储节点关系索引、节点关系语义;所述文本语义数据表存储文本索引、文本语义;所述文本索引包括超边语义索引、超边关系语义索引、节点语义索引、节点关系语义索引;所述文本语义包括超边语义、超边关系语义、节点语义、节点关系语义。
如图2-2所示,所述超图信息计算模块包括超图邻接矩阵M和超图语义矩阵X,所述超图邻接矩阵M用于同时表征超图的节点和超边、节点与节点、超边和超边之间的关系,所述超图语义矩阵X用于表征超图建模实体的语义信息、以及节点和超边、节点与节点、超边和超边之间的关系的语义信息。
所述超图编码器也称作超图卷积编码器,如图2-2所示,超图卷积编码器结合超图模型和图卷积算法,设计l层超图卷积层,其中l由超边数目确定,将超图结构和信息嵌入到低维空间中,输出经过l层卷积后对应节点特征向量
Figure RE-GDA0003618396520000111
Figure RE-GDA0003618396520000112
其中,fHGCN为超图卷积函数,输入位于超边ε中节点的特征向量
Figure RE-GDA0003618396520000113
超图模型的邻接矩阵M、语义矩阵X,其中
Figure RE-GDA0003618396520000114
初始为N维单位向量,通过超图卷积进行计算更新,σReLU为激活函数线性整流函数,
Figure RE-GDA0003618396520000115
是维度为N×N邻接矩阵与单位矩阵的和,⊙为训练过程中不断更新的卷积核,其初始值为随机给出;分别对每组超边中的n节点进行编码,得到n项隐层特征,作为超图解码器的输入。
所述超图解码器也称作超图内积解码器,如图2-2所示,超图内积解码器经过编码器得到的隐层特征将会作为解码器的输入,首先对n项特征进行内积,获得代表计算更新后的超图邻接矩阵;整合所有计算更新后的超边信息,进一步对所有超边的邻接矩阵进行内积,重建整个超图的邻接矩阵;同时,建立损失函数对所有超边进行训练,同时以减小误差loss为依据,调整卷积核参数。
所述超图模型如图2-1右下角所示,包括:
1)超边集合ε:超边指三个或三个以上节点构成的关系,将本体节点及属性作为超边的建立规则;
2)有限节点集合v:指符合超边规则的超图节点集合。
一种地学知识图谱推理优化方法如图2-1、图4所示,该方法基于一种超图模型的异质信息网络结构,该异质信息网络结构将地学知识图谱的知识体系和逻辑架构,拆分为顶层本体和下层事实的异质信息网络,称为“本体-事实”异质信息网络;其特征在于:包括以下步骤:
步骤一,地学知识图谱结构拆解:输入地学知识图谱数据,根据其知识体系和逻辑架构、以及地学本体设定模块数据,将其拆解为“本体-事实”知识网络;所述异质信息网络指包含具有一种或多种类型的节点和边,表示为:
G{O,F}=(V{O,F},E{O,F})
其中V,E分别为节点和边的集合;
步骤二,知识数据超图模型构建:构建以本体网络为超边集合、事实网络为有限节点集合的超图模型
Figure RE-GDA0003618396520000121
以本体概念VO及其属性构建超边集合ε={ε12,…,εi},以事实网络节点VF构建超图有限节点集υ={υ12,…,υn},对于任意一条超边εi∈ε是节点集υ的一个子集;故超图模型为:
Figure RE-GDA0003618396520000131
步骤三,超图信息传递概率计算:利用超图模型邻接矩阵M和概率矩阵X训练超图自编码器,用于计算节点间隐式连接;所述超图自编码器由超图编码器(Encoder)和超图解码器(Decoder)两部分组成,所述超图编码器也称超图卷积编码器,所述超图解码器也称作超图内积解码器,输入目标超图的超图邻接矩阵M和超图语义矩阵X,经过超图卷积编码器和超图内积解码器后输出重构的超图邻接矩阵M,用于表征通过学习得到的节点间隐式连接。
步骤四,地学知识图谱推理优化:通过上述对现有地学知识图谱的拆解和超图模型的构建与计算,实现从原始知识信息中挖掘潜在的高阶关联关系,优化地学图谱的可推理能力。
实施例一:超图模型的拆分
以图3为例进行超图模型的拆分如下:
图3分为左、中、右三个部分,中间为超图模型的拆分,以图3中间部分的拆分部分作为实例:
第一步、通过地学本体设定模块设定三种类型的本体:遥感数据、连接woridview1的光学卫星数据、连接woridview3的光学卫星数据,并将三种类型的超边索引、超边语义保存到“文本语义数据库”;其中,“超边索引”对应文本语义数据表的“文本索引”字段,“超边语义”对应文本语义数据表的“文本语义”字段。
第二步、建立超边数据表:从“文本语义数据库”的“文本索引”、“文本语义”分别读取超边索引、超边语义,并将超边索引和超边语义保存到“超边数据表”;
第三步,建立超边关系数据表:三个超边分别用2条用粗黑实线表示关系线,在“文本语义数据库”建立对应这2条超边关系的“超边关系索引”以及“超边关系语义”,从文本语义数据库读取“超边关系索引”以及“超边关系语义”,将“超边关系索引”以及“超边关系语义”保存到“超边关系数据表”;
第四步:建立有限节点数据表:1)从基础地学知识图谱数据库读取有限节点索引、并给每个有限节点命名语义,将“有限节点索引”、以及“有限节点语义”保存到“文本语义数据表”;2)再给每个节点分配所属超边索引:从图3中间的图看出,一共7个有限节点,有限节点woridview1、0.5米属于一个超边;有限节点woridview3、0.4、0.5、0.4米属于一个超边;3)建立“节点-所属超边关联数据表”,该表包括节点索引、所属超边索引,具体为:将有限节点woridview1、0.5米对应一个超边索引,有限节点woridview3、0.4、0.5、 0.4米对应一个超边索引;4)建立有限节点数据表:读取“节点-所属超边关联数据表”的有限节点索引、所属超边索引,以及“文本语义数据表”的节点语义,建立有限节点数据表。
第五步:建立节点关系数据表。从基础地学知识图谱数据库读取节点关系索引,并给每个节点关系命名语义,将节点关系索引、节点关系语义保存到“文本语义数据库”,读取文本语义数据表的节点关系索引、节点关系语义,建立“节点关系数据表”。
需要强调的是,上述具体实施例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对上述实施例做出没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专利法的保护。

Claims (7)

1.一种概率超图驱动的地学知识图谱推理优化系统,其特征在于:包括地学知识图谱模块、地学本体设定模块、超图模型构建模块、超图自编码器模块、以及地学知识图普推理优化模块;所述超图自编码器模块包括超图信息计算模块、以及超图信息传递模块;所述超图模型构建模块包括超图模型拆分模块、超图模型存储模块;
所述地学知识图谱模块分别向地学本体设定模块、以及超图模型构建模块发送基础地学知识图谱信息;
所述地学本体设定模块从地学知识图谱模块获得相关信息、并根据该相关信息抽象出地学内的概念层次结构、并将抽象出的地学内的概念层次结构发送给超图模型构建模块;
所述超图模型拆分模块根据地学知识图谱模块和地学本体设定模块发送的信息,对地学知识图谱进行拆分,拆分后组成具有超边、超边关系、节点关系的超图模型,从而构建超图模型;所述超图属于一种集合,而并非实体和边的关系,超图是将同一个概念的实体、或同一个上级的实体集合起来称为超图;所述超边就是由二个或二个以上具有同一个本体的节点组成的集合;所述超边关系就是一个超边和另一个超边之间的关系;所述节点关系就是一个节点或实体和另一个节点或实体之间的关系;
所述超图自编码器的超图信息计算模块接收超图模型构建模块的存储信息、并根据存储的超边数据、超边关系数据、有限节点数据及节点关系数据,结合通用的邻接矩阵构造函数算法转化为超图邻接矩阵M,在此基础上搜索上述数据中的语义索引,构造超图语义矩阵X,并将超图邻接矩阵M、以及超图语义矩阵X作为超图信息传递模块的输入;所述语义索引包括超边语义索引、超边关系语义索引、节点语义索引、节点关系语义索引。
所述超图自编码器的超图信息传递模块包括超图编码器、超图解码器,所述超图编码器用于学习和挖掘超图模型的深层特征,所述超图解码器用于重构超图邻接矩阵,通过超图编码器、超图解码器将推理优化后的知识图谱输出给地学知识图普推理优化模块。
2.根据权利要求1所述的一种概率超图驱动的地学知识图谱推理优化系统,其特征在于:所述超图模型数据存储模块,包括:超边数据表、超边关系数据表、有限节点数据表、节点关系数据表、文本语义数据表;所述超边数据表存储超边索引、超边语义;所述超边关系数据表存储超边关系索引、超边关系语义;所述有限节点数据表存储有限节点索引、所述超边索引、节点语义;所述节点关系数据表存储节点关系索引、节点关系语义;所述文本语义数据表存储文本索引、文本语义;所述文本索引包括超边语义索引、超边关系语义索引、节点语义索引、节点关系语义索引;所述文本语义包括超边语义、超边关系语义、节点语义、节点关系语义。
3.根据权利要求1所述的一种概率超图驱动的地学知识图谱推理优化系统,其特征在于:所述超图信息计算模块包括超图邻接矩阵M和超图语义矩阵X,所述超图邻接矩阵M用于同时表征超图的节点和超边、节点与节点、超边和超边之间的关系,所述超图语义矩阵X用于表征超图建模实体的语义信息、以及节点和超边、节点与节点、超边和超边之间的关系的语义信息。
4.根据权利要求1所述的一种概率超图驱动的地学知识图谱推理优化系统,其特征在于:所述超图编码器结合超图模型和图卷积算法,设计l层超图卷积层,其中l由超边数目确定,将超图结构和信息嵌入到低维空间中,输出经过l层卷积后对应节点特征向量
Figure FDA0003469684090000021
Figure FDA0003469684090000031
其中,fHGCN为超图卷积函数,输入位于超边ε中节点的特征向量
Figure FDA0003469684090000032
超图模型的邻接矩阵M、语义矩阵X,其中
Figure FDA0003469684090000033
初始为N维单位向量,通过超图卷积进行计算更新,σReLU为激活函数线性整流函数,
Figure FDA0003469684090000034
是维度为N×N邻接矩阵与单位矩阵的和,⊙为训练过程中不断更新的卷积核,其初始值为随机给出;分别对每组超边中的n节点进行编码,得到n项隐层特征,作为超图解码器的输入。
5.根据权利要求1所述的一种概率超图驱动的地学知识图谱推理优化系统,其特征在于:所述超图解码器经过编码器得到的隐层特征将会作为解码器的输入,首先对n项特征进行内积,获得代表计算更新后的超图邻接矩阵;整合所有计算更新后的超边信息,进一步对所有超边的邻接矩阵进行内积,重建整个超图的邻接矩阵;同时,建立损失函数对所有超边进行训练,同时以减小误差loss为依据,调整卷积核参数。
6.根据权利要求1所述的一种概率超图驱动的地学知识图谱推理优化系统,其特征在于:所述超图模型包括:
1)超边集合ε:超边指三个或三个以上节点构成的关系,将本体节点及属性作为超边的建立规则;
2)有限节点集合v:指符合超边规则的超图节点集合。
7.一种基于权利要求1-6任意一项所述一种概率超图驱动的地学知识图谱推理优化系统的地学知识图谱推理优化方法,该方法基于一种超图模型的异质信息网络结构,该异质信息网络结构将地学知识图谱的知识体系和逻辑架构,拆分为顶层本体和下层事实的异质信息网络,称为“本体-事实”异质信息网络;其特征在于:包括以下步骤:
步骤一,地学知识图谱结构拆解:输入地学知识图谱数据,根据其知识体系和逻辑架构、以及地学本体设定模块数据,将其拆解为“本体-事实”知识网络;所述异质信息网络指包含具有一种或多种类型的节点和边,表示为:
G{O,F}=(V{O,F},E{O,F})
其中V,E分别为节点和边的集合;
步骤二,知识数据超图模型构建:构建以本体网络为超边集合、事实网络为有限节点集合的超图模型
Figure FDA0003469684090000041
以本体概念VO及其属性构建超边集合ε={ε1,ε2,...,εi},以事实网络节点VF构建超图有限节点集υ={υ1,υ2,...,υn},对于任意一条超边εi∈ε是节点集υ的一个子集;故超图模型为:
Figure FDA0003469684090000042
步骤三,超图信息传递概率计算:利用超图模型邻接矩阵M和概率矩阵X训练超图自编码器,用于计算节点间隐式连接;所述超图自编码器由超图编码器(Encoder)和超图解码器(Decoder)两部分组成,所述超图编码器也称超图卷积编码器,所述超图解码器也称作超图内积解码器,输入目标超图的超图邻接矩阵M和超图语义矩阵X,经过超图卷积编码器和超图内积解码器后输出重构的超图邻接矩阵M,用于表征通过学习得到的节点间隐式连接。
步骤四,地学知识图谱推理优化:通过上述对现有地学知识图谱的拆解和超图模型的构建与计算,实现从原始知识信息中挖掘潜在的高阶关联关系,优化地学图谱的可推理能力。
CN202210039658.8A 2022-01-14 2022-01-14 一种概率超图驱动的地学知识图谱推理优化系统和方法 Active CN114547325B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210039658.8A CN114547325B (zh) 2022-01-14 2022-01-14 一种概率超图驱动的地学知识图谱推理优化系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210039658.8A CN114547325B (zh) 2022-01-14 2022-01-14 一种概率超图驱动的地学知识图谱推理优化系统和方法

Publications (2)

Publication Number Publication Date
CN114547325A true CN114547325A (zh) 2022-05-27
CN114547325B CN114547325B (zh) 2022-09-02

Family

ID=81671139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210039658.8A Active CN114547325B (zh) 2022-01-14 2022-01-14 一种概率超图驱动的地学知识图谱推理优化系统和方法

Country Status (1)

Country Link
CN (1) CN114547325B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116541593A (zh) * 2023-04-28 2023-08-04 华中师范大学 一种基于超图神经网络的课程推荐方法
CN116845889A (zh) * 2023-09-01 2023-10-03 东海实验室 一种基于层次化超图神经网络的电力负载预测方法
CN116541593B (zh) * 2023-04-28 2024-05-31 华中师范大学 一种基于超图神经网络的课程推荐方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170092143A1 (en) * 2015-09-25 2017-03-30 International Business Machines Corporation Techniques for transforming questions of a question set to facilitate answer aggregation and display
CN108319705A (zh) * 2018-02-06 2018-07-24 中山大学 一种基于教学资源的个性化教学过程自动生成方法及系统
US20180276261A1 (en) * 2014-05-30 2018-09-27 Georgetown University Process and Framework For Facilitating Information Sharing Using a Distributed Hypergraph
CN110287327A (zh) * 2019-07-03 2019-09-27 中山大学 基于教材目录和有向超图的路径适应性知识图谱自动生成方法
CN112288091A (zh) * 2020-10-30 2021-01-29 西南电子技术研究所(中国电子科技集团公司第十研究所) 基于多模态知识图谱的知识推理方法
CN112417219A (zh) * 2020-11-16 2021-02-26 吉林大学 基于超图卷积的超边链接预测方法
CN112613602A (zh) * 2020-12-25 2021-04-06 神行太保智能科技(苏州)有限公司 基于知识感知超图神经网络的推荐方法及系统
US20210375488A1 (en) * 2020-05-29 2021-12-02 Medius Health System and methods for automatic medical knowledge curation
CN113779219A (zh) * 2021-09-13 2021-12-10 内蒙古工业大学 一种结合文本双曲分段知识嵌入多重知识图谱的问答方法
CN113836312A (zh) * 2021-09-13 2021-12-24 中国人民解放军32801部队 一种基于编码器和解码器架构的知识表示推理方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180276261A1 (en) * 2014-05-30 2018-09-27 Georgetown University Process and Framework For Facilitating Information Sharing Using a Distributed Hypergraph
US20170092143A1 (en) * 2015-09-25 2017-03-30 International Business Machines Corporation Techniques for transforming questions of a question set to facilitate answer aggregation and display
CN108319705A (zh) * 2018-02-06 2018-07-24 中山大学 一种基于教学资源的个性化教学过程自动生成方法及系统
CN110287327A (zh) * 2019-07-03 2019-09-27 中山大学 基于教材目录和有向超图的路径适应性知识图谱自动生成方法
US20210375488A1 (en) * 2020-05-29 2021-12-02 Medius Health System and methods for automatic medical knowledge curation
CN112288091A (zh) * 2020-10-30 2021-01-29 西南电子技术研究所(中国电子科技集团公司第十研究所) 基于多模态知识图谱的知识推理方法
CN112417219A (zh) * 2020-11-16 2021-02-26 吉林大学 基于超图卷积的超边链接预测方法
CN112613602A (zh) * 2020-12-25 2021-04-06 神行太保智能科技(苏州)有限公司 基于知识感知超图神经网络的推荐方法及系统
CN113779219A (zh) * 2021-09-13 2021-12-10 内蒙古工业大学 一种结合文本双曲分段知识嵌入多重知识图谱的问答方法
CN113836312A (zh) * 2021-09-13 2021-12-24 中国人民解放军32801部队 一种基于编码器和解码器架构的知识表示推理方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
MENG WANG 等: "Visual Classification by ℓ1 -Hypergraph Modeling", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 *
RUNZHONG WANG 等: "Neural Graph Matching Network: Learning Lawler’s Quadratic Assignment Problem with Extension to Hypergraph and Multiple-graph Matching", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 *
朱孝文: "融合超图的项目知识图谱构建方法研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *
王琳 等: "一种张量分解的知识图谱推理优化算法", 《计算机应用研究》 *
魏泽林 等: "基于知识图谱问答系统的技术实现", 《软件工程》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116541593A (zh) * 2023-04-28 2023-08-04 华中师范大学 一种基于超图神经网络的课程推荐方法
CN116541593B (zh) * 2023-04-28 2024-05-31 华中师范大学 一种基于超图神经网络的课程推荐方法
CN116845889A (zh) * 2023-09-01 2023-10-03 东海实验室 一种基于层次化超图神经网络的电力负载预测方法
CN116845889B (zh) * 2023-09-01 2023-12-22 东海实验室 一种基于层次化超图神经网络的电力负载预测方法

Also Published As

Publication number Publication date
CN114547325B (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
JP7468929B2 (ja) 地理知識取得方法
CN112529168B (zh) 一种基于gcn的属性多层网络表示学习方法
Zhuge The Knowledge Grid: Toward Cyber-Physical Society
El Mohadab et al. Predicting rank for scientific research papers using supervised learning
CN113378048B (zh) 一种基于多视角知识图谱注意力网络的个性化推荐方法
CN114579879B (zh) 好友推荐方法、装置、设备和存储介质
CN113240086B (zh) 一种复杂网络链接预测方法及系统
CN114996488A (zh) 一种天网大数据决策级融合方法
CN112541132A (zh) 基于多视图知识表示的跨领域推荐方法
CN114547325B (zh) 一种概率超图驱动的地学知识图谱推理优化系统和方法
CN115544264A (zh) 知识驱动的桥梁建造数字孪生场景智能构建方法及系统
Fu et al. Robust representation learning for heterogeneous attributed networks
CN114528971A (zh) 一种基于异质图神经网络的图谱频繁关系模式挖掘方法
CN110909124B (zh) 基于人在回路的混合增强智能需求精准感知方法及系统
CN116595479A (zh) 基于图双重自编码器的社区发现方法、系统、设备及介质
Ramakrishnan Recommender systems of problem-solving environments
CN114153996A (zh) 多图注意力协同的地学知识图谱更新方法和装置
Woof et al. A framework for end-to-end learning on semantic tree-structured data
Costin et al. Building product models, terminologies, and object type libraries
Zhang Sharing of teaching resources for English majors based on ubiquitous learning resource sharing platform and neural network
Ding et al. Constructing a Knowledge Graph for the Chinese Subject Based on Collective Intelligence
Zhao et al. Research on emotion-embedded design flow based on deep learning technology
Luo [Retracted] A Personalized Recommendation Algorithm for Political and Ideological Courses in Colleges Using Multiple Interests of Users
Yang et al. Construction and Application of a Landscape Design Teaching Platform Driven by Artificial Intelligence
CN115146180B (zh) 一种好友和兴趣点推荐方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant