CN114020935A - 基于形式规则引导的地学知识图谱融合优化系统和方法 - Google Patents

基于形式规则引导的地学知识图谱融合优化系统和方法 Download PDF

Info

Publication number
CN114020935A
CN114020935A CN202210007775.6A CN202210007775A CN114020935A CN 114020935 A CN114020935 A CN 114020935A CN 202210007775 A CN202210007775 A CN 202210007775A CN 114020935 A CN114020935 A CN 114020935A
Authority
CN
China
Prior art keywords
knowledge
fusion
rule
graph
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210007775.6A
Other languages
English (en)
Other versions
CN114020935B (zh
Inventor
谢潇
鄂超
伍庭晨
贾慧彤
李方方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Digsur Science And Technology Co ltd
Original Assignee
Beijing Digsur Science And Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Digsur Science And Technology Co ltd filed Critical Beijing Digsur Science And Technology Co ltd
Priority to CN202210007775.6A priority Critical patent/CN114020935B/zh
Publication of CN114020935A publication Critical patent/CN114020935A/zh
Application granted granted Critical
Publication of CN114020935B publication Critical patent/CN114020935B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于形式规则引导的地学知识图谱融合优化系统和方法,该系统包括包括:向知识图谱融合优化系统输入待完善的常规地学知识图谱数据单元、基于层级划分的形式引导规则单元、基于形式规则引导的知识图谱优化单元;该方法包括向知识图谱融合优化系统输入待完善的常规地学知识图谱数据;设置地学知识图谱的形式引导规则;形式规则引导的知识图谱优化:本发明减少计算所需空间和时间;更进一步的,本方法所设计的规则及算法逻辑,对于存在关系嵌套(互影响)的多组浅、中、深层知识进行多线路并行计算融合时,能够保证局部融合准确性,以及全局结构、知识完备及关键数据不受破坏。

Description

基于形式规则引导的地学知识图谱融合优化系统和方法
技术领域
本发明属于地理大数据分析技术领域,特别涉及一种基于形式规则引导的地学知识图谱融合优化系统和方法。
背景技术
人工智能发展到今天能解决很多问题、但是也有很多问题很难理解:怎样让机器能够真正理解人的语言,目前还做得很不够。进一步规划机器学习发展路径已经成为当今的热点。机器学习目前还只是停留在计算智能、感知智能上,怎样让机器能有认知能力、模仿人去认知一些事物、提高机器学习的认识能力是一个新的课题,知识图谱就是填补人机鸿沟的很重要的方法。
知识图谱是描述真实世界中存在的各种实体、或概念、及其关系的语义网络图,所述语义网络图模拟人的语言记忆和联想方式,直接而明确地表达概念的语义关系,可利用语义网络的结构关系检索和推理,效率高、通过节点和关系的特殊图结构数据为真实世界的各个场景直观建模;语义网络在辅助智能问答、物联网设备互联、可解释性人工智能等多个方面展现出丰富的应用价值:
地学知识图谱的广泛应用可以推动地球科学与信息科学、数据科学的交叉融合,促进学科发展。具体的,地学知识图谱可以应用在工程全生命周期管理、高精度地质时间轴构建、地学大数据综合分析以及智能地图编辑与制图控制等多个地学领域场景。
然而,地学知识具有跨领域、多粒度、多尺度的信息特征,导致运用传统的三元组形式(头部节点、尾部节点、头尾之间的向量关系)进行数据存储和知识表达时,容易产生同义实体重复、知识关系错乱、图谱知识稀疏等问题,同时地学知识存在交叉现象,单体知识图谱专题性和针对性较强,无法涵盖任务场景的全过程要素,难以应用于上述地学知识服务。
现有技术为解决信息冗余、错乱及不一致等问题采用的方法是:对三元组数据进行表的遍历,首先遍历是否有同概念(文本)实体信息;若搜索到两个目标实体,进一步分别遍历,遍历所连关系、实体,对于数据量极大的知识图谱甚至需要N次遍历;遍历结束后,从机器自动的角度,仅能实现对重复实体及相连关系的无差别删除;因此,传统的直接遍历方法从算法实现角度,有计算量大、时间复杂度高、运算空间不足及结果易错的问题,并且,传统单一的方法大部分仅能实现完全相同文本的知识实体的融合,这显然存在不足。
发明内容
针对现有技术存在的问题,因此,本发明提出一种基于形式规则引导的地学知识图谱融合优化系统和方法,目的在于解决现有技术传统的直接遍历方法,计算量大、时间复杂度高、运算空间不足及结果易错的问题,并且,传统单一的方法大部分仅能实现完全相同文本的知识实体的融合的问题。
本发明为解决其技术问题采用以下技术方案。
一种基于形式规则引导的地学知识图谱融合优化系统,其特点是,包括:向知识图谱融合优化系统输入待完善的常规地学知识图谱数据单元、基于层级划分的形式引导规则单元、基于形式规则引导的知识图谱优化单元;所述的向知识图谱融合优化系统输入待完善的常规地学知识图谱数据单元,用于向设置地学知识图谱的形式引导规则单元提供待完善的常规地学知识图谱数据;所述的设置地学知识图谱的形式引导规则单元,用于根据待完善的常规地学知识图谱数据,设置相应的优化地学知识图谱的形式引导规则;所述的形式规则引导的知识图谱优化单元,用于根据设置地学知识图谱的形式引导规则单元的形式引导规则,进行常规地学知识图谱的优化。
所述向知识图谱融合优化系统输入待完善的常规地学知识图谱数据单元,包括知识图普数据库建立模块、地学知识三元组导入模块,该地学知识三元组导入模块将导入的地学知识三元组存储到知识图普数据库中;
所述基于层级划分的形式引导规则单元,包括基于信息粒度的知识层级划分模块、面向知识层级的融合规则构建模块、基于融合规则的算法实现模块;所述知识层级划分模块将知识层级划分结果发送给所述融合规则构建模块、以及所述算法实现模块,所述融合规则构建模块将融合规则发送给算法实现模块。
所述基于信息粒度的知识层级划分模块包括目标知识实体的信息粒度计算子模块、目标知识实体的层级划分模块,图节点特征计算子模块、打分函数设置子模块;所述信息粒度计算子模块根据图节点特征计算结果对目标实体进行信息粒度的计算,所述信息粒度包括概念语义、关系语义、位置语义;所述层级划分模块根据信息粒度的计算结果、以及打分函数设置子模块的打分结果,对目标知识实体进行层级划分,所述的层级划分包括浅层知识实体、中层知识实体、深层知识实体。
所述面向知识层级的融合规则构建模块包括知识简约融合规则子模块、知识合并融合规则子模块、知识重构融合规则子模块;所述知识简约融合规则子模块用于对浅层知识实体进行知识简约;所述知识合并融合规则子模块用于对中层知识实体进行知识合并;所述知识重构融合规则子模块用于对深层知识实体进行知识重构;所述知识重构融合规则子模块对深层知识实体进行知识重构的同时,也包含了对中层知识实体的合并融合、对浅层知识实体的约简融合;
所述基于融合规则的算法实现模块包括节点嵌入算法子模块、三元组嵌入算法子模块、子图嵌入算法子模块;所述节点嵌入算法子模块用于知识简约融合规则子模块,所述三元组嵌入算法子模块用于知识合并融合规则子模块,所述子图嵌入算法子模块用于知识重构融合规则子模块;所述三元组嵌入算法包含了节点嵌入算法,所述子图嵌入算法包含了三元组嵌入算法。
一种形式规则引导的地学知识图谱融合优化方法,其特征在于:该方法包括以下步骤:
步骤一、向知识图谱融合优化系统输入待完善的常规地学知识图谱数据;
所述常规地学知识图谱数据指基于人工经验构造的知识三元组,包括头部地理实体、关系、尾部地理实体,所述待完善是指常规地学知识图谱数据存在同义实体重复、知识关系错乱,图谱知识稀疏的问题;
步骤二、设置地学知识图谱的形式引导规则:所述形式引导规则包括基于信息粒度的知识层级划分、面向知识层级的融合规则构建、基于融合规则的实现算法;
步骤三、形式规则引导的知识图谱优化:依照知识层级划分、融合规则构建和实现算法,生成融合优化后的地学知识图谱,所述融合优化既是最终实现单体知识图谱的信息精确、精简、精细表达,增强知识图谱的跨域融合能力。
所述步骤二的基于信息粒度的知识层级划分,具体过程为:
1)确定知识实体在知识图谱中的信息粒度,所述信息粒度是指知识实体在图谱中表征的语义丰富与细化程度,包括概念语义
Figure 100002_DEST_PATH_IMAGE001
、关系语义
Figure 100002_DEST_PATH_IMAGE002
、及位置语义
Figure 100002_DEST_PATH_IMAGE003
2)根据知识实体表征的信息粒度,将其划分为浅、中,深三层知识级;所述知识层级
Figure 100002_DEST_PATH_IMAGE004
是基于信息粒度,即综合上述概念语义
Figure 109555DEST_PATH_IMAGE001
、关系语义
Figure 455085DEST_PATH_IMAGE002
、及位置语义
Figure 339865DEST_PATH_IMAGE003
的复杂度进行定量计算
Figure 100002_DEST_PATH_IMAGE005
并评判划分:
Figure 100002_DEST_PATH_IMAGE006
所述步骤二的面向知识层级的融合规则构建,具体为:面向不同层级的知识实体,构建用于知识融合的适应性规则:所述适应性规则包括浅层知识约简、中层知识合并,及深层知识重构;
所述浅层知识约简:知识约简是指单体地学知识图谱中,对于重复录入的知识实体进行节点的删减和关系的约除;
所述中层知识合并:知识合并是指单体地学知识图谱,或不同图谱中,对表达相同信息的知识实体进行合并,同时对合并实体的连接关系进行迁移,保证知识的完整性;
所述深层知识重构:知识重构是指在各类地学图谱进行合并时,原始实体所关联上下级实体的位置动态变化以及与融合目标实体的关系重构,深层知识融合过程较为复杂,需要结合算法实现。
所述步骤二的基于融合规则的映射算法组织,具体为:结合图论的图嵌入算法,实现基于上述规则的信息空间和向量空间双向映射,提升知识融合的可自主计算能力;所述图嵌入是指在向量空间中,具有相似特征的节点会靠近彼此,包括以下步骤:
1)对于浅层知识实体,利用节点嵌入算法(Node Embedding)进行向量相似度计算,将相似度高的重复节点进行删除,实现融合约简;
具体为:向图节点嵌入算法输入知识节点特征矩阵
Figure 100002_DEST_PATH_IMAGE007
,计算浅层知识节点相似性;所述图节点嵌入算法包括编码(Encoder)和解码(Decoder):
Figure 100002_DEST_PATH_IMAGE008
Figure 100002_DEST_PATH_IMAGE009
上式
Figure 100002_DEST_PATH_IMAGE010
为嵌入计算的任意节点,经过
Figure 100002_DEST_PATH_IMAGE011
编码后输出节点向量
Figure 100002_DEST_PATH_IMAGE012
,将节点向量
Figure 100002_DEST_PATH_IMAGE013
输入
Figure 100002_DEST_PATH_IMAGE014
,输出为
Figure 100002_DEST_PATH_IMAGE015
相似性
Figure DEST_PATH_IMAGE016
2)对于中层知识实体,利用三元组嵌入算法(SPO Embedding)计算实体与实体关系的向量相似度,实现对知识实体的融合和连接关系的迁移;
具体为:向三元组嵌入算法输入头实体为中层知识的三元组数据形式<头实体,关系,尾实体>
Figure DEST_PATH_IMAGE017
,计算相似性;通过计算任意三元组的相似性,进一步实现对中层知识实体融合和所连接关系的迁移。
3)对于深层知识实体,利用子图嵌入算法(Subgraph Embedding)计算深层实体与连接大量实体组合构成的子图向量相似度,实现知识图的整体融合。
具体为:向子图嵌入算法输入以深层知识实体为图节点中心的对应子图,计算相似性,实现原始实体的位置变化以及与融合目标实体的关系重构。
本发明的优点效果
1、本发明创新提出了知识层级规则和基于知识层级的融合规则,再同步约束图嵌入计算,对比传统遍历数据库节点和知识图谱全部节点同规则、共同图嵌入的方法,更加适应复杂度不同的知识节点,同时,分层级的嵌入能够合理分配系统计算空间,保障了知识准确性和逻辑完整性的更高效融合,从而解决了传统的直接遍历方法,计算量大、时间复杂度高、运算空间不足及结果易错的问题。
2、本发明将常规地学知识图谱数据、基于知识层级划分的形式引导规则、基于形式引导规则的知识图谱优化三者有机结合,组合以后的效果要比组合以前的效果优越得多:在对深层知识重构的同时,对所涉及浅层及中层知识同时进行相应约简融合与合并融合,减少计算所需空间和时间;更进一步的,本方法所设计的规则及算法逻辑,对于存在关系嵌套(互影响)的多组浅、中、深层知识进行多线路并行计算融合时,能够保证局部融合准确性,以及全局结构、知识完备及关键数据不受破坏。
附图说明
图1-1 为本发明基于形式规则引导的地学知识图普融合优化系统框图;
图1-2 为本发明向知识图普融合优化系统输入待完善的常规地学知识图普数据单元框图;
图1-3 为本发明基于层级划分的形式引导规则单元框图;
图1-4 为本发明基于信息粒度的知识层级划分模块框图;
图1-5 为本发明面向知识层级的融合规则构建模块框图;
图1-6 为本发明基于融合规则的算法实现模块;
图1-7 为本发明基于形式规则引导的地学知识图谱融合优化方法流程图;
图 2待优化的地学知识图谱一(部分);
图 3为本发明对地学知识图谱一采用“简约”、“合并”规则分析图;
图 4为本发明对地学知识图谱一采用“简约”、“合并”优化结果示意图;
图 5待优化的地学知识图谱二(部分);
图 6为本发明对知识图谱二采用“知识重构”优化结果示意图。
具体实施方式
下面结合附图对本发明做出进一步解释:
本发明设计原理
1、设计“知识约简”、“知识融合”、“知识重构”优化方法的原因及优势:
对浅层知识进行约简的原因及优势在于:浅层知识通常表现为图谱的边缘节点(叶子节点),其关联关系较少,即受其他知识节点影响较低,当浅层信息冗余并将其约简后对整体图谱影响较小,对浅层知识的进行约简的前提为,任意两个节点具有相似度高的关系指向和文本语义,对于浅层知识实体的判别可以通过目标知识实体的信息粒度计算模块自动判别;
对中层知识进行合并的原因及优势在于:由于中层知识受到一定的关联关系影响,且在知识图中所处位置较为关键,难以随意约简或删除,知识合并能够在减少实体冗余的同时对所含关系进行迁移,同上,对中层知识进行判断、实体融合和关系迁移过程均可通过所述通过目标知识实体的信息粒度计算模块、以及对应算法自动实现;
对深层知识进行重构的原因及优势在于,由于深层知识可抽象理解为知识树根部,从全局的视角来看,深层知识节点及其所包含的对应关系的子节点能够视作原始大型知识图谱的子图,因此,对任意两个深层知识融合即是对两个子图融合,不仅仅是约简、合并的融合操作,还需要在此基础上对图整体进行可解释的、科学的、符合逻辑的融合和重构,同上对深层知识进行判断、重构过程均可通过所述通过目标知识实体的信息粒度计算模块、以及对应算法自动实现;
2、本发明实现的难点:其难点在于,所包括算法必须互不冲突并能够并行运算,即在对深层知识重构的同时,对所涉及浅层及中层知识进行相应约简融合与合并融合,减少计算所需空间和时间;更进一步的,本方法所设计的规则及算法逻辑,对于存在关系嵌套(互影响)的多组浅、中、深层知识进行多线路并行计算融合时,能够保证局部融合准确性,以及全局结构、知识完备及关键数据不受破坏。
3、本发明针对难点的解决方案: 1)本方法利用图嵌入的机器学习算法,将具有高维度信息的知识实体和关系嵌入到低维空间进行计算和融合,从而有效简化了运算的复杂度,对比传统知识实体逐个遍历数据库节点和融合的方法,提高了机器计算效率;2)本方法创新提出的知识层级规则和基于知识层级的融合规则,再同步约束图嵌入计算,对比传统遍历数据库节点和知识图谱全部节点同规则、共同图嵌入的方法,更加适应复杂度不同的知识节点,同时,分层级的嵌入能够合理分配系统计算空间,实现了知识准确性,逻辑完整性的更高效融合。
基于以上原理,本发明设计了一种基于形式规则引导的地学知识图谱融合优化系统和方法。
一种基于形式规则引导的地学知识图谱融合优化系统如图1-1所示,其特点是,包括:向知识图谱融合优化系统输入待完善的常规地学知识图谱数据单元、基于层级划分的形式引导规则单元、基于形式规则引导的知识图谱优化单元;所述的向知识图谱融合优化系统输入待完善的常规地学知识图谱数据单元,用于向设置地学知识图谱的形式引导规则单元提供待完善的常规地学知识图谱数据;所述的设置地学知识图谱的形式引导规则单元,用于根据待完善的常规地学知识图谱数据,设置相应的优化地学知识图谱的形式引导规则;所述的形式规则引导的知识图谱优化单元,用于根据设置地学知识图谱的形式引导规则单元的形式引导规则,进行常规地学知识图谱的优化。
如图1-2所示,所述向知识图谱融合优化系统输入待完善的常规地学知识图谱数据单元,包括知识图普数据库建立模块、地学知识三元组导入模块,该地学知识三元组导入模块将导入的地学知识三元组存储到知识图普数据库中;
如图1-3所示,所述基于层级划分的形式引导规则单元,包括基于信息粒度的知识层级划分模块、面向知识层级的融合规则构建模块、基于融合规则的算法实现模块;所述知识层级划分模块将知识层级划分结果发送给所述融合规则构建模块、以及所述算法实现模块,所述融合规则构建模块将融合规则发送给算法实现模块。
如图1-4所示,所述基于信息粒度的知识层级划分模块包括目标知识实体的信息粒度计算子模块、目标知识实体的层级划分模块,图节点特征计算子模块、打分函数设置子模块;所述信息粒度计算子模块根据图节点特征计算结果对目标实体进行信息粒度的计算,所述信息粒度包括概念语义、关系语义、位置语义;所述层级划分模块根据信息粒度的计算结果、以及打分函数设置子模块的打分结果,对目标知识实体进行层级划分,所述的层级划分包括浅层知识实体、中层知识实体、深层知识实体。
如图1-5所示,所述面向知识层级的融合规则构建模块包括知识简约融合规则子模块、知识合并融合规则子模块、知识重构融合规则子模块;所述知识简约融合规则子模块用于对浅层知识实体进行知识简约;所述知识合并融合规则子模块用于对中层知识实体进行知识合并;所述知识重构融合规则子模块用于对深层知识实体进行知识重构;所述知识重构融合规则子模块对深层知识实体进行知识重构的同时,也包含了对中层知识实体的合并融合、对浅层知识实体的约简融合;
如图1-6所示,所述基于融合规则的算法实现模块包括节点嵌入算法子模块、三元组嵌入算法子模块、子图嵌入算法子模块;所述节点嵌入算法子模块用于知识简约融合规则子模块,所述三元组嵌入算法子模块用于知识合并融合规则子模块,所述子图嵌入算法子模块用于知识重构融合规则子模块;所述三元组嵌入算法包含了节点嵌入算法,所述子图嵌入算法包含了三元组嵌入算法。
一种形式规则引导的地学知识图谱融合优化方法,其特征在于:该方法包括以下步骤:
步骤一、向知识图谱融合优化系统输入待完善的常规地学知识图谱数据;
所述常规地学知识图谱数据指基于人工经验构造的知识三元组,包括头部地理实体、关系、尾部地理实体,所述待完善是指常规地学知识图谱数据存在同义实体重复、知识关系错乱,图谱知识稀疏的问题;
步骤二、设置地学知识图谱的形式引导规则:所述形式引导规则包括基于信息粒度的知识层级划分、面向知识层级的融合规则构建、基于融合规则的实现算法;
步骤三、形式规则引导的知识图谱优化:依照知识层级划分、融合规则构建和实现算法,生成融合优化后的地学知识图谱,所述融合优化既是最终实现单体知识图谱的信息精确、精简、精细表达,增强知识图谱的跨域融合能力。
所述步骤二的基于信息粒度的知识层级划分,具体过程为:
1)确定知识实体在知识图谱中的信息粒度,所述信息粒度是指知识实体在图谱中表征的语义丰富与细化程度,包括概念语义
Figure DEST_PATH_IMAGE018
、关系语义
Figure DEST_PATH_IMAGE019
、及位置语义
Figure DEST_PATH_IMAGE020
2)根据知识实体表征的信息粒度,将其划分为浅、中,深三层知识级;所述知识层级
Figure DEST_PATH_IMAGE021
是基于信息粒度,即综合概念语义
Figure 368083DEST_PATH_IMAGE001
、关系语义
Figure 363720DEST_PATH_IMAGE002
、及位置语义
Figure 953971DEST_PATH_IMAGE003
义的复杂度进行定量计算
Figure DEST_PATH_IMAGE022
并评判划分:
Figure DEST_PATH_IMAGE023
所述步骤二的面向知识层级的融合规则构建,具体为:面向不同层级的知识实体,构建用于知识融合的适应性规则:所述适应性规则包括浅层知识约简、中层知识合并,及深层知识重构;
所述浅层知识约简:知识约简是指单体地学知识图谱中,对于重复录入的知识实体进行节点的删减和关系的约除;
所述中层知识合并:知识合并是指单体地学知识图谱,或不同图谱中,对表达相同信息的知识实体进行合并,如“高分一号”和“GF-1”属于同义知识实体,同时对合并实体的连接关系进行迁移,保证知识的完整性;
所述深层知识重构:知识重构是指在各类地学图谱进行合并时,原始实体所关联上下级实体的位置动态变化以及与融合目标实体的关系重构,深层知识融合过程较为复杂,需要结合算法实现。
所述步骤二的基于融合规则的映射算法组织,具体为:结合图论的图嵌入算法,实现基于上述规则的信息空间和向量空间双向映射,提升知识融合的可自主计算能力;所述图嵌入是指在向量空间中,具有相似特征的节点会靠近彼此,包括以下步骤:
1)对于浅层知识实体,利用节点嵌入算法(Node Embedding)进行向量相似度计算,将相似度高的重复节点进行删除,实现融合约简;
具体为:向图节点嵌入算法输入知识节点特征矩阵
Figure DEST_PATH_IMAGE024
,计算浅层知识节点相似性,由节点嵌入算法输出需要约简的节点,若后面还有其它算法,则节点嵌入算法将计算结果暂时存在计算空间中,待全部算法完成后一起对数据库进行增删查改;所述图节点嵌入算法包括编码(Encoder)和解码(Decoder):
Figure DEST_PATH_IMAGE025
Figure DEST_PATH_IMAGE026
上式
Figure DEST_PATH_IMAGE027
为嵌入计算的任意节点,经过
Figure DEST_PATH_IMAGE028
编码后输出节点向量
Figure DEST_PATH_IMAGE029
,将节点向量
Figure DEST_PATH_IMAGE030
输入
Figure DEST_PATH_IMAGE031
,输出为
Figure DEST_PATH_IMAGE032
相似性
Figure DEST_PATH_IMAGE033
2)对于中层知识实体,利用三元组嵌入算法(SPO Embedding)计算实体与实体关系的向量相似度,实现对知识实体的融合和连接关系的迁移;
具体为:向三元组嵌入算法输入头实体为中层知识的三元组数据形式<头实体,关系,尾实体>
Figure DEST_PATH_IMAGE034
,计算相似性;通过计算任意三元组的相似性,进一步实现对中层知识实体融合和所连接关系的迁移。由三元组嵌入算法输出需要合并的节点和迁移的关系,若上面还有约简结果,则结合上述约简结果,由三元组嵌入算法在知识数据库中进行增删改,释放计算空间。
3)对于深层知识实体,利用子图嵌入算法(Subgraph Embedding)计算深层实体与连接大量实体组合构成的子图向量相似度,实现知识图的整体融合。
具体为:向子图嵌入算法输入以深层知识实体为图节点中心的对应子图,计算相似性,实现原始实体的位置变化以及与融合目标实体的关系重构,由子图嵌入算法输出需要融合的节点和重构的关系,并由子图嵌入算法在知识数据库中进行增删改,释放计算空间。
实施例一:浅层知识约简、中层知识合并的设计
1) 原始地学知识图谱未能体现层级的划分:图2所示为待优化的地学知识图谱一(部分),该图是一张原始的没有划分层级的图,从图中看出,实体节点中有2个重复的0.6米, 2个近似的“Spot-5”和“spot5”
2)设置打分函数并设置层级。如图3所示,设计划分层级的打分函数:
Figure DEST_PATH_IMAGE035
;根据各个节点的分数将它们分为三层:深层、中层、浅层:图3中的2个0.6米划分为浅层,因为它们的位置为末梢层,也就是叶子级别,对叶子级别“概念重复”的实体采用“知识约简”的方法,具体为:输入叶子级别节点至所述节点嵌入算法,由节点嵌入算法输出需要约简的节点,暂时存在计算空间中。图3中2个近似的“Spot-5”和“spot5”,其中,“spot5”打分后划分为深层,“Spot-5”打分后划分为中层,因为“Spot-5”是“spot5”的对象,当对象是中层级别时,就将“Spot-5”和“spot5”采用“知识合并”的方法,具体为:输入中层级别节点和所连关系至所述三元组嵌入算法,由三元组嵌入算法输出需要合并的节点和迁移的关系,结合上述约简结果,同时,由三元组嵌入算法在知识数据库中进行增删改,释放计算空间。
3)优化的结果。图4是图3优化以后的结果。对浅层0.6米的2个实体进行“知识约简”的优化后,重复的概念被删除了,但原始图的关系并未删除而是被迁移过来,从而保留了完整了关联关系。“Spot-5”和“spot5”进行“知识融合”的优化后,“spot5”被保留,“Spot-5”被融合,同时,将“Spot-5”的关系“包含0.8米”迁移到“spot5”的关系中,由原来的“spot5”的包含关系为3个改为4个:包含5米、0.6米、0.8米、10米。
实施例二:深层知识重构的设计:
1)图5所示为待优化的地学知识图谱二(部分),人工发现,第一个需要优化的地方,四个黑色实体中,两两重复,为同一概念,需要通过“知识融合”进行优化;第二个需要优化的地方,图谱知识稀疏,0.7米、0.8米属于卫星分辨率的细分内容,但是却没有和卫星分辨率连接。
2)经过打分函数计算,四个黑色实体均被划分为深层。对于深层进行知识重构的方法,既包含前面“知识简约”、“知识融合”,也包含“知识重构”,可以根据需要选择全部优化方法或部分优化方法。图5中,对于两两重复的问题采用“知识融合”的方法,对于“图谱知识稀疏”的问题采用“知识重构”的方法,具体为:输入子图节点和所涉及关系至所述子图嵌入算法,由子图嵌入算法输出需要融合的节点和重构的关系,并由子图嵌入算法在知识数据库中进行增删改,释放计算空间。“知识重构”以后,将0.8米、0.7米连接“卫星分辨率”。具体为:结合图5和图6,有如下知识及关系:<landset,包含,0.8米>(图5左)与<Landset,包含,2.5米>(图4右)与<卫星分辨率,细分,2.5米>;通过该方法融合优化在于:①合并了“landset”和“Landset”;
3)优化结果:正确迁移了“landset”与“2.5米”和“1.5”米的包含关系;重构了“卫星分辨率”与“0.8米”实体之间的“细分关系”,保障了知识完整性;“QuickBird”同上,证明了本方法能够实现并行计算和融合。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例。

Claims (10)

1.一种基于形式规则引导的地学知识图谱融合优化系统,其特征在于,包括:向知识图谱融合优化系统输入待完善的常规地学知识图谱数据单元、基于层级划分的形式引导规则单元、基于形式规则引导的知识图谱优化单元;所述的向知识图谱融合优化系统输入待完善的常规地学知识图谱数据单元,用于向设置地学知识图谱的形式引导规则单元提供待完善的常规地学知识图谱数据;所述的设置地学知识图谱的形式引导规则单元,用于根据待完善的常规地学知识图谱数据,设置相应的优化地学知识图谱的形式引导规则;所述的形式规则引导的知识图谱优化单元,用于根据设置地学知识图谱的形式引导规则单元的形式引导规则,进行常规地学知识图谱的优化。
2.根据权利要求1所述的一种基于形式规则引导的地学知识图谱融合优化系统,其特征在于:
所述向知识图谱融合优化系统输入待完善的常规地学知识图谱数据单元,包括知识图普数据库建立模块、地学知识三元组导入模块,该地学知识三元组导入模块将导入的地学知识三元组存储到知识图普数据库中;
所述基于层级划分的形式引导规则单元,包括基于信息粒度的知识层级划分模块、面向知识层级的融合规则构建模块、顾忌融合规则的算法实现模块;所述知识层级划分模块将知识层级划分结果发送给所述融合规则构建模块、以及所述算法实现模块,所述融合规则构建模块将融合规则发送给算法实现模块。
3.根据权利要求2所述的一种基于形式规则引导的地学知识图谱融合优化系统,其特征在于:
所述基于信息粒度的知识层级划分模块包括目标知识实体的信息粒度计算子模块、目标知识实体的层级划分模块,图节点特征计算子模块、打分函数设置子模块;所述信息粒度计算子模块根据图节点特征计算结果对目标实体进行信息粒度的计算,所述信息粒度包括概念语义、关系语义、位置语义;所述层级划分模块根据信息粒度的计算结果、以及打分函数设置子模块的打分结果,对目标知识实体进行层级划分,所述的层级划分包括浅层知识实体、中层知识实体、深层知识实体;
所述面向知识层级的融合规则构建模块包括知识简约融合规则子模块、知识合并融合规则子模块、知识重构融合规则子模块;所述知识简约融合规则子模块用于对浅层知识实体进行知识简约;所述知识合并融合规则子模块用于对中层知识实体进行知识合并;所述知识重构融合规则子模块用于对深层知识实体进行知识重构;所述知识重构融合规则子模块对深层知识实体进行知识重构的同时,也包含了对中层知识实体的合并融合、对浅层知识实体的约简融合;
所述基于融合规则的算法实现模块包括节点嵌入算法子模块、三元组嵌入算法子模块、子图嵌入算法子模块;所述节点嵌入算法子模块用于知识简约融合规则子模块,所述三元组嵌入算法子模块用于知识合并融合规则子模块,所述子图嵌入算法子模块用于知识重构融合规则子模块;所述三元组嵌入算法包含了节点嵌入算法,所述子图嵌入算法包含了三元组嵌入算法。
4.一种基于权利要求1-3任意一项所述一种基于形式规则引导的地学知识图谱融合优化系统的一种形式规则引导的地学知识图谱融合优化方法,其特征在于:该方法包括以下步骤:
步骤一、向知识图谱融合优化系统输入待完善的常规地学知识图谱数据;
所述常规地学知识图谱数据指基于人工经验构造的知识三元组,包括头部地理实体、关系、尾部地理实体,所述待完善是指常规地学知识图谱数据存在同义实体重复、知识关系错乱,图谱知识稀疏的问题;
步骤二、设置地学知识图谱的形式引导规则:所述形式引导规则包括基于信息粒度的知识层级划分、面向知识层级的融合规则构建、基于融合规则的实现算法;
步骤三、形式规则引导的知识图谱优化:依照知识层级划分、融合规则构建和实现算法,生成融合优化后的地学知识图谱,所述融合优化既是最终实现单体知识图谱的信息精确、精简、精细表达,增强知识图谱的跨域融合能力。
5.根据权利要求4所述一种形式规则引导的地学知识图谱融合优化方法,其特征在于:所述步骤二的基于信息粒度的知识层级划分,具体过程为:
1)确定知识实体在知识图谱中的信息粒度,所述信息粒度是指知识实体在图谱中表征的语义丰富与细化程度,包括概念语义
Figure DEST_PATH_IMAGE001
、关系语义
Figure DEST_PATH_IMAGE002
、及位置语义
Figure DEST_PATH_IMAGE003
2)根据知识实体表征的信息粒度,将其划分为浅、中,深三层知识级;所述知识层级
Figure DEST_PATH_IMAGE004
是基于信息粒度,即综合上述概念语义
Figure 33261DEST_PATH_IMAGE001
、关系语义
Figure 340614DEST_PATH_IMAGE002
、及位置语义
Figure 182668DEST_PATH_IMAGE003
的复杂度进行定量计算
Figure DEST_PATH_IMAGE005
并评判划分:
Figure DEST_PATH_IMAGE006
6.根据权利要求4所述一种形式规则引导的地学知识图谱融合优化方法,其特征在于:所述步骤二的面向知识层级的融合规则构建,具体为:面向不同层级的知识实体,构建用于知识融合的适应性规则:所述适应性规则包括浅层知识约简、中层知识合并,及深层知识重构;
所述浅层知识约简:知识约简是指单体地学知识图谱中,对于重复录入的知识实体进行节点的删减和关系的约除;
所述中层知识合并:知识合并是指单体地学知识图谱,或不同图谱中,对表达相同信息的知识实体进行合并,同时对合并实体的连接关系进行迁移,保证知识的完整性;
所述深层知识重构:知识重构是指在各类地学图谱进行合并时,原始实体所关联上下级实体的位置动态变化以及与融合目标实体的关系重构,深层知识融合过程较为复杂,需要结合算法实现。
7.根据权利要求4所述一种形式规则引导的地学知识图谱融合优化方法,其特征在于:所述步骤二的基于融合规则的映射算法组织,具体为:结合图论的图嵌入算法,实现基于上述规则的信息空间和向量空间双向映射,提升知识融合的可自主计算能力;所述图嵌入是指在向量空间中,具有相似特征的节点会靠近彼此,包括以下步骤:
1)对于浅层知识实体,利用节点嵌入算法进行向量相似度计算,将相似度高的重复节点进行删除,实现融合约简;
2)对于中层知识实体,利用三元组嵌入算法计算实体与实体关系的向量相似度,实现对知识实体的融合和连接关系的迁移;
3)对于深层知识实体,利用子图嵌入算法计算深层实体与连接大量实体组合构成的子图向量相似度,实现知识图的整体融合。
8.根据权利要求7所述的形式规则引导的地学知识图谱融合优化方法,其特征在于:所述步骤1),具体为:向图节点嵌入算法输入知识节点特征矩阵
Figure DEST_PATH_IMAGE007
,计算浅层知识节点相似性;所述图节点嵌入算法包括编码(Encoder)和解码(Decoder):
Figure DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE009
上式
Figure DEST_PATH_IMAGE010
为嵌入计算的任意节点,经过ENC 编码后输出节点向量
Figure DEST_PATH_IMAGE011
,将节点向量
Figure DEST_PATH_IMAGE012
输入DEC ,输出为
Figure DEST_PATH_IMAGE013
相似性
Figure DEST_PATH_IMAGE014
9.根据权利要求7所述的形式规则引导的地学知识图谱融合优化方法,
其特征在于:所述步骤2),具体为:向三元组嵌入算法输入头实体为中层知识的三元组数据形式<头实体,关系,尾实体>
Figure DEST_PATH_IMAGE015
,计算相似性;通过计算任意三元组的相似性,进一步实现对中层知识实体融合和所连接关系的迁移。
10.根据权利要求7所述的形式规则引导的地学知识图谱融合优化方法,其特征在于:所述步骤3),具体为:向子图嵌入算法输入以深层知识实体为图节点中心的对应子图,计算相似性,实现原始实体的位置变化以及与融合目标实体的关系重构。
CN202210007775.6A 2022-01-06 2022-01-06 基于形式规则引导的地学知识图谱融合优化系统和方法 Active CN114020935B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210007775.6A CN114020935B (zh) 2022-01-06 2022-01-06 基于形式规则引导的地学知识图谱融合优化系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210007775.6A CN114020935B (zh) 2022-01-06 2022-01-06 基于形式规则引导的地学知识图谱融合优化系统和方法

Publications (2)

Publication Number Publication Date
CN114020935A true CN114020935A (zh) 2022-02-08
CN114020935B CN114020935B (zh) 2022-03-25

Family

ID=80069843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210007775.6A Active CN114020935B (zh) 2022-01-06 2022-01-06 基于形式规则引导的地学知识图谱融合优化系统和方法

Country Status (1)

Country Link
CN (1) CN114020935B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550221A (zh) * 2015-12-04 2016-05-04 百度在线网络技术(北京)有限公司 信息搜索方法及装置
US20200073932A1 (en) * 2018-08-30 2020-03-05 Intelligent Fusion Technology, Inc Method and system for pattern discovery and real-time anomaly detection based on knowledge graph
CN112612908A (zh) * 2021-01-05 2021-04-06 上海云扣科技发展有限公司 自然资源知识图谱构建方法、装置、服务器及可读存储器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550221A (zh) * 2015-12-04 2016-05-04 百度在线网络技术(北京)有限公司 信息搜索方法及装置
US20200073932A1 (en) * 2018-08-30 2020-03-05 Intelligent Fusion Technology, Inc Method and system for pattern discovery and real-time anomaly detection based on knowledge graph
CN112612908A (zh) * 2021-01-05 2021-04-06 上海云扣科技发展有限公司 自然资源知识图谱构建方法、装置、服务器及可读存储器

Also Published As

Publication number Publication date
CN114020935B (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
Hui et al. Linguistic structure guided context modeling for referring image segmentation
CN115269751B (zh) 地理实体时空知识图谱本体库构建方法
CN111368095B (zh) 基于水利知识-事理耦合网络的决策支持系统架构与方法
Beirão et al. Creating specific grammars with generic grammars: towards flexible urban design
CN109949692B (zh) 路网匹配方法、装置、计算机设备及存储介质
Du et al. Geospatial information integration for authoritative and crowd sourced road vector data
CN114238542A (zh) 多源交通gis路网多层级实时融合更新方法
Dilo Representation of and reasoning with vagueness in spatial information: A system for handling vague objects
CN115544264A (zh) 知识驱动的桥梁建造数字孪生场景智能构建方法及系统
CN114547325A (zh) 一种概率超图驱动的地学知识图谱推理优化系统和方法
Martin et al. Graph-ResNets for short-term traffic forecasts in almost unknown cities
CN116518960A (zh) 路网更新方法、装置、电子设备和存储介质
Li et al. Hierarchical elimination selection method of dendritic river network generalization
Jin et al. Association rules redundancy processing algorithm based on hypergraph in data mining
Nguyen et al. Realistic road path reconstruction from GIS data
CN114020935B (zh) 基于形式规则引导的地学知识图谱融合优化系统和方法
CN111159424B (zh) 标注知识图谱实体的方法,装置,存储介质及电子设备
Caiqian et al. Multimedia system and database simulation based on internet of things and cloud service platform
Touya Relevant space partitioning for collaborative generalisation
Bloch On fuzzy spatial distances
Wang et al. [Retracted] An Intelligent Animation Interaction Design Algorithm Based on Example and Parameterization
CN111552758B (zh) 一种基于gis技术的风景名胜数据库及其构建方法
Wang et al. GIS cloud computing based government Big Data analysis platform
Liu et al. Construction Method of City-Level Geographic Knowledge Graph Based on Geographic Entity
CN110147393A (zh) 面向数据空间的实体解析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant