CN116108205A - 空间关系的知识图谱数据模型构建方法、装置及查询方法 - Google Patents

空间关系的知识图谱数据模型构建方法、装置及查询方法 Download PDF

Info

Publication number
CN116108205A
CN116108205A CN202310290230.5A CN202310290230A CN116108205A CN 116108205 A CN116108205 A CN 116108205A CN 202310290230 A CN202310290230 A CN 202310290230A CN 116108205 A CN116108205 A CN 116108205A
Authority
CN
China
Prior art keywords
space
time
grid
knowledge
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310290230.5A
Other languages
English (en)
Inventor
刘杰
任伏虎
刘嘉澍
伍学民
王丽娜
王飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beidou Fuxi Zhongke Digital Hefei Co ltd
Original Assignee
Beidou Fuxi Zhongke Digital Hefei Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beidou Fuxi Zhongke Digital Hefei Co ltd filed Critical Beidou Fuxi Zhongke Digital Hefei Co ltd
Priority to CN202310290230.5A priority Critical patent/CN116108205A/zh
Publication of CN116108205A publication Critical patent/CN116108205A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种空间关系的知识图谱数据模型构建方法、装置及查询方法。其中空间关系的知识图谱数据模型构建方法,包括:为时空数据赋予剖分网格编码及时间剖分编码;对装载在剖分网格中的时空数据进行网格化建模,抽取出时空数据中的时空实体;将时空实体引入预构建的逻辑实体知识库;在逻辑实体知识库的基础上,通过剖分网格编码的计算建立时空实体间的空间关系,从而得到网格时空知识图谱。通过将时空数据装载在剖分网格中,通过剖分网格表达地理空间节点多源异构数据,从而达到支持地理空间节点多源异构数据的高效表达并提供时空对象存储、检索、推理、计算和管理的目的。

Description

空间关系的知识图谱数据模型构建方法、装置及查询方法
技术领域
本发明属于知识图谱技术领域,尤其是涉及一种空间关系的知识图谱数据模型构建方法、装置及查询方法。
背景技术
时空知识图谱是知识图谱在时间和空间上的拓展,是结构化的时空信息知识库;是通过描述地理时空信息领域的概念、实体、属性及其相互关系,构成的网状知识结构。时空知识图谱的核心是有效组织地理时空信息和知识,在其基础上形成时空知识网,然后通过时空计算模型、自然语义模型等,实现时空信息和时空知识的存储、检索、推理、计算和管理,进而实现语义搜索、时空计算、时空知识推荐、关联分析等功能,从而具备对地理空间、时间上分散的人、环境、事件等进行大规模实时关联、智能问答、推理分析的能力。
目前针对时空知识图谱的研究主要包括语义网络在时空场景下的应用和基于面向对象GIS增强的时空知识图谱两个方面。
语义网络在时空场景下的应用主要是借助知识图谱的传统属性,构建语义网络模型描述时空对象。基于自然语言的语义模型是借助知识图谱的传统属性,构建语义和自然语言模型来描述时空对象。具体做法是将不同来源的知识进行对齐、合并,形成全局统一的知识标识和关联,解决知识图谱异构问题。在地理信息领域,针对海量地理空间数据的多样性和异构性,知识图谱的应用也相继应运而生,常见的开发操作是利用基于网络平台的大量志愿者贡献的地理数据和地理知识,提取各种不同类型的地理实体,以资源描述框架(RDF)中三元组(实体,关系,实体)格式存储为通用的地理知识图谱。该方法缺乏对时间和空间特征的建模,侧重逻辑推理,无法进行实时空间计算,采用逻辑推理得到的空间关系模式单一,基于语义描述的空间关系难以满足复杂空间问答、计算的需求。同时,传统知识图谱时空描述不具有唯一性,有限的关联难以进行复杂的时空推理。地理信息空间分析的目的在于找出地理实体与相关实体的空间关系。现有知识图谱描述同一个岛屿的位置,即可能用经纬度描述、有可能选取不同的参照物描述,这样不唯一的时空描述很难用于复杂的空间分析。
基于面向对象GIS增强的时空知识图谱主要是借助传统的面向对象的传统GIS模型组织时空对象、进行空间推理。GIS系统是连续的,关系有无限多种,不利于表达知识图谱图中节点之间的关系。如果时空关系不在面向对象GIS系统中进行计算,全部放入传统知识图谱系统,即脱离面向对象的GIS系统的空间计算,把时空实体作为知识图谱节点形成的一套系统,节点和节点之间的关系将无限多:有无数多的方位描述,有无数多个距离描述,有无数多的复杂空间关系。容易使系统要维护的关系数超过系统本身的节点数,使知识图谱系统脱离了常规的使用和维护范畴。知识图谱是一张知识图,不同类型的对象之间的逻辑关系,需要能在同一张图上表达,而面向对象的GIS系统中,信息综合时GIS变成最小图斑,要用overlay的跨图层计算,这种分专题图的表达方法和知识图谱以对象标识语义相关的表达方法是有一定冲突的——无法在一张图中进行表达,引入面向对象的GIS系统,势必造成跨系统的操作和数据冗余。面向对象的GIS分析框架一般只涉及空间和属性维度,对空间对象的描述和表达是静态的。随着地理信息领域的发展,动态表达空间对象成为趋势,时间维度的加入亟待解决。因此,具有时空属性的知识图谱是新地理信息时代的需求,也是广义GIS的重要发展方向。
现有的语义知识图谱采用基于“实体—关系”的数据表达,对实体和概念节点以及逻辑关系知识具有稳定的存储管理和推理应用能力,但其不支持地理时空节点(含时空实体和时间空间数据)的表达;不具备高效的时空存储、检索、推理、计算和管理能力。
现有的时空知识图谱中引入的面向实体的GIS模型进行空间对象组织的方法无法满足大数据时代下对时空知识图谱支持全域时空知识自适应表达、支持多源异构数据甚至多模态数据、支持群智协同的图谱演进、支持机器挖掘的动态知识获取等要求。
发明内容
针对现有技术中存在的问题,本发明提供了一种空间关系的知识图谱数据模型构建方法、装置及查询方法,至少部分的解决现有技术中存在的不能支持地理空间节点多源异构数据高效表达的问题。
第一方面,本公开实施例提供了一种空间关系的知识图谱数据模型构建方法,包括:
将时空数据装载在剖分网格中,为时空数据赋予剖分网格编码及时间剖分编码;
对装载在剖分网格中的时空数据进行网格化建模,抽取出时空数据中的时空实体;
将时空实体引入预构建的逻辑实体知识库;
在逻辑实体知识库的基础上,通过剖分网格编码的计算建立时空实体间的空间关系,从而得到网格时空知识图谱。
可选的,所述网格时空知识图谱中包括地理信息和多源异构的时空数据;所述多源异构的时空数据通过时空数据标准化赋码引接,转换为标准化的时间数据。
可选的,所述多源异构的时空数据通过时空数据标准化赋码引接,包括:
设剖分网格中空间剖分网格的全集为
Figure BDA0004141161350000041
其中,
Figure BDA0004141161350000042
表示第l层级的所有网格,且对第l层级的任意两个网格Cp(l),Cq(l)(p≠q),均有
Figure BDA0004141161350000043
则对于时空实体中的某一空间实体obj,令O(obj)表示其占据的真实空间,其表示精度在网格体系中对应的层级为l,该空间实体在剖分空间中可描述为若干个第l层级格网的集合
Figure BDA0004141161350000044
Figure BDA0004141161350000045
对于格网集合的属性,令Attr(·)表示空间实体或其表达的属性,则,
Figure BDA0004141161350000046
Attr(C(l))=Attr(O(C(l)))。
可选的,所述多源异构的时空数据通过时空数据标准化赋码引接,包括:
对时空实体的描述引入时间剖分编码,用时间剖分编码直接对时空实体的时间特征进行建模,并按照时间的先后顺序和设定的时间间隔组织不同时刻的空间数据;
将时空实体的网格化描述为三维的网格集合。
可选的,所述将时空实体的网格化描述为三维的网格集合,包括:
令obj为时空实体,objt表示t时刻该时空实体的空间状态,其中
Figure BDA0004141161350000051
Figure BDA0004141161350000052
表示全部时间域,则时空实体表示为时空网格的集合:
Figure BDA0004141161350000053
可选的,所述网格时空知识图谱的数据组织模型,包括:
网格时空知识图谱以三元组形式进行数据组织和数据表达,将时空剖分网格引入图谱成为节点,时空剖分网格为将时空数据装载在剖分网格中得到的;
所述网格时空知识图谱的数据组织模型,包括:
知识表示、在网格中承载时空知识、节点、边和属性。
可选的,所述知识表示,包括将概念表示为类,概念和概念之间表示为子类的关系;
所述节点包括实体和网格;
所述边包括显示关系和隐式关系,显示关系直接表示实体或类间的时空关系或非时空关系,未通过显式关系表示的、通过剖分网格编码代数计算得到的关系即为隐式关系。
可选的,在网格中承载时空知识,包括时空网格的表达,所述时空网格的表达包括空间和对象:
Figure BDA0004141161350000054
Space为空间,GridID为网格编码,ObjectID为对象编码,TimeID为时间编码序列,M、N和S均为常数;
Figure BDA0004141161350000061
Object为对象,attibute为属性,m和n为常数。
第二方面,本公开实施例还提供了一种空间关系的知识图谱数据模型构建装置,包括:
装载模块,用于将时空数据装载在剖分网格中,为时空数据赋予剖分网格编码及时间剖分编码;
抽取模块,用于对装载在剖分网格中的时空数据进行网格化建模,抽取出时空数据中的时空实体;
引入模块,用于将时空实体引入预构建的逻辑实体知识库;
构建模块,用于在逻辑实体知识库的基础上,通过剖分网格编码的计算建立时空实体间的空间关系,从而得到网格时空知识图谱。
第三方面,本公开实施例还提供了一种基于空间关系的知识图谱数据模型的查询方法,包括:利用网格时空知识图谱,基于选择的实体相关的网格进行查询,其中所述网格时空知识图谱的数据模型通过如第一方面任一所述的方法构建而得;
判断查询网格的时间属性,从而返回符合过滤条件的网格的查询结果。
本发明提供的空间关系的知识图谱数据模型构建方法,通过将时空数据装载在剖分网格中,通过剖分网格表达地理空间节点多源异构数据,网格是知识图谱中的节点,参与逻辑推理,并具有空间计算能力,从而达到支持地理空间节点多源异构数据的高效表达并提供时空对象存储、检索、推理、计算和管理的目的。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1为本公开实施例提供的网格时空知识图谱的概念结构示意图;
图2为本公开实施例提供的网格时空知识图谱的构建的原理框图;
图3为本公开实施例提供的网格时空知识图谱示意图;
图4为本公开实施例提供的网格时空知识图谱的属性示意图;
图5为本公开实施例提供的围绕实体船B的网格时空知识图谱示意图;
图6为本公开实施例提供的一种电子设备的原理框图。
具体实施方式
下面结合附图对本公开实施例进行详细描述。
应当明确,以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图示中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
为突破基于多源异构数据的知识萃取、不完备信息下的目标准确认知、目标群体行为预测、高维时空变化演进规模与分析等关键技术,为提升时空认知能力奠定理论和技术基础,本实施例提出了网格时空知识图谱。网格时空知识图谱是全球剖分网格体系在知识图谱领域的具体应用。既是为知识图谱的时空对象提供网格剖分的管理计算框架,也是全球剖分网格业务能力范围的扩展。在语义网络中引入时空剖分网格模型,对带有时空特征和时空属性的节点进行基于时空剖分网格的数据组织和管理,依托时空剖分网格的时空表达能力及网格代数计算能力,实现“以存储网格编码替代存储空间信息和复杂空间关系”,在其基础上形成时空知识网,从而更高效、更快速地支持图谱的时空推理,并为图谱的存储、检索、快速更新、可视化、推理、计算、从知识图谱到认知图谱等应用提供基础能力。
图1所示为网格时空知识图谱的概念结构图。多源异构的时空原始数据通过时空数据的标准化赋码引接,形成时空数据的网格数据建模,即将时空信息装载在剖分网格中。结合实体关系数据,通过网格时空知识图谱的数据组织模型,形成网格时空知识图谱。基于网格时空知识图设计推理模型、计算模型、判定模型、意图模型等模型算法,模型可输出推理和计算结果、判定网格时空表达图、意图态势图等。基于以上数据层和模型层,可支持综合信息检索推理、关联信息智能推送、盲区预测和补全、轨迹预测分析、时空知识问答综合态势融合分析、时空知识判定等应用。
在网格时空知识图谱的研究中,网格时空知识图谱的三元组描述框架是研究重点之一。
本实施中网格时空知识图谱使用GeoSOT全球时空剖分网格框架对时空实体、时空属性进行标准化时空建模描述。
本实施例公开的空间关系的知识图谱数据模型构建方法,包括:
将时空数据装载在剖分网格中,为时空数据赋予剖分网格编码及时间剖分编码;
对装载在剖分网格中的时空数据进行网格化建模,抽取出时空数据中的时空实体;
将时空实体引入预构建的逻辑实体知识库;
在逻辑实体知识库的基础上,通过剖分网格编码的计算建立时空实体间的空间关系,从而得到网格时空知识图谱。
如图2所示,具体包括:将时空数据装载在地球剖分网格中,为时空数据赋予地球剖分网格编码及时间剖分编码,对时空数据进行网格化建模,并抽取出时空实体并引入逻辑实体知识库,通过网格编码的代数计算建立实体间的空间关系。
建立在知识图谱构建方法的基础上,网格时空知识图谱中既包括带有泛在地理信息的文献、书籍、网络文本等数据,也包括多源异构的时空数据。对于多源异构的时空数据,需要采用时空网格数据组织方法。
多源异构时空数据在网格时空知识图谱中的数据组织方法:
空间上,每个GeoSOT-3D网格在剖分体系中具有明确的位置,并可以与现实世界中的特定范围建立对应关系;GeoSOT空间网格可以完整地表述空间实体的位置属性和表示精度。GeoSOT网格的整体思路是“面向空间建模”而非“面向对象建模”,不同的空间实体根据其位置和所需的表示精度,被抽象表达成不同尺度的网格的集合。网格集合中的每个网格继承空间实体在该网格对应位置上的属性。
具体地,设空间剖分网格(Cell)的全集为
Figure BDA0004141161350000101
其中,
Figure BDA0004141161350000102
表示第l层级的所有网格,且对第l层级的任意两个网格Cp(l),Cq(l)(p≠q),均有
Figure BDA0004141161350000103
则对于某一空间实体obj,令O(obj)表示其占据的真实空间,其表示精度在网格体系中对应的层级为l,该实体在剖分空间中可描述为若干个第l层级格网的集合
Figure BDA0004141161350000104
Figure BDA0004141161350000105
对于格网集合的属性,令Attr(·)表示空间实体或其表达的属性,则,
Figure BDA0004141161350000111
Attr(C(l))=Attr(O(C(l)))
在对空间实体进行建模时,网格模型中不同类型的网格集合可以进一步分别对应到传统数据模型中的点、线、面三类基本对象。
对于带有时间特征的空间对象,GeoSOT-T的基础是认为空间和时间为两个互相正交的维度,因此,对时空实体的描述引入GeoSOT-T,用时间编码直接对时空实体的时间特征进行建模,并按照时间的先后顺序和一定的时间间隔来组织不同时刻的空间数据。时空对象的网格化描述本质上是三维的网格集合。具体地,令obj为某一时空实体,objt表示t时刻该实体的空间状态,即任一时刻的空间实体的表示精度在空间网格体系中对应的剖分层级,其中
Figure BDA0004141161350000112
表示全部时间域,则该时空实体可以表示为时空网格的集合:
Figure BDA0004141161350000113
网格时空知识图谱的数据组织模型:
网格时空知识图谱依然以(节点-边-节点)的三元组形式进行数据组织和数据表达,与语义网络的最大区别是将时空剖分网格引入图谱成为节点,以此满足时空标准化建模和时空计算需求。
1)知识表示方法:
网格时空知识图谱将概念表示为“类”(Class)。概念和概念之间可以表示为“子类”(Subclass)的关系。如图3所示,用实线圆形代表概念,箭头代表关系,箭头出端代表三元组的首元(Subject),箭头上表名三元组的关系(Predicate),箭头的入端代表三元组的末元(Object)。用虚线圆形代表实体。实体间的关系可采用三元组进行表达,例如,“约翰史密斯的父亲是杰克史密斯”,即可表示为(约翰史密斯,父亲,杰克史密斯)。用方形代表网格。虚线代表隐式关系。例如,Gridp和Gridq之间没有显式的边关系,但可通过relation(Gridp,Gridq)进行计算得到。
2)网格中可以承载时空知识:
时空网格的表达基础:
空间(地球)=(网格编码+(对象编码+时间编码序列)集合)集合
Figure BDA0004141161350000121
对象(点、线、面、体)=对象ID+网格编码集合+属性集合
Figure BDA0004141161350000122
网格的属性即网格中承载的知识,可以直接回答时空问题并进行时空计算。数据、实体和网格建立逻辑关系,可以直接进行时空问答——网格也是知识图谱中的节点,参与逻辑推理,并天然具有空间计算能力。
3)节点:
网格时空知识图谱中的节点分为实体和网格两种类型。
(1)实体:
从本体论的角度出发,实体可分为概念和实例,在功能上类似于“类”和“对象”。
概念是思维的基本形式之一,反映客观事物的一般的、本质的特征。人类在认识过程中,从感性认识上升到理性认识,把所感知的事物的共同本质特点抽象出来,加以概括,成为自我认知意识的一种表达,即为概念。例如,“人”,不特指是某个人,即不特指是某个实体,因此是一个类。“美国人”也是一个类。
实例是客观存在并可相互区别的事物。在网格时空知识图谱中,认为任何实例都可能带有时空特征——在何时,实例与何空间发生关系。例如,“北京大学遥感楼”是一个实例;“车牌号为京A XXXXX的轿车”也是一个实例。
(2)网格:
网格时空知识图谱的节点可以是时空剖分网格。在设计中,以GeoSOT-3D和GeoSOT-T分别表征时空网格的剖分编码。以C表示具体的剖分网格,以剖分网格编码形式表示,以上角标区分时间编码(C时间),下角标区分空间编码(C空间)。不同剖分尺度的时空网格均可作为网格时空知识图谱中的节点,例如第15层某个具体的GeoSOT-3D网格,表示为Ci(15)。时空网格,有时可以缺省时间(某固定地物),有时可以缺省空间(单出描述一个人的生日);而如需描述一个人出生的时间地点,可以直接用时间和空间都不缺省的网格。
4)边:
在网格时空知识图谱中,节点与节点之间靠边来联系,以表示它们之间的关系。关系的本质是从一个域到另一个域的映射。网格时空知识图谱的边关系分为显式关系和隐式关系两种。
显示关系:
节点之间的边表示显式关系,等价于语义网络中的关系。显示关系可以直接表示实体或类间的时空关系或非时空关系。例如,“约翰史密斯的父亲是杰克史密斯”“北京大学遥感楼在北京大学里”。
隐式关系:
网格时空知识图谱的思路是通过时空网格代数计算代替复杂的关系存储。因此,未通过显式关系表示的、可通过时空网格代数计算得到的关系即为隐式关系。如图3所示中,网格的节点间的虚线代表隐式关系。例如,Cp和Cq之间没有显式的边关系,但可通过Relation(Cp,Cq)进行计算得到。网格间可计算的关系包括:包含、相邻、分离、距离为XX、角度为XX等。
5)属性:
网格的属性体现了面向空间(而非面向对象的)的数据组织方式一一它们既是该网格的信息,也是与该网格相关的事实。比如通过推理得到如下与船B相关的事实:在时间时,船B处水温5.5℃,风力为6级,有义波高2.5m。如图4所示。
本实施例还公开一种基于空间关系的知识图谱数据模型的查询方法,包括:利用网格时空知识图谱,基于选择的实体相关的网格进行查询,其中所述网格时空知识图谱的数据模型通过本实施例公开的方法构建而得;
判断查询网格的时间属性,从而返回符合过滤条件的网格的查询结果。
在一个具体的应用场景中,如图5所示,围绕实体“船B”的网格时空知识图谱示意及推理查询实例。
Q1:船B在t1时刻所处的环境中风力为几级?
船B(实体)在t1时刻处于
Figure BDA0004141161350000151
(网格),在t2时刻处于
Figure BDA0004141161350000152
(网格)。
Figure BDA0004141161350000153
的空间属性包括“温度5.5℃”“有义波高2.5m”“风力6级”,即知在t1时刻,船B所处的环境温度、有义波高和风力信息。上述查询选择了船B有关的网格,并判断网格的时间属性为t1,返回符合过滤条件的网格的风力。
本实施例公开的构建方法具有以下优点:
1)构建一套网格知识图谱数据模型,让知识图谱支持地理空间节点多源异构数据的高效表达,为提供时空对象存储、检索、推理、计算和管理能力做支撑。
2)网格在时空知识图谱上的优势特性包括:(1)单元化:异构数据可通过网格区域单元开放整合,支持全空间多源异构数据统一管理与展示。为时空数据进入图谱提供标准化范式。(2)主键化:网格编码为可索引的一维代码,可事先排序避免动态排序开销,支持海量数据快速检索。同时天然满足知识图谱中对对象全局统一的知识标识和关联的要求。(3)离散化:将空间现象和目标离散为全时空网格索引结构,简化三维时空计算,大幅提升性能。网格时空知识图谱的核心思想和亮点是“只存编码、不存空间关系”,空间关系推理由网格计算实时响应,以提升传统知识图谱的时空关联能力和数据融合能力。(4)并行化:按照网格对空间块进行有序分布存储,支持并行化处理,通过动态资源调度保障大规模运算效率。提升知识图谱的检索和推理效率。
3)网格是标准化图谱构建的基础。采用时空网格改造传统知识图谱,借助本体库来规范概念、实例、关系、实体类型以及属性等对象之间联系的基础上,加入数据网格本身所具有的网格外部时空拓扑关系和内部属性索引关联,形成一个由网格、关系、属性同时包含了网格实体的庞大网格关系网络。将结构化、半结构化、非结构化的多源异构信息孤岛进行网格化的标准化处理和表达,形成全时空域知识图谱,在全时空网格范围内进行知识图谱的一致化管理和自适应演进,为“数据-信息-知识”的知识图谱构建提供标准化基础。
4)网格是自适应演进快的“活图谱”基础。通过继承时空框架,可方便实现知识实体网格的纵向聚合、分解,以及横向组合、拆分,从而大大加快动态知识图谱的动态更新、时空聚类和自动重构,成为一个“活”图谱。完成知识图谱结构的建立后,再进行实体与关系、上下位概念、数据模式的学习。最终提出一种完善的地理知识对齐与关系快速构建推理的方法,根据学习模型建立出语义搜索乃至智能问答的模型框架。
本实施例还公开了一种空间关系的知识图谱数据模型构建装置,包括:
装载模块,用于将时空数据装载在剖分网格中,为时空数据赋予剖分网格编码及时间剖分编码;
抽取模块,用于对装载在剖分网格中的时空数据进行网格化建模,抽取出时空数据中的时空实体;
引入模块,用于将时空实体引入预构建的逻辑实体知识库;
构建模块,用于在逻辑实体知识库的基础上,通过剖分网格编码的计算建立时空实体间的空间关系,从而得到网格时空知识图谱。
本实施例还公开了一种电子设备,电子设备包括存储器和处理器。该存储器用于存储非暂时性计算机可读指令。具体地,存储器可以包括一个或多个计算机程序产品,该计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。该易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。该非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。
该处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制电子设备中的其它组件以执行期望的功能。在本公开的一个实施例中,该处理器用于运行该存储器中存储的该计算机可读指令,使得该电子设备执行前述的本公开各实施例的空间关系的知识图谱数据模型构建方法全部或部分步骤。
本领域技术人员应能理解,为了解决如何获得良好用户体验效果的技术问题,本实施例中也可以包括诸如通信总线、接口等公知的结构,这些公知的结构也应包含在本公开的保护范围之内。
如图6为本公开实施例提供的一种电子设备的结构示意图。其示出了适于用来实现本公开实施例中的电子设备的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM)中的程序或者从存储装置加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有电子设备操作所需的各种程序和数据。处理装置、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
通常,以下装置可以连接至I/O接口:包括例如传感器或者视觉信息采集设备等的输入装置;包括例如显示屏等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备(比如边缘计算设备)进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本公开实施例的空间关系的知识图谱数据模型构建方法的全部或部分步骤。
有关本实施例的详细说明可以参考前述各实施例中的相应说明,在此不再赘述。
根据本公开实施例的计算机可读存储介质,其上存储有非暂时性计算机可读指令。当该非暂时性计算机可读指令由处理器运行时,执行前述的本公开各实施例的空间关系的知识图谱数据模型构建方法的全部或部分步骤。
上述计算机可读存储介质包括但不限于:光存储介质(例如:CD-ROM和DVD)、磁光存储介质(例如:MO)、磁存储介质(例如:磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如:存储卡)和具有内置ROM的媒体(例如:ROM盒)。
有关本实施例的详细说明可以参考前述各实施例中的相应说明,在此不再赘述。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
在本公开中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
另外,如在此使用的,在以“至少一个”开始的项的列举中使用的“或”指示分离的列举,以便例如“A、B或C的至少一个”的列举意味着A或B或C,或AB或AC或BC,或ABC(即A和B和C)。此外,措辞“示例的”不意味着描述的例子是优选的或者比其他例子更好。
还需要指出的是,在本公开的系统和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
可以不脱离由所附权利要求定义的教导的技术而进行对在此所述的技术的各种改变、替换和更改。此外,本公开的权利要求的范围不限于以上所述的处理、机器、制造、事件的组成、手段、方法和动作的具体方面。可以利用与在此所述的相应方面进行基本相同的功能或者实现基本相同的结果的当前存在的或者稍后要开发的处理、机器、制造、事件的组成、手段、方法或动作。因而,所附权利要求包括在其范围内的这样的处理、机器、制造、事件的组成、手段、方法或动作。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种空间关系的知识图谱数据模型构建方法,其特征在于,包括:
将时空数据装载在剖分网格中,为时空数据赋予剖分网格编码及时间剖分编码;
对装载在剖分网格中的时空数据进行网格化建模,抽取出时空数据中的时空实体;
将时空实体引入预构建的逻辑实体知识库;
在逻辑实体知识库的基础上,通过剖分网格编码的计算建立时空实体间的空间关系,从而得到网格时空知识图谱。
2.根据权利要求1所述的空间关系的知识图谱数据模型构建方法,其特征在于,
所述网格时空知识图谱中包括地理信息和多源异构的时空数据;
所述多源异构的时空数据通过时空数据标准化赋码引接,转换为标准化的时间数据。
3.根据权利要求2所述的空间关系的知识图谱数据模型构建方法,其特征在于,所述多源异构的时空数据通过时空数据标准化赋码引接,包括:
设剖分网格中空间剖分网格的全集为
Figure FDA0004141161340000011
其中,
Figure FDA0004141161340000012
表示第l层级的所有网格,且对第l层级的任意两个网格Cp(l),Cq(l)(p≠q),均有
Figure FDA0004141161340000014
则对于时空实体中的某一空间实体obj,令O(obj)表示其占据的真实空间,其表示精度在网格体系中对应的层级为l,该空间实体在剖分空间中可描述为若干个第l层级格网的集合
Figure FDA0004141161340000013
Figure FDA0004141161340000021
对于格网集合的属性,令Attr(·)表示空间实体或其表达的属性,则,
Figure FDA0004141161340000022
Attr(C(l))=Attr(O(C(l)))。
4.根据权利要求3所述的空间关系的知识图谱数据模型构建方法,其特征在于,所述多源异构的时空数据通过时空数据标准化赋码引接,包括:
对时空实体的描述引入时间剖分编码,用时间剖分编码直接对时空实体的时间特征进行建模,并按照时间的先后顺序和设定的时间间隔组织不同时刻的空间数据;
将时空实体的网格化描述为三维的网格集合。
5.根据权利要求4所述的空间关系的知识图谱数据模型构建方法,其特征在于,所述将时空实体的网格化描述为三维的网格集合,包括:
令obj为时空实体,objt表示t时刻该时空实体的空间状态,其中
Figure FDA0004141161340000023
Figure FDA0004141161340000024
表示全部时间域,则时空实体表示为时空网格的集合:
Figure FDA0004141161340000025
6.根据权利要求1所述的空间关系的知识图谱数据模型构建方法,其特征在于,所述网格时空知识图谱的数据组织模型,包括:
网格时空知识图谱以三元组形式进行数据组织和数据表达,将时空剖分网格引入图谱成为节点,时空剖分网格为将时空数据装载在剖分网格中得到的;
所述网格时空知识图谱的数据组织模型,包括:
知识表示、在网格中承载时空知识、节点、边和属性。
7.根据权利要求6所述的空间关系的知识图谱数据模型构建方法,其特征在于,所述知识表示,包括将概念表示为类,概念和概念之间表示为子类的关系;
所述节点包括实体和网格;
所述边包括显示关系和隐式关系,显示关系直接表示实体或类间的时空关系或非时空关系,未通过显式关系表示的、通过剖分网格编码代数计算得到的关系即为隐式关系。
8.根据权利要求6所述的空间关系的知识图谱数据模型构建方法,其特征在于,在网格中承载时空知识,包括时空网格的表达,所述时空网格的表达包括空间和对象:
Figure FDA0004141161340000031
Space为空间,GridID为网格编码,ObjectID为对象编码,TimeID为时间编码序列,M、N和S均为常数;
Figure FDA0004141161340000032
Object为对象,attibute为属性,m和n为常数。
9.一种空间关系的知识图谱数据模型构建装置,其特征在于,包括:
装载模块,用于将时空数据装载在剖分网格中,为时空数据赋予剖分网格编码及时间剖分编码;
抽取模块,用于对装载在剖分网格中的时空数据进行网格化建模,抽取出时空数据中的时空实体;
引入模块,用于将时空实体引入预构建的逻辑实体知识库;
构建模块,用于在逻辑实体知识库的基础上,通过剖分网格编码的计算建立时空实体间的空间关系,从而得到网格时空知识图谱。
10.一种基于空间关系的知识图谱数据模型的查询方法,其特征在于,包括:利用网格时空知识图谱,基于选择的实体相关的网格进行查询,其中所述网格时空知识图谱的数据模型通过如权利要求1-8任一所述的方法构建而得;
判断查询网格的时间属性,从而返回符合过滤条件的网格的查询结果。
CN202310290230.5A 2023-03-23 2023-03-23 空间关系的知识图谱数据模型构建方法、装置及查询方法 Pending CN116108205A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310290230.5A CN116108205A (zh) 2023-03-23 2023-03-23 空间关系的知识图谱数据模型构建方法、装置及查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310290230.5A CN116108205A (zh) 2023-03-23 2023-03-23 空间关系的知识图谱数据模型构建方法、装置及查询方法

Publications (1)

Publication Number Publication Date
CN116108205A true CN116108205A (zh) 2023-05-12

Family

ID=86263979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310290230.5A Pending CN116108205A (zh) 2023-03-23 2023-03-23 空间关系的知识图谱数据模型构建方法、装置及查询方法

Country Status (1)

Country Link
CN (1) CN116108205A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117332091A (zh) * 2023-08-29 2024-01-02 泰瑞数创科技(北京)股份有限公司 一种基于语义关系的地理实体时空知识图谱构建方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117332091A (zh) * 2023-08-29 2024-01-02 泰瑞数创科技(北京)股份有限公司 一种基于语义关系的地理实体时空知识图谱构建方法
CN117332091B (zh) * 2023-08-29 2024-03-29 泰瑞数创科技(北京)股份有限公司 一种基于语义关系的地理实体时空知识图谱构建方法

Similar Documents

Publication Publication Date Title
Hor et al. A semantic graph database for BIM-GIS integrated information model for an intelligent urban mobility web application
Fan et al. Attribute-oriented cognitive concept learning strategy: a multi-level method
Chadzynski et al. Semantic 3D City Database—An enabler for a dynamic geospatial knowledge graph
Castelli et al. Urban intelligence: a modular, fully integrated, and evolving model for cities digital twinning
CN106897954A (zh) 智慧城市时空信息云平台
CN104850601A (zh) 基于图数据库的警务实时分析应用平台及其构建方法
CN114373111A (zh) 一种基于孪生数据驱动的融合方法及引擎系统
Li et al. Performance benchmark on semantic web repositories for spatially explicit knowledge graph applications
CN116108205A (zh) 空间关系的知识图谱数据模型构建方法、装置及查询方法
Sarwat Interactive and scalable exploration of big spatial data--a data management perspective
KR101467707B1 (ko) 지식 베이스의 개체 매칭 방법 및 이를 위한 장치
Masoumi et al. City Digital Twins: their maturity level and differentiation from 3D city models
CN115080765A (zh) 一种航天质量知识图谱构建方法、系统、介质和设备
CN115756870A (zh) 基于GeoSOT网格算力的组织模型构建方法及空时数据存储方法
CN115757810A (zh) 一种知识图谱标准本体构建方法
Lü et al. Data environment construction for virtual geographic environment
CN116167440B (zh) 基于网格时空知识图谱的时空知识规则判定方法及相关设备
Gu et al. A parallel varied density-based clustering algorithm with optimized data partition
Grolinger et al. Ontology–based representation of simulation models
CN115858498A (zh) 五维时空分布式数据库构建方法及装置
Laurini et al. A primer of geographic databases based on chorems
CN115618007A (zh) 基于知识图谱的监察数据分析系统
CN115577519A (zh) 基于本体和知识图谱的双层次多重时空耦合建模方法
Liang Allocation of multi-dimensional distance learning resource based on MOOC data
Peral et al. Energy consumption prediction by using an integrated multidimensional modeling approach and data mining techniques with Big Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination