CN112328623A - 基于混合本体模式的多源异构数据管理方法 - Google Patents
基于混合本体模式的多源异构数据管理方法 Download PDFInfo
- Publication number
- CN112328623A CN112328623A CN202011226384.0A CN202011226384A CN112328623A CN 112328623 A CN112328623 A CN 112328623A CN 202011226384 A CN202011226384 A CN 202011226384A CN 112328623 A CN112328623 A CN 112328623A
- Authority
- CN
- China
- Prior art keywords
- data
- ontology
- query
- retrieval
- source heterogeneous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013523 data management Methods 0.000 title claims abstract description 20
- 230000010354 integration Effects 0.000 claims abstract description 20
- 238000013507 mapping Methods 0.000 claims description 43
- 238000013500 data storage Methods 0.000 claims description 25
- 238000004458 analytical method Methods 0.000 claims description 8
- 230000001149 cognitive effect Effects 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 230000008520 organization Effects 0.000 claims description 3
- 238000010835 comparative analysis Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000019771 cognition Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/256—Integrating or interfacing systems involving database management systems in federated or virtual databases
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据管理方法领域,尤其是基于混合本体模式的多源异构数据管理方法。该数据管理方法包括以下步骤:(1)首先将基于混合SQL/NoSQL模式的多源异构数据存储在数据库中;(2)接着对不同数据库中基于本体的多源异构数据进行集成;(3)最后建立数据检索和语义检索,从多源异构数据中获取信息。本发明通过从空间目标态势数据的存储、集成和检索三方面,构建基于混合本体模式的空间目标态势多源异构数据管理方法,实现空间目标态势数据的共享,为不同应用场景下的数据需求提供保障。
Description
技术领域
本发明涉及数据管理方法领域,尤其是基于混合本体模式的多源异构数据管理方法。
背景技术
为了实现空间目标态势认知,需要对空间目标态势领域内不同来源、不同类型和不同结构的数据进行分析、计算和推理。然而,空间目标态势领域内“数据孤岛”问题的存在导致获取结构化和形式化的分析结果较为困难,也使得无法进一步进行更加广泛的领域数据挖掘。
发明内容
为了解决背景技术中描述的技术问题,本发明提供了一种基于混合本体模式的多源异构数据管理方法,通过从空间目标态势数据的存储、集成和检索三方面,构建基于混合本体模式的空间目标态势多源异构数据管理方法,实现空间目标态势数据的共享,为不同应用场景下的数据需求提供保障。
本发明解决其技术问题所采用的技术方案是:
一种基于混合本体模式的多源异构数据管理方法,该方法包含以下步骤:
(1)首先将基于混合SQL/NoSQL模式的多源异构数据存储在数据库中;
(2)接着对不同数据库中基于本体的多源异构数据进行集成;
(3)最后建立数据检索和语义检索,从多源异构数据中获取信息。
具体地,步骤(1)中,数据存储的具体步骤为:
(1)明确需要存储的数据种类,针对不同的数据类型,确定不同的存储方式,建立数据存储架构;
(2)根据键值对等关键信息,建立不同数据源之间的联系;
(3)对基于MySQL和基于混合数据存储策略下的数据存储与检索效率进行对比分析。
具体地,步骤(2)中,多源异构数据进行集成的具体步骤为:
(1)建立空间目标态势数据集成模型,该模型中主要包括底层数据与局部本体的映射以及局部本体与全局本体的映射;
(2)建立底层数据与局部本体的映射;
(3)建立局部本体与全局本体的映射。
具体地,所述映射的具体步骤为:
(1)分析和整理底层数据Data,对空间目标态势的数据源进行分析和整理,获取空间目标基本的概念、属性和关系,并抽取对应的语义内容;
(2)针对空间目标态势领域内认知与服务的需求,分析不同应用场景中的相关概念、属性和关系,构建局部本体LO;
(3)构建底层数据Data与局部本体LO的映射关系,不同的局部本体使用不同的底层数据,利用查询引擎,从底层数据中检索数据,并经过组织提供给相应的局部本体;
(4)利用从底层数据Data和局部本体LO中提取的概念、属性和关系,建立全局共享词典,并构建全局本体GO;
(5)构建全局本体GO与局部本体LO之间的映射关系。
具体地,所述局部本体与全局本体的映射包括概念之间的映射和属性之间的映射。
具体地,步骤(3)中,建立数据检索和语义检索包括:空间目标态势数据检索和空间目标态势语义检索。
具体地,所述空间目标态势数据检索包括:检索缓存数据;从MySQL中获取结构化数据和非结构化数据的元数据,并将结果返回数据检索与集成模块;通过请求信息或者在第二部分中获取的非结构数据的元数据来得到查询参数,从MongoDB中获取非结构化数据,并将结果返回数据检索与集成模块。
具体地,所述空间目标态势语义检索的具体步骤为:
步骤1、通过交互界面获取经过查询构造的查询内容,使用查询解析将查询内容解析为SQWRL格式的查询语句;
步骤2、利用SQWRL格式的查询语句执行本体查询,如果需要从数据库中查询数据,则执行步骤3;否则,执行步骤4;
步骤3、将SQWRL格式的查询语句和从本体中查询的结果转化为SQL格式的查询语句,执行数据库查询;
步骤4、将查询结果进行形式化处理,构建满足需求的数据格式,利用不同方案进行结果展示。
本发明的有益效果是:本发明提供了一种基于混合本体模式的多源异构数据管理方法,通过从空间目标态势数据的存储、集成和检索三方面,构建基于混合本体模式的空间目标态势多源异构数据管理方法,实现空间目标态势数据的共享,为不同应用场景下的数据需求提供保障。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明的空间目标态势数据分类图;
图2是本发明的空间目标态势混合数据存储架构;
图3是本发明的基于混合本体模式的空间目标态势数据集成图;
图4是本发明的空间目标态势信息检索流程图;
图5是本发明的空间目标态势数据检索处理过程图;
图6是本发明的空间目标态势语义检索处理流程图;
具体实施方式
图1是本发明的空间目标态势数据分类图,图2是本发明的空间目标态势混合数据存储架构,图3是本发明的基于混合本体模式的空间目标态势数据集成图,图4是本发明的空间目标态势信息检索流程图,图5是本发明的空间目标态势数据检索处理过程图,图6是本发明的空间目标态势语义检索处理流程图。
数据是实现空间目标态势认知和服务的基础,空间目标态势数据种类多样。从数据结构方面看,空间目标态势数据可以分成结构化、半结构化和非结构化数据。结构化数据常以表格化的形式存在,如空间目标属性数据、发射场数据等。非结构化数据通常是格式不规则或者不完整的数据,如图片、视频、语音、邮件等。半结构化数据中同时包括了结构化和非结构化数据,如遥感卫星对地观测数据中,不仅有地面目标的位置、数据获取时间等结构化数据,还有遥感影像等非结构化数据。
从实际应用角度看,空间目标态势数据可以分为太空数据和地面数据两类。太空数据主要包括空间目标属性数据、空间目标轨道数据、空间目标状态监控数据、有效载荷和传感器等采集的数据、地面目标的指令信号和监视数据、航天器之间传递的数据以及空间目标在轨处理的数据等。地面数据主要包括航天器向地面发送的数据、地面站处理和分析的结果、地面数据库的数据、服务网络数据等。
从上述分类可以看出,空间目标态势数据具有显著的多源异构特性。为了有效的管理空间目标态势数据,通常使用RDBMS存储各种结构化数据,并通过结构化查询语言(Structured Query Language,SQL)检索数据。然而,RDBMS(i)不擅长存储非结构化数据,(ii)无法有效维护海量空间目标态势数据,尤其是千万级别的数据二维表,(iii)数据服务集群过于复杂和昂贵,并且扩展性较差,(iv)无法为海量用户的并发访问提供高性能的服务。
NoSQL(Not Only SQL)数据库作为能够灵活存储半结构化和非结构化数据的数据库,可以满足用户的高并发访问,并弥补RDBMS的部分不足。NoSQL数据库(i)具有较高的服务可用性,能够满足海量数据的低延迟访问,(ii)数据模式灵活,适合存储各种结构的数据,(iii)可以在不影响现有数据的情况下增加新的数据结构,(iv)能够方便的进行数据存储的水平扩展。根据存储模式的差异,NoSQL数据库可以分为文档存储(如MongoDB)、列式存储(如Apache HBase)、键值存储(如Redis)等。NoSQL数据库的优良特性使其在互联网领域取得了非常成功的应用。然而,相比于RDBMS,NoSQL数据库无法提供较好的数据一致性和垂直可伸缩性,并且查询方式单一,不能很好的支持复杂的数据查询。
为了满足多源异构空间目标态势数据的存储需求,并为数据的集成与检索提供高效稳定的服务,本节充分利用RDBMS和NoSQL数据库的存储特性和应用优势,设计了融合SQL数据库(RDBMS)和NoSQL数据库的统一逻辑结构,即混合SQL/NoSQL模式,构建了空间目标态势多源异构数据存储模型(Hybrid Data Storage Model,HDSM)。
一种基于混合本体模式的多源异构数据管理方法,该方法包含以下步骤:
一、首先将基于混合SQL/NoSQL模式的多源异构数据存储在数据库中。
如附图1所示,明确需要存储的数据种类。如附图2所示,针对不同的数据类型,确定不同的存储方式,建立数据存储架构。根据键值对等关键信息,建立不同数据源之间的联系。在此基础上,对基于MySQL和基于混合数据存储策略下的数据存储与检索效率进行对比分析。测试数据包括两部分:(i)数值数据和(ii)数值数据与图像数据。数值数据包含历史TLE数据和光度数据,图像数据则主要包括光学影像文件。
a、数据存储效率对比
测试通过设置不同的单次入库数据量分别对比了两种测试数据的入库效率,第一种为MySQL和混合数据存储策略仅输入数值数据;第二种为MySQL同时输入数值数据与图像数据,混合数据存储策略中将数值数据与图像数据分别输入不同数据库。对比结果表明,混合数据存储策略入库效率比MySQL数据库入库效率,在数值数据情况下提高超过17倍,在数值数据和图像数据情况下提高超过34倍。对比结果说明混合数据存储策略在面对海量数据入库时具有优异的性能,尤其是在针对图像等非结构化数据时,具有比MySQL更好的性能。
b、数据检索效率
空间目标光学特性数据可以为测试、分析和仿真等应用场景提供服务,因此空间目标光学特性数据的存储需要满足数据访问需求,尤其是高并发访问下的数据检索请求。实验使用压力测试软件Apache JMeter设置不同并发访问度,测试了在建立索引的情况下,访问MySQL数据库和混合数据存储策略下的响应速度,对比结果表明,当并发访问数量增加时,MySQL数据库的响应时间随之呈现快速的线型增长趋势,而混合数据存储策略下的响应时间变化较为平缓,且远远低于MySQL数据库,表明混合数据存储策略能够满足高并发访问下的数据需求。
二、接着对不同数据库中基于本体的多源异构数据进行集成。
为了建立对空间目标态势数据的规范化描述和统一化理解,需要建立不同应用场景中数据之间的联系,实现数据的集成与融合。
如附图3所示,a、建立空间目标态势数据集成模型,该模型中主要包括底层数据与局部本体的映射以及局部本体与全局本体的映射,其中,具体映射步骤为:
步骤1:分析和整理底层数据Data。对空间目标态势的数据源进行分析和整理,获取空间目标基本的概念、属性和关系,并抽取对应的语义内容。
步骤2:针对空间目标态势领域内认知与服务的需求,分析不同应用场景中的相关概念、属性和关系,构建局部本体LO。
步骤3:构建底层数据Data与局部本体LO的映射关系。不同的局部本体需要使用不同的底层数据。底层数据Data与局部本体LO之间的映射实质是通过局部本体构建查询语句,利用查询引擎,从底层数据中检索数据,并经过组织提供给相应的局部本体。
步骤4:构建全局本体GO。空间目标态势以空间目标为主要研究对象,空间目标的基本概念、属性和关系至关重要。因此,利用从底层数据Data和局部本体LO中提取的概念、属性和关系,建立全局共享词典,并构建全局本体GO。例如,可以从轨道状态本体中获取空间目标轨道状态的概念、属性和关系,从时空本体中获取拓扑关系的概念、属性和关系。
构建全局本体GO与局部本体LO之间的映射关系。基于全局共享词典构建的全局本体,能够通过空间目标的NORAD编号、国际编号、目标名称等元素,在各个局部本体之间共享概念、建立连接并集成数据,实现与局部本体的关联。
b、建立底层数据与局部本体的映射;
通过构建底层数据Data与局部本体LO之间的映射MLD,可以对空间目标态势数据进行基于本体的数据组织、语义描述和知识推理。为了构建映射MLD,本节针对空间目标态势领域的各个局部本体定义了如表1所示的抽取规则。
表1 底层数据与局部本体的映射规则
以UCS卫星数据库为例,构建数据库与局部本体之间的映射关系的步骤包括:
步骤1:根据规则R3-1,将UCS卫星数据库的表名ucs_satellite_list转化为数据本体DO中的概念,使用DO:DataClass表示,其对应实体名称为UCSSatelliteList;
步骤2:根据规则R3-2,将UCS卫星数据库的列转化为DO:DataClass的属性,使用DO:DataProperty表示,包括NORADID、purpose、orbitClass、launchSite等属性;
根据规则R3-3,建立概念与属性之间的关系,并使用关系属性hasObjectProperty和hasDataProperty表示概念与属性之间的关系。
步骤3:根据规则R3-4,构建UCS卫星数据库与数据本体DO中其他类的关联。该关联关系主要指UCS卫星数据库中的列与其他类的关联。例如,UCS卫星数据库中的发射场launchSite是发射场数据库的外键,则使用hasChild表示UCS卫星数据库与发射场数据库之间的关系;
步骤4:根据规则R3-5,从UCS卫星数据库中抽取空间目标的相关属性信息,如NORAD编号、国际编号、卫星名称等,结合局部本体,将得到的概念、属性和关系等要素添加到全局共享词典中。
除了上述映射规则之外,在构建底层数据与局部本体的映射时,为了增强概念之间的关系,消除重复的概念,获取隐含的信息,并为不同的局部本体补充缺失的数据,本节定义了如表2所示的部分推理规则。
表2 底层数据与本体间关系的推理规则
以“不同数据源中资源三号02星的发射场信息”为例。UCS数据库中,资源三号02星的名称使用“Ziyuan 3-2”表示,其所属的发射场为“Taiyuan Launch Center”,而通过CelesTrak网站获取的资源三号02星使用“ZY 3 2”表示,其所属的发射场为“TAISC”。由于“Ziyuan 3-2”和“ZY 3 2”均表示同一卫星,根据推理规则R3-8,将PropertyX设置为LaunchSite,使用式(1)推理可得,“Taiyuan Launch Center”与“TAISC”为太原卫星发射场的不同表示方式。
c、建立局部本体与全局本体的映射;
通过底层数据与局部本体的映射,能够实现空间目标态势领域本体对各种数据源的访问。然而,空间目标态势领域内不同的分析过程会产生各种底层数据并不包含的概念、属性和关系,如空间目标之间的复杂时空关系、空间目标轨道的状态等。为了实现空间目标态势领域内不同应用场景下数据的集成和认知的形式化、规范化和统一化表达,本节构建局部本体与全局本体之间的映射MGL,实现空间目标态势领域在认知与服务过程中处理、分析与认知结果的融合,为空间活动提供完备的空间目标态势认知成果。
局部本体与全局本体的映射MGL主要从概念之间的映射和属性之间的映射两方面建立:
(1)概念之间的映射
映射MGL中,概念之间的映射可以利用概念之间的关联关系实现。概念之间的关联关系通常包括等价、类似、父子等关系,因此可以使用网络本体语言(Ontology WebLanguage,OWL)提供的描述符,如subClassOf、equivalentClass等描述。例如有效载荷(Payload)作为空间目标(SpaceObject)的子概念,可以使用下式表示:
(Payload)subClassOf(SpaceObject) (2)
(2)属性之间的映射
映射MGL中,属性之间的映射可以利用属性之间的关联关系实现。属性之间的关联关系使用OWL提供的描述符,如subPropertyOf、equivalentProperty等描述。例如,NORAD编号(NORADID)作为识别数据(IdentificationData)的子属性,可以使用下式表示:
(NORADID)subPropertyOf(IdentificationData) (3)
三、最后建立数据检索和语义检索,从多源异构数据中获取信息。
在建立了数据的存储和集成后,需要从中获取必须的信息才能够实现数据的应用。
如附图4所示,为了向空间目标态势领域内不同应用场景提供不同层次的结构化和形式化的检索结果,专利设计不同的检索方式,将空间目标态势信息的检索分为数据检索和语义检索。
a、空间目标态势数据检索
如附图5所示,空间目标态势领域内计算、分析和可视化可以利用数据检索获取数据,其中,数据检索与集成作为数据检索服务的一部分,可以为数据请求提供统一访问的接口,并构建形式化和规范化的数据检索结果。数据检索处理过程主要包括三部分:
第一部分:检索缓存数据。当数据请求通过数据检索与集成模块时(1请求),数据检索与集成模块根据请求条件,首先从缓存数据中查询数据(2请求缓存),将结果返回数据检索与集成模块(3返回),并判断数据缓存是否存在(4缓存存在?)。如果缓存数据存在,则直接返回获取的缓存数据(5返回缓存),无需请求数据库中的持久化数据;否则执行第二部分。
第二部分:当请求结构化数据时,可以从MySQL中获取结构化数据和非结构化数据的元数据(6查询结构化数据与元数据),并将结果返回数据检索与集成模块(7返回)。对于访问频次较高的原始数据,需要将结果存储于缓存数据中(8将结果存储于缓存数据库),以保证后续数据的访问效率。根据需求的不同,需要在数据检索与集成模块中对是否检索非结构化数据进行判断。当不需要非结构化数据时,直接返回查询结果(12返回);否则,数据检索与集成模块根据从MySQL获取的非结构化数据的元数据,执行第三部分,获取非结构化数据的查询结果。
第三部分:当请求半结构或者非结构化数据时,可以通过请求信息或者在第二部分中获取的非结构数据的元数据来得到查询参数,从MongoDB中获取非结构化数据(9查询非结构化数据),并将结果返回数据检索与集成模块(10返回)。对于访问频次较高的原始数据,需要将结果存储于缓存数据中(11将结果存储于缓存数据库),以保证访问效率。
b、空间目标态势语义检索
如附图6所示,语义检索的最终目的是为了获取和利用知识。为此,本节构建了语义检索处理过程:
步骤1:通过交互界面获取经过查询构造的查询内容,使用查询解析将查询内容解析为SQWRL格式的查询语句。
步骤2:利用SQWRL格式的查询语句执行本体查询。同时,如果需要从数据库中查询数据,则执行步骤3;否则,执行步骤4。
步骤3:将SQWRL格式的查询语句和从本体中查询的结果转化为SQL格式的查询语句,执行数据库查询。
步骤4:将查询结果进行形式化处理,构建满足需求的数据格式,便于利用不同方案进行结果展示。
为了满足不同的查询需求,通常需要对本体进行查询扩展。为此,在2.2节构建的空间目标态势领域本体的基础上,本节进行了以下查询扩展:
(1)同义查询扩展,即通过本体中的关系定义,获取查询的同义词。例如,查询目标为“资源三号02星”,而由于“资源三号02星”、“ZiYuan 3-2”和“ZY 3 2”为同义词,表示同一空间目标,因此将查询目标扩展为“资源三号02星”、“ZiYuan 3-2”和“ZY 3 2”。
(2)规则查询扩展,即利用SWRL定义相应的规则,在此基础上通过推理实现查询扩展。例如,查询“西昌卫星发射基地”的位置,结合传递性属性声明,通过推理,可以获取不同行政等级的关联关系,最终得到,“西昌卫星发射基地”位于“中国”“四川省”“冕宁县”。
属性查询扩展,即利用本体中构建的各种关系,结合属性声明,获取与查询内容相关的各种属性概念。例如,查询“资源三号02星”的国际标识,可以通过构建的关系和推理,分别获取其对应的国际标识包括两种:NORAD编号为“41556”和国际编号为“2016-033A”。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (8)
1.一种基于混合本体模式的多源异构数据管理方法,其特征是,该方法包含以下步骤:
(1)首先将基于混合SQL/NoSQL模式的多源异构数据存储在数据库中;
(2)接着对不同数据库中基于本体的多源异构数据进行集成;
(3)最后建立数据检索和语义检索,从多源异构数据中获取信息。
2.根据权利要求1所述的基于混合本体模式的多源异构数据管理方法,其特征在于:步骤(1)中,数据存储的具体步骤为:
(1)明确需要存储的数据种类,针对不同的数据类型,确定不同的存储方式,建立数据存储架构;
(2)根据键值对等关键信息,建立不同数据源之间的联系;
(3)对基于MySQL和基于混合数据存储策略下的数据存储与检索效率进行对比分析。
3.根据权利要求1所述的基于混合本体模式的多源异构数据管理方法,其特征在于:步骤(2)中,多源异构数据进行集成的具体步骤为:
(1)建立空间目标态势数据集成模型,该模型中主要包括底层数据与局部本体的映射以及局部本体与全局本体的映射;
(2)建立底层数据与局部本体的映射;
(3)建立局部本体与全局本体的映射。
4.根据权利要求3所述的基于混合本体模式的多源异构数据管理方法,其特征在于:所述映射的具体步骤为:
(1)分析和整理底层数据Data,对空间目标态势的数据源进行分析和整理,获取空间目标基本的概念、属性和关系,并抽取对应的语义内容;
(2)针对空间目标态势领域内认知与服务的需求,分析不同应用场景中的相关概念、属性和关系,构建局部本体LO;
(3)构建底层数据Data与局部本体LO的映射关系,不同的局部本体使用不同的底层数据,利用查询引擎,从底层数据中检索数据,并经过组织提供给相应的局部本体;
(4)利用从底层数据Data和局部本体LO中提取的概念、属性和关系,建立全局共享词典,并构建全局本体GO;
(5)构建全局本体GO与局部本体LO之间的映射关系。
5.根据权利要求3所述的基于混合本体模式的多源异构数据管理方法,其特征在于:所述局部本体与全局本体的映射包括概念之间的映射和属性之间的映射。
6.根据权利要求1所述的基于混合本体模式的多源异构数据管理方法,其特征在于:步骤(3)中,建立数据检索和语义检索包括:空间目标态势数据检索和空间目标态势语义检索。
7.根据权利要求6所述的基于混合本体模式的多源异构数据管理方法,其特征在于:所述空间目标态势数据检索包括:检索缓存数据;从MySQL中获取结构化数据和非结构化数据的元数据,并将结果返回数据检索与集成模块;通过请求信息或者在第二部分中获取的非结构数据的元数据来得到查询参数,从MongoDB中获取非结构化数据,并将结果返回数据检索与集成模块。
8.根据权利要求6所述的基于混合本体模式的多源异构数据管理方法,其特征在于:所述空间目标态势语义检索的具体步骤为:
步骤1、通过交互界面获取经过查询构造的查询内容,使用查询解析将查询内容解析为SQWRL格式的查询语句;
步骤2、利用SQWRL格式的查询语句执行本体查询,如果需要从数据库中查询数据,则执行步骤3;否则,执行步骤4;
步骤3、将SQWRL格式的查询语句和从本体中查询的结果转化为SQL格式的查询语句,执行数据库查询;
步骤4、将查询结果进行形式化处理,构建满足需求的数据格式,利用不同方案进行结果展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011226384.0A CN112328623A (zh) | 2020-11-06 | 2020-11-06 | 基于混合本体模式的多源异构数据管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011226384.0A CN112328623A (zh) | 2020-11-06 | 2020-11-06 | 基于混合本体模式的多源异构数据管理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112328623A true CN112328623A (zh) | 2021-02-05 |
Family
ID=74315438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011226384.0A Withdrawn CN112328623A (zh) | 2020-11-06 | 2020-11-06 | 基于混合本体模式的多源异构数据管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112328623A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112908441A (zh) * | 2021-03-04 | 2021-06-04 | 文华学院 | 一种医疗平台的数据处理方法、装置以及处理设备 |
CN113254519A (zh) * | 2021-05-28 | 2021-08-13 | 北京奇岱松科技有限公司 | 多源异构数据库的访问方法、装置、设备和存储介质 |
CN113326870A (zh) * | 2021-05-11 | 2021-08-31 | 中科迅(深圳)科技有限公司 | 一种基于大数据的多平台旅游数据融合系统 |
CN113360518A (zh) * | 2021-06-07 | 2021-09-07 | 哈尔滨工业大学 | 一种基于多源异构数据的层次本体构造方法 |
CN113535788A (zh) * | 2021-07-12 | 2021-10-22 | 中国海洋大学 | 一种面向海洋环境数据的检索方法、系统、设备及介质 |
CN116541414A (zh) * | 2023-07-05 | 2023-08-04 | 广州信安数据有限公司 | 基于多源异构数据的统一本体连接查询方法、介质及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682122A (zh) * | 2012-05-15 | 2012-09-19 | 北京科技大学 | 基于本体构建材料科学领域语义数据模型的方法 |
CN104182454A (zh) * | 2014-07-04 | 2014-12-03 | 重庆科技学院 | 基于领域本体构建的多源异构数据语义集成的模型及方法 |
-
2020
- 2020-11-06 CN CN202011226384.0A patent/CN112328623A/zh not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682122A (zh) * | 2012-05-15 | 2012-09-19 | 北京科技大学 | 基于本体构建材料科学领域语义数据模型的方法 |
CN104182454A (zh) * | 2014-07-04 | 2014-12-03 | 重庆科技学院 | 基于领域本体构建的多源异构数据语义集成的模型及方法 |
Non-Patent Citations (4)
Title |
---|
卢万杰: "基于SQL/NoSQL的空间目标光学特性数据混合存储策略", 天文学报, vol. 61, no. 1, pages 1 - 3 * |
王志: "基于本体的异构数据源集成的研究及应用", 中国优秀硕士学位论文全文数据库 信息科技辑, pages 18 - 48 * |
王飞: "基于SQWRL的本体知识库语义查询", 计算机技术与发展, pages 1 - 4 * |
蔚继承;杨丽丽;: "一种基于本体的异构数据集成方法", 信息化研究, no. 01 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112908441A (zh) * | 2021-03-04 | 2021-06-04 | 文华学院 | 一种医疗平台的数据处理方法、装置以及处理设备 |
CN113326870A (zh) * | 2021-05-11 | 2021-08-31 | 中科迅(深圳)科技有限公司 | 一种基于大数据的多平台旅游数据融合系统 |
CN113254519A (zh) * | 2021-05-28 | 2021-08-13 | 北京奇岱松科技有限公司 | 多源异构数据库的访问方法、装置、设备和存储介质 |
CN113254519B (zh) * | 2021-05-28 | 2021-10-08 | 北京奇岱松科技有限公司 | 多源异构数据库的访问方法、装置、设备和存储介质 |
CN113360518A (zh) * | 2021-06-07 | 2021-09-07 | 哈尔滨工业大学 | 一种基于多源异构数据的层次本体构造方法 |
CN113360518B (zh) * | 2021-06-07 | 2023-03-21 | 哈尔滨工业大学 | 一种基于多源异构数据的层次本体构造方法 |
CN113535788A (zh) * | 2021-07-12 | 2021-10-22 | 中国海洋大学 | 一种面向海洋环境数据的检索方法、系统、设备及介质 |
CN113535788B (zh) * | 2021-07-12 | 2024-03-05 | 中国海洋大学 | 一种面向海洋环境数据的检索方法、系统、设备及介质 |
CN116541414A (zh) * | 2023-07-05 | 2023-08-04 | 广州信安数据有限公司 | 基于多源异构数据的统一本体连接查询方法、介质及系统 |
CN116541414B (zh) * | 2023-07-05 | 2023-09-26 | 广州信安数据有限公司 | 基于多源异构数据的统一本体连接查询方法、介质及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112328623A (zh) | 基于混合本体模式的多源异构数据管理方法 | |
Janowicz et al. | Why the data train needs semantic rails | |
CN110941612B (zh) | 基于关联数据的自治数据湖构建系统及方法 | |
Mena et al. | OBSERVER: An approach for query processing in global information systems based on interoperation across pre-existing ontologies | |
Fonseca et al. | Using ontologies for integrated geographic information systems | |
Gagnon | Ontology-based integration of data sources | |
Stefanowski et al. | Exploring complex and big data | |
CN106372114A (zh) | 一种基于大数据的联机分析处理系统和方法 | |
Kashyap et al. | Information brokering across heterogeneous digital data: a metadata-based approach | |
US9201905B1 (en) | Semantically mediated access to knowledge | |
KR20200082179A (ko) | 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법 | |
Pokorný | Database architectures: Current trends and their relationships to environmental data management | |
CN108241709A (zh) | 一种数据集成方法、装置和系统 | |
Shah et al. | Logical information modeling of Web-accessible heterogeneous digital assets | |
Kerschberg et al. | Just-in-time knowledge management | |
Sheth et al. | Semantic information brokering: How can a Multi-Agent approach help? | |
Laskey et al. | Probabilistic ontology for net-centric fusion | |
Li et al. | Research on storage method for fuzzy RDF graph based on Neo4j | |
Amer-Yahia et al. | Interactive exploration of composite items | |
Fileto et al. | A survey on information systems interoperability | |
Zhang et al. | Storing fuzzy description logic ontology knowledge bases in fuzzy relational databases | |
Sall et al. | Using XML data integration and ontology reuse to share agricultural data | |
Wang et al. | Inter-database instance identification in composite information systems | |
Hakimpour et al. | Data Processing in Space, Time, and Semantics Dimensions | |
de Souza Baptista et al. | Spatial Information Systems and the World Wide Web |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210205 |