CN109471957A - 一种基于统一标签的元数据转换方法及装置 - Google Patents

一种基于统一标签的元数据转换方法及装置 Download PDF

Info

Publication number
CN109471957A
CN109471957A CN201811094223.3A CN201811094223A CN109471957A CN 109471957 A CN109471957 A CN 109471957A CN 201811094223 A CN201811094223 A CN 201811094223A CN 109471957 A CN109471957 A CN 109471957A
Authority
CN
China
Prior art keywords
label
data
metadata
unified
converted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811094223.3A
Other languages
English (en)
Other versions
CN109471957B (zh
Inventor
王玄音
董水峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yuatu Remote Sensing Technology Development Co Ltd
Original Assignee
Beijing Yuatu Remote Sensing Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yuatu Remote Sensing Technology Development Co Ltd filed Critical Beijing Yuatu Remote Sensing Technology Development Co Ltd
Priority to CN201811094223.3A priority Critical patent/CN109471957B/zh
Publication of CN109471957A publication Critical patent/CN109471957A/zh
Application granted granted Critical
Publication of CN109471957B publication Critical patent/CN109471957B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种基于统一标签的元数据转换方法及装置。其中,所述方法包括:获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据;根据所述目标标签实体数据得到目标元数据文件。本发明实施例针对多源异构空间数据,通过构建基于统一标签的元数据统一标签交换模型,最大程度屏蔽各元数据方案之间的异构性,建立已有元数据标准与统一元数据标准之间的映射关系,将不同格式的元数据转换为标准格式,进而转换成目标格式,实现了多源空间数据的集中管理和数据共享。

Description

一种基于统一标签的元数据转换方法及装置
技术领域
本发明实施例涉及数据处理技术领域,具体涉及一种基于统一标签的元数据转换方法及装置。
背景技术
由于空间数据来源不同、格式不同、种类不同,比如Landsat数据的元数据格式与GF数据的元数据格式不同,各数据中心分别采用不同的元数据模型,建立了不同的元数据库,对外提供不同的访问接口,实现空间数据的管理和检索利用。
不同的元数据模型只适用于某种特定的数据,不具备普适性,不能将多源数据整合在一起,很容易形成“信息孤岛”,元数据与元数据之间缺乏关联,不同的元数据之间有着不同的元素与结构形式,难以直接实现情报信息的交互,不利于多源空间数据的集中管理和数据共享。
发明内容
为解决现有技术中多源空间数据的集中管理和数据共享的难题,本发明实施例提供一种基于统一标签的元数据转换方法及装置。
第一方面,本发明实施例提供一种基于统一标签的元数据转换方法,该方法包括:获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;根据所述目标标签实体数据得到目标元数据文件。
第二方面,本发明实施例提供一种基于统一标签的元数据转换装置,该装置包括:中间统一标签实体数据获取模块,用于获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;目标标签实体数据获取模块,用于根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;元数据文件生成模块,用于根据所述目标标签实体数据得到目标元数据文件。
第三方面,本发明实施例提供一种电子设备,包括存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;根据所述目标标签实体数据得到目标元数据文件。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下方法:获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;根据所述目标标签实体数据得到目标元数据文件。
本发明实施例针对多源异构空间数据,通过构建基于统一标签的元数据统一标签交换模型,最大程度屏蔽各元数据方案之间的异构性,建立已有元数据标准与统一元数据标准之间的映射关系,将不同格式的元数据转换为标准格式,进而转换成目标格式,实现了多源空间数据的集中管理和数据共享。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于统一标签的元数据转换方法流程图;
图2是本发明另一实施例提供的基于统一标签的元数据转换方法流程图;
图3是本发明实施例提供的基于统一标签的元数据转换装置示意图;
图4是本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的基于统一标签的元数据转换方法流程图。如图1所示,所述方法包括:
步骤101、获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;
基于统一标签的元数据转换装置根据输入的待转换元数据文件,获取所述待转换元数据文件的标签实体数据,即所述待转换标签实体数据。所述待转换标签实体数据包括所述待转换元数据文件的节点标签及标签选择路径(节点标签之间的路径关系);根据所述待转换标签实体数据得到中间统一标签实体数据,所述中间统一标签实体数据是指与所述待转换标签实体数据对应的统一标签实体数据;所述统一标签实体数据由预设的统一元数据模型的元数据文件得到。所述统一标签实体数据包括统一元数据模型(标准元数据模型)的元数据文件的节点标签及标签选择路径。
步骤102、根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;
所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;所述目标标签实体数据是指与所述中间统一标签实体数据对应的目标元数据模型的元数据文件的标签实体数据。所述中间统一标签实体数据属于统一标签实体数据。因此,根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据。
所述目标标签实体数据是与所述中间统一标签实体数据对应的目标元数据模型的元数据文件的标签实体数据,也是与所述待转换元数据文件的待转换标签实体数据对应的目标元数据模型的元数据文件的标签实体数据。
步骤103、根据所述目标标签实体数据得到目标元数据文件。
所述目标标签实体数据包含了与所述待转换元数据文件的待转换标签实体数据对应的目标元数据模型下的节点标签和标签选择路径,由节点标签和标签选择路径可以获取具体的数据。因此,根据所述目标标签实体数据,根据目标元数据文件的编码规范,生成格式化的元数据文件,即得到目标元数据文件,完成元数据格式的转换。
本发明实施例针对多源异构空间数据,通过构建基于统一标签的元数据统一标签交换模型,最大程度屏蔽各元数据方案之间的异构性,建立已有元数据标准与统一元数据标准之间的映射关系,将不同格式的元数据转换为标准格式,进而转换成目标格式,实现了多源空间数据的集中管理和数据共享。
进一步地,基于上述实施例,所述获取待转换元数据文件的待转换标签实体数据,具体包括:根据所述待转换元数据文件,通过广度遍历获取节点标签,并通过深度遍历获取标签选择路径,根据所述节点标签和所述标签选择路径得到所述待转换标签实体数据。
使用计算机自动标签提取技术,根据所述待转换元数据文件,利用待转换元数据表达规则,通过广度遍历获取节点标签,并通过深度遍历获取标签选择路径,所述标签选择路径是指节点标签的分层关系或节点标签之间的路径关系,根据所述节点标签和所述标签选择路径得到所述待转换标签实体数据。所述待转换标签实体数据可进一步进行标准化表达,如表示出类别、名称、属性等信息。
所述待转换标签实体数据可于内存存储,以供进一步处理。
在上述实施例的基础上,本发明实施例通过广度遍历获取节点标签及深度遍历获取标签选择路径,得到待转换标签实体数据,提高了待转换标签实体数据获取的全面性和准确性,进而提高了元数据转换的全面性和准确性。
进一步地,基于上述实施例,所述根据所述待转换标签实体数据得到中间统一标签实体数据,具体包括:通过标签语义分析,得到所述待转换标签实体数据与统一标签实体数据之间的映射关系,根据所述待转换标签实体数据与统一标签实体数据之间的映射关系得到所述中间统一标签实体数据。
针对所述待转换标签实体数据与统一标签实体数据,结合语料库,通过标签语义分析,得到所述待转换标签实体数据与统一标签实体数据中对应的语义相同或相似的标签,进一步通过对语义相同或相似的标签各自的标签选择路径上的标签的语义分析,确定对应的两个标签是否表示相同的数据。若对应的两个标签相同或相似,且各自标签选择路径上的关键标签也相同或相似,则可判定对应的两个标签存在映射关系。通过上述方法可以建立所述待转换标签实体数据与统一标签实体数据之间的映射关系。
由于所述待转换标签实体数据与统一标签实体数据之间的映射关系即是将所述待转换标签实体数据映射到了所述统一标签实体数据中的所述目标统一标签实体数据,因此,根据所述待转换标签实体数据与统一标签实体数据之间的映射关系可以得到所述中间统一标签实体数据。
在上述实施例的基础上,本发明实施例通过标签语义分析,建立待转换标签实体数据与统一标签实体数据之间的映射关系,进而得到中间统一标签实体数据,提高了中间统一标签实体数据的全面性和准确性,进一步提高了元数据转换的全面性和准确性。
进一步地,基于上述实施例,所述元数据统一标签交换模型的建立过程包括:根据标准元数据模型的元数据文件,通过广度遍历获取节点标签及通过深度遍历获取标签选择路径,得到统一标签实体数据;根据异构元数据模型的元数据文件,通过广度遍历获取节点标签及通过深度遍历获取标签选择路径,得到异构标签实体数据;根据所述异构标签实体数据和所述统一标签实体数据,通过标签语义分析,得到所述异构标签实体数据和所述统一标签实体数据之间的映射关系,进而得到所述元数据统一标签交换模型。
所述元数据统一标签交换模型包括不同标准的异构元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系。所述异构元数据模型包括目标元数据模型,因此,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系。其中,所述统一标签实体数据是指预设的标准元数据模型的元数据文件的标签实体数据。所述元数据统一标签交换模型的建立过程包括:
根据标准元数据模型的元数据文件,通过广度遍历获取节点标签及通过深度遍历获取标签选择路径,得到统一标签实体数据。如使用计算机自动标签提取技术,输入标准元数据模型的XML实体文件,利用标准元数据模型中定义的元数据标签提取。输入的数据是符合标准规范的XML数据,利用XML数据表达规则,通过广度遍历获取XML节点标签,并通过深度遍历抽取标签选择路径。由得到的节点标签和标签选择路径得到统一标签实体数据。同时,可以将输出的统一标签实体数据进行标准化表达,入库。
根据异构元数据模型的元数据文件,通过广度遍历获取节点标签及通过深度遍历获取标签选择路径,得到异构标签实体数据。同样使用计算机自动标签提取技术,输入异构元数据文件,完成异构元数据定义的标签提取。输入的数据是不同标准的异构元数据模型的XML数据,利用XML数据表达规则,通过广度遍历获取XML节点标签,并通过深度遍历抽取标签选择路径。由得到的节点标签和标签选择路径得到异构标签实体数据。同时,可以将输出的异构标签实体数据进行标准化表达,入库。
根据所述异构标签实体数据和所述统一标签实体数据,通过标签语义分析,得到所述异构标签实体数据和所述统一标签实体数据之间的映射关系,进而得到所述元数据统一标签交换模型。针对所述异构标签实体数据与所述统一标签实体数据,结合语料库,通过标签语义分析,得到所述异构标签实体数据与统一标签实体数据中对应的语义相同或相似的标签,进一步通过对语义相同或相似的标签各自的标签选择路径上的标签的语义分析,确定对应的两个标签是否表示相同的数据。若对应的两个标签相同或相似,且各自标签选择路径上的关键标签也相同或相似,则可判定对应的两个标签存在映射关系。通过上述方法可以建立所述异构标签实体数据与统一标签实体数据之间的映射关系,进而得到所述元数据统一标签交换模型。
在上述实施例的基础上,本发明实施例通过自动化标签提取技术分别得到异构标签实体数据和统一标签实体数据,并进一步通过标签语义分析得到异构标签实体数据和统一标签实体数据之间的映射关系,进而得到元数据统一标签交换模型,提高了元数据统一标签交换模型的准确性,从而进一步提高了元数据转换的准确性。
进一步地,基于上述实施例,所述节点标签包括一级分类节点标签和二级分类节点标签。
一级分类节点标签和二级分类节点标签对应元数据的关键内容,更高级别的节点标签对应更细微的内容,获取的节点级别越高,则系统运行越缓慢,对资源的要求越高。由于根据一级分类节点标签和二级分类节点标签即可获取主要的元数据的内容,可以满足空间数据分析的需求。因此,为减小资源消耗、提高效率,本发明实施例可以设定获取一级分类节点标签及二级分类节点标签即可。
其中,节点标签也可以简述为标签。
在上述实施例的基础上,本发明实施例通过使得节点标签包括一级分类节点标签和二级分类节点标签,在满足空间数据分析的基础上,提高了系统运行的效率,减少了资源消耗。
进一步地,基于上述实施例,所述异构标签实体数据与统一标签实体数据之间的映射关系和所述待转换标签实体数据与统一标签实体数据之间的映射关系包括定向关系、组合关系和拆分关系。
根据待转换元数据文件的待转换标签实体数据得到中间统一标签实体数据时,需要利用待转换标签实体数据与统一标签实体数据之间的映射关系实现;同样,根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据时,需要利用异构标签实体数据与统一标签实体数据之间的映射关系实现。所述异构标签实体数据与统一标签实体数据之间的映射关系和所述待转换标签实体数据与统一标签实体数据之间的映射关系包括定向关系、组合关系和拆分关系。
根据标签的语义及标签选择路径可确定映射关系。定向映射关系表示标签的语义相同且选择路径也相同。根据标签实体的关系确认上下位关系,进而将下位关系界定为拆分,上位关系界定为组合。
在上述实施例的基础上,本发明实施例通过建立标签实体间的定向关系、组合关系和拆分关系,对标签实体数据的转换提供了便利。
进一步地,基于上述实施例,所述标签选择路径通过XPath实现。
XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。因此,在元数据为XML格式时,可用XPath获取所述标签选择路径。
在上述实施例的基础上,本发明实施例通过利用XPath获取标签选择路径,提高了标签选择路径获取的准确性。
图2是本发明另一实施例提供的基于统一标签的元数据转换方法流程图。如图2所示,所述方法包括:
输入待转换元数据文件,并根据所述待转换元数据文件得到待转换标签实体数据;根据统一元数据标签得到统一标签实体数据;通过建立待转换元数据文件的待转换标签实体数据和统一标签实体数据之间的映射关系,得到中间统一标签实体数据,即输出标准的元数据标签实体集。
根据所述待转换元数据文件拟转换成的目标元数据模型的元数据格式,即确认目标类型的元数据格式,进而得到目标元数据模型的元数据文件的标签实体数据,通过建立的元数据统一标签交换模型将根据待转换的元数据文件的待转换标签实体数据输出的标准的元数据标签实体集转换成目标元数据模型的格式的标签实体数据,并组合生成XML文档;最后,根据目标元数据模型的元数据的编码规范,获取实际数据,并输出目标类型的元数据文件。
本发明实施例针对多源异构空间数据,通过构建基于统一标签的元数据统一标签交换模型,最大程度屏蔽各元数据方案之间的异构性,建立已有元数据标准与统一元数据标准之间的映射关系,将不同格式的元数据转换为标准格式,进而转换成目标格式,实现了多源空间数据的集中管理和数据共享。
图3是本发明实施例提供的基于统一标签的元数据转换装置示意图。如图3所示,所述装置包括中间统一标签实体数据获取模块10、目标标签实体数据获取模块20和元数据文件生成模块30,其中:
中间统一标签实体数据获取模块10用于获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;
中间统一标签实体数据获取模块10根据输入的待转换元数据文件,获取所述待转换元数据文件的待转换标签实体数据;根据所述待转换标签实体数据得到中间统一标签实体数据,所述中间统一标签实体数据是指与所述待转换标签实体数据对应的统一标签实体数据。
目标标签实体数据获取模块20用于根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;
所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;所述目标标签实体数据是指与所述中间统一标签实体数据对应的目标元数据模型的元数据文件的标签实体数据。目标标签实体数据获取模块20根据元数据统一标签交换模型及所述中间统一标签实体数据可以得到目标标签实体数据。
元数据文件生成模块30用于根据所述目标标签实体数据得到目标元数据文件。
元数据文件生成模块30根据所述目标标签实体数据,根据目标元数据文件的编码规范,生成格式化的元数据文件,即得到目标元数据文件,完成元数据格式的转换。
本发明实施例针对多源异构空间数据,通过构建基于统一标签的元数据统一标签交换模型,最大程度屏蔽各元数据方案之间的异构性,建立已有元数据标准与统一元数据标准之间的映射关系,将不同格式的元数据转换为标准格式,进而转换成目标格式,实现了多源空间数据的集中管理和数据共享。
进一步地,基于上述实施例,中间统一标签实体数据获取模块10在用于获取待转换元数据文件的待转换标签实体数据时,具体用于:根据所述待转换元数据文件,通过广度遍历获取节点标签,并通过深度遍历获取标签选择路径,根据所述节点标签和所述标签选择路径得到所述待转换标签实体数据。
中间统一标签实体数据获取模块10使用计算机自动标签提取技术,根据所述待转换元数据文件,通过广度遍历获取节点标签,并通过深度遍历获取标签选择路径,根据所述节点标签和所述标签选择路径得到所述待转换标签实体数据。
在上述实施例的基础上,本发明实施例通过广度遍历获取节点标签及深度遍历获取标签选择路径,得到待转换标签实体数据,提高了待转换标签实体数据获取的全面性和准确性,进而提高了元数据转换的全面性和准确性。
进一步地,基于上述实施例,中间统一标签实体数据获取模块10在用于根据所述待转换标签实体数据得到中间统一标签实体数据时,具体用于:通过标签语义分析,得到所述待转换标签实体数据与统一标签实体数据之间的映射关系,根据所述待转换标签实体数据与统一标签实体数据之间的映射关系得到所述中间统一标签实体数据。
中间统一标签实体数据获取模块10针对所述待转换标签实体数据与统一标签实体数据,结合语料库,通过标签语义分析,得到所述待转换标签实体数据与统一标签实体数据中对应的语义相同或相似的标签,进一步通过对语义相同或相似的标签各自的标签选择路径上的标签的语义分析,确定对应的两个标签是否表示相同的含义。中间统一标签实体数据获取模块10若获知对应的两个标签相同或相似,且各自标签选择路径上的关键标签也相同或相似,则可判定对应的两个标签存在映射关系。中间统一标签实体数据获取模块10根据所述待转换标签实体数据与统一标签实体数据之间的映射关系可以得到所述中间统一标签实体数据。
在上述实施例的基础上,本发明实施例通过标签语义分析,建立待转换标签实体数据与统一标签实体数据之间的映射关系,进而得到中间统一标签实体数据,提高了中间统一标签实体数据的全面性和准确性,进一步提高了元数据转换的全面性和准确性。
进一步地,基于上述实施例,所述装置还包括元数据统一标签交换模型建立模块,具体用于:根据标准元数据模型的元数据文件,通过广度遍历获取节点标签及通过深度遍历获取标签选择路径,得到统一标签实体数据;根据异构元数据模型的元数据文件,通过广度遍历获取节点标签及通过深度遍历获取标签选择路径,得到异构标签实体数据;根据所述异构标签实体数据和所述统一标签实体数据,通过标签语义分析,得到所述异构标签实体数据和所述统一标签实体数据之间的映射关系,进而得到所述元数据统一标签交换模型。
所述统一标签实体数据是指预设的标准元数据模型的元数据文件的标签实体数据。元数据统一标签交换模型建立模块根据标准元数据模型的元数据文件,使用计算机自动标签提取技术,通过广度遍历获取节点标签及通过深度遍历获取标签选择路径,得到统一标签实体数据。元数据统一标签交换模型建立模块根据异构元数据模型的元数据文件,使用计算机自动标签提取技术,通过广度遍历获取节点标签及通过深度遍历获取标签选择路径,得到异构标签实体数据。根据所述异构标签实体数据和所述统一标签实体数据,通过标签语义分析,得到所述异构标签实体数据和所述统一标签实体数据之间的映射关系,进而得到所述元数据统一标签交换模型。
在上述实施例的基础上,本发明实施例通过自动化标签提取技术分别得到异构标签实体数据和统一标签实体数据,并进一步通过标签语义分析得到异构标签实体数据和统一标签实体数据之间的映射关系,进而得到元数据统一标签交换模型,提高了元数据统一标签交换模型的准确性,从而进一步提高了元数据转换的准确性。
进一步地,基于上述实施例,所述节点标签包括一级分类节点标签和二级分类节点标签。
由于根据一级分类节点标签和二级分类节点标签即可获取主要的元数据的内容,可以满足空间数据分析的需求,因此,为减小资源消耗、提高效率,本发明实施例可以设定获取一级分类节点标签及二级分类节点标签即可。
在上述实施例的基础上,本发明实施例通过使得节点标签包括一级分类节点标签和二级分类节点标签,在满足空间数据分析的基础上,提高了系统运行的效率,减少了资源消耗。
进一步地,基于上述实施例,所述异构标签实体数据与统一标签实体数据之间的映射关系和所述待转换标签实体数据与统一标签实体数据之间的映射关系包括定向关系、组合关系和拆分关系。
根据标签的语义及标签选择路径可确定映射关系。定向映射关系表示标签的语义相同且选择路径也相同。根据标签实体的关系确认上下位关系,进而将下位关系界定为拆分,上位关系界定为组合。
在上述实施例的基础上,本发明实施例通过建立标签实体间的定向关系、组合关系和拆分关系,对标签实体数据的转换提供了便利。
进一步地,基于上述实施例,所述标签选择路径通过XPath实现。
XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。在上述实施例的基础上,本发明实施例通过利用XPath获取标签选择路径,提高了标签选择路径获取的准确性。
本发明实施例提供的装置是用于上述方法的,具体功能可参照上述方法流程,此处不再赘述。
图4是本发明实施例提供的电子设备的结构示意图。如图4所示,所述电子设备包括处理器401、存储器402和总线403。其中,所述处理器401和所述存储器402通过所述总线403完成相互间的通信;所述处理器401用于调用所述存储器402中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;根据所述目标标签实体数据得到目标元数据文件。
本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;根据所述目标标签实体数据得到目标元数据文件。
本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;根据所述目标标签实体数据得到目标元数据文件。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的电子设备等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于统一标签的元数据转换方法,其特征在于,包括:
获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;
根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;
根据所述目标标签实体数据得到目标元数据文件。
2.根据权利要求1所述的方法,其特征在于,所述获取待转换元数据文件的待转换标签实体数据,具体包括:
根据所述待转换元数据文件,通过广度遍历获取节点标签,并通过深度遍历获取标签选择路径,根据所述节点标签和所述标签选择路径得到所述待转换标签实体数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述待转换标签实体数据得到中间统一标签实体数据,具体包括:
通过标签语义分析,得到所述待转换标签实体数据与统一标签实体数据之间的映射关系,根据所述待转换标签实体数据与统一标签实体数据之间的映射关系得到所述中间统一标签实体数据。
4.根据权利要求1所述的方法,其特征在于,所述元数据统一标签交换模型的建立过程包括:
根据标准元数据模型的元数据文件,通过广度遍历获取节点标签及通过深度遍历获取标签选择路径,得到统一标签实体数据;
根据异构元数据模型的元数据文件,通过广度遍历获取节点标签及通过深度遍历获取标签选择路径,得到异构标签实体数据;
根据所述异构标签实体数据和所述统一标签实体数据,通过标签语义分析,得到所述异构标签实体数据和所述统一标签实体数据之间的映射关系,进而得到所述元数据统一标签交换模型。
5.根据权利要求2~4任一所述的方法,其特征在于,所述节点标签包括一级分类节点标签和二级分类节点标签。
6.根据权利要求3所述的方法,其特征在于,所述异构标签实体数据与统一标签实体数据之间的映射关系和所述待转换标签实体数据与统一标签实体数据之间的映射关系包括定向关系、组合关系和拆分关系。
7.根据权利要求2或4所述的方法,其特征在于,所述标签选择路径通过XPath实现。
8.一种基于统一标签的元数据转换装置,其特征在于,包括:
中间统一标签实体数据获取模块,用于获取待转换元数据文件的待转换标签实体数据,并根据所述待转换标签实体数据得到中间统一标签实体数据;
目标标签实体数据获取模块,用于根据元数据统一标签交换模型及所述中间统一标签实体数据得到目标标签实体数据,所述元数据统一标签交换模型包括目标元数据模型的元数据文件的标签实体数据与统一标签实体数据之间的映射关系;
元数据文件生成模块,用于根据所述目标标签实体数据得到目标元数据文件。
9.一种电子设备,其特征在于,包括存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至7任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一所述的方法。
CN201811094223.3A 2018-09-19 2018-09-19 一种基于统一标签的元数据转换方法及装置 Active CN109471957B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811094223.3A CN109471957B (zh) 2018-09-19 2018-09-19 一种基于统一标签的元数据转换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811094223.3A CN109471957B (zh) 2018-09-19 2018-09-19 一种基于统一标签的元数据转换方法及装置

Publications (2)

Publication Number Publication Date
CN109471957A true CN109471957A (zh) 2019-03-15
CN109471957B CN109471957B (zh) 2020-08-04

Family

ID=65663129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811094223.3A Active CN109471957B (zh) 2018-09-19 2018-09-19 一种基于统一标签的元数据转换方法及装置

Country Status (1)

Country Link
CN (1) CN109471957B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579679A (zh) * 2020-12-15 2021-03-30 北京动力机械研究所 设计异构数据模型映射策略和自动转换方法及装置
CN115630112A (zh) * 2022-12-19 2023-01-20 南京视云信息科技有限公司 基于数据处理的数据动态转换方法
CN116955463A (zh) * 2023-06-12 2023-10-27 自然资源陕西省卫星应用技术中心 多源异构数据整合系统
CN112579679B (zh) * 2020-12-15 2024-05-28 北京动力机械研究所 设计异构数据模型映射策略和自动转换方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020194201A1 (en) * 2001-06-05 2002-12-19 Wilbanks John Thompson Systems, methods and computer program products for integrating biological/chemical databases to create an ontology network
CN101067814A (zh) * 2007-05-10 2007-11-07 浪潮集团山东通用软件有限公司 数据访问层Xml格式数据与关系数据间的映射转换方法
CN103970899A (zh) * 2014-05-27 2014-08-06 重庆大学 面向服务的元数据关联性提取管理方法及其管理系统
CN104008135A (zh) * 2014-05-07 2014-08-27 南京邮电大学 一种多源异构数据库融合系统及其数据查询方法
CN104346377A (zh) * 2013-07-31 2015-02-11 克拉玛依红有软件有限责任公司 一种基于唯一标识的数据集成和交换方法
CN104462244A (zh) * 2014-11-19 2015-03-25 武汉大学 一种基于元模型的智慧城市异构数据共享方法
CN107357933A (zh) * 2017-08-04 2017-11-17 刘应波 一种用于多源异构科技信息资源的标签描述方法和装置
CN107895046A (zh) * 2017-11-30 2018-04-10 广东奥飞数据科技股份有限公司 一种异构数据集成平台

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020194201A1 (en) * 2001-06-05 2002-12-19 Wilbanks John Thompson Systems, methods and computer program products for integrating biological/chemical databases to create an ontology network
CN101067814A (zh) * 2007-05-10 2007-11-07 浪潮集团山东通用软件有限公司 数据访问层Xml格式数据与关系数据间的映射转换方法
CN104346377A (zh) * 2013-07-31 2015-02-11 克拉玛依红有软件有限责任公司 一种基于唯一标识的数据集成和交换方法
CN104008135A (zh) * 2014-05-07 2014-08-27 南京邮电大学 一种多源异构数据库融合系统及其数据查询方法
CN103970899A (zh) * 2014-05-27 2014-08-06 重庆大学 面向服务的元数据关联性提取管理方法及其管理系统
CN104462244A (zh) * 2014-11-19 2015-03-25 武汉大学 一种基于元模型的智慧城市异构数据共享方法
CN107357933A (zh) * 2017-08-04 2017-11-17 刘应波 一种用于多源异构科技信息资源的标签描述方法和装置
CN107895046A (zh) * 2017-11-30 2018-04-10 广东奥飞数据科技股份有限公司 一种异构数据集成平台

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579679A (zh) * 2020-12-15 2021-03-30 北京动力机械研究所 设计异构数据模型映射策略和自动转换方法及装置
CN112579679B (zh) * 2020-12-15 2024-05-28 北京动力机械研究所 设计异构数据模型映射策略和自动转换方法及装置
CN115630112A (zh) * 2022-12-19 2023-01-20 南京视云信息科技有限公司 基于数据处理的数据动态转换方法
CN115630112B (zh) * 2022-12-19 2023-06-20 南京视云信息科技有限公司 基于数据处理的数据动态转换方法
CN116955463A (zh) * 2023-06-12 2023-10-27 自然资源陕西省卫星应用技术中心 多源异构数据整合系统
CN116955463B (zh) * 2023-06-12 2024-04-02 自然资源陕西省卫星应用技术中心 多源异构数据整合系统

Also Published As

Publication number Publication date
CN109471957B (zh) 2020-08-04

Similar Documents

Publication Publication Date Title
US9317557B2 (en) Answering relational database queries using graph exploration
US9753960B1 (en) System, method, and computer program for dynamically generating a visual representation of a subset of a graph for display, based on search criteria
CN102968307B (zh) 一种基于java的web开发中间件
WO2021032146A1 (zh) 元数据管理方法和装置、设备及存储介质
CN102999537A (zh) 一种数据迁移系统和方法
CN102254022A (zh) 一种面向多数据类型信息资源元数据的共享方法
CN105975466A (zh) 一种面向短新闻的机器写稿方法及装置
CN103390018A (zh) 一种基于SDD的Web服务数据建模与搜索方法
US20170060977A1 (en) Data preparation for data mining
CN109271428A (zh) 数据抽取方法及基于地理信息的数据展示方法
CN104252345A (zh) 在云环境中管理复杂对象的方法及系统
CN103077022A (zh) 一种作业流程可视化的作业配置方法和装置
CN103577931A (zh) 一种基于语义的可复用软件服务管理系统及其实现方法
Mesiti et al. Towards a user-friendly loading system for the analysis of big data in the internet of things
Mostajabi et al. A Systematic Review of Data Models for the Big Data Problem
CN109471957A (zh) 一种基于统一标签的元数据转换方法及装置
CN103164476A (zh) 一种bi应用元数据描述文件的执行方法和装置
CN115757810A (zh) 一种知识图谱标准本体构建方法
CN108959356A (zh) 一种智能配用电大数据应用系统数据集市建立方法
Silvescu et al. Graph databases
CN114168117A (zh) 一种基于设计器的信创低代码开发工具和存储设备
CN102594851A (zh) 一种海洋应用服务链动态构建的方法
CN102129468B (zh) 一种可定制集群状态展现的方法
CN116775605A (zh) 一种基于人工智能的产业数据管理和共享平台
WO2024011829A1 (zh) 一种基于时空体系的综合智能平台数据管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100085 room A515, building 79, Shuang Qing Lu, Haidian District, Beijing.

Applicant after: Beijing yuetu Data Technology Development Co., Ltd

Address before: 100085 room A515, building 79, Shuang Qing Lu, Haidian District, Beijing.

Applicant before: BEIJING YUETU REMOTE SENSING TECHNOLOGY DEVELOPMENT Co.,Ltd.

GR01 Patent grant
GR01 Patent grant