CN115344582A - 元数据的管理方法、装置、电子设备及计算机存储介质 - Google Patents

元数据的管理方法、装置、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN115344582A
CN115344582A CN202211014536.XA CN202211014536A CN115344582A CN 115344582 A CN115344582 A CN 115344582A CN 202211014536 A CN202211014536 A CN 202211014536A CN 115344582 A CN115344582 A CN 115344582A
Authority
CN
China
Prior art keywords
metadata
model
information
meta
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211014536.XA
Other languages
English (en)
Inventor
缪海旭
王帅
刘艳芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Travelsky Technology Co Ltd
Original Assignee
China Travelsky Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Travelsky Technology Co Ltd filed Critical China Travelsky Technology Co Ltd
Priority to CN202211014536.XA priority Critical patent/CN115344582A/zh
Publication of CN115344582A publication Critical patent/CN115344582A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种元数据的管理方法、装置、电子设备及计算机存储介质,该方法包括:首先,完成元模型的新增,得到新增元模型;然后,注册新增元模型的文件类数据的注册信息;其中,注册信息包括基本信息、数据源、字段消息、安全信息、管理信息以及文件传输协议信息;再对新增元模型进行采集配置;其中,采集配置包括采集数据源、采集适配器以及采集作业信息;之后,新增元模型按照采集配置,进行元数据的采集;最终,对收集得到的注册元数据以及采集元数据进行存储;其中,注册元数据以及采集元数据的存储方式为相同的存储结构,均以元数据类型、元模型编号和元数据名称作为唯一主键来标识一个元数据。有效的提高元数据管理的完整性。

Description

元数据的管理方法、装置、电子设备及计算机存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种元数据的管理方法、装置、电子设备及计算机存储介质。
背景技术
现有技术中主要存在两种元数据管理方法,事前(designed)元数据管理和事后(implemented)元数据管理。两种元数据管理方法均需对元模型进行管理,遵照元模型收集相关的元数据信息。区别在于事前元数据管理在数据设计环节进行管控,主要通过人工填写表单或者元模型模板文档来实现;事后元数据管理则在数据落地环节后进行管理,主要通过配置不同类型的采集适配器实现元数据的自动化采集。其中,事前元数据管理需要强有力的管理支撑,形成自上而下的强大驱动力,严格按照相关流程完成元数据的收集,这种方法的弊端在于过分依赖管理力度及人工维护,人工成本高且元数据管理的持续性、准确性、完整性得不到有效的保障;事后元数据管理在数据落地后通过技术手段完成元数据采集,可以保证收集的元数据与生产环境的高度一致性,但是由于生产环境所限导致部分业务元数据、管理元数据等无法通过技术手段获取,部分技术方法考虑增加人工补录来解决这一问题,势必会降低工作效率,难于保证元数据管理的完整性。
发明内容
有鉴于此,本申请提供了一种元数据的管理方法、装置、电子设备及计算机存储介质,可以有效提高元数据管理的完整性。
本申请第一方面提供了一种元数据的管理方法,包括:
完成元模型的新增,得到新增元模型;
注册所述新增元模型的文件类数据的注册信息;其中,所述注册信息包括基本信息、数据源、字段消息、安全信息、管理信息以及文件传输协议信息;
对所述新增元模型进行采集配置;其中,所述采集配置包括采集数据源、采集适配器以及采集作业信息;
所述新增元模型按照所述采集配置,进行元数据的采集;
对收集得到的注册元数据以及采集元数据进行存储;其中,所述注册元数据以及采集元数据的存储方式为相同的存储结构,均以元数据类型、元模型编号和元数据名称作为唯一主键来标识一个元数据。
可选的,所述完成元模型的新增,得到新增元模型,包括:
根据当前存量元模型确定新增元模型的编号;
定义所述新增元模型的属性信息;其中,所述属性信息包括:名称、技术属性、业务属性、管理属性、安全属性、操作属性以及依赖关系信息;
完成所述新增元模型的新增。
可选的,所述对所述新增元模型进行采集配置,包括:
根据开发生产环境配置采集数据源;
根据关系型数据仓库的类型选择相应的采集适配器;
配置采集作业信息;其中所述采集作业信息包括:采集作业名称以及采集作业执行频率。
可选的,所述对收集得到的注册元数据以及采集元数据进行存储之后,还包括:
针对每一个元数据,将所述元数据在注册和采集过程中,收集得到的注册元数据和采集元数据,按照元数据的比对规则进行比对,得到比对结果;
若所述比对结果表明注册元数据和采集元数据不相同,则生成差异分析报告;
若所述比对结果表明注册元数据和采集元数据相同,则进行下一个元数据的注册元数据和采集元数据的比对。
本申请第二方面提供了一种元数据的管理装置,包括:
模型新增单元,用于完成元模型的新增,得到新增元模型;
注册单元,用于注册所述新增元模型的文件类数据的注册信息;其中,所述注册信息包括基本信息、数据源、字段消息、安全信息、管理信息以及文件传输协议信息;
配置单元,用于对所述新增元模型进行采集配置;其中,所述采集配置包括采集数据源、采集适配器以及采集作业信息;
采集单元,用于所述新增元模型按照所述采集配置,进行元数据的采集;
存储单元,用于对收集得到的注册元数据以及采集元数据进行存储;其中,所述注册元数据以及采集元数据的存储方式为相同的存储结构,均以元数据类型、元模型编号和元数据名称作为唯一主键来标识一个元数据。
可选的,所述模型新增单元,包括:
编号确定单元,用于根据当前存量元模型确定新增元模型的编号;
定义单元,用于定义所述新增元模型的属性信息;其中,所述属性信息包括:名称、技术属性、业务属性、管理属性、安全属性、操作属性以及依赖关系信息;
模型新增子单元,用于完成所述新增元模型的新增。
可选的所述配置单元,包括:
第一配置子单元,用于根据开发生产环境配置采集数据源;
第二配置子单元,用于根据关系型数据仓库的类型选择相应的采集适配器;
第三配置子单元,用于配置采集作业信息;其中所述采集作业信息包括:采集作业名称以及采集作业执行频率。
可选的,所述元数据的管理装置,还包括:
比对单元,用于针对每一个元数据,将所述元数据在注册和采集过程中,收集得到的注册元数据和采集元数据,按照元数据的比对规则进行比对,得到比对结果;
生成单元,用于若所述比对结果表明注册元数据和采集元数据不相同,则生成差异分析报告;
处理单元,用于若所述比对结果表明注册元数据和采集元数据相同,则进行下一个元数据的注册元数据和采集元数据的比对。
本申请第三方面提供了一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如第一方面任意一项所述的元数据的管理方法。
本申请第四方面提供了一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如第一方面任意一项所述的元数据的管理方法。
由以上方案可知,本申请提供一种元数据的管理方法、装置、电子设备及计算机存储介质,所述元数据的管理方法包括:首先,完成元模型的新增,得到新增元模型;然后,注册所述新增元模型的文件类数据的注册信息;其中,所述注册信息包括基本信息、数据源、字段消息、安全信息、管理信息以及文件传输协议信息;再对所述新增元模型进行采集配置;其中,所述采集配置包括采集数据源、采集适配器以及采集作业信息;之后,所述新增元模型按照所述采集配置,进行元数据的采集;最终,对收集得到的注册元数据以及采集元数据进行存储;其中,所述注册元数据以及采集元数据的存储方式为相同的存储结构,均以元数据类型、元模型编号和元数据名称作为唯一主键来标识一个元数据。有机地结合注册元数据与采集元数据管理实现元数据管理,并通过注册元数据与采集元数据的整合补充,有效的提高元数据管理的完整性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种元数据的管理方法的具体流程图;
图2为本申请另一实施例提供的一种元数据的管理方法的流程图;
图3为本申请另一实施例提供的一种元数据的管理方法的流程图;
图4为本申请另一实施例提供的一种元数据的管理方法的流程图;
图5为本申请另一实施例提供的一种元数据的管理装置的示意图;
图6为本申请另一实施例提供的一种模型新增单元的示意图;
图7为本申请另一实施例提供的一种配置单元的示意图;
图8为本申请另一实施例提供的一种元数据的管理装置的示意图;
图9为本申请另一实施例提供的一种实现元数据的管理方法的电子设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本申请中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本申请实施例提供了一种告警信息的生成方法,如图1所示,具体包括以下步骤:
S101、完成元模型的新增,得到新增元模型。
可选的,在本申请的另一实施例中,步骤S101的一种实施方式,如图2所示,包括:
S201、根据当前存量元模型确定新增元模型的编号。
具体的,新增元模型的编号可以但不限于在当前存量元模型的最大编号的基础上加1,此处不做限定。
S202、定义新增元模型的属性信息。
其中,属性信息包括:名称、技术属性、业务属性、管理属性、安全属性、操作属性以及依赖关系信息。
其中,名称可以定义为关系数据库表等;技术属性包括但不限于库表物理名称,并且可以进一步的定义技术属性的规则,例如:库表物理名称的命名规则应符合“数据层_主题域_业务描述”;业务属性包括但不限于“库表中文名称”、“库表英文名称”、“库表描述”等;管理属性包括但不限于“责任部门”、“责任人”、“创建日期”、“审计周期”、“保存周期”等;安全属性包括但不限于“更新频率”、“访问次数”、“库表存量空间”、“库表增量空间”等;依赖关系信息包括但不限于“关系数据库表”与“关系数据库字段”、“关系数据库索引”等存在依赖关系,此处不做限定。如表1所示,为部分元模型的目录结构。依赖关系信息包括继承关系、组合关系、依赖关系。
一级目录 二级目录 三级目录 元模型名称
数据采集 批量 文件 数据文件
实时 消息队列 消息队列
数据存储 关系型数据库 Oracle 库表
字段
NoSQL数据库 HIVE 库表
数据处理 批处理 ETL 处理任务
流处理 Spark 处理任务
数据服务 批量 文件 数据文件
实时 消息队列 消息队列
表1
S203、完成新增元模型的新增。
S102、注册新增元模型的文件类数据的注册信息。
其中,注册信息包括基本信息、数据源、字段消息、安全信息、管理信息以及文件传输协议信息。基本信息包括但不限于:“数据所属业务分类”、“数据名称”、“数据内容简述”、“数据采集频率”等。更优地,通过预设配置管理,可以通过点选操作实现部分信息的注册,提高效率与系统易用性;数据源作为数据采集环节的重要信息需要记录数据来源的业务系统;更优地,字段消息可支持上传相关文件字段说明文档,或可支持关联引用数据标准进而提升元数据的规范性;安全信息如通过点选是否包含既定的隐私信息可以自动生成文件类数据的安全级别;管理信息包括但不限于“责任部门”、“责任人”等,此处不做限定。
需要说明的是,元数据的注册可以是在数据设计环节中进行注册。并且,支持元数据的新增、修改及删除操作。支持相关元数据属性的配置化管理,支持数据标准的引用关联,减少人工操作,提高效率和质量。
S103、对新增元模型进行采集配置。
其中,采集配置包括采集数据源、采集适配器以及采集作业信息。
可选的,在本申请的另一实施例中,步骤S103的一种实施方式,如图3所示,包括:
S301、根据开发生产环境配置采集数据源。
例如:对于关系型数据仓库的采集,需要配置数据仓库所在服务器的IP地址,数据仓库名称等。
S302、根据关系型数据仓库的类型选择相应的采集适配器。
例如:Oracle采集适配器、GreenPlum采集适配器、EDB采集适配器等。
S303、配置采集作业信息。
其中,采集作业信息包括:采集作业名称以及采集作业执行频率。
并且,在本申请的实际应用过程中,还可以增加对采集作业的监控,监控作业的运行状态,对于非正常运行的作业进行告警。
S104、新增元模型按照采集配置,进行元数据的采集。
S105、对收集得到的注册元数据以及采集元数据进行存储。
其中,注册元数据以及采集元数据的存储方式为相同的存储结构,均以元数据类型、元模型编号和元数据名称作为唯一主键来标识一个元数据。
并且,在本申请的实际应用过程中,还需要考虑元数据更新的处理机制。一般的更新机制有两种,全量更新和增量更新。需根据实际应用场景如元数据体量等选择合适的更新机制。
可选的,在本申请的另一实施例中,元数据的管理方法的一种实施方式,如图4所示,包括:
S401、针对每一个元数据,将元数据在注册和采集过程中,收集得到的注册元数据和采集元数据,按照元数据的比对规则进行比对,得到比对结果。
由于,注册元数据和采集元数据的先天差异,必然存在无法严格比对的元模型属性。因此需要指定哪些字段是关键字段需要强一致,哪些字段可以存在差异,哪些字段不参与比对。
需要说明的是,比对规则是由技术人员或相关有权限的工作人员进行预先设置、更改的,此处不做限定。
具体的,比对方式可以是,从统计到明细,匹配两套元数据的个数、属性、内容等。以关系型数据仓库的库表为例说明,匹配库表“物理名称”、“库表中文名称”、“字段个数”、“字段物理名称”、“字段描述”、“更新频率”等。
S402、若比对结果表明注册元数据和采集元数据不相同,则生成差异分析报告。
S403、若比对结果表明注册元数据和采集元数据相同,则进行下一个元数据的注册元数据和采集元数据的比对。
需要说明的是,在本申请的具体实现过程中,还可以支持注册元数据与采集元数据差异的监控告警功能。
在本申请的具体实现过程中,还可以定义注册元数据与采集元数据的整合规则。整合规则为:以注册元数据为主数据源、采集元数据为辅数据源。按着元模型的目录结构,逐级逐类进行注册元数据与采集元数据的整合,形成元数据统一视图,并支持元数据的查询。当注册元数据与采集元数据存在冲突时,以注册元数据为准,对于注册元数据中无法获取的元数据,则采用采集元数据获取的元数据进行补充。
由以上方案可知,本申请提供一种元数据的管理方法:首先,完成元模型的新增,得到新增元模型;然后,注册新增元模型的文件类数据的注册信息;其中,注册信息包括基本信息、数据源、字段消息、安全信息、管理信息以及文件传输协议信息;再对新增元模型进行采集配置;其中,采集配置包括采集数据源、采集适配器以及采集作业信息;之后,新增元模型按照采集配置,进行元数据的采集;最终,对收集得到的注册元数据以及采集元数据进行存储;其中,注册元数据以及采集元数据的存储方式为相同的存储结构,均以元数据类型、元模型编号和元数据名称作为唯一主键来标识一个元数据。有机地结合注册元数据与采集元数据管理实现元数据管理,并通过注册元数据与采集元数据的整合补充,有效的提高元数据管理的完整性。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本申请实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Python、Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本申请的另一实施例提供了一种元数据的管理装置,如图5所示,具体包括:
模型新增单元501,用于完成元模型的新增,得到新增元模型。
可选的,在本申请的另一实施例中,模型新增单元501的一种实施方式,如图6所示,包括:
编号确定单元601,用于根据当前存量元模型确定新增元模型的编号。
定义单元602,用于定义新增元模型的属性信息。
其中,属性信息包括:名称、技术属性、业务属性、管理属性、安全属性、操作属性以及依赖关系信息。
模型新增子单元603,用于完成新增元模型的新增。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图2所示,此处不再赘述。
注册单元502,用于注册新增元模型的文件类数据的注册信息。
其中,注册信息包括基本信息、数据源、字段消息、安全信息、管理信息以及文件传输协议信息。
配置单元503,用于对新增元模型进行采集配置。
其中,采集配置包括采集数据源、采集适配器以及采集作业信息。
可选的,在本申请的另一实施例中,配置单元503的一种实施方式,如图7所示,包括:
第一配置子单元701,用于根据开发生产环境配置采集数据源。
第二配置子单元702,用于根据关系型数据仓库的类型选择相应的采集适配器。
第三配置子单元703,用于配置采集作业信息;其中采集作业信息包括:采集作业名称以及采集作业执行频率。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图3所示,此处不再赘述。
采集单元504,用于新增元模型按照采集配置,进行元数据的采集。
存储单元505,用于对收集得到的注册元数据以及采集元数据进行存储。
其中,注册元数据以及采集元数据的存储方式为相同的存储结构,均以元数据类型、元模型编号和元数据名称作为唯一主键来标识一个元数据。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图1所示,此处不再赘述。
可选的,在本申请的另一实施例中,元数据的管理装置的一种实施方式,如图8所示,还包括:
比对单元801,用于针对每一个元数据,将元数据在注册和采集过程中,收集得到的注册元数据和采集元数据,按照元数据的比对规则进行比对,得到比对结果。
生成单元802,用于若比对结果表明注册元数据和采集元数据不相同,则生成差异分析报告。
处理单元803,用于若比对结果表明注册元数据和采集元数据相同,则进行下一个元数据的注册元数据和采集元数据的比对。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图4所示,此处不再赘述。
由以上方案可知,本申请提供一种元数据的管理装置:首先,模型新增单元501完成元模型的新增,得到新增元模型;然后,注册单元502注册新增元模型的文件类数据的注册信息;其中,注册信息包括基本信息、数据源、字段消息、安全信息、管理信息以及文件传输协议信息;配置单元503对新增元模型进行采集配置;其中,采集配置包括采集数据源、采集适配器以及采集作业信息;之后,采集单元504按照采集配置,进行元数据的采集;最终,存储单元505对收集得到的注册元数据以及采集元数据进行存储;其中,注册元数据以及采集元数据的存储方式为相同的存储结构,均以元数据类型、元模型编号和元数据名称作为唯一主键来标识一个元数据。有机地结合注册元数据与采集元数据管理实现元数据管理,并通过注册元数据与采集元数据的整合补充,有效的提高元数据管理的完整性。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
本申请另一实施例提供了一种电子设备,如图9所示,包括:
一个或多个处理器901。
存储装置902,其上存储有一个或多个程序。
当一个或多个程序被一个或多个处理器901执行时,使得一个或多个处理器901实现如上述实施例中任意一项的元数据的管理方法。
本申请另一实施例提供了一种计算机存储介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现如上述实施例中任意一项的元数据的管理方法。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
本申请另一实施例提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于执行上述任一项的元数据的管理方法。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本申请实施例的方法中限定的上述功能。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本申请的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的申请范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述申请构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中申请的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种元数据的管理方法,其特征在于,包括:
完成元模型的新增,得到新增元模型;
注册所述新增元模型的文件类数据的注册信息;其中,所述注册信息包括基本信息、数据源、字段消息、安全信息、管理信息以及文件传输协议信息;
对所述新增元模型进行采集配置;其中,所述采集配置包括采集数据源、采集适配器以及采集作业信息;
所述新增元模型按照所述采集配置,进行元数据的采集;
对收集得到的注册元数据以及采集元数据进行存储;其中,所述注册元数据以及采集元数据的存储方式为相同的存储结构,均以元数据类型、元模型编号和元数据名称作为唯一主键来标识一个元数据。
2.根据权利要求1所述的管理方法,其特征在于,所述完成元模型的新增,得到新增元模型,包括:
根据当前存量元模型确定新增元模型的编号;
定义所述新增元模型的属性信息;其中,所述属性信息包括:名称、技术属性、业务属性、管理属性、安全属性、操作属性以及依赖关系信息;
完成所述新增元模型的新增。
3.根据权利要求1所述的管理方法,其特征在于,所述对所述新增元模型进行采集配置,包括:
根据开发生产环境配置采集数据源;
根据关系型数据仓库的类型选择相应的采集适配器;
配置采集作业信息;其中所述采集作业信息包括:采集作业名称以及采集作业执行频率。
4.根据权利要求1所述的管理方法,其特征在于,所述对收集得到的注册元数据以及采集元数据进行存储之后,还包括:
针对每一个元数据,将所述元数据在注册和采集过程中,收集得到的注册元数据和采集元数据,按照元数据的比对规则进行比对,得到比对结果;
若所述比对结果表明注册元数据和采集元数据不相同,则生成差异分析报告;
若所述比对结果表明注册元数据和采集元数据相同,则进行下一个元数据的注册元数据和采集元数据的比对。
5.一种元数据的管理装置,其特征在于,包括:
模型新增单元,用于完成元模型的新增,得到新增元模型;
注册单元,用于注册所述新增元模型的文件类数据的注册信息;其中,所述注册信息包括基本信息、数据源、字段消息、安全信息、管理信息以及文件传输协议信息;
配置单元,用于对所述新增元模型进行采集配置;其中,所述采集配置包括采集数据源、采集适配器以及采集作业信息;
采集单元,用于所述新增元模型按照所述采集配置,进行元数据的采集;
存储单元,用于对收集得到的注册元数据以及采集元数据进行存储;其中,所述注册元数据以及采集元数据的存储方式为相同的存储结构,均以元数据类型、元模型编号和元数据名称作为唯一主键来标识一个元数据。
6.根据权利要求5所述的管理装置,其特征在于,所述模型新增单元,包括:
编号确定单元,用于根据当前存量元模型确定新增元模型的编号;
定义单元,用于定义所述新增元模型的属性信息;其中,所述属性信息包括:名称、技术属性、业务属性、管理属性、安全属性、操作属性以及依赖关系信息;
模型新增子单元,用于完成所述新增元模型的新增。
7.根据权利要求5所述的管理装置,其特征在于,所述配置单元,包括:
第一配置子单元,用于根据开发生产环境配置采集数据源;
第二配置子单元,用于根据关系型数据仓库的类型选择相应的采集适配器;
第三配置子单元,用于配置采集作业信息;其中所述采集作业信息包括:采集作业名称以及采集作业执行频率。
8.根据权利要求5所述的管理装置,其特征在于,还包括:
比对单元,用于针对每一个元数据,将所述元数据在注册和采集过程中,收集得到的注册元数据和采集元数据,按照元数据的比对规则进行比对,得到比对结果;
生成单元,用于若所述比对结果表明注册元数据和采集元数据不相同,则生成差异分析报告;
处理单元,用于若所述比对结果表明注册元数据和采集元数据相同,则进行下一个元数据的注册元数据和采集元数据的比对。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至4中任一所述的元数据的管理方法。
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至4中任一所述的元数据的管理方法。
CN202211014536.XA 2022-08-23 2022-08-23 元数据的管理方法、装置、电子设备及计算机存储介质 Pending CN115344582A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211014536.XA CN115344582A (zh) 2022-08-23 2022-08-23 元数据的管理方法、装置、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211014536.XA CN115344582A (zh) 2022-08-23 2022-08-23 元数据的管理方法、装置、电子设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN115344582A true CN115344582A (zh) 2022-11-15

Family

ID=83954307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211014536.XA Pending CN115344582A (zh) 2022-08-23 2022-08-23 元数据的管理方法、装置、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN115344582A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117785977A (zh) * 2023-12-27 2024-03-29 国网江苏省电力有限公司信息通信分公司 元数据的采集方法、装置及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117785977A (zh) * 2023-12-27 2024-03-29 国网江苏省电力有限公司信息通信分公司 元数据的采集方法、装置及设备

Similar Documents

Publication Publication Date Title
CN112685385B (zh) 一种用于智慧城市建设的大数据平台
CN110855473B (zh) 一种监控方法、装置、服务器及存储介质
CN112396404A (zh) 一种数据中台系统
CN109388637A (zh) 数据仓库信息处理方法、装置、系统、介质
CN109446274B (zh) 大数据平台bi元数据管理的方法和装置
CN110704873B (zh) 一种防止敏感数据泄漏的方法及系统
US11669599B2 (en) Systems and methods for software license management
CN104036365A (zh) 一种企业级数据服务平台建设方法
WO2019076001A1 (zh) 信息更新方法和装置
US20200059423A1 (en) Indicator value aggregation in a multi-instance computing environment
CN114519085A (zh) 一种数据标准化管理方法与共享系统
CN115344582A (zh) 元数据的管理方法、装置、电子设备及计算机存储介质
CN110502529B (zh) 数据处理方法、装置、服务器及存储介质
CN112506490A (zh) 一种接口生成方法、装置、电子设备及存储介质
US10003492B2 (en) Systems and methods for managing data related to network elements from multiple sources
CN116362443A (zh) 一种企业信息平台的数据治理方法和装置
CN107894942B (zh) 数据表访问量的监控方法和装置
CN116628215A (zh) 数据资产管理方法、控制装置及可读存储介质
CN116204428A (zh) 一种测试用例生成方法和装置
US10664501B2 (en) Deriving and interpreting users collective data asset use across analytic software systems
CN115033625A (zh) 一种企业业务数据对接方法、装置和电子设备
CN114356945A (zh) 数据处理方法、装置、计算机设备和存储介质
CN110096638B (zh) 一种灌区气象与遥感信息监测平台
US20120011082A1 (en) Governance of modeling systems
CN113779017A (zh) 数据资产管理的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination