CN117435650A - 技术元数据处理方法、系统、设备及存储介质 - Google Patents

技术元数据处理方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN117435650A
CN117435650A CN202311205713.7A CN202311205713A CN117435650A CN 117435650 A CN117435650 A CN 117435650A CN 202311205713 A CN202311205713 A CN 202311205713A CN 117435650 A CN117435650 A CN 117435650A
Authority
CN
China
Prior art keywords
metadata
technical metadata
technical
data
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311205713.7A
Other languages
English (en)
Inventor
李佳妮
黄炜
周骏
谢华雯
陆燕
童征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Pudong Development Bank Co Ltd
Original Assignee
Shanghai Pudong Development Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Pudong Development Bank Co Ltd filed Critical Shanghai Pudong Development Bank Co Ltd
Priority to CN202311205713.7A priority Critical patent/CN117435650A/zh
Publication of CN117435650A publication Critical patent/CN117435650A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书涉及技术元数据技术领域,提供了一种技术元数据处理方法、系统、设备及存储介质,该方法包括:使应用服务器定时根据配置的数据源信息连接数据库;根据配置的技术元数据元模型从对应数据库中采集技术元数据,将识别出的技术元数据生成目标格式的技术元数据文件;并将所述目标格式的技术元数据文件传输至指定存储路径;使数据资产服务器从所述指定存储路径中异步加载技术元数据文件,调用预设的数据校验逻辑校验所述技术元数据文件;并发布通过校验的技术元数据文件。通过本说明书实施例可以提高技术元数据的处理时效性和数据安全性,降低处理成本。

Description

技术元数据处理方法、系统、设备及存储介质
技术领域
本说明书涉及技术元数据技术领域,尤其是涉及一种技术元数据处理方法、系统、设备及存储介质。
背景技术
技术元数据是指数据仓库的设计和管理人员用于开发和日常管理数据仓库时用的数据。主要包括数据模型、应用系统以及数据迁移与转换规则等,其中数据模型包括应用数据模型与分析模型;应用系统涉及应用工具、应用程序、基础架构软件、操作系统、物理硬件及网络设备等;数据迁移转换规则,包括数据在系统之间或系统内部抽取、转换、映射、计算、加载的具体规则。
近年来,商业银行数据日益增多,但大多散落在各信息系统中,为提升全行数据资产信息的有效共享,各商业银行纷纷启动数据资产盘点工作,编制并发布数据资产目录。目前现有数据资产盘点聚焦于各信息系统技术元数据信息,一般以人工或自动采集技术元数据,并经人工检核通过后再行发布。然而,人工采集和人工核验商业银行的技术元数据的成本较高且时效性较低。
发明内容
本说明书实施例的目的在于提供一种技术元数据处理方法、系统、设备及存储介质,以提高技术元数据的处理时效性和数据安全性,降低处理成本。
为达到上述目的,一方面,本说明书实施例提供了一种技术元数据处理方法,包括:
使应用服务器定时根据配置的数据源信息连接数据库;根据配置的技术元数据元模型从对应数据库中采集技术元数据,将识别出的技术元数据生成目标格式的技术元数据文件;并将所述目标格式的技术元数据文件传输至指定存储路径;
使数据资产服务器从所述指定存储路径中异步加载技术元数据文件,调用预设的数据校验逻辑校验所述技术元数据文件;并发布通过校验的技术元数据文件。
本说明书实施例的技术元数据处理方法,所述技术元数据元模型包括:系统数据库元模型、模式元模型、表元模型、表字段元模型、视图元模型、视图字段元模型、物理代码元模型和虚拟代码元模型。
本说明书实施例的技术元数据处理方法,所述根据配置的技术元数据元模型从所述数据库中采集技术元数据,包括:
根据所述系统数据库元模型定义的数据库元数据采集要素,采集所连接数据库的数据库元数据;并根据所述模式元模型定义的模式元数据采集要素,采集所连接数据库的模式元数据;
根据所述表元模型定义的表元数据采集要素,采集所述数据库中数据表的表元数据;并根据所述表字段元模型定义的表字段元数据采集要素,采集所述数据表中的表字段元数据;
根据所述表元模型定义的视图元数据采集要素,采集所述数据库中视图的视图元数据;并根据所述视图字段元模型定义的视图字段元数据采集要素,采集所述视图中的视图字段元数据;
根据所述物理代码元模型定义的物理代码元数据采集要素,采集所述表字段元数据和所述视图字段元数据中的码元数据;和/或,根据所述虚拟代码元模型定义的虚拟代码元数据采集要素,采集所述表字段元数据和所述视图字段元数据中的码元数据。
本说明书实施例的技术元数据处理方法,所述数据校验逻辑包括:文件命名校验逻辑、文件内字段个数校验逻辑和字段非空性校验逻辑。
本说明书实施例的技术元数据处理方法,还包括:
使所述数据资产服务器接收对未通过校验的技术元数据文件的修改操作并保存修改结果。
本说明书实施例的技术元数据处理方法,所述目标格式为TXT格式。
另一方面,本说明书实施例还提供了一种一种技术元数据处理系统,包括:
包括应用服务器和数据资产服务器;
所述应用服务器包括:
连接模块,用于定时根据配置的数据源信息连接数据库;
采集模块,用于根据配置的技术元数据元模型从对应数据库中采集技术元数据,将识别出的技术元数据生成目标格式的技术元数据文件;
传输模块,用于将所述目标格式的技术元数据文件传输至指定存储路径;
所述数据资产服务器包括:
加载模块,用于从所述指定存储路径中异步加载技术元数据文件;
校验模块,用于调用预设的数据校验逻辑校验所述技术元数据文件;
发布模块,用于发布通过校验的技术元数据文件。
另一方面,本说明书实施例还提供了一种计算机设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时,执行上述方法的指令。
另一方面,本说明书实施例还提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被计算机设备的处理器运行时,执行上述方法的指令。
另一方面,本说明书实施例还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被计算机设备的处理器运行时,执行上述方法的指令。
由以上本说明书实施例提供的技术方案可见,本说明书实施例中,利用应用服务器实现了技术元数据的自动采集,并利用数据资产服务器实现了技术元数据的自动验证和发布,从而提高了技术元数据的处理时效性,降低了技术元数据的处理成本。并且,通过配置的技术元数据元模型还可以实现技术元数据按需采集和校验,从而满足了技术元数据处理的个性化需求,具有较强的可扩展性。不仅如此,技术元数据的采集与处理分离的异步处理方式技术元数据的采集与处理分离的异步处理方式,不仅进一步提高了技术元数据的处理效率,还提高了数据安全性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了本说明书一些实施例中技术元数据处理系统的应用环境示意图;
图2示出了本说明书一些实施例中技术元数据处理方法的流程图;
图3示出了图2所示方法中根据技术元数据元模型从数据库中采集技术元数据的流程图;
图4示出了本说明书一些实施例中应用服务器的结构框图;
图5示出了本说明书一些实施例中数据资产服务器的结构框图;
图6示出了本说明书一些实施例中计算机设备的结构框图。
【附图标记说明】
10、数据库;
20、应用服务器;
21、连接模块;
22、采集模块;
23、传输模块;
30、数据资产服务器;
31、加载模块;
32、校验模块;
33、发布模块;
602、计算机设备;
604、处理器;
606、存储器;
608、驱动机构;
610、输入/输出接口;
612、输入设备;
614、输出设备;
616、呈现设备;
618、图形用户接口;
620、网络接口;
622、通信链路;
624、通信总线。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
图1中示出了本说明书一些实施例中技术元数据处理系统的应用环境示意图,可以应用包括金融领域在内的任何技术元数据处理场景;该技术元数据处理系统包括应用服务器20和数据资产服务器30。应用服务器20可以定时根据配置的数据源信息连接数据库10;根据配置的技术元数据元模型从对应数据库10中采集技术元数据,将识别出的技术元数据生成目标格式的技术元数据文件;并将所述目标格式的技术元数据文件传输至指定存储路径。数据资产服务器30可以从所述指定存储路径中异步加载技术元数据文件,调用预设的数据校验逻辑校验所述技术元数据文件;并发布通过校验的技术元数据文件。通过本说明书实施例的技术元数据处理方案,可以提高技术元数据的处理时效性,降低技术元数据的处理成本。
在本说明书一些实施例中,所述数据库10可以为具体应用领域不同业务系统下的各个数据库系统。所述应用服务器20和数据资产服务器30可以为具有运算和网络交互功能的电子设备;也可以为运行于该电子设备中,为数据处理和网络交互提供业务逻辑的软件。
本说明书实施例提供了一种技术元数据处理方法,可以应用于上述的技术元数据处理系统侧,参考图2所示,在本说明书一些实施例中,技术元数据处理方法可以包括以下步骤:
步骤201、使应用服务器定时根据配置的数据源信息连接数据库;根据配置的技术元数据元模型从对应数据库中采集技术元数据,将识别出的技术元数据生成目标格式的技术元数据文件;并将所述目标格式的技术元数据文件传输至指定存储路径。
步骤202、使数据资产服务器从所述指定存储路径中异步加载技术元数据文件,调用预设的数据校验逻辑校验所述技术元数据文件;并发布通过校验的技术元数据文件。
本说明书实施例中,利用应用服务器实现了技术元数据的自动采集,并利用数据资产服务器实现了技术元数据的自动验证和发布,从而提高了技术元数据的处理时效性,降低了技术元数据的处理成本。并且,通过配置的技术元数据元模型还可以实现技术元数据按需采集和校验,从而满足了技术元数据处理的个性化需求,具有较强的可扩展性。
在一些利用元数据解析器自动化采集元数据的方案中,需将元数据解析器部署于数据库侧,元数据解析器需不断随数据库版本进行升级,从而阻碍了技术元数据采集更新的及时性;而本说明书实施例中,数据库(数据源)的选择、技术元数据的采集及校验,均可以通过配置实现,从而有利于保证技术元数据采集更新的及时性。
在本说明书一些实施例中,数据源信息可以包括数据库类型、数据库地址、端口、账号、密码等信息,可以按需自定义配置。每当定时任务的执行时机到来时,应用服务器可以根据数据源信息连接对应的数据库;待完成本次定时任务后,主动断开与这些数据库的连接。
技术元数据元模型中定义了从数据库中要采集的采集对象及其采集要素。在本说明书一些实施例中,技术元数据元模型由粗至细可以包括:系统数据库元模型、模式(schema)元模型、表元模型、表字段元模型、视图元模型、视图字段元模型、物理代码元模型和虚拟代码元模型。每个技术元数据元模型可以视为一个采集对象,在本说明书一些实施例中,技术元数据元模型的采集对象及其采集要素可以如下表1所示。
表1
其中,schema为数据库模式,是用于组织数据库中的对象。schema中的对象通常包括表、索引、数据类型、序列、视图、存储过程、主键、外键等等。视图是指数据库中的视图,是一种虚拟表,其内容可以由查询定义。同真实的表(即物理表)一样,视图包含一系列带有名称的列和行数据。但是,视图并不在数据库中以存储的数据值集形式存在。行和列数据来自由定义视图的查询所引用的表,并且在引用视图时动态生成;对应的,视图字段即为虚拟表中的字段。物理代码是指定义在数据库实体表中的代码值和代码描述,虚拟代码是指在程序编码中定义的代码值和代码描述。参考图3所示,在本说明书的一些实施例中,根据配置的技术元数据元模型从所述数据库中采集技术元数据,可以包括以下步骤:
步骤301、根据所述系统数据库元模型定义的数据库元数据采集要素,采集所连接数据库的数据库元数据;并根据所述模式元模型定义的模式元数据采集要素,采集所连接数据库的模式元数据。
例如,以表1所示的技术元数据元模型为例,采集的数据库元数据可以包括系统编号、系统中文名、数据库名称、数据库描述、数据库类型、数据库负责人等。采集的模式元数据可以包括系统编号、系统中文名、数据库名称、schema英文名称、schema描述、schema定义等。由于采集的数据库元数据中已经包含了系统编号、系统中文名和数据库名称,在实际采集模式元数据时,这部分可无需再采集。同样,在其他技术元数据元模型中,亦是如此,以下不再一一赘述。
步骤302、根据所述表元模型定义的表元数据采集要素,采集所述数据库中数据表的表元数据;并根据所述表字段元模型定义的表字段元数据采集要素,采集所述数据表中的表字段元数据。
例如,以Oracle数据库为例,表元数据信息存储在用户表(USER_TABLES)中,该表中包含数据库名称、schema英文名称、表英文名,表对应的字段元数据信息存储在用户列表(USER_TAB_COLUMNS)中,系统下各表、视图的物理存储空间存储在用户分区表(USER_SEGMENT)中,创建时间存储在用户对象表(USER_OBJECTS),分区字段名存储在用户关键列表(USER_PART_KEY_COLUMNS)中,上述表通过主键字段(TABLE_NAME)进行逻辑关联后,查询获取表元模型对应的元数据要素。
如上所述,表字段的元数据信息存储在USER_TAB_COLUMNS表中,该表包含数据库名称、schema英文名、表英文名、字段英文名、字段ID、是否主键、数据类型、数据长度、数据精度、小数位数、是否为空,将表中文名存储在表注释表(USER_TAB_COMMENTS),将字段中文名存储在列注释表(USER_COL_COMMENTS),上述表通过主键字段(COLUMN_NAME)进行逻辑关联后查询获取表字段元模型对应的元数据要素。
步骤303、根据所述表元模型定义的视图元数据采集要素,采集所述数据库中视图的视图元数据;并根据所述视图字段元模型定义的视图字段元数据采集要素,采集所述视图中的视图字段元数据。
例如,以Oracle数据库为例,视图的元数据信息存储在用户视图表(USER_VIEWS)中,该表中包含数据库名称、schema英文名称、视图英文名、视图sql语句,视图中文名存储在表注释表(USER_TAB_COMMENTS),上述两张表通过主键字段(VIEW_NAME)进行逻辑关联后查询获取视图元模型对应的元数据要素。
如上所述,视图的元数据信息存储在USER_VIEWS表中。根据上一步骤采集表字段元数据,然后将USER_TAB_COLUMNS表和USER_VIEWS表分别通过主键字段TABLE_NAME和VIEW_NAME关联,即可获取对应是视图的字段元数据信息。
步骤304、根据所述物理代码元模型定义的物理代码元数据采集要素,采集所述表字段元数据和所述视图字段元数据中的码元数据;和/或,根据所述虚拟代码元模型定义的虚拟代码元数据采集要素,采集所述表字段元数据和所述视图字段元数据中的码元数据。其中,码元数据可以包括但不限于代码值和代码值描述等。
基于图3所示的元数据采集逻辑(包含技术元数据元模型),实现了技术元数据由粗至细的分层次采集。
在本说明书一些实施例中,将识别出的技术元数据生成目标格式的技术元数据文件可以包括:将识别出的技术元数据生成TXT格式的技术元数据文件。例如,以表元模型、表字段元模型、视图元模型和视图字段元模型为例,可以将对应采集到的表元数据、表字段元数据、视图数据和视图字段元数据,分别转换为TXT格式的表元数据文件、表字段元数据文件、视图数据文件和视图字段元数据文件,以便于后续处理。
在本说明书一些实施例中,指定存储路径可以为数据资产服务器侧的存储路径;如此,可以方便数据资产服务器进行后续的校验及发布等处理。
在本说明书一示例性实施例中,可以将基于Java语言将配置的数据源信息、元数据查询逻辑(包含技术元数据元模型)和指定存储路径进行程序化封装,形成Java包,并在应用服务器上部署Java包,以通过程序化方式实现技术元数据的采集。
通过数据资产服务器从指定存储路径中异步加载技术元数据文件,可以实现技术元数据的采集与处理分离(即由应用服务器根据定时任务采集技术元数据并文件形式写入指定存储路径,由数据资产服务器从指定存储路径中异步读取并加载技术元数据文件),从而有利于提高的技术元数据处理系统的处理效率等性能。不仅如此,技术元数据的采集与处理分离,还可以避免数据资产服务器直连数据库而产生的系统运维风险。
通过对技术元数据文件进行数据校验逻辑,可以保证所采集的技术元数据的准确性和完整性。在本说明书一些实施例中,数据校验逻辑可以包括但不限于:文件命名校验逻辑、文件内字段个数校验逻辑和字段非空性校验逻辑(即字段不能为空或默认值);其中,文件命名校验逻辑和文件内字段个数校验逻辑可以保证所采集的技术元数据的完整性;字段非空性校验逻辑可以保证所采集的技术元数据的正确性。
在本说明书一些实施例中,当技术元数据文件通过校验时,可以将其进行发布;当技术元数据文件未通过校验时,可以采用手动录入的方式进行技术元数据的修改。对应的,在此场景下,在本说明书实施例的技术元数据处理方法中,还可以包括:使所述数据资产服务器接收对未通过校验的技术元数据文件的修改操作,并保存修改结果。其中的修改可以包括:增加、替换或删除技术元数据等。如此,可以进一步保证所采集的技术元数据的完整性。鉴于技术元数据文件不能通过校验的情况是小概率事件,这种人工采集的方式几乎不影响技术元数据处理的时效性。
虽然上文描述的过程流程包括以特定顺序出现的多个操作,但是,应当清楚了解,这些过程可以包括更多或更少的操作,这些操作可以顺序执行或并行执行(例如使用并行处理器或多线程环境)。
参考图4所示,在本说明书一些实施例中,上述应用服务器20可以包括:
连接模块21,用于定时根据配置的数据源信息连接数据库;
采集模块22,用于根据配置的技术元数据元模型从对应数据库中采集技术元数据,将识别出的技术元数据生成目标格式的技术元数据文件;
传输模块23,用于将所述目标格式的技术元数据文件传输至指定存储路径;
参考图5所示,在本说明书一些实施例中,上述数据资产服务器30可以包括:
加载模块31,用于从所述指定存储路径中异步加载技术元数据文件;
校验模块32,用于调用预设的数据校验逻辑校验所述技术元数据文件;
发布模块33,用于发布通过校验的技术元数据文件。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
需要说明的是,本说明书的实施例中,所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权同意且经过各方充分授权的信息和数据。
本说明书的实施例还提供一种计算机设备。如图6所示,在本说明书一些实施例中,所述计算机设备602可以包括一个或多个处理器604,诸如一个或多个中央处理单元(CPU)或图形处理器(GPU),每个处理单元可以实现一个或多个硬件线程。计算机设备602还可以包括任何存储器606,其用于存储诸如代码、设置、数据等之类的任何种类的信息,一具体实施例中,存储器606上并可在处理器604上运行的计算机程序,所述计算机程序被所述处理器604运行时,可以执行上述任一实施例所述的技术元数据处理方法的指令。非限制性的,比如,存储器606可以包括以下任一项或多种组合:任何类型的RAM,任何类型的ROM,闪存设备,硬盘,光盘等。更一般地,任何存储器都可以使用任何技术来存储信息。进一步地,任何存储器可以提供信息的易失性或非易失性保留。进一步地,任何存储器可以表示计算机设备602的固定或可移除部件。在一种情况下,当处理器604执行被存储在任何存储器或存储器的组合中的相关联的指令时,计算机设备602可以执行相关联指令的任一操作。计算机设备602还包括用于与任何存储器交互的一个或多个驱动机构608,诸如硬盘驱动机构、光盘驱动机构等。
计算机设备602还可以包括输入/输出接口610(I/O),其用于接收各种输入(经由输入设备612)和用于提供各种输出(经由输出设备614)。一个具体输出机构可以包括呈现设备616和相关联的图形用户接口618(GUI)。在其他实施例中,还可以不包括输入/输出接口610(I/O)、输入设备612以及输出设备614,仅作为网络中的一台计算机设备。计算机设备602还可以包括一个或多个网络接口620,其用于经由一个或多个通信链路622与其他设备交换数据。一个或多个通信总线624将上文所描述的部件耦合在一起。
通信链路622可以以任何方式实现,例如,通过局域网、广域网(例如,因特网)、点对点连接等、或其任何组合。通信链路622可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务端等的任何组合。
本申请是参照本说明书一些实施例的方法、设备(系统)、计算机可读存储介质和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理器的处理器以产生一个机器,使得通过计算机或其他可编程数据处理器的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理器以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理器上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算机设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算机设备访问的信息。按照本说明书中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理器来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
还应理解,在本说明书实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种技术元数据处理方法,其特征在于,包括:
使应用服务器定时根据配置的数据源信息连接数据库;根据配置的技术元数据元模型从对应数据库中采集技术元数据,将识别出的技术元数据生成目标格式的技术元数据文件;并将所述目标格式的技术元数据文件传输至指定存储路径;
使数据资产服务器从所述指定存储路径中异步加载技术元数据文件,调用预设的数据校验逻辑校验所述技术元数据文件;并发布通过校验的技术元数据文件。
2.如权利要求1所述的技术元数据处理方法,其特征在于,所述技术元数据元模型包括:系统数据库元模型、模式元模型、表元模型、表字段元模型、视图元模型、视图字段元模型、物理代码元模型和虚拟代码元模型。
3.如权利要求2所述的技术元数据处理方法,其特征在于,所述根据配置的技术元数据元模型从所述数据库中采集技术元数据,包括:
根据所述系统数据库元模型定义的数据库元数据采集要素,采集所连接数据库的数据库元数据;并根据所述模式元模型定义的模式元数据采集要素,采集所连接数据库的模式元数据;
根据所述表元模型定义的表元数据采集要素,采集所述数据库中数据表的表元数据;并根据所述表字段元模型定义的表字段元数据采集要素,采集所述数据表中的表字段元数据;
根据所述表元模型定义的视图元数据采集要素,采集所述数据库中视图的视图元数据;并根据所述视图字段元模型定义的视图字段元数据采集要素,采集所述视图中的视图字段元数据;
根据所述物理代码元模型定义的物理代码元数据采集要素,采集所述表字段元数据和所述视图字段元数据中的码元数据;和/或,根据所述虚拟代码元模型定义的虚拟代码元数据采集要素,采集所述表字段元数据和所述视图字段元数据中的码元数据。
4.如权利要求1所述的技术元数据处理方法,其特征在于,所述数据校验逻辑包括:文件命名校验逻辑、文件内字段个数校验逻辑和字段非空性校验逻辑。
5.如权利要求1所述的技术元数据处理方法,其特征在于,还包括:
使所述数据资产服务器接收对未通过校验的技术元数据文件的修改操作并保存修改结果。
6.如权利要求5所述的技术元数据处理方法,其特征在于,所述目标格式为TXT格式。
7.一种技术元数据处理系统,其特征在于,包括应用服务器和数据资产服务器;
所述应用服务器包括:
连接模块,用于定时根据配置的数据源信息连接数据库;
采集模块,用于根据配置的技术元数据元模型从对应数据库中采集技术元数据,将识别出的技术元数据生成目标格式的技术元数据文件;
传输模块,用于将所述目标格式的技术元数据文件传输至指定存储路径;
所述数据资产服务器包括:
加载模块,用于从所述指定存储路径中异步加载技术元数据文件;
校验模块,用于调用预设的数据校验逻辑校验所述技术元数据文件;
发布模块,用于发布通过校验的技术元数据文件。
8.一种计算机设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,其特征在于,所述计算机程序被所述处理器运行时,执行根据权利要求1-6任意一项所述方法的指令。
9.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被计算机设备的处理器运行时,执行根据权利要求1-6任意一项所述方法的指令。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被计算机设备的处理器运行时,执行根据权利要求1-6任意一项所述方法的指令。
CN202311205713.7A 2023-09-18 2023-09-18 技术元数据处理方法、系统、设备及存储介质 Pending CN117435650A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311205713.7A CN117435650A (zh) 2023-09-18 2023-09-18 技术元数据处理方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311205713.7A CN117435650A (zh) 2023-09-18 2023-09-18 技术元数据处理方法、系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117435650A true CN117435650A (zh) 2024-01-23

Family

ID=89554361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311205713.7A Pending CN117435650A (zh) 2023-09-18 2023-09-18 技术元数据处理方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117435650A (zh)

Similar Documents

Publication Publication Date Title
US11544623B2 (en) Consistent filtering of machine learning data
Sumbaly et al. The big data ecosystem at linkedin
US20190258625A1 (en) Data partitioning and ordering
US9805080B2 (en) Data driven relational algorithm formation for execution against big data
US20210049163A1 (en) Data preparation context navigation
EP2608074B1 (en) Systems and methods for merging source records in accordance with survivorship rules
US20120239612A1 (en) User defined functions for data loading
CN109034988B (zh) 一种会计分录生成方法和装置
CN111427971B (zh) 用于计算机系统的业务建模方法、装置、系统和介质
CN114461603A (zh) 多源异构数据融合方法及装置
CN107403111A (zh) Hive数据脱敏方法及装置
CN116955361A (zh) 存储器内密钥范围搜索方法和系统
CN107085613A (zh) 入库文件的过滤方法和装置
CN113779349A (zh) 数据检索系统、装置、电子设备和可读存储介质
US11354313B2 (en) Transforming a user-defined table function to a derived table in a database management system
CN111984745A (zh) 数据库字段动态扩展方法、装置、设备及存储介质
CN113297057A (zh) 内存分析方法、装置及系统
CN113722296A (zh) 一种农业信息处理方法、装置、电子设备及存储介质
CN117421302A (zh) 一种数据处理方法及相关设备
US8229946B1 (en) Business rules application parallel processing system
US11868362B1 (en) Metadata extraction from big data sources
Mohan et al. Addressing the shimming problem in big data scientific workflows
CN115114297A (zh) 数据轻量存储及查找方法、装置、电子设备及存储介质
CN117435650A (zh) 技术元数据处理方法、系统、设备及存储介质
CN115129787A (zh) 一种维护区块链数据的方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination