CN110941629B - 元数据处理方法、装置、设备及计算机可读存储介质 - Google Patents

元数据处理方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110941629B
CN110941629B CN201910967579.1A CN201910967579A CN110941629B CN 110941629 B CN110941629 B CN 110941629B CN 201910967579 A CN201910967579 A CN 201910967579A CN 110941629 B CN110941629 B CN 110941629B
Authority
CN
China
Prior art keywords
metadata
semantic
data
information
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910967579.1A
Other languages
English (en)
Other versions
CN110941629A (zh
Inventor
陈志兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN201910967579.1A priority Critical patent/CN110941629B/zh
Publication of CN110941629A publication Critical patent/CN110941629A/zh
Application granted granted Critical
Publication of CN110941629B publication Critical patent/CN110941629B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及大数据技术领域,公开了一种元数据处理方法,包括以下步骤:提取目标数据的生成脚本并解析,获得所述脚本的语义信息;对所述语义信息进行分析,获得所述目标数据的语义元数据;根据预置配置规则及所述语义信息,建立各语义元数据的关联关系;解析所述语义元数据的数据结构,获得所述语义元数据的作用域;基于所述作用域,获取与所述语义元数据存在关联关系的更多语义元数据;基于多个所述语义元数据之间的关联关系,构建元数据关系网;基于所述元数据关系网创建数据关系查询页面,以供进行数据查询。本发明还公开了一种元数据处理装置、设备及计算机可读存储介质。本发明通过语义识别元数据,提高了元数据的规范性和正确性。

Description

元数据处理方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及大数据技术领域,尤其涉及一种元数据处理方法、装置及计算机可读存储介质。
背景技术
目前,元数据管理系统的数据关系为大数据使用者提供可靠的数据识别和追溯,是数据仓库管理的关键的一环。然而,由于数据来源复杂,不同的业务系统有不同的数据来源,而且不同的业务系统之间的定义也不一致,让构建一个完善的元数据管理系统成为一项长期的困难工作。
现在构建元数据管理系统一般是通过机器抽取数据源的元数据,然后由人工识别数据的业务特征和构建数据之间的关系,但因维护人员人工理解的不同,导致数据的业务特征和关系与实际业务存在一定的差异,造成元数据的管理存在滞后性,运维人员在后期维护时也会出现错误。
发明内容
本发明的主要目的在于提供一种元数据处理方法、装置及计算机可读存储介质,旨在解决现有技术中由人工识别的元数据管理系统存在因理解差异导致数据的业务特征和关系与实际业务存在不一致,维护不方便,且不能实时更新的技术问题。
为实现上述目的,本发明提供一种元数据处理方法,所述元数据处理方法包括以下步骤:
提取目标数据的生成脚本并解析,获得所述脚本的语义信息;
对所述语义信息进行分析,获得所述目标数据的语义元数据;
根据预置配置规则建立与所述语义元数据相关联的关联关系,其中,所述预置配置规则由用户自定义设置生成所述关联关系的生成方式;
解析所述语义元数据的数据结构,获得所述语义元数据的作用域,其中,所述作用域标识有语义元数据的业务领域,加载时可得到不同的关联关系;
基于所述作用域,获取与所述语义元数据存在关联关系的更多语义元数据;
基于多个所述语义元数据之间的关联关系,构建元数据关系网;
基于所述元数据关系网创建数据关系查询页面,以供进行数据查询。
可选地,在所述提取数据的生成脚本并解析,获得所述脚本的语义信息的步骤之前,还包括:
建立数据源与所述语义元数据之间的映射关系,其中,不同类型的所述数据源与不同的所述语义元数据一一对应。
可选地,所述对所述语义信息进行分析,获得所述数据的语义元数据包括:
解析所述语义信息,得到所述语义信息中描述所述目标数据的信息;
从所述信息中提取所述目标数据的生成逻辑信息;
从所述生成逻辑信息中提取所述目标数据的语义元数据,并作为查询语义元数据。
可选地,在所述从所述信息中提取所述目标数据的生成逻辑信息的步骤之后,包括:
从所述生成逻辑信息中提取所述目标数据的版本信息,并进行记录,所述版本信息包括目标数据版本的生成时间和版本号;
创建版本信息查询页面,以供进行数据的版本信息查询。
可选地,所述根据预置配置规则及所述语义信息,建立各语义元数据的关联关系包括:
获取各语义元数据的来源信息,所述来源信息包括数据源、访问路径;
根据所述来源信息和所述语义信息,确定各语义元数据之间的关系;
根据预置配置规则,建立各语义元数据的关联关系。
可选地,在所述基于所述元数据关系网创建数据关系查询页面,以供进行数据查询的步骤之后,包括:
基于所述元数据关系网创建数据关系查询页面后,选择查询字段;
根据所述查询字段在所述元数据关系网上的路径关系构建查询表达式;
基于所述查询表达式所指向的所述元数据关系网上的路径关系,查询相关联的关数据。
可选地,所述基于所述查询表达式所指向的所述元数据关系网上的路径关系,查询相关联的元数据包括:
基于所述查询表达式,获取相应的SQL查询语句;
解析所述SQL查询语句,获得所述SQL查询语句所指向的所述元数据关系网上的路径关系;
基于所述路径关系,进行数据查询。
进一步地,为实现上述目的,本发明还提供一种元数据处理装置,所述元数据处理装置包括:
提取模块,用于提取数据的生成脚本并解析,获得所述脚本的语义信息;
分析模块,用于对所述语义信息进行分析,获得所述数据的语义元数据;
第一建立模块,用于根据预置配置规则建立与所述语义元数据相关联的关联关系,其中,所述预置规则至少包括建立关联关系的方式;
解析模块,用于解析所述语义元数据的数据结构,获得所述语义元数据的作用域,其中,所述作用域标识有语义元数据的业务领域,加载时可得到不同的关联关系;
获取模块,用于基于所述作用域,获取与所述语义元数据存在关联关系的更多语义元数据;
第一构建模块,用于基于多个所述语义元数据之间的关联关系,构建元数据关系网;
创建模块,用于基于所述元数据关系网创建数据关系查询页面,以供进行数据查询。
可选地,所述元数据处理装置还包括:
第二建立模块,用于建立数据源与所述语义元数据之间的映射关系,其中,不同类型的所述数据源与不同的所述语义元数据一一对应。
可选地,所述分析模块包括:
第一解析单元,用于解析所述语义信息,得到所述语义信息中描述所述目标数据的信息;
第一提取单元,用于从所述信息中提取所述目标数据的生成逻辑信息;
第二提取单元,用于从所述生成逻辑信息中提取所述目标数据的语义元数据,并作为查询语义元数据。
可选地,所述分析模块还包括:
第三提取单元,用于从所述生成逻辑信息中提取所述目标数据的版本信息,并进行记录,所述版本信息包括目标数据版本的生成时间和版本号;
创建单元,用于创建版本信息查询页面,以供进行数据的版本信息查询。
可选地,所述第一建立模块包括:
获取单元,用于获取各语义元数据的来源信息,所述来源信息包括数据源、访问路径;
确定单元,用于根据所述来源信息和所述语义信息,确定各语义元数据之间的关系;
建立单元,用于根据预置配置规则,建立各语义元数据的关联关系。
可选地,所述元数据处理装置还包括:
选择模块,用于基于所述元数据关系网创建数据关系查询页面后,选择查询字段;
第二构建模块,用于根据所述查询字段在所述元数据关系网上的路径关系构建查询表达式;
查询模块,用于基于所述查询表达式所指向的所述元数据关系网上的路径关系,查询相关联的元数据。
可选地,所述查询模块还包括:
获取单元,用于基于所述查询表达式,获取相应的SQL查询语句;
第二解析单元,用于解析所述SQL查询语句,以获取所述SQL查询语句所指向的所述元数据关系网上的路径关系;
查询单元,用于基于所述SQL查询语句所指向的所述元数据关系网上的路径关系,进行数据查询。
进一步地,为实现上述目的,本发明还提供一种元数据处理设备,所述元数据处理设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的元数据处理程序,所述元数据处理程序被所述处理器执行时实现如上述任一项所述的元数据处理方法的步骤。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有元数据处理程序,所述元数据处理程序被处理器执行时实现如上述任一项所述的元数据处理方法的步骤。
本发明通过提取目标数据的生成脚本并解析,获取所述脚本的语义信息,通过分析所述语义信息,得到所述目标数据的语义元数据,再根据预置配置规则及所述语义信息,建立各语义元数据的关联关系,然后解析所述语义元数据的数据结构,获得所述语义元数据的作用域,根据所述作用域,获取与所述语义元数据存在关联关系的更多语义元数据,基于多个所述语义元数据之间的关联关系,构建元数据关系网,基于所述元数据关系网创建数据关系查询页面,以供进行数据查询,代替了由人工理解数据的元数据,从而避免了由人工理解所存在的差异性使数据的元数据管理和维护产生不必要的错误,提高了元数据的规范性和正确性。
附图说明
图1为本发明实施例方案涉及的元数据处理设备运行环境的结构示意图;
图2为本发明元数据处理方法第一实施例的流程示意图;
图3为本发明元数据处理方法第二实施例的流程示意图;
图4为本发明元数据处理方法第三实施例的流程示意图;
图5为本发明元数据处理方法第四实施例的流程示意图;
图6为本发明元数据处理方法第五实施例的流程示意图;
图7为本发明元数据处理方法第六实施例的流程示意图;
图8为本发明元数据处理装置一实施例的功能没开示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明提供一种元数据处理设备。
参照图1,图1为本发明实施例方案涉及的元数据处理设备运行环境的结构示意图。
如图1所示,该元数据处理设备包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的元数据处理设备的硬件结构并不构成对元数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。其中,操作系统是管理和控制元数据处理设备和软件资源的程序,支持元数据处理程序以及其它软件和/或程序的运行。
在图1所示的元数据处理设备的硬件结构中,网络接口1004主要用于接入网络;用户接口1003主要用于侦测确认指令和编辑指令等。而处理器1001可以用于调用存储器1005中存储的元数据处理程序,并执行以下元数据处理方法的各实施例的操作。
基于上述元数据处理设备硬件结构,提出本发明元数据处理方法的各个实施例。
参照图2,图2为本发明元数据处理方法第一实施例的流程示意图。本实施例中,所述元数据处理方法包括以下步骤:
步骤S10:提取目标数据的生成脚本并解析,获得所述脚本的语义信息;
随着数据库和网络的发展,企业内部积累了越来越多的数据资产,为了支持管理决策,充分挖掘数据价值,企业需要对大量的元数据进行数据处理和分析,随着数据量的增多、业务的复杂性增加,加上人工识别的元数据存在一定差异性,因而导致元数据的维护出现不必要的错误,而且由于是人工运维,元数据无法实现实时更新,使得元数据的管理存在滞后性,因此,有必要设计一种元数据处理方法。
本实施例中,数据仓库中的数据是在对原有分散的数据库抽取、清理的基础上经过系统加工、汇总和整理得到的,必须要得消除数据的不一致性,以保证数据仓库内的信息一致。其中,数据的变化是通过SQL脚本完成的,因而获取目标数据的sql脚本语句并进行解析,得到所述SQL脚本语句的语义信息。
步骤S20:对所述语义信息进行分析,获得所述目标数据的语义元数据;
本实施例中,基于SQL通用分析规则,对所述语义信息进行分析,从所述语义信息中识别所述目标数据的语义元数据,并将所述语义元数据设置为查询语义元数据。其中,所述语义元数据包括形容目标数据在的所有数据,如目标数据的说明、标识、程序集所依赖的其他程序集、运行所需的安全权限、类型的说明、名称、可见性、基类、实现的接口、属性、事件、修饰类型、存储位置、历史数据、资源查找、文件记录、其他说明性元素等。
例如,设定一张贺卡为一张由张三制作的大小为50k的JPG格式的印着一只小狗的圣诞贺卡,其中,语义元数据为张三制作、圣诞贺卡、狗、小狗、圣诞、贺卡、圣诞节,将这些语义元数据设置为这张照片的查询语义元数据。
步骤S30:根据预置配置规则建立与所述语义元数据相关联的关联关系,其中,所述预置配置规则由用户自定义设置建立所述关联关系的建立方式;
本实施例中,根据预置配置规则中指定的关联关系建立方式,建立与所述语义元数据相关联的关联关系。然后基于所述关联关系和所述语义元数据的数据结构查出并获取相关联的语义元数据。其中,由于一个语义元数据有可能在不同的系统中具有不同的标识,因而,在进行关联设置时,可以对已存在的关联设置进行知识挖掘。
例如,设定一张贺卡为一张由张三制作的大小为50k的JPG格式的印着一只小狗的圣诞贺卡,其中,语义元数据为张三制作、圣诞贺卡、狗、小狗、圣诞、贺卡、圣诞节,而这些语义元数据再别的系统可能存在其他关系,因而建立关联关系,基于所述关联关系和所述语义元数据的数据结构查出并获取相关联的语义元数据。
进一步地,一个语义元数据,在不同的系统存在不同的标识,两个语义元数据之间,在不同的系统中也存在不同的关系,从语义信息获取N个语义元数据,生成N个语义元数据之间的关系,根据所述关系及所述语义元数据的数据结构查询并获取相关联的语义元数据。
步骤S40:基于所述关联关系和所述语义元数据结构,查询并获取相关联的语义元数据;
本实施例中,一个语义元数据,在不同的系统存在不同的标识,两个语义元数据之间,在不同的系统中也存在不同的关系,从而基于语义元数据的关联关系及语义元数据的数据结构,查询并获取相关联的语义元数据。
例如,设定一张贺卡为一张由张三制作的大小为50k的JPG格式的印着一只小狗的圣诞贺卡,其中,语义元数据为张三制作、圣诞贺卡、狗、小狗、圣诞、贺卡、圣诞节,而这些语义元数据再别的系统可能存在其他关系,基于所述关联关系和所述语义元数据的数据结构查出并获取相关联的语义元数据。
步骤S50:基于多个所述语义元数据之间的关联关系,构建元数据关系网;
本实施例中,由所述关联关系和所述语义元数据的数据结构查询并火球相关联的语义元数据,因而所述语义元数据与获取的语义元数据存在关联关系,基于多个所述语义元数据之间的关联关系,构建元数据关系网。
比如,设定一张贺卡为一张由张三制作的大小为50k的JPG格式的印着一只小狗的圣诞贺卡,基于“照片”元数据,获取与“照片”相关联的语义元数据,如“张三拍摄、圣诞贺卡、狗、小狗、圣诞、贺卡、圣诞节”,将这些语义元数据之间根据各数据之间关系建立元数据关系网。
步骤S60:基于所述元数据关系网创建数据关系查询页面,以供进行数据查询。
本实施例中,基于所述元数据的关系网络,创建查询页面,以供进行数据的关系查询。其中,基于输入的数据,提取该数据的语义元数据,以该语义元数据查询元数据关系网,获取与该语义元数据有关系的数据。比如,查询数据B的关系网络,进而得到关于数据B的元数据,基于数据B的元数据,确定与数据B有关系的数据。
本实施例通过提取目标数据的生成脚本并解析,获取所述脚本的语义信息,通过分析所述语义信息,得到所述目标数据的语义元数据,再根据预置配置规则及所述语义信息,建立各语义元数据的关联关系,然后解析所述语义元数据的数据结构,获得所述语义元数据的作用域,根据所述作用域,获取与所述语义元数据存在关联关系的更多语义元数据,基于多个所述语义元数据之间的关联关系,构建元数据关系网,基于所述元数据关系网创建数据关系查询页面,以供进行数据查询,代替了由人工理解数据的元数据,从而避免了由人工理解所存在的差异性使数据的元数据管理和维护产生不必要的错误,提高了元数据的规范性和正确性。
进一步地,在本发明元数据处理方法另一实施例中,本实施例中,在上述步骤S10之前,还包括:
建立数据源与所述语义元数据之间的映射关系,其中,不同类型的所述数据源与不同的所述语义元数据一一对应。
本实施例中,通过建立数据源与元数据之间的对应关系,将不同类数据结构中的表示同一种实体业务的数据进行统一,避免了用户在使用时需要解除各种不同数据结构所带来的困难,提高系统的效率,此外,每一个元数据都可以定位到相应的数据源来完成相应操作。进一步地,当需要提供数据的扩展数据时,可以增加新的外部数据源,相应的,建立对应的数据源映射关系即可。
参照图3,图3为本发明元数据处理方法第二实施例的流程示意图。本实施例中,上述步骤S20包括:
步骤S201:解析所述语义信息,得到所述语义信息中描述所述目标数据的信息;
步骤S202:从所述信息中提取所述目标数据的生成逻辑信息;
步骤S203:从所述生成逻辑信息中提取所述目标数据的语义元数据,并作为查询语义元数据。
本实施例中,从所述目标数据的生成脚本中提取脚本的语义信息,并对所述语义信息进行解析处理,得到所述语义信息中关于目标数据的描述信息,其中,描述信息包含了目标数据的生成逻辑、元数据等信息,从所述描述信息中提取所述目标数据的生成逻辑信息,基于所述生成逻辑信息,即目标数据的转化过程信息,如初始数据的来源、初始数据的含义、所述目标数据的形成、所述目标数据的含义、初始数据和所述目标数据之间的转化关系、初始数据和所述目标数据之间的网络关系和描述,提取所述目标数据的语义元数据,并将所述语义元数据作为查询语义元数据。
例如,目标数据为一个人的个人信息,而一个人的姓名、性别、民族、政治面貌、一寸照片、学历、职称等等这些就是这个人的元数据,这些都在这个目标数据的生成脚本的语义信息中,通过从目标数据的生成脚本中识别语义信息,从描述这个人的信息数据中提取这个人的描述信息,如“一个姓x名xx的汉族男人,在职研究生,一级工程师”,然后再从这些描述信息中获取姓名、性别、民族、学历、职称等数据,这些数据就是目标数据“人”的元数据,以这些元数据作为查询语义元数据。
参照图4,图4为本发明元数据处理方法第四实施例的流程示意图。本实施例中,上述步骤S30包括:
步骤S205:从所述生成逻辑信息中提取所述目标数据的版本信息,并进行记录,所述版本信息包括目标数据当前版本的生成时间和版本号;
步骤S206:创建版本信息查询页面,以供进行数据的版本信息查询。
本实施例中,从所述生成逻辑信息中提取目标数据的版本信息,获取当前版本的生成日期,查询当前版本是否为最新版本,若不是,则从snv库中提取最新版本的脚本,重新生成所述目标数据。其中,snv库为提交并存放脚本文件的场所,记录有每个脚本的提交时间。可以通过获取当前脚本的提交时间,在snv库中进行比对,确定当前脚本的版本信息,若当前脚本不是最新版本,则可以在snv库中调取当前脚本的最新版本,并执行最新版本的脚本,生成新的目标数据。
例如,当一段脚本编写好后,提交到snv时,snv会自动记录该段脚本的提交时间,检测目标数据是否是最新的数据时,获取目标数据的生成脚本,并通过识别该脚本的语义信息,从语义信息中获取该脚本的提交时间,若该脚本的提交时间与snv中该段脚本最近的提交时间一致,,则该段脚本的版本为最新版本,若不一致,则该段脚本不是最新版本,该脚本所生成的目标数据也不是最新的规范数据,因而需要从snv提取最新版本的数据,并执行生成最新且符合规范的目标数据。
进一步地,通过维护数据的生命周期和语义自动扫描,能够记录同一个数据的变化关系和变化历史,由人工维护元数据的方式只能实现少量的数据版本,在通过识别脚本的语义信息,从语义信息中获取脚本的版本变化后,能够记录更多的版本信息。
参照图5,图5为本发明元数据处理方法第五实施例的流程示意图。本实施例中,上述步骤S30包括:
步骤S301:获取各语义元数据的来源信息,所述来源信息包括数据源、访问路径;
步骤S302:根据所述来源信息和所述语义信息,确定各语义元数据之间的关系;
步骤S303:根据预置配置原则,建立各语义元数据的关键关系。
本实施例中,查询各语义元数据的来源信息,从所述来源信息中获取各语义元数据的数据源和数据源的对应访问路径,其中,不排除相同数据源的语义元数据,根据所述来源信息和所述语义信息,确定各语义元数据之间的关系,然后根据确定的关系及预置关联关系建立方式,建立各语义元数据的关联关系。其中,对获取的语义元数据自定义关联关系,选择需建立关联关系的多个语义元数据,触发关联知识挖掘,以生成自定义关联关系。在该技术方案中,用户可以根据需要进行自定义关联关系,而且通过关联知识挖掘,有助于特定领域的分析,提高查询效率。
进一步地,通过提取语义层的元数据,对查询使用者来说,面对的是自己知识领域的数据实体,以及针对查询数据试题的关联关系,实现知识发现的方法,对查询数据的元数据提供智能化支持。
例如,识别一个生成脚本的语义信息为一张贺卡为一张由张三制作的大小为50K的jpg格式的印着一只小狗的圣诞贺卡,其中,通过语义可以知道,目标数据为圣诞节贺卡,语义元数据为张三制作、50K、jpg格式、小狗、狗、圣诞节、贺卡,其中,制作人、文件大小、印着的图案、贺卡类别,这些可以作为这张贺卡的元数据的类别,获取这些语义元数据的对应数据源,如果存在相同数据源的语义元数据,相同数据源的语义元数据本身就存在一定的关系,然后根据脚本的语义信息,进一步确定脚本中的语义元数据的关系,使不同数据源的语义元数据因为同一个目标数据,而建立关系,进而根据预置的关联关系建立方式,建立各语义元数据之间的关系。
参照图6,图6为本发明元数据处理方法第五实施例的流程示意图。本实施例中,在上述步骤S70之后,包括:
步骤S80:基于所述元数据关系网创建数据关系查询页面,并选择查询字段;
步骤S90:根据所述查询字段在所述元数据关系网上的路径关系构建查询表达式;
步骤S100:基于所述查询表达式所指向的所述元数据关系网上的路径关系,查询相关联的关数据。
本实施例中,以所述元数据关系网为基础,创建数据关系查询页面,并基于所述元数据关系网选取查询字段,定义所述查询字段在所述元数据关系网中的路径关系,根据定义构建查询表达式,根据查询表达式所定义的路径关系,查询与目标数据相关联的元数据,在元数据对应的数据源中提取数据,加载到查询页面中。其中,查询表达式的构建:查询模型设计中所涉及到的元数据和字段信息从元数据关系网中获取,节点之间的连接对应着其关联关系,这样从关系网中选取任何一个节点的任何字段都可以构建出链接关系,进而实现数据的查询。
进一步地,构建查询表达式与报表设计时所定义的查询模型有关,如果查询使用的是二维数据表,从关系数据库上取数,则查询表达式可以使用SQL实现,具体SQL查询语句,这里不做赘述。如果是通过构建多维数据表模型进行的报表查询涉及,则可以把相关的元数据分别生成相应的事实表和维度表,设计二者间的关联,进而通过相应的服务器获取相关结果数据。
参照图7,图7为本发明元数据处理方法第六实施例的流程示意图。本实施例中,上述步骤S603包括:
步骤S1001:基于所述查询表达式,获取相应的SQL查询语句;
步骤S1002:解析所述SQL查询语句,以获取所述SQL查询语句所指向的所述元数据关系网上的路径关系;
步骤S1003:基于所述SQL查询语句所指向的所述元数据关系网上的路径关系,进行数据查询。
本实施例中,元数据加载与数据处理跟具体的查询模型相关。如果采用多维数据集模型,则一般其所依赖的服务器可以直接通过元数据驱动器读取数据,在内存中构建查询所要的多维数据集;如果查询模型依赖于关系数据和SQL,那么元数据驱动器在加载不同数据源数据或者其他格式类型文件时候,就需要对数据进行复制和转储,借助于功能模块或第三方接口实现。通过解析所述查询表达式,获取相应的SQL查询语句,基于所述SQL查询语句,获取SQL查询语句中所指明的路径关系,然后根据所述路径关系,找到所述目标数据,然后获取与所述目标数据存在关联关系的的语义元数据。
进一步地,解析所述SQL查询语句,对所述SQL查询语句按最小的操作单元进行分段,并且按SQL执行顺序进行编号,然后对每段SQL语句细化分解,如一段语句是对多个字段进行处理,则分解为多个语句,每个语句只对一个字段进行处理,最后将执行顺序的编号以及细化的多个语句逐一执行,进而达到数据查询。
例如,当接收到查询表达式时,解析该查询表达式,获取查询表达式的SQL查询语句,基于所述SQL查询语句,获取所述SQL查询语句表达的目标数据在所述元数据关系网中的路径关系,查询得到SQL查询语句中所查询的目标数据的元数据。
参照图8,图8为本发明元数据处理装置一实施例的功能没开示意图。本实施例中,所述元数据处理装置包括:
提取模块10:用于提取数据的生成脚本并解析,获得所述脚本的语义信息;
分析模块20:用于对所述语义信息进行分析,获得所述数据的语义元数据;
第一建立模块30:用于根据预置配置规则建立与所述语义元数据相关联的关联关系;
解析模块40,用于解析所述语义元数据的数据结构,获得所述语义元数据的作用域,其中,所述作用域标识有语义元数据的业务领域,加载时可得到不同的关联关系;
获取模块50,用于基于所述作用域,获取与所述语义元数据存在关联关系的更多语义元数据;
第一构建模块60,用于基于多个所述语义元数据之间的关联关系,构建元数据关系网;
创建模块70,用于基于所述元数据关系网创建数据关系查询页面,以供进行数据查询。
本实施例中,提取模块10提取数据的生成脚本并解析,获得所述脚本的语义信息,分析模块20对所述语义信息进行分析,获得所述数据的语义元数据,第一建立模块30根据预置配置规则建立与所述语义元数据相关联的关联关系,解析模块40解析所述语义元数据的数据结构,获得所述语义元数据的作用域,获取模块50基于所述作用域,获取与所述语义元数据存在关联关系的更多语义元数据,第一构建模块60基于多个所述语义元数据之间的关联关系,构建元数据关系网,创建模块70基于所述元数据关系网创建数据关系查询页面,以供进行数据查询。
本发明还提供一种计算机可读存储介质。
本实施例中,所述计算机可读存储介质上存储有元数据处理程序,所述元数据处理程序被处理器质性时实现如上述任一项实施例中所述的元数据处理方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本发明的保护之内。

Claims (9)

1.一种元数据处理方法,其特征在于,所述元数据处理方法包括以下步骤:
提取目标数据的生成脚本并解析,获得所述脚本的语义信息;
对所述语义信息进行分析,获得所述目标数据的语义元数据;
根据预置配置规则及所述语义信息,建立各语义元数据的关联关系,其中,所述预置配置规则至少包括建立关联关系的方式;
解析所述语义元数据的数据结构,获得所述语义元数据的作用域,其中,所述作用域标识有语义元数据的业务领域,加载时可得到不同的关联关系;
基于所述作用域,获取与所述语义元数据存在关联关系的更多语义元数据;
基于多个所述语义元数据之间的关联关系,构建元数据关系网;
基于所述元数据关系网创建数据关系查询页面,以供进行数据查询;
所述对所述语义信息进行分析,获得所述数据的语义元数据包括:
解析所述语义信息,得到所述语义信息中描述所述目标数据的信息;
从所述信息中提取所述目标数据的生成逻辑信息;
从所述生成逻辑信息中提取所述目标数据的语义元数据,并作为查询语义元数据。
2.如权利要求1所述的元数据处理方法,其特征在于,在所述提取目标数据的生成脚本并解析,获得所述脚本的语义信息的步骤之前,还包括:
建立数据源与所述语义元数据之间的映射关系,其中,不同类型的所述数据源与不同的所述语义元数据一一对应。
3.如权利要求1所述的元数据处理方法,其特征在于,在所述从所述信息中提取所述目标数据的生成逻辑信息的步骤之后,包括:
从所述生成逻辑信息中提取所述目标数据的版本信息,并进行记录,所述版本信息包括目标数据版本的生成时间和版本号;
创建版本信息查询页面,以供进行数据的版本信息查询。
4.如权利要求1所述的元数据处理方法,其特征在于,所述根据预置配置规则及所述语义信息,建立各语义元数据的关联关系包括:
获取各语义元数据的来源信息,所述来源信息包括数据源、访问路径;
根据所述来源信息和所述语义信息,确定各语义元数据之间的关系;
根据预置配置规则,建立各语义元数据的关联关系。
5.如权利要求1所述的元数据处理方法,其特征在于,在所述基于所述元数据关系网创建数据关系查询页面,以供进行数据查询的步骤之后,包括:
基于所述元数据关系网创建数据关系查询页面后,选择查询字段;
根据所述查询字段在所述元数据关系网上的路径关系构建查询表达式;
基于所述查询表达式所指向的所述元数据关系网上的路径关系,查询相关联的元数据。
6.如权利要求5所述的元数据处理方法,其特征在于,所述基于所述查询表达式所指向的所述元数据关系网上的路径关系,查询相关联的元数据包括:
基于所述查询表达式,获取相应的SQL查询语句;
解析所述SQL查询语句,获得所述SQL查询语句所指向的所述元数据关系网上的路径关系;
基于所述路径关系,进行数据查询。
7.一种元数据处理装置,其特征在于,所述元数据处理装置包括:
提取模块,用于提取目标数据的生成脚本并解析,获得所述脚本的语义信息;
分析模块,用于对所述语义信息进行分析,获得所述数据的语义元数据;
第一建立模块,用于根据预置配置规则建立与所述语义元数据相关联的关联关系,其中,所述预置配置规则至少包括建立关联关系的方式;
解析模块,用于解析所述语义元数据的数据结构,获得所述语义元数据的作用域,其中,所述作用域标识有语义元数据的业务领域,加载时可得到不同的关联关系;
获取模块,用于基于所述作用域,获取与所述语义元数据存在关联关系的更多语义元数据;
第一构建模块,用于基于多个所述语义元数据之间的关联关系,构建元数据关系网;
创建模块,用于基于所述元数据关系网创建数据关系查询页面,以供进行数据查询;
分析模块,还用于解析所述语义信息,得到所述语义信息中描述所述目标数据的信息;从所述信息中提取所述目标数据的生成逻辑信息;从所述生成逻辑信息中提取所述目标数据的语义元数据,并作为查询语义元数据。
8.一种元数据处理设备,其特征在于,所述元数据处理设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的元数据处理程序,所述元数据处理程序被所述处理器执行时实现如权利要求1-6中任一项所述的元数据处理方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有元数据处理程序,所述元数据处理程序被处理器执行时实现如权利要求1-6中任一项所述的元数据处理方法的步骤。
CN201910967579.1A 2019-10-12 2019-10-12 元数据处理方法、装置、设备及计算机可读存储介质 Active CN110941629B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910967579.1A CN110941629B (zh) 2019-10-12 2019-10-12 元数据处理方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910967579.1A CN110941629B (zh) 2019-10-12 2019-10-12 元数据处理方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110941629A CN110941629A (zh) 2020-03-31
CN110941629B true CN110941629B (zh) 2023-09-29

Family

ID=69906046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910967579.1A Active CN110941629B (zh) 2019-10-12 2019-10-12 元数据处理方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110941629B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111832661B (zh) * 2020-07-28 2024-04-02 平安国际融资租赁有限公司 分类模型构建方法、装置、计算机设备及可读存储介质
CN112333193B (zh) * 2020-11-06 2021-11-12 珠海格力电器股份有限公司 协议自动更新方法及系统
CN113312396B (zh) * 2021-05-12 2024-04-19 上海哲锦信息科技有限公司 一种基于大数据的元数据处理方法及设备
CN114238467A (zh) * 2021-12-01 2022-03-25 中冶赛迪重庆信息技术有限公司 一种结构化数据分析方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8180758B1 (en) * 2008-05-09 2012-05-15 Amazon Technologies, Inc. Data management system utilizing predicate logic
CN102591952A (zh) * 2011-12-28 2012-07-18 用友软件股份有限公司 基于语义的数据查询装置和基于语义的数据查询方法
CN102799644A (zh) * 2012-06-28 2012-11-28 用友软件股份有限公司 基于元数据的数据库动态查询系统和数据库动态查询方法
CN103092998A (zh) * 2013-02-21 2013-05-08 用友软件股份有限公司 数据查询系统和数据查询方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8180758B1 (en) * 2008-05-09 2012-05-15 Amazon Technologies, Inc. Data management system utilizing predicate logic
CN102591952A (zh) * 2011-12-28 2012-07-18 用友软件股份有限公司 基于语义的数据查询装置和基于语义的数据查询方法
CN102799644A (zh) * 2012-06-28 2012-11-28 用友软件股份有限公司 基于元数据的数据库动态查询系统和数据库动态查询方法
CN103092998A (zh) * 2013-02-21 2013-05-08 用友软件股份有限公司 数据查询系统和数据查询方法

Also Published As

Publication number Publication date
CN110941629A (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
CN110941629B (zh) 元数据处理方法、装置、设备及计算机可读存储介质
US20240078096A1 (en) Systems and methods for code clustering analysis and transformation
CN107370786B (zh) 一种基于微服务架构的通用信息管理系统
US11188319B2 (en) Systems and methods for entry point-based code analysis and transformation
US9229971B2 (en) Matching data based on numeric difference
US8296311B2 (en) Solution search for software support
US20190243641A1 (en) Systems and methods for code analysis heat map interfaces
CN109299183A (zh) 一种数据处理方法、装置、终端设备和存储介质
CN112685433B (zh) 元数据更新方法、装置、电子设备及计算机可读存储介质
US20150317331A1 (en) Unified platform for application development
CN112966004B (zh) 数据查询方法、装置、电子设备以及计算机可读介质
KR101355273B1 (ko) 컴퓨팅 시스템 및 그 실행 제어 방법과, 그 실행 제어 프로그램을 기록한 기록 매체
US20210124752A1 (en) System for Data Collection, Aggregation, Storage, Verification and Analytics with User Interface
CN111737227A (zh) 数据修改方法及系统
US20240036890A1 (en) System and method of a modular framework for configuration and reuse of web components
CN110968569B (zh) 数据库的管理方法、数据库的管理装置及存储介质
CN113722337B (zh) 业务数据确定方法、装置、设备及存储介质
CN112162731B (zh) 数据扩展方法、装置、存储介质及电子装置
CN114153438A (zh) 一种api自动生成系统
WO2017072872A1 (ja) 業務プログラム生成支援システムおよび業務プログラム生成支援方法
JP5500859B2 (ja) 環境関連情報集計分析システム。
CN113901048B (zh) 一种电子化档案数据管理系统与处理方法
CN111079391B (zh) 一种报表的生成方法及装置
CN117235045A (zh) 一种应用于企业级数据治理的元数据管理方法及平台
CN117493327A (zh) 数据质量检测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant