CN113392076A - 获取元数据质量信息的方法、装置、电子设备和介质 - Google Patents
获取元数据质量信息的方法、装置、电子设备和介质 Download PDFInfo
- Publication number
- CN113392076A CN113392076A CN202110771592.7A CN202110771592A CN113392076A CN 113392076 A CN113392076 A CN 113392076A CN 202110771592 A CN202110771592 A CN 202110771592A CN 113392076 A CN113392076 A CN 113392076A
- Authority
- CN
- China
- Prior art keywords
- metadata
- preset
- information
- dimensions
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000000007 visual effect Effects 0.000 claims description 16
- 238000013523 data management Methods 0.000 claims description 14
- 238000007726 management method Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 235000019633 pungent taste Nutrition 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/164—File meta data generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/156—Query results presentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开的实施例公开了获取元数据质量信息的方法、装置、电子设备和介质。该方法的一具体实施方式包括:获取针对目标数据系统的元数据信息集合;按照至少两个预设维度生成该元数据信息集合对应的分数,其中,该预设维度包括以下至少一项:元数据完整度,元数据准确度,元数据贡献度;根据该至少两个预设维度对应的权重与至少两个预设维度对应的分数,生成该元数据信息集合的质量信息。该实施方式实现了元数据的质量信息的自动生成,从而为支持不同用户对元数据管理或使用的需求提供技术基础。
Description
技术领域
本公开的实施例涉及计算机技术领域,具体涉及获取元数据质量信息的方法、装置、电子设备和介质。
背景技术
随着互联网技术的飞速发展,数据规模也不断扩大,企业业务信息、舆情信息、第三方信息等各类数据资产信息不断增长,企业为了实现数据信息对业务增长的价值变现,就需要对企业所涉及的所有数据资产信息构建企业元数据系统,也叫做数据目录系统,用以支持企业决策分析、数据分析、数据挖掘等数据工作,支持企业营销、运营,为各类企业经营管理人员更加充分了解企业具有的数据资产分类、数据资产范围、数据资产数量、数据资产质量等提供服务。
目前,不同行业背景的很多企业都建设了数据资产元数据 (Metadata)系统,例如hive数据仓库(Data Warehouse,DW)。现有元数据系统通常只有元数据的基础信息,在大数据(big data)时代,由于数据量巨大,如何判断元数据系统中的数据的质量需要更加数字化、智能化的方法。
发明内容
本公开的实施例提出了获取元数据质量信息的方法、装置、电子设备和介质。
第一方面,本公开的实施例提供了一种获取元数据质量信息的方法,该方法包括:获取针对目标数据系统的元数据信息集合;按照至少两个预设维度生成元数据信息集合对应的分数,其中,预设维度包括以下至少一项:元数据完整度,元数据准确度,元数据贡献度;根据至少两个预设维度对应的权重与至少两个预设维度对应的分数,生成元数据信息集合的质量信息。
在一些实施例中,上述预设维度包括元数据完整度;以及上述按照至少两个预设维度生成元数据信息集合对应的分数,包括:按照至少两个预设完整度子维度生成元数据信息集合对应的子分数,其中,完整度子维度包括以下至少一项:多语种对照描述得分,业务用途描述得分,使用方法描述得分,枚举字段描述得分;根据至少两个预设完整度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的准确度维度的分数。
在一些实施例中,上述预设维度包括元数据准确度;以及上述按照至少两个预设维度生成元数据信息集合对应的分数,包括:按照至少两个预设准确度子维度生成元数据信息集合对应的子分数,其中,准确度子维度包括以下至少一项:维护人信息得分,更新信息得分,枚举数据完整度得分;根据至少两个预设准确度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的准确度维度的分数。
在一些实施例中,上述预设维度包括元数据贡献度;以及上述按照至少两个预设维度生成元数据信息集合对应的分数,包括:按照至少两个预设贡献度子维度生成元数据信息集合对应的子分数,其中,贡献度子维度包括以下至少一项:用户满意度得分,元数据热度得分,元数据权威性得分;根据至少两个预设贡献度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的贡献度维度的分数。
在一些实施例中,在根据至少两个预设维度对应的权重与对应的所生成的分数,生成元数据信息集合的质量信息之前,该方法还包括:接收目标用户端发送的权重设置值;基于权重设置值,确定以下至少一项:预设维度对应的权重,预设完整度子维度对应的权重,预设准确度子维度对应的权重,预设贡献度子维度对应的权重。
在一些实施例中,该方法还包括:将质量信息存入预设的数据质量信息库;根据数据质量信息库中的质量信息,生成可视化报表,其中,可视化报表包括以下至少一项:与至少两个预设维度对应的分数呈现信息,质量信息的历史变化呈现信息,质量信息排名呈现信息。
第二方面,本公开的实施例提供了一种获取元数据质量信息的装置,该装置包括:获取单元,被配置成获取针对目标数据系统的元数据信息集合;第一生成单元,被配置成按照至少两个预设维度生成元数据信息集合对应的分数,其中,预设维度包括以下至少一项:元数据完整度,元数据准确度,元数据贡献度;第二生成单元,被配置成根据至少两个预设维度对应的权重与至少两个预设维度对应的分数,生成元数据信息集合的质量信息。
在一些实施例中,上述预设维度包括元数据完整度;上述第一生成单元进一步被配置成:按照至少两个预设完整度子维度生成元数据信息集合对应的子分数,其中,完整度子维度包括以下至少一项:多语种对照描述得分,业务用途描述得分,使用方法描述得分,枚举字段描述得分;根据至少两个预设完整度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的准确度维度的分数。
在一些实施例中,上述预设维度包括元数据准确度;上述第一生成单元进一步被配置成:按照至少两个预设准确度子维度生成元数据信息集合对应的子分数,其中,准确度子维度包括以下至少一项:维护人信息得分,更新信息得分,枚举数据完整度得分;根据至少两个预设准确度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的准确度维度的分数。
在一些实施例中,上述预设维度包括元数据贡献度;上述第一生成单元进一步被配置成:按照至少两个预设贡献度子维度生成元数据信息集合对应的子分数,其中,贡献度子维度包括以下至少一项:用户满意度得分,元数据热度得分,元数据权威性得分;根据至少两个预设贡献度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的贡献度维度的分数。
在一些实施例中,该装置还进一步被配置成:接收目标用户端发送的权重设置值;基于权重设置值,确定以下至少一项:预设维度对应的权重,预设完整度子维度对应的权重,预设准确度子维度对应的权重,预设贡献度子维度对应的权重。
在一些实施例中,该装置还进一步被配置成:将质量信息存入预设的数据质量信息库;根据数据质量信息库中的质量信息,生成可视化报表,其中,可视化报表包括以下至少一项:与至少两个预设维度对应的分数呈现信息,质量信息的历史变化呈现信息,质量信息排名呈现信息。
第三方面,本申请实施例提供了一种获取元数据质量信息的系统,该系统包括:数据管理端,被配置成存储元数据;提供元数据信息管理服务;提供数据地图服务;数据质量确定端,被配置成执行实现如第一方面中任一实现方式描述的方法;用户端,被配置成向数据管理端和/或数据质量确定端发送数据获取请求;接收与数据获取请求对应的响应结果。
第四方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第五方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开的实施例提供的获取元数据质量信息的方法、装置、电子设备和介质,通过按照至少两个预设维度生成所获取的元数据信息集合对应的分数,以及根据至少两个预设维度对应的权重与至少两个预设维度对应的分数,生成元数据信息集合的质量信息,实现了从多个维度综合生成元数据系统中的数据的质量信息,从而为支持不同用户对元数据管理或使用的需求(例如管理人员需了解元数据的整体质量,以进行元数据治理;负责人需了解自己负责的元数据的质量,以对有问题的方面进行完善;开发人员在查询和使用元数据的时候需知道该元数据的质量和问题分布,以实现快速的业务开发)提供技术基础。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
图2是根据本公开的获取元数据质量信息的方法的一个实施例的流程图;
图3是根据本公开的实施例的获取元数据质量信息的方法的一个应用场景的示意图;
图4a是根据本公开的获取元数据质量信息的方法的又一个实施例的流程图;
图4b是根据本公开的获取元数据质量信息的方法的又一个实施例的可视化报表示意图;
图5是根据本公开的获取元数据质量信息的装置的一个实施例的结构示意图;
图6是根据本申请的获取元数据质量信息的系统的一个实施例的系统架构图。
图7是适于用来实现本申请的实施例的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的获取元数据质量信息的方法或获取元数据质量信息的装置的示例性架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、数据库类应用、搜索类应用、即时通信工具等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持人机交互的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如为终端设备101、 102、103上数据库类应用提供支持的后台服务器。后台服务器可以对接收到的数据质量获取请求进行分析处理,并根据上述请求执行相应的处理(例如生成上述请求所指示的数据的质量信息),还可以将生成的处理结果(如质量信息)反馈给终端设备。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本公开的实施例所提供的获取元数据质量信息的方法一般由服务器105执行,相应地,获取元数据质量信息的装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本公开的获取元数据质量信息的方法的一个实施例的流程200。该获取元数据质量信息的方法包括以下步骤:
步骤201,获取针对目标数据系统的元数据信息集合。
在本实施例中,获取元数据质量信息的方法的执行主体(如图1 所示的服务器105)可以通过有线连接方式或者无线连接方式从本地或通信连接的电子设备获取针对目标数据系统的元数据信息集合。其中,上述目标数据系统可以是根据实际的应用需求,预先指定的任意数据系统。上述目标数据系统也可以是根据规则而定的数据系统,例如用于存储上述元数据的数据系统。
需要说明的是,元数据又称中介数据、中继数据,为描述数据的数据(data aboutdata),主要包括用于描述数据属性(property)的信息,其可以用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。作为示例,用于记录数据项的业务描述信息的元数据能够帮助用户使用数据。作为又一示例,元数据能够支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。
在本实施例中,上述针对目标数据系统的元数据信息集合中可以包括各种元数据信息。作为示例,上述元数据信息集合中可以包括元数据的基础信息。上述元数据的基础信息可以包括但不限于以下至少一项:元数据对应的表的创建时间,元数据对应的表的分区情况,元数据对应的表的字段信息,元数据对应的表的业务描述信息,元数据对应的表的维护负责人信息。
步骤202,按照至少两个预设维度生成元数据信息集合对应的分数。
在本实施例中,按照至少两个预设维度,上述执行主体可以通过各种方式生成元数据信息集合对应的分数。其中,上述预设维度可以包括以下至少一项:元数据完整度,元数据准确度,元数据贡献度。其中,上述元数据完整度可以用于表征上述元数据信息集合中的元数据是否完整。上述元数据准确度可以用于表征上述元数据信息集合中的元数据是否准确。上述元数据贡献度可以用于表征上述元数据信息集合中的元数据的价值。
在本实施例中,上述执行主体可以根据预设的指标生成上述元数据信息集合对应的分数。作为示例,上述执行主体可以根据上述元数据信息集合中的元数据对应的表中是否包含预设的字段以及所包含的预设的字段的数目生成元数据完整度对应的分数。作为又一示例,上述执行主体可以根据上述元数据信息集合中的元数据对应的表的更新时间生成元数据准确度对应的分数。作为再一示例,上述执行主体可以根据上述元数据信息集合中的元数据对应的表中的数据被查询的次数生成元数据贡献度对应的分数。
在本实施例的一些可选的实现方式中,上述预设维度可以包括元数据完整度。上述执行主体可以按照如下步骤生成上述元数据信息集合对应的分数:
第一步,按照至少两个预设完整度子维度生成元数据信息集合对应的子分数。
在这些实现方式中,上述执行主体可以通过各种方式按照至少两个预设完整度子维度生成元数据信息集合对应的子分数。其中,上述完整度子维度可以包括以下至少一项:多语种对照描述得分,业务用途描述得分,使用方法描述得分,枚举字段描述得分。
在这些实现方式中,上述多语种对照描述例如可以包括中英对照描述。上述枚举字段描述例如可以包括“性别描述:0-男,1-女”。
作为示例,上述执行主体可以确定上述元数据信息集合中的元数据信息中是否存在中英对照描述。根据是否存在,上述执行主体可以生成多语种对照描述得分对应的子分数(例如存在为25,不存在为0)。作为又一示例,上述执行主体还可以确定上述元数据信息集合中的元数据信息中是否存在业务用途描述、使用方法描述、枚举字段描述。根据是否存在,上述执行主体可以生成多语种对照描述得分对应的子分数(例如存在为25,不存在为0)
第二步,根据至少两个预设完整度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的完整度维度的分数。
在这些实现方式中,根据至少两个预设完整度子维度对应的权重与对应的所生成的子分数,上述执行主体可以通过加权求和的方式生成元数据信息集合对应的完整度维度的分数。其中,上述预设完整度子维度对应的权重可以是预设的默认值,也可以通过客户端灵活设定,此处不做限定。
基于上述可选的实现方式,本方案可以通过选取多语种对照描述得分、业务用途描述得分、使用方法描述得分、枚举字段描述得分中的至少两者作为生成元数据信息集合对应的完整度维度的分数的依据,从而丰富了完整度维度的分数的生成方式。
在本实施例的一些可选的实现方式中,上述预设维度可以包括元数据准确度。上述执行主体可以按照如下步骤生成上述元数据信息集合对应的分数:
第一步,按照至少两个预设准确度子维度生成元数据信息集合对应的子分数。
在这些实现方式中,上述执行主体可以通过各种方式按照至少两个预设准确度子维度生成元数据信息集合对应的子分数。其中,上述准确度子维度可以包括以下至少一项:维护人信息得分,更新信息得分,枚举数据完整度得分。
在这些实现方式中,作为示例,上述执行主体可以确定上述元数据信息集合中的元数据对应的表的维护人是否在职。根据是否在职,上述执行主体可以生成维护人信息得分对应的子分数(例如在职为 40,非在职为0)。作为又一示例,上述执行主体可以根据上述元数据信息集合中的元数据的更新频率(例如是否实时更新或者每天更新一次)生成更新信息得分。作为再一示例,上述执行主体还可以根据枚举数据是否完整生成枚举数据完整度得分。
第二步,根据至少两个预设准确度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的准确度维度的分数。
在这些实现方式中,根据至少两个预设准确度子维度对应的权重与对应的所生成的子分数,上述执行主体可以通过加权求和的方式生成元数据信息集合对应的准确度维度的分数。其中,上述预设准确度子维度对应的权重可以是预设的默认值,也可以通过客户端灵活设定,此处不做限定。
基于上述可选的实现方式,本方案可以通过选取维护人信息得分,更新信息得分,枚举数据完整度得分中的至少两者作为生成元数据信息集合对应的准确度维度的分数的依据,从而丰富了准确度维度的分数的生成方式。
在本实施例的一些可选的实现方式中,上述预设维度可以包括元数据贡献度。上述执行主体可以按照如下步骤生成上述元数据信息集合对应的分数:
第一步,按照至少两个预设贡献度子维度生成元数据信息集合对应的子分数。
在这些实现方式中,上述执行主体可以通过各种方式按照至少两个预设贡献度子维度生成元数据信息集合对应的子分数。其中,上述贡献度子维度可以包括以下至少一项:用户满意度得分,元数据热度得分,元数据权威性得分。
在这些实现方式中,作为示例,上述执行主体可以根据所获取的用户反馈打分生成用户满意度得分。其中,上述用户反馈打分可以是数值,也可以是星级(例如5星对应50分,3星对应30分)。作为又一示例,上述执行主体可以从元数据系统的访问数据获取上述元数据信息集合中的元数据对应的表被访问的次数,根据上述被访问的次数,上述执行主体可以生成元数据热度得分(例如访问次数排名属于前 100名,则元数据热度得分为30,否则为0)。作为再一示例,上述执行主体还可以根据元数据系统中与上述元数据信息集合中的元数据对应的表对应的用于表征是否为专家认证模型的标识,生成元数据权威性得分。
第二步,根据至少两个预设贡献度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的贡献度维度的分数。
在这些实现方式中,根据至少两个预设贡献度子维度对应的权重与对应的所生成的子分数,上述执行主体可以通过加权求和的方式生成元数据信息集合对应的贡献度维度的分数。其中,上述预设贡献度子维度对应的权重可以是预设的默认值,也可以通过客户端灵活设定,此处不做限定。
基于上述可选的实现方式,本方案可以通过选取用户满意度得分,元数据热度得分,元数据权威性得分中的至少两者作为生成元数据信息集合对应的贡献度维度的分数的依据,从而丰富了贡献度维度的分数的生成方式。
步骤203,根据至少两个预设维度对应的权重与至少两个预设维度对应的分数,生成元数据信息集合的质量信息。
在本实施例中,根据至少两个预设维度对应的权重与步骤202所生成的对应的分数,上述执行主体可以通过各种方式生成元数据信息集合的质量信息。作为示例,上述执行主体可以将元数据完整度对应的权重乘以元数据完整度对应的分数,再将元数据准确度对应的权重乘以元数据准确度对应的分数,然后将所得到的两个乘积相加,将所得到的结果确定为上述元数据信息集合的质量信息。
在本实施例中,上述质量信息可以用于指示元数据的健康度。作为示例,元数据越完整、越准确,元数据就越“健康”,则质量信息所指示的值(例如健康度得分)越高。
在本实施例的一些可选的实现方式中,在根据至少两个预设维度对应的权重与对应的所生成的分数,生成元数据信息集合的质量信息之前,上述执行主体还可以执行如下步骤:
第一步,接收目标用户端发送的权重设置值。
在这些实现方式中,上述执行主体可以通过有线或无线的方式接收目标用户端发送的权重设置值。其中,上述权重设置值可以用于指示各维度(例如元数据完整度,元数据准确度,元数据贡献度)对应的权重值。可选地,上述权重设置值还可以用于指示各维度对应的子维度(例如多语种对照描述得分,业务用途描述得分,使用方法描述得分,枚举字段描述得分,维护人信息得分,更新信息得分,枚举数据完整度得分,用户满意度得分,元数据热度得分,元数据权威性得分)的权重值。
第二步,基于权重设置值,确定以下至少一项:预设维度对应的权重,预设完整度子维度对应的权重,预设准确度子维度对应的权重,预设贡献度子维度对应的权重。
在这些实现方式中,基于上述第一步所接收的权重设置值,上述执行主体可以通过各种方式确定以下至少一项:预设维度对应的权重,预设完整度子维度对应的权重,预设准确度子维度对应的权重,预设贡献度子维度对应的权重。
基于上述可选的实现方式,本方案可以支持权重的自定义设置,从而可以根据应用场景的不同灵活设置权重,提高系统的适用性。
继续参见图3,图3是根据本公开的实施例的获取元数据质量信息的方法的应用场景的一个示意图。在图3的应用场景中,用户301 使用终端设备302向服务器304发送针对X数据系统的元数据的质量信息查询请求303。服务器304可以利用已有的数据采集工具例如数据管道采集数据信息,生成X数据系统的元数据信息集合。上述元数据信息集合中例如可以包括元数据表的中英文名称,维护人信息,业务描述信息,业务分类信息,分区情况,hive表的HDFS(Hadoop Distributed File System,分布式文件系统)路径等信息。服务器304可以分别生成元数据信息集合的元数据完整度得分和元数据贡献度得分(如图中306所示)。之后,服务器304可以根据上述元数据完整度和元数据贡献度对应的权重(例如分别为0.5)与所生成的元数据完整度得分和元数据贡献度得分进行加权求和,生成元数据信息集合的质量信息(如图中307所示)。可选地,服务器304还可以将所生成的质量信息307发送至终端设备302,以显示给用户301。
目前,现有技术之一通常是元数据系统中只有元数据的基础信息,导致在大数据时代难以判断元数据系统中的数据的质量。而本公开的上述实施例提供的方法,通过按照至少两个预设维度生成所获取的元数据信息集合对应的分数,以及根据至少两个预设维度对应的权重与对应的所生成的分数,生成元数据信息集合的质量信息,实现了从多个维度综合生成元数据系统中的数据的质量信息,从而为支持不同用户对元数据管理或使用的需求(例如管理人员需了解元数据的整体质量,以进行元数据治理;负责人需了解自己负责的元数据的质量,以对有问题的方面进行完善;开发人员在查询和使用元数据的时候需知道该元数据的质量和问题分布,以实现快速的业务开发)提供技术基础。
进一步参考图4a,其示出了获取元数据质量信息的方法的又一个实施例的流程400。该获取元数据质量信息的方法的流程400,包括以下步骤:
步骤401,获取针对目标数据系统的元数据信息集合。
步骤402,按照至少两个预设维度生成元数据信息集合对应的分数。
步骤403,根据至少两个预设维度对应的权重与至少两个预设维度对应的分数,生成元数据信息集合的质量信息。
上述步骤401、步骤402、步骤403分别与前述实施例中的步骤 201、步骤202、步骤203及其可选的实现方式一致,上文针对步骤201、步骤202、步骤203及其可选的实现方式的描述也适用于步骤401、步骤402和步骤403,此处不再赘述。
步骤404,将质量信息存入预设的数据质量信息库。
在本实施例中,获取元数据质量信息的方法的执行主体(例如图 1所示的服务器105)可以将上述步骤403所生成的质量信息存入预设的数据质量信息库。其中,上述预设的数据质量信息库中可以存储有历史质量信息。作为示例,上述预设的数据质量信息库中可以包括近一天、近一周或近一月所生成的质量信息。可选地,上述数据质量信息库中还可以包括生成上述质量信息的各项分数(例如元数据完整度对应的分数,元数据准确度对应的分数,元数据贡献度对应的分数)。
步骤405,根据数据质量信息库中的质量信息,生成可视化报表。
在本实施例中,根据数据质量信息库中的质量信息,上述执行主体可以通过各种方式生成可视化报表。其中,上述可视化报表可以包括以下至少一项:与至少两个预设维度对应的分数呈现信息,质量信息的历史变化呈现信息,质量信息排名呈现信息。
作为示例,上述执行主体可以通过JDBC(Java Database Connectivity,Java数据库连接)方式提供给Java应用程序、可视化报表等服务,从而生成可视化报表(如图4b所示)。
从图4a中可以看出,本实施例中的获取元数据质量信息的方法的流程400体现了将质量信息存入预设的数据质量信息库的步骤,以及根据数据质量信息库中的质量信息,生成可视化报表的步骤。由此,本实施例描述的方案可以通过根据存储有历史数据质量信息的数据库生成可视化报表,从而为用户直观地查询和使用元数据质量信息提供支持。
进一步参考图5,作为对上述各图所示方法的实现,本公开提供了获取元数据质量信息的装置的一个实施例,该装置实施例与图2或图4a所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例提供的获取元数据质量信息的装置500包括获取单元501、第一生成单元502和第二生成单元503。其中,获取单元501,被配置成获取针对目标数据系统的元数据信息集合;第一生成单元502,被配置成按照至少两个预设维度生成元数据信息集合对应的分数,其中,预设维度包括以下至少一项:元数据完整度,元数据准确度,元数据贡献度;第二生成单元503,被配置成根据至少两个预设维度对应的权重与至少两个预设维度对应的分数,生成元数据信息集合的质量信息。
在本实施例中,获取元数据质量信息的装置500中:获取单元501、第一生成单元502和第二生成单元503的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201、步骤202、步骤203 和步骤204的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,上述预设维度可以包括元数据完整度。上述第一生成单元502可以进一步被配置成:按照至少两个预设完整度子维度生成元数据信息集合对应的子分数,其中,完整度子维度包括以下至少一项:多语种对照描述得分,业务用途描述得分,使用方法描述得分,枚举字段描述得分;根据至少两个预设完整度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的准确度维度的分数。
在本实施例的一些可选的实现方式中,上述预设维度可以包括元数据准确度。上述第一生成单元502可以进一步被配置成:按照至少两个预设准确度子维度生成元数据信息集合对应的子分数,其中,准确度子维度包括以下至少一项:维护人信息得分,更新信息得分,枚举数据完整度得分;根据至少两个预设准确度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的准确度维度的分数。
在本实施例的一些可选的实现方式中,上述预设维度可以包括元数据贡献度。上述第一生成单元502可以进一步被配置成:按照至少两个预设贡献度子维度生成元数据信息集合对应的子分数,其中,贡献度子维度包括以下至少一项:用户满意度得分,元数据热度得分,元数据权威性得分;根据至少两个预设贡献度子维度对应的权重与对应的所生成的子分数,生成元数据信息集合对应的贡献度维度的分数。
在本实施例的一些可选的实现方式中,该获取元数据质量信息的装置500还可以进一步被配置成:接收目标用户端发送的权重设置值;基于权重设置值,确定以下至少一项:预设维度对应的权重,预设完整度子维度对应的权重,预设准确度子维度对应的权重,预设贡献度子维度对应的权重。
在本实施例的一些可选的实现方式中,该获取元数据质量信息的装置500还可以进一步被配置成:将质量信息存入预设的数据质量信息库;根据数据质量信息库中的质量信息,生成可视化报表,其中,可视化报表包括以下至少一项:与至少两个预设维度对应的分数呈现信息,质量信息的历史变化呈现信息,质量信息排名呈现信息。
本公开的上述实施例提供的装置,通过第一生成单元502按照至少两个预设维度生成获取单元501所获取的元数据信息集合对应的分数,以及第二生成单元503根据至少两个预设维度对应的权重与至少两个预设维度对应的分数,生成元数据信息集合的质量信息,实现了从多个维度综合生成元数据系统中的数据的质量信息,从而为支持不同用户对元数据管理或使用的需求提供技术基础。
进一步参考图6,其示出了获取元数据质量信息的系统的一个实施例中系统架构图600。该获取元数据质量信息的系统可以包括:数据管理端601,被配置成存储元数据;提供元数据信息管理服务;提供数据地图服务;数据质量确定端602,被配置成执行实现如前述实施例所描述的获取元数据质量信息的方法;用户端603,被配置成向数据管理端和/或数据质量确定端发送数据获取请求;接收与数据获取请求对应的响应结果。
如图6所示,在本实施例中,上述数据管理端601可以将所获取的企业数据资产各类信息表存储到大数据平台环境,例如hadoop分布式框架基础上的hive数据仓库存储或mysql库。数据管理端601还可以提供元数据信息管理服务,例如可以包括元数据的基础信息管理(例如业务元数据、技术元数据等信息)、流程信息、标签管理、权限管理等。其中,上述技术元数据可以包括字段名称、字段长度、数据库表结构等。上述业务元数据可以包括业务名称、业务定义、业务描述等。数据管理端601还可以提供元数据的数据地图服务等,从而可以支持数据分析、信息检索等。
在本实施例中,上述数据质量确定端602可以用于执行如前述实施例中步骤201-203、步骤401-405及其可选的实现方式中描述的步骤,此处不再赘述。
在本实施例中,上述用户端603可以被配置成向上述数据管理端 601和/或上述数据质量确定端602发送数据获取请求;接收与数据获取请求对应的响应结果。作为示例,上述用户端603可以向上述数据管理端601发送元数据的基础信息查询请求。而后,上述用户端603 可以接收上述数据管理端601发送的查询结果。作为又一示例,上述用户端603可以向上述数据质量确定端602发送元数据的质量信息获取请求。而后,上述用户端603可以接收上述数据质量确定端602发送的质量信息。
本申请的上述实施例提供的获取元数据质量信息的系统,通过数据管理端601提供存储元数据、元数据信息管理、数据地图等服务;数据质量确定端602按照至少两个预设维度生成所获取的元数据信息集合对应的分数,以及根据至少两个预设维度对应的权重与对应的所生成的分数,生成元数据信息集合的质量信息;用户端603向上述数据管理端601和/或数据质量确定端602发送请求以及接收返回的结果,实现了为大规模数据的质量管理和数据的高效应用的有力支持。
下面参考图7,其示出了适于用来实现本申请的实施例的电子设备(例如图1中的服务器105)700的结构示意图。图7示出的服务器仅仅是一个示例,不应对本申请的实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700可以包括处理装置(例如中央处理器、图形处理器等)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储装置708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有电子设备700操作所需的各种程序和数据。处理装置701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线 704。
通常,以下装置可以连接至I/O接口705:包括例如触摸屏、触摸板、键盘、鼠标、等的输入装置706;包括例如液晶显示器(LCD, Liquid Crystal Display)、扬声器、振动器等的输出装置707;包括例如磁带、硬盘等的存储装置708;以及通信装置709。通信装置709可以允许电子设备700与其他设备进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备700,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图7中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置709从网络上被下载和安装,或者从存储装置708被安装,或者从ROM 702被安装。在该计算机程序被处理装置701执行时,执行本申请的实施例的方法中限定的上述功能。
需要说明的是,本公开的实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器 (RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM 或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(Radio Frequency,射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取针对目标数据系统的元数据信息集合;按照至少两个预设维度生成元数据信息集合对应的分数,其中,预设维度包括以下至少一项:元数据完整度,元数据准确度,元数据贡献度;根据至少两个预设维度对应的权重与对应的所生成的分数,生成元数据信息集合的质量信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”、Python语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN) 或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机 (例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开的各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器,包括获取单元、第一生成单元、第二生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取针对目标数据系统的元数据信息集合的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种获取元数据质量信息的方法,包括:
获取针对目标数据系统的元数据信息集合;
按照至少两个预设维度生成所述元数据信息集合对应的分数,其中,所述预设维度包括以下至少一项:元数据完整度,元数据准确度,元数据贡献度;
根据所述至少两个预设维度对应的权重与所述至少两个预设维度对应的分数,生成所述元数据信息集合的质量信息。
2.根据权利要求1所述的方法,其中,所述预设维度包括元数据完整度;以及
所述按照至少两个预设维度生成所述元数据信息集合对应的分数,包括:
按照至少两个预设完整度子维度生成所述元数据信息集合对应的子分数,其中,所述完整度子维度包括以下至少一项:多语种对照描述得分,业务用途描述得分,使用方法描述得分,枚举字段描述得分;
根据所述至少两个预设完整度子维度对应的权重与对应的所生成的子分数,生成所述元数据信息集合对应的准确度维度的分数。
3.根据权利要求1所述的方法,其中,所述预设维度包括元数据准确度;以及
所述按照至少两个预设维度生成所述元数据信息集合对应的分数,包括:
按照至少两个预设准确度子维度生成所述元数据信息集合对应的子分数,其中,所述准确度子维度包括以下至少一项:维护人信息得分,更新信息得分,枚举数据完整度得分;
根据所述至少两个预设准确度子维度对应的权重与对应的所生成的子分数,生成所述元数据信息集合对应的准确度维度的分数。
4.根据权利要求1所述的方法,其中,所述预设维度包括元数据贡献度;以及
所述按照至少两个预设维度生成所述元数据信息集合对应的分数,包括:
按照至少两个预设贡献度子维度生成所述元数据信息集合对应的子分数,其中,所述贡献度子维度包括以下至少一项:用户满意度得分,元数据热度得分,元数据权威性得分;
根据所述至少两个预设贡献度子维度对应的权重与对应的所生成的子分数,生成所述元数据信息集合对应的贡献度维度的分数。
5.根据权利要求1-4之一所述的方法,其中,在所述根据所述至少两个预设维度对应的权重与对应的所生成的分数,生成所述元数据信息集合的质量信息之前,所述方法还包括:
接收目标用户端发送的权重设置值;
基于所述权重设置值,确定以下至少一项:预设维度对应的权重,预设完整度子维度对应的权重,预设准确度子维度对应的权重,预设贡献度子维度对应的权重。
6.根据权利要求1所述的方法,其中,所述方法还包括:
将所述质量信息存入预设的数据质量信息库;
根据所述数据质量信息库中的质量信息,生成可视化报表,其中,所述可视化报表包括以下至少一项:与所述至少两个预设维度对应的分数呈现信息,质量信息的历史变化呈现信息,质量信息排名呈现信息。
7.一种获取元数据质量信息的装置,包括:
获取单元,被配置成获取针对目标数据系统的元数据信息集合;
第一生成单元,被配置成按照至少两个预设维度生成所述元数据信息集合对应的分数,其中,所述预设维度包括以下至少一项:元数据完整度,元数据准确度,元数据贡献度;
第二生成单元,被配置成根据所述至少两个预设维度对应的权重与所述至少两个预设维度对应的分数,生成所述元数据信息集合的质量信息。
8.一种获取元数据质量信息的系统,包括:
数据管理端,被配置成存储元数据;提供元数据信息管理服务;提供数据地图服务;
数据质量确定端,被配置成执行实现如权利要求1-6中任一所述的方法;
用户端,被配置成向所述数据管理端和/或所述数据质量确定端发送数据获取请求;接收与所述数据获取请求对应的响应结果。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110771592.7A CN113392076A (zh) | 2021-07-08 | 2021-07-08 | 获取元数据质量信息的方法、装置、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110771592.7A CN113392076A (zh) | 2021-07-08 | 2021-07-08 | 获取元数据质量信息的方法、装置、电子设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113392076A true CN113392076A (zh) | 2021-09-14 |
Family
ID=77625469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110771592.7A Pending CN113392076A (zh) | 2021-07-08 | 2021-07-08 | 获取元数据质量信息的方法、装置、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113392076A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241358A (zh) * | 2018-08-14 | 2019-01-18 | 中国平安财产保险股份有限公司 | 元数据管理方法、装置、计算机设备及存储介质 |
CN109657991A (zh) * | 2018-12-21 | 2019-04-19 | 江苏满运软件科技有限公司 | 元数据质量评估方法、装置、电子设备、存储介质 |
CN110098961A (zh) * | 2019-04-25 | 2019-08-06 | 北京天融信网络安全技术有限公司 | 一种数据质量评估方法、装置及存储介质 |
CN110728437A (zh) * | 2019-09-26 | 2020-01-24 | 华南师范大学 | 一种开放数据的质量评估方法及系统 |
CN111198902A (zh) * | 2018-11-16 | 2020-05-26 | 长鑫存储技术有限公司 | 元数据管理方法、装置、存储介质及电子设备 |
CN111913954A (zh) * | 2020-06-20 | 2020-11-10 | 杭州城市大数据运营有限公司 | 智能数据标准目录生成方法和装置 |
CN112699175A (zh) * | 2021-01-15 | 2021-04-23 | 广州汇智通信技术有限公司 | 一种数据治理系统及其方法 |
CN112732686A (zh) * | 2020-12-29 | 2021-04-30 | 广东省电信规划设计院有限公司 | 一种基于gp集群提高数据集市的运算方法及装置 |
US20210192389A1 (en) * | 2019-12-23 | 2021-06-24 | Beijing Zhongchuang Telecom Test Co., Ltd. | Method for ai optimization data governance |
-
2021
- 2021-07-08 CN CN202110771592.7A patent/CN113392076A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241358A (zh) * | 2018-08-14 | 2019-01-18 | 中国平安财产保险股份有限公司 | 元数据管理方法、装置、计算机设备及存储介质 |
CN111198902A (zh) * | 2018-11-16 | 2020-05-26 | 长鑫存储技术有限公司 | 元数据管理方法、装置、存储介质及电子设备 |
CN109657991A (zh) * | 2018-12-21 | 2019-04-19 | 江苏满运软件科技有限公司 | 元数据质量评估方法、装置、电子设备、存储介质 |
CN110098961A (zh) * | 2019-04-25 | 2019-08-06 | 北京天融信网络安全技术有限公司 | 一种数据质量评估方法、装置及存储介质 |
CN110728437A (zh) * | 2019-09-26 | 2020-01-24 | 华南师范大学 | 一种开放数据的质量评估方法及系统 |
US20210192389A1 (en) * | 2019-12-23 | 2021-06-24 | Beijing Zhongchuang Telecom Test Co., Ltd. | Method for ai optimization data governance |
CN111913954A (zh) * | 2020-06-20 | 2020-11-10 | 杭州城市大数据运营有限公司 | 智能数据标准目录生成方法和装置 |
CN112732686A (zh) * | 2020-12-29 | 2021-04-30 | 广东省电信规划设计院有限公司 | 一种基于gp集群提高数据集市的运算方法及装置 |
CN112699175A (zh) * | 2021-01-15 | 2021-04-23 | 广州汇智通信技术有限公司 | 一种数据治理系统及其方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109086409B (zh) | 微服务数据处理方法、装置、电子设备及计算机可读介质 | |
US10291704B2 (en) | Networked solutions integration using a cloud business object broker | |
CN111177231A (zh) | 报表生成方法和报表生成装置 | |
CN108958959B (zh) | 检测hive数据表的方法和装置 | |
KR20190128116A (ko) | 공통 스토리와 관련된 미디어-컨텐츠 아이템을 식별, 선택 및 제시하기 위한 방법 및 시스템 | |
CN108536867B (zh) | 用于生成信息的方法和装置 | |
US20210406389A1 (en) | Method and device for displaying information | |
CN110321544B (zh) | 用于生成信息的方法和装置 | |
CN110674117A (zh) | 数据建模方法、装置、计算机可读介质及电子设备 | |
US20190171777A1 (en) | Modular data insight handling for user application data | |
CN113485781A (zh) | 报表生成方法、装置、电子设备及计算机可读介质 | |
CN110737824B (zh) | 内容查询方法和装置 | |
JP6963062B1 (ja) | 情報処理装置及び情報処理方法 | |
CN116594683A (zh) | 一种代码注释信息生成方法、装置、设备及存储介质 | |
CN110866040A (zh) | 用户画像生成方法、装置和系统 | |
CN111125064A (zh) | 一种生成数据库模式定义语句的方法和装置 | |
CN111190905A (zh) | 数据库表格处理方法、装置及电子设备 | |
CN112947919A (zh) | 构建业务模型和处理业务请求的方法和装置 | |
US10289525B2 (en) | Multi-layer design response time calculator | |
Panda | Usefulness and impact of big data in libraries: An opportunity to implement embedded librarianship | |
CN111488386A (zh) | 数据查询方法和装置 | |
CN113378346A (zh) | 模型仿真的方法和装置 | |
CN110881056A (zh) | 用于推送信息的方法和装置 | |
CN113392076A (zh) | 获取元数据质量信息的方法、装置、电子设备和介质 | |
CN112256566B (zh) | 一种测试案例的保鲜方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |