CN109033188A - 一种元数据采集方法、装置、服务器和计算机可读介质 - Google Patents

一种元数据采集方法、装置、服务器和计算机可读介质 Download PDF

Info

Publication number
CN109033188A
CN109033188A CN201810681381.2A CN201810681381A CN109033188A CN 109033188 A CN109033188 A CN 109033188A CN 201810681381 A CN201810681381 A CN 201810681381A CN 109033188 A CN109033188 A CN 109033188A
Authority
CN
China
Prior art keywords
metadata
data source
acquisition device
information
collector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810681381.2A
Other languages
English (en)
Inventor
曾伟
姚玉兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Big Data Technologies Co Ltd
Original Assignee
New H3C Big Data Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Big Data Technologies Co Ltd filed Critical New H3C Big Data Technologies Co Ltd
Priority to CN201810681381.2A priority Critical patent/CN109033188A/zh
Publication of CN109033188A publication Critical patent/CN109033188A/zh
Pending legal-status Critical Current

Links

Abstract

本申请提供了一种元数据采集方法、装置、服务器和计算机可读介质,涉及计算机的技术领域,该方法包括:获取元数据监听器监听到的发生变更的元数据的变更信息;基于变更信息确定发生变更的元数据所属的元数据类型;确定与元数据类型相对应的目标元数据采集器,向目标元数据采集器发送采集指令,以使目标元数据采集器对发生变更的元数据进行采集,在本实施例中,在监听到数据源部分元数据发生变更时,针对该部分元数据进行采集的方式,避免了重复性的元数据采集操作,提高了元数据采集的效率,从而实现了元数据的快速采集。

Description

一种元数据采集方法、装置、服务器和计算机可读介质
技术领域
本申请涉及计算机的技术领域,尤其是涉及一种元数据采集方法、装置、服务器和计算机可读介质。
背景技术
元数据管理系统是提升共享、重新获取和理解企业信息资产水平的重要工具,是企业信息管理的润滑剂。如果企业不对元数据进行管理或管理不得当,信息将被丢失或处于隐匿状态而难以被用户使用,数据集成将十分昂贵,不能对业务进行有效支撑。其中,元数据采集是元数据管理系统的核心,亦是整个系统的基础。
当前的元数据采集主要分为手动采集和定时采集两种。手动采集是根据数据源信息,利用对应采集器去采集指定数据源中库,表,字段等属性信息。定时采集是按照指定时间去采集上述信息。
不论是手动采集还是定时采集,其技术方案如下:配置数据源:配置将要采集的数据源信息,如数据源的IP,端口,用户名,密码等。选择采集器:根据不同的数据源选择不同的采集器进行采集,比如采集Oracle数据源信息,则需要选择Oracle采集器进行元数据的采集。采集元数据:按照事先约定的规则按顺序采集对应元数据信息,比如先采集库相关元数据,然后采集表相关元数据,最后采集字段相关元数据等。
上述元数据采集方案具有以下缺点:数据量很大时,采集元数据信息很费时;重复工作很多,比如指定数据源上次采集的信息和这次采集的信息是相同的,那么这次的工作毫无意义。还有当库信息发生变更时,利用上述方法,还会采集表,字段这些没有变化的属性,这些实际没有必要,因为上一次采集已经都有这些属性了。
发明内容
有鉴于此,本申请的目的在于提供一种元数据采集方法、装置、服务器和计算机可读介质,以实现元数据的快速采集。
第一方面,本申请实施例提供了一种元数据采集方法,包括:获取元数据监听器监听到的发生变更的元数据的变更信息;基于所述变更信息确定发生变更的元数据所属的元数据类型;确定与所述元数据类型相对应的目标元数据采集器,向所述目标元数据采集器发送采集指令,以使所述目标元数据采集器对所述发生变更的元数据进行采集。
进一步地,所述元数据类型包括以下至少之一:数据源中的库信息,数据源中的表信息,数据源中的字段信息;所述元数据采集器组中包括以下至少一种元数据采集器:用于采集数据源中库信息的元数据采集器,用于采集数据源中表信息的元数据采集器,用于采集数据源中字段信息的元数据采集器。
进一步地,所述方法还包括:在所述元数据采集器组中的每个元数据采集器首次采集所述数据源的元数据时,关闭所述元数据监听器;在所述元数据采集器组中的所有元数据采集器首次采集所述数据源的元数据之后,开启所述元数据监听器。
进一步地,在向所述目标元数据采集器发送采集指令之前,所述目标元数据采集器处于关闭状态。
进一步地,一个数据源对应一个数据监听器和一个元数据采集器组。
第二方面,本申请实施例提供了一种元数据采集装置,包括:获取单元,用于获取元数据监听器监听到的发生变更的元数据的变更信息;第一确定单元,用于基于所述变更信息确定发生变更的元数据所属的元数据类型;第二确定单元,用于确定与所述元数据类型相对应的目标元数据采集器,向所述目标元数据采集器发送采集指令,以使所述目标元数据采集器对所述发生变更的元数据进行采集。
进一步地,所述元数据类型包括以下至少之一:数据源中的库信息,数据源中的表信息,数据源中的字段信息;所述元数据采集器组中包括以下至少一种元数据采集器:用于采集数据源中库信息的元数据采集器,用于采集数据源中表信息的元数据采集器,用于采集数据源中字段信息的元数据采集器。
进一步地,所述装置还用于:在所述元数据采集器组中的每个元数据采集器首次采集所述数据源的元数据时,关闭所述元数据监听器;在所述元数据采集器组中的所有元数据采集器首次采集所述数据源的元数据之后,开启所述元数据监听器。
进一步地,所述装置还用于:在向所述目标元数据采集器发送采集指令之前,所述目标元数据采集器处于关闭状态。
进一步地,一个数据源对应一个元数据监听器和一个元数据采集器组。
第三方面,本申请实施例提供了一种服务器,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的方法。
第四方面,本申请实施例提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述第一方面任一项所述的方法。
在本申请实施例中,首先,获取元数据监听器监听到的发生变更的元数据的变更信息;之后,基于变更信息确定发生变更的元数据所属的元数据类型;最后,确定与元数据类型相对应的目标元数据采集器,向目标元数据采集器发送采集指令,以使目标元数据采集器对发生变更的元数据进行采集。在本实施例中,在监听到数据源部分元数据发生变更时,针对该部分元数据进行采集的方式,避免了重复性的元数据采集操作,提高了元数据采集的效率,从而实现了元数据的快速采集。
本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的一种元数据采集方法的流程图;
图2是根据本申请实施例的一种元数据采集装置的结构示意图;
图3是根据本申请实施例的第一种可选地元数据采集方法的流程图;
图4是根据本申请实施例的第二种可选地元数据采集方法的流程图;
图5是根据本申请实施例的一种元数据采集装置的示意图;
图6是根据本申请实施例的一种服务器的示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
元数据(Meta data)为描述数据的数据,一般为结构化的数据,例如,存储在数据库里的数据,规定了字段的长度、类型等。元数据是指从信息资源中抽取出来的用于说明其特征、内容的结构化的数据,例如,如题名,版本、出版数据、相关说明、包括检索点等,用于组织、描述、检索、保存、管理信息和知识资源。针对数据库里的数据,比如表,表名,表类型,字段,字段长度等即是表的元数据信息。
元数据采集是元数据管理系统最为核心的模块,而现有的技术方案在面对大数据量时,一是采集的速度很慢,用户等待的时间很长。二是重复的工作很多,浪费不必要的资源。针对这些问题,本实施例提出了一种优化元数据采集的方案,该方案针对一个数据源通过多个不同类型的采集器,并发的采集该数据源的不同类型元数据。同时利用元数据管理器,管理不同类型数据源下的不同元数据采集器,实时监听数据源,当数据源某部分元数据信息发生变更时,针对性地采集该部分元数据信息,避免了重复性采集的操作。下面将结合具体实施例介绍该方法。
实施例1:
根据本申请实施例,提供了一种元数据采集方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的一种元数据采集方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取元数据监听器监听到的发生变更的元数据的变更信息;
具体地,变更信息中包括:发生变更的元数据的元数据类型或者能够表征发生变更的元数据的元数据类型的标识信息,以及该发生变更的元数据的变更类型,其中,变更类型包括以下至少之一:新增(或者插入),修改;元数据类型包括以下至少之一:数据源中的库信息,数据源中的表信息,数据源中的字段信息。
步骤S104,基于所述变更信息确定发生变更的元数据所属的元数据类型;
步骤S106,确定与所述元数据类型相对应的目标元数据采集器,向所述目标元数据采集器发送采集指令,以使所述目标元数据采集器对所述发生变更的元数据进行采集。
需要说明的是,上述步骤S102至步骤S106可以应用在元数据管理器上,其中,该元数据管理器用于管理元数据采集器。上述元数据管理器和元数据采集器预先设置在服务器中。
在本申请实施例中,首先,获取元数据监听器监听到的发生变更的元数据的变更信息;之后,基于变更信息确定发生变更的元数据所属的元数据类型;最后,确定与元数据类型相对应的目标元数据采集器,向目标元数据采集器发送采集指令,以使目标元数据采集器对发生变更的元数据进行采集。在本实施例中,在监听到数据源部分元数据发生变更时,针对该部分元数据进行采集的方式,避免了重复性的元数据采集操作,提高了元数据采集的效率,从而实现了元数据的快速采集。
下面结合图2具体介绍上述元数据采集方法。如图2所示,包括多种数据源,分别为PG数据源,HIVE数据源,ORACLE数据源和MPP(Massively Parallel Processing,大规模并行处理系统)数据源。其中,每个数据源对应一个元数据采集器组和一个元数据监听器。
也就是说,在本实施例中,当数据源为多个时,所述元数据监听器的数量为多个,且一个监听器用于监听一个数据源的中的元数据是否发生变化;一个数据源对应一个元数据采集器组。
上述元数据采集器组中包括以下至少一种元数据采集器:用于采集数据源中库信息的元数据采集器,用于采集数据源中表信息的元数据采集器,用于采集数据源中字段信息的元数据采集器。
需要说明的是,在本实施例中,针对同一个数据源提供了多个元数据采集器(即元数据采集器组),其中,为形象表示将元数据采集器表示为Spider。
相比较现有的元数据采集方案中,针对一个数据源提供一个元数据采集器的方式,本实施例中对同一个数据源根据元数据类型的不同,提供多个元数据采集器。
如下图2所示。从图2中可以看到,包括以下数据源:PG数据源,HIVE数据源,ORACLE数据源和MPP数据源。上述四个数据源中每个数据源都有多个不同的元数据采集器。以HIVE数据源为例,提供了HIVE库Spider,HIVE表Spider,HIVE字段Spider,以及HIVE监听Spider。
具体地,HIVE库Spider,HIVE表Spider,HIVE字段Spider分别对应采集HIVE库,表,字段元数据信息,其中,HIVE库Spider为用于采集数据源中库信息的元数据采集器,HIVE表Spider为用于采集数据源中表信息的元数据采集器;HIVE表Spider为用于采集数据源中字段信息的元数据采集器。
除了进行采集的Spider外,还额外提供了一个监听的Spider。该HIVE监听Spider用于监控HIVE数据源中的元数据是否发生变化。一旦监听到HIVE数据源中的元数据发生变更,该HIVE监听Spider则通知元数据管理器(以下简称为Spider管理器)进行对应处理。Spider管理器的作用类似于计算机中的CPU,它管理着所有的元数据采集器Spider,并根据各个监听Spider的行为,发出指令,通知对应的Spider去采集元数据信息。
也就是说,在本实施例中,通过元数据监听器监听对应数据源中的元数据是否发生变更。如果监听到发生变更,则向元数据管理器发送变更信息,元数据管理器在获取到变更信息之后,确定发生变更的元数据所属的元数据类型;并确定与该元数据类型相对应的目标元数据采集器,进而,向该目标元数据采集器发送采集指令,以使目标元数据采集器对发生变更的元数据进行采集。
实施例2:
如图3所示,在上述实施例1的基础上,可以通过以下步骤所描述的方式来生成变更信息:
步骤S301,通过所述元数据监听器每隔预设时间获取对应数据源的操作日志信息;
步骤S302,从所述操作日志信息中筛选出所述变更类型为插入和/或修改的目标日志信息;
步骤S303,根据所述目标日志信息生成所述变更信息。
当元数据监听器开启之后,元数据监听器一直处于监听状态。本申请实施例中的监听状态,是指元数据监听器在一定间隔时间去分析数据源操作日志信息,即,元数据监听器每隔预设时间获取对应数据源的操作日志信息。例如,HIVE监听Spider(HIVE数据源的元数据监听器)获取HIVE数据源的操作日志信息,PG监听Spider(PG数据源的元数据监听器)获取PG数据源的操作日志信息,ORACLE监听Spider(ORACLE数据源的元数据监听器)获取ORACLE数据源的操作日志信息。
需要说明的是,上述操作日志信息中包括对元数据进行操作的记录信息,例如,对元数据进行读取的操作日志信息,对元数据进行修改的操作日志信息等等。一般情况下,对元数据进行读取时,未修改元数据的内容。因此,在本实施例中,元数据监听器在获取到上述操作日志信息之后,会对上述操作日志信息进行筛选,以分析出变更类型为插入和/或修改的目标日志信息,进而,根据目标日志信息生成上述变更信息。
在生成上述变更信息之后,向Spider管理器发送该变更信息,由Spider管理器根据变更信息确定发生变更的元数据所属的元数据类型,进而,调用不同的Spider进行采集操作,最后将采集的元数据信息入库。
通过上述描述可知,在本实施例中,通过设置元数据监听器每隔预设时间获取对应数据源的日志信息,并对日志信息进行分析的方式,能够保证在元数据监听器监听到数据源部分元数据发生变更时,针对该部分元数据进行采集的方式,避免了重复性的元数据采集操作,提高了元数据采集的效率,从而实现了元数据的快速采集。
需要说明的是,在变更信息中包括多条变更信息的情况下,需要对每条变更信息进行分析,以从每条变更信息中读取到对应的元数据类型,进而得到至少一种元数据类型。之后,就可以向目标元数据采集器发送采集指令,以使目标元数据采集器对发生变更的元数据进行采集。
通过上述描述可知,变更信息中包括:发生变更的元数据的元数据类型或者能够发生变更的元数据的元数据类型的标识信息,以及该元数据的变更类型,其中,变更类型包括以下至少之一:新增(或者插入),修改。
实施例3:
如图4所示,在上述实施例1或实施例2的基础上,如果元数据类型包括以下至少之一:数据源中的库信息,数据源中的表信息,数据源中的字段信息;那么在本实施例中,预先设置了与元数据类型相对应的元数据采集器,该相对应的元数据采集器构成一个元数据采集器组。也就是说,在本实施例中,为每个数据源预先设置了一个元数据采集器组,其中,元数据采集器组中包括以下至少一种:用于采集数据源中库信息的元数据采集器,用于采集数据源中表信息的元数据采集器,用于采集数据源中字段信息的元数据采集器。基于此,上述步骤确定与所述元数据类型相对应的目标元数据采集器包括如下步骤:
步骤S401,基于所述元数据类型在元数据采集器组中确定所述目标元数据采集器,所述元数据采集器组中包括以下至少一种元数据采集器:用于采集数据源中库信息的元数据采集器,用于采集数据源中表信息的元数据采集器,用于采集数据源中字段信息的元数据采集器。
通过上述描述可知,在本实施例中,一个数据源对应一个元数据采集器组和一个元数据监听器。基于此,在本实施例中,元数据管理器在确定出发生变更的元数据所属的元数据类型之后,就可以在该数据源所对应的元数据采集器组中确定与该元数据类型相对应的目标元数据采集器,其中,元数据类型包括以下至少之一:数据源中的库信息,数据源中的表信息,数据源中的字段信息。
例如,如果确定出时HIVE数据源中库信息的元数据发生变更,则向与HIVE数据源相对应的元数据采集器组中用于采集数据源中库信息的元数据采集器发送采集指令,以使该元数据采集器采集HIVE数据源中库信息的元数据。
通过上述描述可知,现有的元数据采集方案,都是一个数据源配置一个元数据采集器Spider。该元数据采集器Spider按照规则去采集不同的元数据信息,比如采集HIVE数据源中库,表,字段信息时,该元数据采集器Spider先去采集库元数据信息,然后再去采集表元数据信息,最后采集字段元数据信息。这样的方案的缺点在于当数据源中元数据信息较多时,很费时;其次,当数据源信息没有发生变动时,无法避免重复操作。
针对上述问题,提出了一种元数据采集方法,该方法针对一个数据源通过多个不同类型的元数据采集器,并发的采集该数据源的不同类型元数据。同时利用元数据管理器,管理不同类型数据源下的不同元数据采集器,实时监听数据源,当数据源某部分元数据发生变更时,针对性地采集该部分元数据,避免了重复性采集的操作。
在本实施例的一个可选实施方式中,在所述元数据采集器组中的每个元数据采集器首次采集所述数据源的元数据时,关闭所述元数据监听器;在所述元数据采集器组中的所有元数据采集器首次采集所述数据源的元数据信息之后,开启所述元数据监听器。
具体地,在本实施例中,元数据采集的具体过程描述如下:
在服务器上部署完成元数据监听器,元数据采集器和元数据管理器之后,就可以执行元数据采集器的初次采集操作。即,各个元数据采集器均执行采集元数据的操作。其中,在各个元数据采集器首次采集元数据时,关闭元数据监听器。采集完毕后,将采集到的元数据保存到本地库。
在元数据采集器首次采集元数据之后,就可以启动元数据监听器,并停止元数据采集器的采集操作。一旦监听Spider(元数据监听器)监听到数据源有变更,则将变更信息发送给Spider管理器(元数据管理器)。Spider管理器(元数据管理器)基于变更信息确定发生变更的元数据的所属的元数据类型,从而驱动与该元数据类型对应的Spider进行采集,未涉及到的Spider不需要有动作。
也就是说,如果元数据采集器是非首次采集,且在元数据管理器向所述目标元数据采集器发送采集指令之前,所述元数据采集器组中的目标元数据采集器处于关闭状态。
实施例4:
本申请实施例还提供了一种元数据采集装置,该元数据采集装置主要用于执行本申请实施例上述内容所提供的元数据采集方法,以下对本申请实施例提供的元数据采集装置做具体介绍。
图5是根据本申请实施例的一种元数据采集装置的示意图,如图5所示,该元数据采集装置主要包括获取单元10,第一确定单元20和第二确定单元30,其中:
获取单元10,用于获取元数据监听器监听到的发生变更的元数据的变更信息;
第一确定单元20,用于基于所述变更信息确定发生变更的元数据所属的元数据类型;
第二确定单元30,用于确定与所述元数据类型相对应的目标元数据采集器,向所述目标元数据采集器发送采集指令,以使所述目标元数据采集器对所述发生变更的元数据进行采集。
在本申请实施例中,首先,获取元数据监听器监听到发生变更的元数据的变更信息;之后,基于变更信息确定发生变更的元数据所属的元数据类型;最后,确定与元数据类型相对应的目标元数据采集器,向目标元数据采集器发送采集指令,以使目标元数据采集器对发生变更的元数据进行采集。在本实施例中,在监听到数据源部分元数据发生变更时,针对该部分元数据进行采集的方式,避免了重复性的元数据采集操作,提高了元数据采集的效率,从而实现了元数据的快速采集。
可选地,所述元数据类型包括以下至少之一:数据源中的库信息,数据源中的表信息,数据源中的字段信息;所述元数据采集器组中包括以下至少一种元数据采集器:用于采集数据源中库信息的元数据采集器,用于采集数据源中表信息的元数据采集器,用于采集数据源中字段信息的元数据采集器。
可选地,该装置还用于:在所述元数据采集器组中的每个元数据采集器首次采集所述数据源的元数据时,关闭所述元数据监听器;在所述元数据采集器组中的所有个元数据采集器首次采集所述数据源的元数据信息之后,开启所述元数据监听器。
可选地,在向所述目标元数据采集器发送采集指令之前,所述目标元数据采集器处于关闭状态。
可选地,一个数据源对应一个数据监听器和一个元数据采集器组。
本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
本申请实施例提供的一种元数据采集装置,与上述实施例提供的一种元数据采集方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
实施例5:
参见图6,本申请实施例还提供一种服务器100,包括:处理器60,存储器61,总线62和通信接口63,所述处理器60、通信接口63和存储器61通过总线62连接;处理器60用于执行存储器61中存储的可执行模块,例如计算机程序。
其中,存储器61可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口63(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线62可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器61用于存储程序601,所述处理器60在接收到执行指令后,执行所述程序601,前述本申请实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器60中,或者由处理器60实现。
处理器60可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器60中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器60可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器61,处理器60读取存储器61中的信息,结合其硬件完成上述方法的步骤。
另外,在本申请实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
在本申请的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (12)

1.一种元数据采集方法,其特征在于,包括:
获取元数据监听器监听到的发生变更的元数据的变更信息;
基于所述变更信息确定发生变更的元数据所属的元数据类型;
确定与所述元数据类型相对应的目标元数据采集器,向所述目标元数据采集器发送采集指令,以使所述目标元数据采集器对所述发生变更的元数据进行采集。
2.根据权利要求1所述的方法,其特征在于,所述元数据类型包括以下至少之一:数据源中的库信息,数据源中的表信息,数据源中的字段信息;
所述元数据采集器组中包括以下至少一种元数据采集器:用于采集数据源中库信息的元数据采集器,用于采集数据源中表信息的元数据采集器,用于采集数据源中字段信息的元数据采集器。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在所述元数据采集器组中的每个元数据采集器首次采集所述数据源的元数据时,关闭所述元数据监听器;
在所述元数据采集器组中的所有元数据采集器首次采集所述数据源的元数据之后,开启所述元数据监听器。
4.根据权利要求2或3所述的方法,其特征在于,在向所述目标元数据采集器发送采集指令之前,所述目标元数据采集器处于关闭状态。
5.根据权利要求2所述的方法,其特征在于,一个数据源对应一个元数据监听器和一个元数据采集器组。
6.一种元数据采集装置,其特征在于,包括:
获取单元,用于获取元数据监听器监听到的发生变更的元数据的变更信息;
第一确定单元,用于基于所述变更信息确定发生变更的元数据所属的元数据类型;
第二确定单元,用于确定与所述元数据类型相对应的目标元数据采集器,向所述目标元数据采集器发送采集指令,以使所述目标元数据采集器对所述发生变更的元数据进行采集。
7.根据权利要求6所述的装置,其特征在于,所述元数据类型包括以下至少之一:数据源中的库信息,数据源中的表信息,数据源中的字段信息;
所述元数据采集器组中包括以下至少一种元数据采集器:用于采集数据源中库信息的元数据采集器,用于采集数据源中表信息的元数据采集器,用于采集数据源中字段信息的元数据采集器。
8.根据权利要求7所述的装置,其特征在于,所述装置还用于:
在所述元数据采集器组中的每个元数据采集器首次采集所述数据源的元数据时,关闭所述元数据监听器;
在所述元数据采集器组中的所有元数据采集器首次采集所述数据源的元数据之后,开启所述元数据监听器。
9.根据权利要求7或8所述的装置,其特征在于,所述装置还用于:在向所述目标元数据采集器发送采集指令之前,所述目标元数据采集器处于关闭状态。
10.根据权利要求7所述的装置,其特征在于,一个数据源对应一个元数据监听器和一个元数据采集器组。
11.一种服务器,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至5中任一项所述的方法。
12.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行上述权利要求1至5中任一项所述的方法。
CN201810681381.2A 2018-06-27 2018-06-27 一种元数据采集方法、装置、服务器和计算机可读介质 Pending CN109033188A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810681381.2A CN109033188A (zh) 2018-06-27 2018-06-27 一种元数据采集方法、装置、服务器和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810681381.2A CN109033188A (zh) 2018-06-27 2018-06-27 一种元数据采集方法、装置、服务器和计算机可读介质

Publications (1)

Publication Number Publication Date
CN109033188A true CN109033188A (zh) 2018-12-18

Family

ID=65520579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810681381.2A Pending CN109033188A (zh) 2018-06-27 2018-06-27 一种元数据采集方法、装置、服务器和计算机可读介质

Country Status (1)

Country Link
CN (1) CN109033188A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377568A (zh) * 2019-07-26 2019-10-25 北京明略软件系统有限公司 一种元数据采集方法及装置
CN111026432A (zh) * 2019-12-06 2020-04-17 中国建设银行股份有限公司 一种大数据处理平台、平台构建方法和存储介质
CN112579705A (zh) * 2019-09-27 2021-03-30 北京国双科技有限公司 元数据采集方法、装置、计算机设备和存储介质
CN112988730A (zh) * 2021-03-29 2021-06-18 国网宁夏电力有限公司电力科学研究院 一种基于企业数据盘点的元数据采集方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101047549A (zh) * 2006-04-10 2007-10-03 华为技术有限公司 数据同步系统及其方法
US20120203736A1 (en) * 2010-06-25 2012-08-09 International Business Machines Corporation Method and system using heuristics in performing batch updates of records

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101047549A (zh) * 2006-04-10 2007-10-03 华为技术有限公司 数据同步系统及其方法
US20120203736A1 (en) * 2010-06-25 2012-08-09 International Business Machines Corporation Method and system using heuristics in performing batch updates of records

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377568A (zh) * 2019-07-26 2019-10-25 北京明略软件系统有限公司 一种元数据采集方法及装置
CN112579705A (zh) * 2019-09-27 2021-03-30 北京国双科技有限公司 元数据采集方法、装置、计算机设备和存储介质
CN111026432A (zh) * 2019-12-06 2020-04-17 中国建设银行股份有限公司 一种大数据处理平台、平台构建方法和存储介质
CN112988730A (zh) * 2021-03-29 2021-06-18 国网宁夏电力有限公司电力科学研究院 一种基于企业数据盘点的元数据采集方法

Similar Documents

Publication Publication Date Title
CN109033188A (zh) 一种元数据采集方法、装置、服务器和计算机可读介质
CN106682097B (zh) 一种处理日志数据的方法和装置
CN111177222B (zh) 模型测试方法、装置及计算设备、存储介质
US20200372007A1 (en) Trace and span sampling and analysis for instrumented software
WO2013078583A1 (zh) 优化数据访问的方法及装置、优化数据存储的方法及装置
US11494395B2 (en) Creating dashboards for viewing data in a data storage system based on natural language requests
WO2015074477A1 (zh) 路径分析方法和装置
CN108875091A (zh) 一种统一管理的分布式网络爬虫系统
US9922116B2 (en) Managing big data for services
US20190034247A1 (en) Creating alerts associated with a data storage system based on natural language requests
US20150113008A1 (en) Providing automatable units for infrastructure support
CN105930502B (zh) 一种收集数据的系统、客户端和方法
CN107153702A (zh) 一种数据处理方法及装置
CN112491609A (zh) 基于业务服务的系统应用架构发现方法及系统
CN111125213A (zh) 数据采集的方法、装置及其系统
US8306953B2 (en) Online management of historical data for efficient reporting and analytics
CN111143724B (zh) 一种数据处理方法、装置、设备及介质
CN110502486B (zh) 日志处理方法、装置、电子设备和计算机可读存储介质
CN107894942B (zh) 数据表访问量的监控方法和装置
CN110928750B (zh) 数据处理方法、装置及设备
WO2016206395A1 (zh) 周报信息处理方法及装置
CN111176950A (zh) 一种监控服务器集群的网卡的方法和设备
CN113220530B (zh) 数据质量监控方法及平台
CN112631879A (zh) 数据采集方法、装置、计算机可读介质及电子设备
CN111428117A (zh) 应用程序的数据获取方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218