CN111581285A - 数据信息的同步方法、装置、电子设备和介质 - Google Patents
数据信息的同步方法、装置、电子设备和介质 Download PDFInfo
- Publication number
- CN111581285A CN111581285A CN202010369975.7A CN202010369975A CN111581285A CN 111581285 A CN111581285 A CN 111581285A CN 202010369975 A CN202010369975 A CN 202010369975A CN 111581285 A CN111581285 A CN 111581285A
- Authority
- CN
- China
- Prior art keywords
- target
- cluster
- source
- data information
- metadata
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种数据信息的同步方法,应用于控制服务器,包括:响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件,不同组的待同步数据信息与部署于源集群中不同的特定组件对应,且与不同的源管理节点对应;控制源集群将导出的多个元数据文件分别传输至目标集群的目标管理节点,不同的元数据文件与部署于目标集群中不同的特定组件对应,且与不同的目标管理节点对应;将与多个元数据文件对应的原配置参数修改为目标配置参数,以生成对应的多个目标元数据文件,原配置参数与源集群对应,目标配置参数与目标集群对应;将多个目标元数据文件分别导入至对应的目标管理节点。还提供了一种数据信息的同步装置,电子设备及介质。
Description
技术领域
本公开涉及大数据技术领域,特别是涉及一种数据信息的同步方法、装置、电子设备和介质。
背景技术
随着企业业务的不断扩展深入,在运营管理和生产过程中将会不断地产生海量的数据,能否高效且快速地对这些产生的海量数据进行存储、整理、分析和计算,在一定程度上将直接影响到大数据在实际应用中的价值和作用。
相关技术中对大数据进行管理的方式之一是使用基于Hadoop的集群技术建立数据仓库或者数据集市。Hadoop是一种分布式系统的基础架构,可以将大量的数据分布到不同的机器上进行处理。Hadoop集群包括多个不同的生态组件,例如LDAP(LightweightDirectory Access Protocol,轻型目录访问协议)、HIVE、HDFS(Hadoop Distributed FileSystem,分布式的文件系统)以及YARN(Yet Another Resource Negotiator,另一种资源协调者)。其中,LDAP是一个开放的,中立的,工业标准的应用协议,通过IP(InternetProtocol,网际互连协议)提供访问控制和维护分布式信息的目录信息。HIVE是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供结构化查询语言(Structured Query Language,SQL)的查询功能。HDFS是适合运行在通用硬件(commodity hardware)上的分布式的文件系统,与现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。YARN的本质是资源管理器,用于控制整个集群并管理应用程序向基础计算资源的分配。
随着数据量的不断增长,Hadoop集群的数量也呈现出日益增多的趋势,如何在多个Hadoop集群之间的实现生态组件的元数据信息同步可以提高Hadoop集群的数据管理效率,因此也成为必须要关注的一个研究方向。但是,相关技术中并无成型的技术方案可以将一个Hadoop集群包含的生态组件的元数据信息同步给另一个Hadoop集群的生态组件。
发明内容
有鉴于此,为了填补在现有分布式集群体系中,业界无成型的技术方案将多个Hadoop集群之间的生态组件的元数据进行同步的空白,并因此实现将多个Hadoop集群之间的生态组件的元数据进行同步的技术效果,本公开提供了一种数据同步方法、装置、电子设备和介质。与现有技术不同,本公开提供的数据同步方法,用于在不同的Hadoop集群之间实现各生态组件的元数据同步,而且是一种可视化、定制化以及自动化的数据同步方法,使得用户可以使用基于Web的图形界面、可选式的进行不同分布式环境下Hadoop集群的任意一个或者多个生态组件的元数据的同步。
为实现上述目的,本公开的一个方面提供了一种数据信息的同步方法,应用于控制服务器,上述方法包括:响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件,不同组的待同步数据信息与部署于上述源集群中不同的特定组件对应,且与不同的源管理节点对应,控制上述源集群将导出的上述多个元数据文件分别传输至目标集群对应的目标管理节点,不同的元数据文件与部署于上述目标集群中上述不同的特定组件对应,且与不同的目标管理节点对应,将与上述多个元数据文件对应的原配置参数修改为目标配置参数,以生成对应的多个目标元数据文件,上述原配置参数与上述源集群对应,上述目标配置参数与上述目标集群对应,将上述多个目标元数据文件分别导入至对应的上述目标管理节点,以实现上述特定组件的数据信息同步。
根据本公开的实施例,上述将源集群的多组待同步数据信息导出为对应的多个元数据文件包括:将源集群的用户数据信息导出为对应的用户数据信息元数据文件,上述用户数据信息与用户信息源管理节点对应,将源集群的数据仓库元数据信息导出为对应的数据仓库元数据信息元数据文件,上述数据仓库元数据信息与数据仓库元数据源管理节点对应,将源集群的资源数据信息导出为对应的资源数据信息元数据文件,上述资源数据信息与资源数据源管理节点对应。
根据本公开的实施例,上述控制上述源集群将导出的上述多个元数据文件分别传输至目标集群对应的目标管理节点包括:控制上述源集群将导出的上述用户数据信息元数据文件传输至上述目标集群的用户信息目标管理节点之后,控制上述源集群将导出的上述数据仓库元数据信息元数据文件传输至上述目标集群的数据仓库元数据目标管理节点,同时控制上述源集群将导出的上述资源数据信息元数据文件传输至上述目标集群的资源数据目标管理节点。
根据本公开的实施例,在控制上述源集群将导出的上述多个元数据文件分别传输至目标集群对应的目标管理节点之前,上述方法还包括:检测上述目标集群中是否已存在数据信息,若是,则获取上述已存在数据信息,在上述目标集群中备份上述已存在数据信息。
根据本公开的实施例,上述方法还包括:对上述目标集群执行禁止主备切换操作。
根据本公开的实施例,上述响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件包括:接收上述源集群的源配置文件和上述目标集群的目标配置文件,上述源配置文件包含源配置参数,上述目标配置文件包含目标配置参数,基于上述源配置文件和上述目标配置文件,获取上述源集群和上述目标集群的登录状态,在上述登录状态表明上述源集群和上述目标集群登录成功的情况下,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件。
根据本公开的实施例,在将上述多个目标元数据文件分别导入至对应的上述目标管理节点之后,上述方法还包括:对上述目标集群取消上述禁止主备切换操作。
为实现上述目的,本公开的另一个方面提供了一种数据信息的同步装置,应用于控制服务器,上述装置包括:导出模块,用于响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件,不同组的待同步数据信息与部署于上述源集群中不同的特定组件对应,且与不同的源管理节点对应,传输模块,用于控制上述源集群将导出的上述多个元数据文件分别传输至目标集群对应的目标管理节点,不同的元数据文件与部署于上述目标集群中上述不同的特定组件对应,且与不同的目标管理节点对应,修改模块,用于将与上述多个元数据文件对应的原配置参数修改为目标配置参数,以生成对应的多个目标元数据文件,上述原配置参数与上述源集群对应,上述目标配置参数与上述目标集群对应,导入模块,用于将上述多个目标元数据文件分别导入至对应的上述目标管理节点,以实现上述特定组件的数据信息同步。
根据本公开的实施例,上述导出模块包括:第一导出子模块,用于将源集群的用户数据信息导出为对应的用户数据信息元数据文件,上述用户数据信息与用户信息源管理节点对应,第二导出子模块,用于将源集群的数据仓库元数据信息导出为对应的数据仓库元数据信息元数据文件,上述数据仓库元数据信息与数据仓库元数据源管理节点对应,第三导出子模块,用于将源集群的资源数据信息导出为对应的资源数据信息元数据文件,上述资源数据信息与资源数据源管理节点对应。
根据本公开的实施例,上述传输模块包括:第一传输子模块,用于控制上述源集群将导出的上述用户数据信息元数据文件传输至上述目标集群的用户信息目标管理节点之后,第二传输子模块,用于控制上述源集群将导出的上述数据仓库元数据信息元数据文件传输至上述目标集群的数据仓库元数据目标管理节点,第三传输子模块,用于同时控制上述源集群将导出的上述资源数据信息元数据文件传输至上述目标集群的资源数据目标管理节点。
根据本公开的实施例,在控制上述源集群将导出的上述多个元数据文件分别传输至目标集群对应的目标管理节点之前,上述装置还包括:检测模块,用于检测上述目标集群中是否已存在数据信息,获取模块,用于若是,则获取上述已存在数据信息,备份模块,用于在上述目标集群中备份上述已存在数据信息。
根据本公开的实施例,上述装置还包括:禁止模块,用于对上述目标集群执行禁止主备切换操作。
根据本公开的实施例,上述导出模块包括:接收子模块,用于接收上述源集群的源配置文件和上述目标集群的目标配置文件,上述源配置文件包含源配置参数,上述目标配置文件包含目标配置参数,获取子模块,用于基于上述源配置文件和上述目标配置文件,获取上述源集群和上述目标集群的登录状态,导出子模块,用于在上述登录状态表明上述源集群和上述目标集群登录成功的情况下,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件。
根据本公开的实施例,在将上述多个目标元数据文件分别导入至对应的上述目标管理节点之后,上述装置还包括:取消禁止模块,用于对上述目标集群取消上述禁止主备切换操作。
为实现上述目的,本公开的另一方面提供了一种电子设备,包括:一个或多个处理器,存储器,用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如上所述的方法。
为实现上述目的,本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,上述指令在被执行时用于实现如上所述的方法。
为实现上述目的,本公开的另一方面提供了一种计算机程序,上述计算机程序包括计算机可执行指令,上述指令在被执行时用于实现如上所述的方法。
由上可见,本公开提供的数据信息的同步方法,考虑到Hadoop集群各生态组件元数据信息底层使用的是关系型数据库存储,所以将源集群的数据库中对应的用户数据信息、数据仓库元数据信息、资源数据信息这三部分内容分别导出成元数据文件,然后分别传输到目标集群的对应目标管理节点,接着将元数据文件的配置信息修改为目标集群对应配置信息,最后导入目标集群底层的关系型数据库中,一方面可以填补在现有分布式集群体系中,业界无成型的技术方案将一个Hadoop集群包含的生态组件的元数据信息同步给另一个Hadoop集群的生态组件的空白,另一方面可以实现Hadoop集群的生态组件的数据信息的定制化同步以及自动化同步,简化数据信息同步的操作步骤,并因此可以实现避免过多集群内部操作导致的Hadoop集群出现宕机或者服务不可用等技术问题。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了适用于本公开实施例的数据信息的同步方法和装置的应用场景;
图2示意性示出了适用于本公开实施例的数据信息的同步方法和装置的系统架构;
图3示意性示出了根据本公开实施例的数据信息的同步方法的流程图;
图4示意性示出了根据本公开另一实施例的数据信息的同步方法的流程图;
图5示意性示出了根据本公开实施例的数据信息的同步装置的框图;
图6示意性示出了根据本公开实施例的适于实现上文描述的数据信息的同步方法的计算机可读存储介质产品的示意图;以及
图7示意性示出了根据本公开实施例的适于实现上文描述的数据信息的同步方法的电子设备的框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了上述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据同步装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
随着数据量的不断增长,Hadoop集群的数量也呈现出日益增多的趋势,如何在多个Hadoop集群之间的实现生态组件的元数据信息同步可以提高Hadoop集群的数据管理效率,因此也成为必须要关注的一个研究方向。但是,相关技术中并无成型的技术方案可以将一个Hadoop集群包含的生态组件的元数据信息同步给另一个Hadoop集群的生态组件。
本公开的实施例提供了一种数据信息的同步的方法、装置、电子设备和计算机可读存储介质。该数据信息的同步方法包括:首先,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件,其中,不同组的待同步数据信息与部署于源集群中不同的特定组件对应,且与不同的源管理节点对应。然后,控制源集群将导出的多个元数据文件分别传输至目标集群对应的目标管理节点,其中,不同的元数据文件与部署于目标集群中不同的特定组件对应,且与不同的目标管理节点对应。接着,将与多个元数据文件对应的原配置参数修改为目标配置参数,以生成对应的多个目标元数据文件,其中,原配置参数与源集群对应,目标配置参数与目标集群对应。最后,将多个目标元数据文件分别导入至对应的目标管理节点,以实现特定组件的数据信息同步。
本公开提供的数据信息的同步方法,一方面可以填补在现有分布式集群体系中,业界无成型的技术方案将一个Hadoop集群包含的生态组件的元数据信息同步给另一个Hadoop集群的生态组件的空白,另一方面可以实现Hadoop集群的生态组件的数据信息的定制化同步以及自动化同步,简化数据信息同步的操作步骤,并因此可以实现避免过多集群内部操作导致的Hadoop集群宕机或者服务不可用等技术问题。
图1示意性示出了适用于本公开实施例的数据信息的同步方法和装置的应用场景100。需要注意的是,图1所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的应用场景100可以包括源集群101、目标集群102、网络103和控制服务器104。
源集群101以及目标集群102可以是Hadoop集群。本公开实施例提供的数据信息的同步方法,是将源集群101中的待同步数据信息,同步至目标集群102中,即源集群101是待同步数据信息的提供方,目标集群102是待同步数据信息的接收方。
网络103用以在源集群101和目标集群102、源集群101和控制服务器104、目标集群102和控制服务器104之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
控制服务器104可以是对源集群101和目标集群102提供控制服务的服务器,例如控制源集群101将导出的多个元数据文件分别传输至目标集群102对应的目标管理节点。
需要说明的是,本公开的实施例所提供的数据信息的同步方法一般可以由控制服务器104执行。相应地,本公开的实施例所提供的数据信息的同步装置一般可以设置于控制服务器104中。本公开的实施例所提供的用户身份的识别的方法也可以由不同于控制服务器104且能够与控制服务器104通信的其他服务器中执行。
应该理解,图1中的源集群、目标集群和控制服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的源集群、目标集群和控制服务器。
本公开提供的数据信息的同步的方法可以应用在任何需要将一个Hadoop集群的生态组件对应的数据信息同步到另一个Hadoop集群的生态组件的场景。
图2示意性示出了适用于本公开实施例的数据信息的同步方法和装置的系统架构。
结合图1所示的应用场景100,本公开实施例提供的生态组件元数据同步装置的系统架构200包括参数设置装置201(包括设置参数装置2011和参数校验装置2012)、集群初始化装置202以及对应的校验装置203、LDAP用户信息同步装置204、LDAP用户信息同步装置204的校验装置205、HIVE元数据同步装置206、HIVE元数据同步装置206的校验装置207、YARN配置同步及恢复租户数据装置208以及YARN配置同步及恢复租户数据装置208的校验装置209。
具体实施时,参数设置装置201用于设置源集群101和目标集群102的参数。集群初始化装置202用于在收到用户操作前台打开页面请求时,进行前台页面服务调起,提供用于输入源集群、目标集群登录配置文件的输入接口。当服务接收到用户将源集群、目标集群的配置文件上传成功后,读取配置文件信息,将配置文件中与源集群、目标集群对应的密码作为参数传入相应程序中。校验装置203用于校验源集群101和目标集群102的初始化是否成功。LDAP用户信息同步装置204用于执行LDAP元数据同步的各项操作。校验装置205用于校验LDAP元数据同步是否成功。HIVE元数据同步装置206用于执行HIVE元数据同步的各项操作,校验装置207用于校验HIVE元数据同步是否成功。YARN配置同步及恢复租户数据装置208用于执行YARN元数据同步的各项操作,校验装置209用于校验YARN元数据同步是否成功。具体的各项操作详见图4的相关描述。
需要注意的是,图2所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他系统架构。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
图3示意性示出了根据本公开实施例的数据信息的同步方法的流程图。
如图3所示,该数据信息的同步方法可以包括操作S310~操作S340。
在操作S310,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件,不同组的待同步数据信息与部署于源集群中不同的特定组件对应,且与不同的源管理节点对应。
根据本公开的实施例,特定组件可以是图2中所示的生态组件LDAP、HIVE以及YARN。根据Hadoop集群的系统架构可知,与LDAP这一生态组件对应的待同步数据信息为用户数据信息,与HIVE这一生态组件对应的待同步数据信息为数据仓库元数据信息,与YARN这一生态组件对应的待同步数据信息为资源数据信息。
作为一种可选的实施例,将源集群的多组待同步数据信息导出为对应的多个元数据文件包括:将源集群的用户数据信息导出为对应的用户数据信息元数据文件,用户数据信息与用户信息源管理节点对应;将源集群的数据仓库元数据信息导出为对应的数据仓库元数据信息元数据文件,数据仓库元数据信息与数据仓库元数据源管理节点对应;将源集群的资源数据信息导出为对应的资源数据信息元数据文件,资源数据信息与资源数据源管理节点对应。
在操作S320,控制源集群将导出的多个元数据文件分别传输至目标集群对应的目标管理节点,不同的元数据文件与部署于目标集群中不同的特定组件对应,且与不同的目标管理节点对应。
在本公开中,管理节点也称为控制节点,包括主节点和备节点,除非特别指出是备节点的情形,其他情形中涉及的管理节点均指主节点。其中,为了便于说明,将部署于源集群上的管理节点称为源管理节点,相应地,将部署于目标集群上的管理节点称为目标管理节点。
在本公开中,不同的生态组件对应不同的管理节点。具体地,与LDAP这一生态组件对应的管理节点为用户信息管理节点,与HIVE这一生态组件对应的管理节点为数据仓库元数据管理节点,与YARN这一生态组件对应的管理节点为资源数据管理节点。
相应地,对部署于源集群的LDAP这一生态组件来说,对应的管理节点称为用户信息源管理节点,对部署于目标集群的LDAP这一生态组件来说,对应的管理节点称为用户信息目标管理节点。
相应地,对部署于源集群的HIVE这一生态组件来说,对应的管理节点称为数据仓库元数据源管理节点,对部署于目标集群的HIVE这一生态组件来说,对应的管理节点称为数据仓库元数据目标管理节点。
相应地,对部署于源集群的YARN这一生态组件来说,对应的管理节点称为资源数据源管理节点,对部署于目标集群的YARN这一生态组件来说,对应的管理节点称为资源数据目标管理节点。
具体地,可以登录源集群的(LDAP用户信息管理主节点,导出用户信息文件,传输到目标集群(LDAP用户信息管理主节点。登录源集群的hive数据仓库元数据管理主节点,导出HIVE元数据信息文件,传输到目标集群HIVE数据仓库元数据管理主节点。登录源集群的YARN资源数据管理主节点,导出YARN资源队列信息文件,传输到目标集群YARN资源数据管理主节点。
需要说明的是,为了保证将源集群中的待同步数据信息顺利成功的同步至目标集群中,在源集群中部署特定组件(LDAP、HIVE以及YARN)的情况下,同样地,在目标集群中也相应地需要部署特定组件(LDAP、HIVE以及YARN)。
作为一种优选的实施例,源集群的版本和目标集群的版本一致。
在操作S330,将与多个元数据文件对应的原配置参数修改为目标配置参数,以生成对应的多个目标元数据文件,原配置参数与源集群对应,目标配置参数与目标集群对应。
根据本公开的实施例,可以修改与用户数据信息对应的元数据文件内容,将文件中源集群IP地址替换成目标集群的IP地址。可以修改源集群传入的元数据信息文件,将其中源集群的角色标识(Identity,ID)替换为目标集群的角色标识。
具体实施时,登录目标集群用户信息管理主节点,备份并删除原目录下的用户信息文件,修改用户信息文件内容,将文件中源集群IP地址替换成目标集群的IP地址。登录目标集群数据仓库元数据管理主节点,登录管理数据库,导出数据仓库元数据,存放到备份目录。登录目标集群资源数据管理主节点,登录管理数据库,导出租户权限信息数据,存放到备份目录;修改源集群传入的元数据信息文件,将其中源集群的角色ID替换为目标集群的角色ID(Identity)。
在操作S340,将多个目标元数据文件分别导入至对应的目标管理节点,以实现特定组件的数据信息同步。
具体实施时,登录目标集群管理前台,停止目标集群服务,禁止目标集群主备切换。登录目标集群用户信息管理主节点、备节点,将修改后的用户信息文件放置到有效目录,即可完成目标集群信息导入。登录目标集群数据仓库元数据管理主节点,管理员用户登录管理数据库,导入HIVE元数据信息文件。登录目标集群资源数据管理主节点,管理员用户登录管理数据库,导入YARN资源队列信息文件。
通过本公开的实施例,可以实现Hadoop集群的生态组件的数据信息的定制化同步以及自动化同步,简化数据信息同步的操作步骤,并因此可以实现避免过多集群内部操作导致的Hadoop集群出现宕机或者服务不可用等技术问题。
作为一种可选的实施例,控制源集群将导出的多个元数据文件分别传输至目标集群对应的目标管理节点包括:控制源集群将导出的用户数据信息元数据文件传输至目标集群的用户信息目标管理节点之后;控制源集群将导出的数据仓库元数据信息元数据文件传输至目标集群的数据仓库元数据目标管理节点;同时控制源集群将导出的资源数据信息元数据文件传输至目标集群的资源数据目标管理节点。
通过本公开的实施例,在将用户数据信息元数据文件同步至目标集群的对应目标管理节点之后,将数据仓库元数据信息元数据文件和资源数据信息元数据文件可同时导入以同步至目标集群对应的目标管理节点,可以大大提升生态组件数据信息同步的效率。
作为一种可选的实施例,在执行前述操作S320(控制源集群将导出的多个元数据文件分别传输至目标集群对应的目标管理节点)之前,该方法还可以包括:检测目标集群中是否已存在数据信息;若是,则获取已存在数据信息;在目标集群中备份已存在数据信息。
根据本公开的实施例,可以将已存在数据信息复制到目标集群的备份路径下,以实现在目标集群中的备份。
通过本公开的实施例,在目标集群中已存在数据信息的情况下,将其备份,可以避免数据信息的丢失,维护数据信息的安全性和完整性。
作为一种可选的实施例,在目标集群中备份已存在数据信息之后,该方法还可以包括:对目标集群执行禁止主备切换操作。
通过本公开的实施例,在目标集群中备份已存在数据信息之后,可以先清除租户资源,再执行禁止主备切换操作,以此保证数据信息同步的顺利进行,可以避免在数据信息的同步过程中数据信息的丢失。
作为一种可选的实施例,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件包括:接收源集群的源配置文件和目标集群的目标配置文件,源配置文件包含源配置参数,目标配置文件包含目标配置参数;基于源配置文件和目标配置文件,获取源集群和目标集群的登录状态;在登录状态表明源集群和目标集群登录成功的情况下,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件。
根据本公开的实施例,在导出源集群中的待同步数据信息为元数据文件之前,还需要对源集群和目标集群进行参数校验,在验证成功的情况下,才执行上述导出操作。在验证失败的情况下,重新进行参数校验,直到验证成功为止。
通过本公开的实施例,在导出源集群的待同步数据信息之前,对源集群和目标集群进行登录状态的校验,可以使得数据信息的同步在源集群和目标集群之间顺利进行,提高数据信息同步的效率。
作为一种可选的实施例,在将多个目标元数据文件分别导入至对应的目标管理节点之后,该方法还可以包括:对目标集群取消禁止主备切换操作。
通过本公开的实施例,目标集群在取消禁止主备切换操作之后,恢复正常的主备切换操作,可以及时启动目标集群的正常服务,避免数据信息的同步给目标集群造成的服务不可用的技术问题。
本公开通过构建一个控制服务器,为其部署一个前台调度服务,该服务一端连接源Hadoop集群,另一端连接目标Hadoop集群,此外提供人机交互服务。
图4示意性示出了根据本公开另一实施例的数据信息的同步方法的流程图。
如图4所示,该数据信息的同步方法可以包括用于执行源集群和目标集群参数校验的操作S410、操作S411以及操作S412,用于执行LDAP元数据同步的操作S420、操作S421以及操作S422,用于执行HIVE元数据同步的操作S430、操作S431以及操作S432,用于执行YARN元数据同步的操作S440、操作S441、操作S442以及操作S450。
源集群和目标集群参数校验可以包括操作S410~S412。
在操作S410,输入集群参数。
在操作S411,检测参数校验是否通过。若通过,则执行操作S420。若不通过,则执行操作S412。
在操作S412,检查源集群与目标集群各参数值,并再次执行操作S411。
在具体实施时,当服务收到用户操作前台打开页面请求时,进行前台页面服务调起,提供用于输入源集群、目标集群登录配置文件的输入接口。当服务接收到用户将源集群、目标集群的配置文件上传成功后,读取配置文件信息,将配置文件中与源集群、目标集群对应的密码作为参数传入相应程序中,将分别远程登录到源集群、目标集群,部署对应程序文件,服务执行源集群、目标集群的登录,服务接收源集群、目标集群登录状态的返回值(成功或者失败)。
若服务接收到源集群、目标集群返回的集群登录状态为失败,则重新提供用于输入源集群、目标集群登录配置文件的输入接口,再重新检查源集群、目标集群登录状态,直到源集群、目标集群登录成功为止。
若服务接收到源集群、目标集群返回的集群登录信息为成功,则对用户提供执行触发选项,同时将集群操作标志置为0。若用户不触发该执行选项,则服务保留现状。若用户触发该执行选项,则服务检查集群操作标志,按与集群操作标志对应的源集群、目标集群的操作顺序依次触发对应的程序文件,禁止执行选项可用性,执行重试选项可用。若服务接收到重试操作,则检查集群操作标志,按集群操作标志触发对应步骤。
LDAP元数据同步可以包括操作S420~S422。
在操作S420,LDAP元数据同步。
在操作S421,检测LDAP元数据同步校验是否通过。若通过,则执行操作S430。若不通过,则执行操作S422。
在操作S422,检查LDAP信息同步执行过程,修复问题。
在具体实施时,首先,针对目标集群,服务进行导出用户信息数据、导出hive数据仓库元数据、导出yarn资源数据成元数据文件,复制目标集群导出的上述数据元文件到备份路径下。记录当前执行标志为1,若备份成功目标集群导出的数据元文件,则返回成功并顺序进行下一步;若返回备份失败则返回错误日志,并提供用户重试触发选项。
接着,针对目标集群,服务执行清理租户资源,执行禁止主备切换操作,执行停集群操作。记录当前执行标志为2,若执行成功则进行下一步;若执行失败则返回错误日志,并提供用户重试触发选项。
然后,针对源集群,服务执行禁止主备切换操作。记录当前标志为3,若执行成功则进行下一步;若执行失败则返回错误日志,并提供用户重试触发选项。
然后,针对源集群,服务登录源集群的用户信息管理主节点执行用户信息数据导出操作,数据压缩并拷贝(传输)到目标集群的用户信息管理主节点。记录当前标志为4,若执行成功则进行下一步;若执行失败则返回错误日志,并提供用户重试触发选项。
最后,针对目标集群,服务执行重启管理服务,登录目标集群的用户信息管理主节点对用户信息进行解压,执行修改文件中源集群信息为目标集群信息,另外将修改后的文件传输到用户信息管理备节点。记录当前标志为5,若成功则返回用户信息同步的成功标识,并进行下一步;若失败则返回错误日志,并提供用户重试触发选项。
执行HIVE元数据同步可以包括操作S430~S432。
在操作S430,HIVE元数据同步。
在操作S431,检测HIVE元数据同步校验是否通过。若通过,则执行操作S440。若不通过,则执行操作S432。
在操作S432,检查HIVE信息同步执行过程,修复问题。
在具体实施时,首先,针对源集群,服务登录管理主节点以登录管理数据库,导出HIVE数据仓库元数据信息。记录当前标志为6,若成功则进行下一步;若失败则返回错误日志,并提供用户重试触发选项。
接着,针对源集群,服务登录管理主节点将元数据信息压缩并拷贝到目标集群的管理节点。记录当前标志为7,若成功则返回元数据信息同步的成功标识,并进行下一步;若失败则返回错误日志,并提供用户重试触发选项。
最后,服务对目标集群管理节点执行数据仓库元数据信息解压,解压后将其中带有源集群的信息文件修改为目标集群信息,导入到目标集群的管理数据库。记录当前标志为8,若成功则进行下一步;若失败则返回错误日志,并提供用户重试触发选项。
YARN元数据同步可以包括操作S440~S442。
在操作S440,YARN元数据同步。
在操作S441,检测YARN元数据同步校验是否通过。若通过,则执行操作S450。若不通过,则执行操作S442。
在操作S442,检查YARN信息同步执行过程,修复问题。
在操作S450,元数据信息同步完成。
在具体实施时,首先,服务对源集群资源信息管理主节点执行导出角色权限和租户数据,压缩并拷贝到目标集群资源信息管理主节点。记录当前标志为9,若成功则进行下一步;若失败则返回错误日志,并提供用户重试触发选项。
接着,服务对目标集群资源信息管理主节点执行角色权限和租户数据解压,修改文件中源集群的角色ID为目标集群的角色ID,导入目标集群的资源数据管理主节点。记录当前标志为10,若成功则返回角色权限和租户数据解压成功,并进行下一步;若失败则返回错误日志,并提供用户重试触发选项。
然后,服务对目标集群取消禁止主备切换功能,并对目标集群执行启服务。若成功则进行下一步;若失败则返回错误日志,记录当前标志为11,并提供用户重试触发选项。
最后,服务对源集群取消禁止主备切换功能。若成功则同步完成;若失败则返回错误日志,记录当前标志为12,并提供用户重试触发选项。
具体实施时,实现用户信息同步,首先,登录源集群的管理后台数据库,获取源集群的主机名、用户信息的角色ID、浮动IP信息,将以上信息生成删除命令存储在日志文件中,传输到目标集群对应的节点;导出源集群用户信息文件,并传输到目标集群对应节点相关目录。然后,登录目标集群的管理控制窗口,执行源集群传输过来的日志文件,以删除源集群对应用户信息。登录目标集群的管理后台数据库,获取目标集群当前用户信息,写入对应的添加用户信息程序中,执行程序添加目标集群用户信息。
具体实施时,实现角色租户信息同步,首先,登录源集群的主管理节点,登录后台管理数据库,导出存放角色和租户信息的8张表,导出成csv文件形式,传输到目标集群主管理节点。获取角色和租户信息的资源管理员角色ID、包ID以及源集群基线(PID),导出成文件传输到目标集群主管理节点。然后,登录目标集群主管理节点,登录后台数据库,创建目标集群角色租户信息备份表,备份数据。删除目标集群角色租户信息原表内容。获取角色和租户信息的资源管理员角色ID、包ID以及目标集群基线(PID),将csv文件中的源集群对应资源管理员角色ID、包ID、集群基线(PID)替换成目标集群对应内容。最后将csv文件导入目标集群后台数据库。
通过本公开的实施例,在底层实现原理基础上,封装一层配置信息控制服务、任务调度控制服务及校验服务,通过前台网页控制实现,并提供可视化监控服务。
图5示意性示出了根据本公开实施例的数据信息的同步装置的框图。
如图5所示,该数据信息的同步装置500可以包括导出模块510、传输模块520、修改模块530以及导入模块540。
导出模块510,用于响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件,不同组的待同步数据信息与部署于源集群中不同的特定组件对应,且与不同的源管理节点对应。
传输模块520,用于控制源集群将导出的多个元数据文件分别传输至目标集群对应的目标管理节点,不同的元数据文件与部署于目标集群中不同的特定组件对应,且与不同的目标管理节点对应。
修改模块530,用于将与多个元数据文件对应的原配置参数修改为目标配置参数,以生成对应的多个目标元数据文件,原配置参数与源集群对应,目标配置参数与目标集群对应。
导入模块540,用于将多个目标元数据文件分别导入至对应的目标管理节点,以实现特定组件的数据信息同步。
通过本公开的实施例,可以实现Hadoop集群的生态组件的数据信息的定制化同步以及自动化同步,简化数据信息同步的操作步骤,并因此可以实现避免过多集群内部操作导致的Hadoop集群出现宕机或者服务不可用等技术问题。
作为一种可选的实施例,导出模块510可以包括:第一导出子模块,用于将源集群的用户数据信息导出为对应的用户数据信息元数据文件,用户数据信息与用户信息源管理节点对应;第二导出子模块,用于将源集群的数据仓库元数据信息导出为对应的数据仓库元数据信息元数据文件,数据仓库元数据信息与数据仓库元数据源管理节点对应;第三导出子模块,用于将源集群的资源数据信息导出为对应的资源数据信息元数据文件,资源数据信息与资源数据源管理节点对应。
作为一种可选的实施例,传输模块530可以包括:第一传输子模块,用于控制源集群将导出的用户数据信息元数据文件传输至目标集群的用户信息目标管理节点之后;第二传输子模块,用于控制源集群将导出的数据仓库元数据信息元数据文件传输至目标集群的数据仓库元数据目标管理节点;第三传输子模块,用于同时控制源集群将导出的资源数据信息元数据文件传输至目标集群的资源数据目标管理节点。
通过本公开的实施例,在将用户数据信息元数据文件同步至目标集群的对应目标管理节点之后,将数据仓库元数据信息元数据文件和资源数据信息元数据文件可同时导入以同步至目标集群对应的目标管理节点,可以大大提升生态组件数据信息同步的效率。
作为一种可选的实施例,在控制源集群将导出的多个元数据文件分别传输至目标集群对应的目标管理节点之前,该装置还可以包括:检测模块,用于检测目标集群中是否已存在数据信息;获取模块,用于若是,则获取已存在数据信息;备份模块,用于在目标集群中备份已存在数据信息。
通过本公开的实施例,在目标集群中已存在数据信息的情况下,将其备份,可以避免数据信息的丢失,维护数据信息的安全性和完整性。
作为一种可选的实施例,该装置还可以包括:禁止模块,用于对目标集群执行禁止主备切换操作。
通过本公开的实施例,在目标集群中备份已存在数据信息之后,可以先清除租户资源,再执行禁止主备切换操作,以此保证数据信息同步的顺利进行,可以避免在数据信息的同步过程中数据信息的丢失。
作为一种可选的实施例,导出模块510还可以包括:接收子模块,用于接收源集群的源配置文件和目标集群的目标配置文件,源配置文件包含源配置参数,目标配置文件包含目标配置参数;获取子模块,用于基于源配置文件和目标配置文件,获取源集群和目标集群的登录状态;导出子模块,用于在登录状态表明源集群和目标集群登录成功的情况下,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件。
通过本公开的实施例,在导出源集群的待同步数据信息之前,对源集群和目标集群进行登录状态的校验,可以使得数据信息的同步在源集群和目标集群之间顺利进行,提高数据信息同步的效率。
作为一种可选的实施例,在将多个目标元数据文件分别导入至对应的目标管理节点之后,该装置还可以包括:取消禁止模块,用于对目标集群取消禁止主备切换操作。
通过本公开的实施例,目标集群在取消禁止主备切换操作之后,恢复正常的主备切换操作,可以及时启动目标集群的正常服务,避免数据信息的同步给目标集群造成的服务不可用的技术问题。
需要说明的是,数据信息的同步装置部分的实施例方式与数据信息的同步方法部分的实施例方式对应类似,并且所达到的技术效果也对应类似,在此不再赘述。
根据本公开的实施例的模块、子模块中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,导出模块510、传输模块520、修改模块530、导入模块540、第一导出子模块、第二导出子模块、第三导出子模块、第一传输子模块、第二传输子模块、第三传输子模块、检测模块、获取模块、备份模块、禁止模块、接收子模块、获取子模块、导出子模块以及取消禁止模块中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,导出模块510、传输模块520、修改模块530、导入模块540、第一导出子模块、第二导出子模块、第三导出子模块、第一传输子模块、第二传输子模块、第三传输子模块、检测模块、获取模块、备份模块、禁止模块、接收子模块、获取子模块、导出子模块以及取消禁止模块中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,导出模块510、传输模块520、修改模块530、导入模块540、第一导出子模块、第二导出子模块、第三导出子模块、第一传输子模块、第二传输子模块、第三传输子模块、检测模块、获取模块、备份模块、禁止模块、接收子模块、获取子模块、导出子模块以及取消禁止模块中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图6示意性示出了根据本公开实施例的适于实现上文描述的数据信息的同步方法的计算机可读存储介质产品的示意图。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在设备上运行时,程序代码用于使设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的数据信息的同步的方法中的前述各项操作(或步骤),例如,电子设备可以执行如图3中根据本公开实施例提供的数据信息的同步方法流程的操作S310,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件,不同组的待同步数据信息与部署于源集群中不同的特定组件对应,且与不同的源管理节点对应。操作S320,控制源集群将导出的多个元数据文件分别传输至目标集群对应的目标管理节点,不同的元数据文件与部署于目标集群中不同的特定组件对应,且与不同的目标管理节点对应。操作S330,将与多个元数据文件对应的原配置参数修改为目标配置参数,以生成对应的多个目标元数据文件,原配置参数与源集群对应,目标配置参数与目标集群对应。操作S340,将多个目标元数据文件分别导入至对应的目标管理节点,以实现特定组件的数据信息同步。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图6所示,描述了根据本发明的实施方式的数据信息的同步程序产品60,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、系统或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆,RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言-诸如Java,C++等,还包括常规的过程式程序设计语言-诸如“C”,语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)一连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
图7示意性示出了根据本公开实施例的适于实现上文描述的数据信息的同步方法的电子设备的框图。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,根据本公开实施例的电子设备700包括处理器701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。处理器701例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器701还可以包括用于缓存用途的板载存储器。处理器701可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 703中,存储有电子设备700操作所需的各种程序和数据。处理器701、ROM702以及RAM 703通过总线704彼此相连。处理器701通过执行ROM 702和/或RAM 703中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,程序也可以存储在除ROM702和RAM 703以外的一个或多个存储器中。处理器701也可以通过执行存储在一个或多个存储器中的程序来执行根据本公开实施例提供的数据信息的同步方法流程的操作S310,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件,不同组的待同步数据信息与部署于源集群中不同的特定组件对应,且与不同的源管理节点对应。操作S320,控制源集群将导出的多个元数据文件分别传输至目标集群对应的目标管理节点,不同的元数据文件与部署于目标集群中不同的特定组件对应,且与不同的目标管理节点对应。操作S330,将与多个元数据文件对应的原配置参数修改为目标配置参数,以生成对应的多个目标元数据文件,原配置参数与源集群对应,目标配置参数与目标集群对应。操作S340,将多个目标元数据文件分别导入至对应的目标管理节点,以实现特定组件的数据信息同步。
根据本公开的实施例,电子设备700还可以包括输入/输出(I/O)接口705,输入/输出(I/O)接口705也连接至总线704。系统700还可以包括连接至I/O接口705的以下部件中的一项或多项:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被处理器701执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、子模块等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的数据信息的同步方法,包括操作S310,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件,不同组的待同步数据信息与部署于源集群中不同的特定组件对应,且与不同的源管理节点对应。操作S320,控制源集群将导出的多个元数据文件分别传输至目标集群对应的目标管理节点,不同的元数据文件与部署于目标集群中不同的特定组件对应,且与不同的目标管理节点对应。操作S330,将与多个元数据文件对应的原配置参数修改为目标配置参数,以生成对应的多个目标元数据文件,原配置参数与源集群对应,目标配置参数与目标集群对应。操作S340,将多个目标元数据文件分别导入至对应的目标管理节点,以实现特定组件的数据信息同步。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 702和/或RAM 703和/或ROM 702和RAM 703以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (16)
1.一种数据信息的同步方法,应用于控制服务器,所述方法包括:
响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件,不同组的待同步数据信息与部署于所述源集群中不同的特定组件对应,且与不同的源管理节点对应;
控制所述源集群将导出的所述多个元数据文件分别传输至目标集群对应的目标管理节点,不同的元数据文件与部署于所述目标集群中所述不同的特定组件对应,且与不同的目标管理节点对应;
将与所述多个元数据文件对应的原配置参数修改为目标配置参数,以生成对应的多个目标元数据文件,所述原配置参数与所述源集群对应,所述目标配置参数与所述目标集群对应;
将所述多个目标元数据文件分别导入至对应的所述目标管理节点,以实现所述特定组件的数据信息同步。
2.根据权利要求1所述的方法,其中,所述将源集群的多组待同步数据信息导出为对应的多个元数据文件包括:
将源集群的用户数据信息导出为对应的用户数据信息元数据文件,所述用户数据信息与用户信息源管理节点对应;
将源集群的数据仓库元数据信息导出为对应的数据仓库元数据信息元数据文件,所述数据仓库元数据信息与数据仓库元数据源管理节点对应;
将源集群的资源数据信息导出为对应的资源数据信息元数据文件,所述资源数据信息与资源数据源管理节点对应。
3.根据权利要求2所述的方法,其中,所述控制所述源集群将导出的所述多个元数据文件分别传输至目标集群对应的目标管理节点包括:
控制所述源集群将导出的所述用户数据信息元数据文件传输至所述目标集群的用户信息目标管理节点之后;
控制所述源集群将导出的所述数据仓库元数据信息元数据文件传输至所述目标集群的数据仓库元数据目标管理节点;
同时控制所述源集群将导出的所述资源数据信息元数据文件传输至所述目标集群的资源数据目标管理节点。
4.根据权利要求1所述的方法,在控制所述源集群将导出的所述多个元数据文件分别传输至目标集群对应的目标管理节点之前,所述方法还包括:
检测所述目标集群中是否已存在数据信息;
若是,则获取所述已存在数据信息;
在所述目标集群中备份所述已存在数据信息。
5.根据权利要求4所述的方法,其中,所述方法还包括:
对所述目标集群执行禁止主备切换操作。
6.根据权利要求1至5中任一项所述的方法,其中,所述响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件包括:
接收所述源集群的源配置文件和所述目标集群的目标配置文件,所述源配置文件包含源配置参数,所述目标配置文件包含目标配置参数;
基于所述源配置文件和所述目标配置文件,获取所述源集群和所述目标集群的登录状态;
在所述登录状态表明所述源集群和所述目标集群登录成功的情况下,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件。
7.根据权利要求4所述的方法,其中,在将所述多个目标元数据文件分别导入至对应的所述目标管理节点之后,所述方法还包括:
对所述目标集群取消所述禁止主备切换操作。
8.一种数据信息的同步装置,应用于控制服务器,所述装置包括:
导出模块,用于响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件,不同组的待同步数据信息与部署于所述源集群中不同的特定组件对应,且与不同的源管理节点对应;
传输模块,用于控制所述源集群将导出的所述多个元数据文件分别传输至目标集群对应的目标管理节点,不同的元数据文件与部署于所述目标集群中所述不同的特定组件对应,且与不同的目标管理节点对应;
修改模块,用于将与所述多个元数据文件对应的原配置参数修改为目标配置参数,以生成对应的多个目标元数据文件,所述原配置参数与所述源集群对应,所述目标配置参数与所述目标集群对应;
导入模块,用于将所述多个目标元数据文件分别导入至对应的所述目标管理节点,以实现所述特定组件的数据信息同步。
9.根据权利要求8所述的装置,其中,所述导出模块包括:
第一导出子模块,用于将源集群的用户数据信息导出为对应的用户数据信息元数据文件,所述用户数据信息与用户信息源管理节点对应;
第二导出子模块,用于将源集群的数据仓库元数据信息导出为对应的数据仓库元数据信息元数据文件,所述数据仓库元数据信息与数据仓库元数据源管理节点对应;
第三导出子模块,用于将源集群的资源数据信息导出为对应的资源数据信息元数据文件,所述资源数据信息与资源数据源管理节点对应。
10.根据权利要求9所述的装置,其中,所述传输模块包括:
第一传输子模块,用于控制所述源集群将导出的所述用户数据信息元数据文件传输至所述目标集群的用户信息目标管理节点之后;
第二传输子模块,用于控制所述源集群将导出的所述数据仓库元数据信息元数据文件传输至所述目标集群的数据仓库元数据目标管理节点;
第三传输子模块,用于同时控制所述源集群将导出的所述资源数据信息元数据文件传输至所述目标集群的资源数据目标管理节点。
11.根据权利要求8所述的装置,在控制所述源集群将导出的所述多个元数据文件分别传输至目标集群对应的目标管理节点之前,所述装置还包括:
检测模块,用于检测所述目标集群中是否已存在数据信息;
获取模块,用于若是,则获取所述已存在数据信息;
备份模块,用于在所述目标集群中备份所述已存在数据信息。
12.根据权利要求11所述的装置,其中,所述装置还包括:
禁止模块,用于对所述目标集群执行禁止主备切换操作。
13.根据权利要求8至12中任一项所述的装置,其中,所述导出模块包括:
接收子模块,用于接收所述源集群的源配置文件和所述目标集群的目标配置文件,所述源配置文件包含源配置参数,所述目标配置文件包含目标配置参数;
获取子模块,用于基于所述源配置文件和所述目标配置文件,获取所述源集群和所述目标集群的登录状态;
导出子模块,用于在所述登录状态表明所述源集群和所述目标集群登录成功的情况下,响应于同步请求,将源集群的多组待同步数据信息导出为对应的多个元数据文件。
14.根据权利要求11所述的装置,其中,在将所述多个目标元数据文件分别导入至对应的所述目标管理节点之后,所述装置还包括:
取消禁止模块,用于对所述目标集群取消所述禁止主备切换操作。
15.一种电子设备,包括:
一个或多个处理器;以及
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任一项所述的方法。
16.一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010369975.7A CN111581285B (zh) | 2020-04-30 | 2020-04-30 | 数据信息的同步方法、装置、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010369975.7A CN111581285B (zh) | 2020-04-30 | 2020-04-30 | 数据信息的同步方法、装置、电子设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111581285A true CN111581285A (zh) | 2020-08-25 |
CN111581285B CN111581285B (zh) | 2023-06-06 |
Family
ID=72124659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010369975.7A Active CN111581285B (zh) | 2020-04-30 | 2020-04-30 | 数据信息的同步方法、装置、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111581285B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749085A (zh) * | 2020-12-31 | 2021-05-04 | 北京知因智慧科技有限公司 | 一种跨集群的任务发布方法、装置、电子设备及存储介质 |
CN114564458A (zh) * | 2022-03-10 | 2022-05-31 | 苏州浪潮智能科技有限公司 | 集群间数据同步的方法、装置、设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102023979A (zh) * | 2009-09-09 | 2011-04-20 | 中国工商银行股份有限公司 | 元数据管理方法及系统 |
CN104317843A (zh) * | 2014-10-11 | 2015-01-28 | 上海瀚之友信息技术服务有限公司 | 一种数据同步etl系统 |
US20170006413A1 (en) * | 2013-12-23 | 2017-01-05 | Orange | A method for rendering an electronic content on a rendering device |
US9575617B1 (en) * | 2013-03-13 | 2017-02-21 | EMC IP Holding Company LLC | Navigation payload injection |
US10362092B1 (en) * | 2016-10-14 | 2019-07-23 | Nutanix, Inc. | Entity management in distributed systems |
-
2020
- 2020-04-30 CN CN202010369975.7A patent/CN111581285B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102023979A (zh) * | 2009-09-09 | 2011-04-20 | 中国工商银行股份有限公司 | 元数据管理方法及系统 |
US9575617B1 (en) * | 2013-03-13 | 2017-02-21 | EMC IP Holding Company LLC | Navigation payload injection |
US20170006413A1 (en) * | 2013-12-23 | 2017-01-05 | Orange | A method for rendering an electronic content on a rendering device |
CN104317843A (zh) * | 2014-10-11 | 2015-01-28 | 上海瀚之友信息技术服务有限公司 | 一种数据同步etl系统 |
US10362092B1 (en) * | 2016-10-14 | 2019-07-23 | Nutanix, Inc. | Entity management in distributed systems |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749085A (zh) * | 2020-12-31 | 2021-05-04 | 北京知因智慧科技有限公司 | 一种跨集群的任务发布方法、装置、电子设备及存储介质 |
CN112749085B (zh) * | 2020-12-31 | 2023-10-24 | 北京知因智慧科技有限公司 | 一种跨集群的任务发布方法、装置、电子设备及存储介质 |
CN114564458A (zh) * | 2022-03-10 | 2022-05-31 | 苏州浪潮智能科技有限公司 | 集群间数据同步的方法、装置、设备和存储介质 |
CN114564458B (zh) * | 2022-03-10 | 2024-01-23 | 苏州浪潮智能科技有限公司 | 集群间数据同步的方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111581285B (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110825420B (zh) | 分布式集群的配置参数更新方法、装置、设备及存储介质 | |
US10824525B2 (en) | Distributed data monitoring device | |
US8543916B2 (en) | System and method for recording collaborative information technology processes in an intelligent workload management system | |
US20160239392A1 (en) | Preserving management services with distributed metadata through the disaster recovery life cycle | |
US10162735B2 (en) | Distributed system test automation framework | |
EP2959387B1 (en) | Method and system for providing high availability for state-aware applications | |
US9892122B2 (en) | Method and apparatus for determining a range of files to be migrated | |
US11212175B2 (en) | Configuration management for cloud storage system and method | |
US9940379B2 (en) | Hybrid data replication | |
CN110971700B (zh) | 分布式锁的实现方法及装置 | |
US10474696B2 (en) | Replication groups for content libraries | |
CN111581285B (zh) | 数据信息的同步方法、装置、电子设备和介质 | |
US10248703B2 (en) | System and method for cluster-wide replication of embedded component configuration | |
US10802920B2 (en) | Backup and restore validation | |
US20210194929A1 (en) | Determination of Compliance with Security Technical Implementation Guide Standards | |
US10318385B2 (en) | Service recovery using snapshots and interservice messages | |
KR102114339B1 (ko) | 액티브/스탠바이 모델을 지원하는 쿠버네티스 시스템의 동작 방법 | |
CN108573049B (zh) | 数据处理方法和分布式存储装置 | |
CN109587202B (zh) | 文件校验和数据处理之间的协同处理方法、装置及系统 | |
CN111898161B (zh) | 一种hue的权限管理方法、系统、设备以及介质 | |
CN115113972A (zh) | 应用改造方法、系统、集群、介质及程序产品 | |
US20240118991A1 (en) | Application scenario injection and validation system | |
McCabe | Introducing Windows Server 2016 Technical Preview | |
US9747166B2 (en) | Self healing cluster of a content management system | |
US10701145B1 (en) | Data output using message requests to a messaging service |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |