CN111756562B - 一种集群接管方法、系统及相关组件 - Google Patents

一种集群接管方法、系统及相关组件 Download PDF

Info

Publication number
CN111756562B
CN111756562B CN201910248079.2A CN201910248079A CN111756562B CN 111756562 B CN111756562 B CN 111756562B CN 201910248079 A CN201910248079 A CN 201910248079A CN 111756562 B CN111756562 B CN 111756562B
Authority
CN
China
Prior art keywords
node
cluster
software
target
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910248079.2A
Other languages
English (en)
Other versions
CN111756562A (zh
Inventor
何倩华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN201910248079.2A priority Critical patent/CN111756562B/zh
Publication of CN111756562A publication Critical patent/CN111756562A/zh
Application granted granted Critical
Publication of CN111756562B publication Critical patent/CN111756562B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/34Network arrangements or protocols for supporting network services or applications involving the movement of software or configuration parameters 

Abstract

本申请公开了一种集群接管方法,所述集群接管方法包括将第一集群中的所有第一节点添加至第二集群的管理平台中,并通过管理平台确定每一第一节点中的目标数据;其中,第二集群包括与每一所述第一节点对应的第二节点;根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件,并通过读取目标数据启动第二节点的目标软件,以便第二集群接管第一集群的服务;其中,目标软件为提供第一节点中对应服务的软件。本方法能够避免集群接管过程中拷贝数据丢失的情况,提高集群接管的稳定性。本申请还公开了一种集群接管系统、一种计算机可读存储介质及一种电子设备,具有以上有益效果。

Description

一种集群接管方法、系统及相关组件
技术领域
本申请涉及大数据集群领域,特别涉及一种集群接管方法、系统、一种计算机可读存储介质及一种电子设备。
背景技术
集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。很多组织一开始部署了一套大数据集群(如hadoop),当发现这套大数据集群不好管理时,需要用大数据平台管理工具(如HDP、CDH)来接管原来的集群。但是,由于原来的集群一直在运行,停止就可能影响对外的业务,上面的数据又不能丢失,这样就需要一个完善的接管方案。
现有技术中的集群接管方案为:搭建好新的Hadoop大数据集群后,把旧平台的数据拷贝新的平台上,然后用新的平台来对外提供服务。但是,一般旧的集群里有很多数据,拷贝数据需要很长的时间,在拷贝数据的过程中,数据可能会由于各种原因而导致数据丢失。
因此,如何避免集群接管过程中拷贝数据丢失的情况,提高集群接管的稳定性是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种集群接管方法、系统、一种计算机可读存储介质及一种电子设备,能够避免集群接管过程中拷贝数据丢失的情况,提高集群接管的稳定性。
为解决上述技术问题,本申请提供一种集群接管方法,该集群接管方法包括:
将第一集群中的所有第一节点添加至第二集群的管理平台中,并通过管理平台确定每一第一节点中的目标数据;其中,第二集群包括与每一所述第一节点对应的第二节点;
根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件,并通过读取目标数据启动第二节点的目标软件,以便第二集群接管第一集群的服务;其中,目标软件为提供第一节点中对应服务的软件。
可选的,根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件包括:
确定第一节点对应的服务的第一软件版本;
判断目标软件的第二软件版本与第一软件版本是否一致;
若否,则对目标软件执行兼容处理操作,以使兼容处理后的第二软件版本与第一软件版本一致;
根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件。
可选的,根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件,并通过读取目标数据启动第二节点的目标软件,包括:
根据第一节点与第二节点的对应关系确定每一第二节点对应的目标软件;
按照预设顺序在第二节点中安装并启动目标软件;其中,启动目标软件的过程具体为通过读取目标数据启动第二节点的目标软件。
可选的,通过读取目标数据启动第二节点的目标软件之前,还包括:
停止第二节点对应的第一节点的服务。
可选的,在通过读取目标数据启动第二节点的目标软件之后,还包括:
判断目标软件是否在第二节点中正常运行;
若否,则停止目标软件,并通过读取目标数据启动第二节点对应的第一节点的服务。
可选的,在第二集群接管第一集群的服务之后,还包括:
断开第一远程数据服务器的连接,并将第一远程数据服务器的全部数据拷贝至第二远程数据服务器;
将第二集群的所有第二节点切换至第二远程数据服务器。
本申请还提供了一种集群接管系统,该集群接管系统包括:
数据确定模块,用于将第一集群中的所有第一节点添加至第二集群的管理平台中,并通过管理平台确定每一第一节点中的目标数据;其中,第二集群包括与每一所述第一节点对应的第二节点;
接管模块,用于根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件,并通过读取目标数据启动第二节点的目标软件,以便第二集群接管第一集群的服务;其中,目标软件为提供第一节点中对应服务的软件。
可选的,接管模块包括:
版本检测单元,用于确定第一节点对应的服务的第一软件版本;还用于判断目标软件的第二软件版本与第一软件版本是否一致;
版本兼容单元,用于当第二软件版本与第一软件版本不一致时,对目标软件执行兼容处理操作,以使兼容处理后的第二软件版本与第一软件版本一致;
软件安装单元,用于根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件;
软件启动单元,用于通过读取目标数据启动第二节点的目标软件。
可选的,接管模块包括:
软件确定单元,用于根据第一节点与第二节点的对应关系确定每一第二节点对应的目标软件;
启动单元,用于按照预设顺序在第二节点中安装并启动目标软件;其中,启动目标软件的过程具体为通过读取目标数据启动第二节点的目标软件。
可选的,还包括:
服务停止模块,用于停止第二节点对应的第一节点的服务。
可选的,还包括:
回滚模块,用于判断目标软件是否在第二节点中正常运行;若否,则停止目标软件,并通过读取目标数据启动第二节点对应的第一节点的服务。
可选的,该系统还包括:
远程数据服务切换模块,用于断开第一远程数据服务器的连接,并将第一远程数据服务器的全部数据拷贝至第二远程数据服务器;还用于将第二集群的所有第二节点切换至第二远程数据服务器。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序执行时实现上述集群接管方法执行的步骤。
本申请还提供了一种电子设备,包括存储器和处理器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时实现上述集群接管方法执行的步骤。
本申请提供了一种集群接管方法,包括将第一集群中的所有第一节点添加至第二集群的管理平台中,并通过管理平台确定每一第一节点中的目标数据;其中,第二集群包括与每一所述第一节点对应的第二节点;根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件,并通过读取目标数据启动第二节点的目标软件,以便第二集群接管第一集群的服务;其中,目标软件为提供第一节点中对应服务的软件。
本申请通过将第一集群中的第一节点添加到第二集群的管理平台中,可以通过管理平台管理第一节点,进而确定每一第一节点对应的目标数据,目标数据为第一节点上运行提供某服务的相关软件时使用到的数据。第二集群中存在有与所有第一节点一一对应的第二节点,进一步本申请在第二节点安装对应的目标软件,并利用之前确定的目标数据启动目标软件以实现在第二节点上提供第一节点对应的相关服务,当所有的第二节点均利用对应的目标数据启动目标软件之后可以实现第二集群接管第一集群的服务。由于上述集群接管过程中,第二集群利用的是第一集群中的目标数据启动目标软件,并不存在数据拷贝的操作。数据拷贝操作涉及数据的传输和存储等操作,因此可能会存在由于网络状况影响数据传输效率、数据存储过程中数据丢失和数据损坏问题,而且当第一集群的目标数据的数据量过大时数据拷贝操作需要消耗过多的时间,数据拷贝操作会降低集群接管效率。由于本申请读取目标数据相当于实时获取目标数据,不涉及数据传输和数据存储,能够避免数据拷贝操作过程中带来的数据丢失、数据损坏、传输效率较低等问题。因此本申请可以避免集群接管过程中拷贝数据丢失的情况,提高集群接管的稳定性。本申请同时还提供了一种集群接管系统、一种计算机可读存储介质和一种电子设备,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种集群接管方法的流程图;
图2为本申请实施例所提供的一种目标软件的安装方法的流程图;
图3为本申请实施例所提供的一种目标软件的启动方法的流程图;
图4为本申请实施例所提供的一种集群的远程数据拷贝方法的流程图;
图5为本申请实施例所提供的一种集群接管系统的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在现有技术的集群接管过程中,为了使新集群能够接管旧集群的服务,需要将旧集群的所有节点对应的目标数据拷贝至新集群,才能够启动新集群进行集群接管。但是,该现有技术在数据拷贝过程中极易出现数据丢失的状况,且整体数据拷贝的耗时较长,为了保持数据一致性,往往需要停止旧集群的所有服务。基于现有技术中集群接管的种种缺陷本申请提供了以下对于集群接管操作的进行优化的实施方式。
下面请参见图1,图1为本申请实施例所提供的一种集群接管方法的流程图。
具体步骤可以包括:
S101:将第一集群中的所有第一节点添加至第二集群的管理平台中,并通过管理平台确定每一第一节点中的目标数据;
其中,第二集群可以包括多个第二节点,第一节点与第二节点一一对应。本实施例的目的在于利用第二集群接管第一集群,使原本第一集群上的服务继续在第二集群上实现,也就是说本实施例中的第一集群相当于原集群,第二集群相当于新集群,本实施例可以广泛应用于新旧集群接管的应用场景中。由于第二集群是能够接管第一集群的集群,因此在第二集群中存在与第一集群中的所有第一节点一一对应的第二节点。节点指构成集群的单独的操作系统,不同类型的节点能够提供不同的服务,例如Namenode节点用于维护文件系统的目录结构并管理文件与Block之间的对应关系,Secondarynode节点用于监控HDFS状态的辅助后台程序。
若需要管理第一集群的节点,就必须把第一集群添加到第二集群的管理平台(如ambari)中,这样就能对此节点进行管理的操作,如在第一节点上安装、运行服务,监控第一节点的状态等。本步骤在将所有的第一节点添加至第二集群的管理平台之后,可以通过管理平台对所有的第一节点进行调用、启动、关闭等操作,当然可以通过管理平台确定每一第一节点中的目标数据。需要说明的是,此处确定目标数据可以为确定目标数据的地址,以便根据该地址调用对应的目标数据。
需要说明的是,第一集群中可以包括多个第一节点,每一个第一节点都可以存在对应的目标数据,本步骤确定的是多个第一节点各自的目标数据。作为一种可行的实施方式,可以记录每一第一节点与目标数据的对应关系,以便在执行S102时利用该对应关系安装相应的目标软件。举例说明上述论述,存在第一节点A1和第一节点B2,确定第一节点A1对应的目标数据为a,第二节点B1对应的目标数据为b,可以记录A1-a,B1-b的对应关系。当新集群中的第二节点A2替换第一节点A1时,可以根据之前记录的对应关系A1-a读取目标数据a,进而实现第二节点A2的启动。目标数据具体是指第一节点上的软件在运行过程中需要调用的数据,可以包括数据和元数据,若无目标数据,第一节点上的软件提供的服务将会出现数据丢失或业务中断的状况。
本实施例并不限定集群的种类,具体的第一集群和第二集群可以为Hadoop大数据集群。
S102:根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件,并通过读取目标数据启动第二节点的目标软件,以便第二集群接管第一集群的服务;
其中,目标软件为提供第一节点中对应服务的软件。可以理解的是,若想实现第二集群接管第一集群必须在第二集群的第二节点上启动每一第一节点对应的服务。第一节点上安装有相关软件,通过在第一节点上运行相关软件可以提供对应的服务,若想实现接管需要在第二节点上进行相关软件的安装、运行等操作。
需要说明的是,由于所有第一节点所提供的服务不尽相同,因此每一第一节点上安装的软件也并不完全相同,在本步骤中根据第一节点与第二节点的对应关系在第二节点对应的目标软件。在第二节点安装目标软件后,本实施例通过读取目标数据来启动目标软件以实现第二节点接管第一节点的服务,该过程读取的目标数据是第一集群内的数据,无需进行第一集群和第二集群之间的数据拷贝操作。数据拷贝操作涉及数据的传输和存储等操作,因此可能会存在由于网络状况影响数据传输效率、数据存储过程中数据丢失和数据损坏问题,而且当第一集群的目标数据的数据量过大时数据拷贝操作需要消耗过多的时间,数据拷贝操作会降低集群接管效率。由于本实施例读取目标数据相当于实时获取目标数据,不涉及数据传输和数据存储,因此能够避免数据拷贝操作过程中带来的数据丢失、数据损坏、传输效率较低等问题。当所有的第一节点对应的第二节点均通过读取目标数据启动对应的目标软件之后,相当于将第一集群对应的所有服务都接管至第二集群,即实现了第二集群对于第一集群的接管。需要补充的是,本实施例默认目标软件需要安装到同样的位置,使用原有的目标数据,使得数据无需拷贝。
本实施例通过将第一集群中的第一节点添加到第二集群的管理平台中,可以通过管理平台管理第一节点,进而确定每一第一节点对应的目标数据,目标数据为第一节点上运行提供某服务的相关软件时使用到的数据。第二集群中存在有与所有第一节点一一对应的第二节点,进一步本实施例在第二节点安装对应的目标软件,并利用之前确定的目标数据启动目标软件以实现在第二节点上提供第一节点对应的相关服务,当所有的第二节点均利用对应的目标数据启动目标软件之后可以实现第二集群接管第一集群的服务。由于上述集群接管过程中,第二集群利用的是第一集群中的目标数据启动目标软件,并不存在数据拷贝的操作。数据拷贝操作涉及数据的传输和存储等操作,因此可能会存在由于网络状况影响数据传输效率、数据存储过程中数据丢失和数据损坏问题,而且当第一集群的目标数据的数据量过大时数据拷贝操作需要消耗过多的时间,数据拷贝操作会降低集群接管效率。由于本申请读取目标数据相当于实时获取目标数据,不涉及数据传输和数据存储,能够避免数据拷贝操作过程中带来的数据丢失、数据损坏、传输效率较低等问题。因此本实施例可以避免集群接管过程中拷贝数据丢失的情况,提高集群接管的稳定性。
下面请参见图2,图2为本申请实施例所提供的一种目标软件的安装方法的流程图;本实施例是对图1对应的实施例中S102的进一步介绍,本实施例中在安装目标软件之前首先对于目标软件的版本进行判断及兼容处理,使得目标软件可以使用第一集群中的目标数据,可以将本实施例与图1对应的实施例进行结合得到更为优选的实施方式,本实施例的具体步骤可以包括:
S201:确定第一节点对应的服务的第一软件版本;
其中,集群中能够提供某项服务的软件可以存在多种版本,因此图1对应的实施例中提到的目标软件可以与相对应的第一节点的原软件的软件版本不同,此处首先确定第一节点中用于提供服务的软件的第一软件版本。本实施例的目的在于使第二集群的目标软件版本与将要接管的软件版本保持一致,使得文件数据能够兼容、共同使用。
S202:判断目标软件的第二软件版本与第一软件版本是否一致;若是,则进入S204;若否,则进入S203;
由于不同版本软件的服务持久化的数据格式可能不一样,若目标软件的第二软件版本与原软件的第一软件版本不一致,将会导致第二节点启动目标软件后的新服务不能使用老的数据(即目标数据),所以需要把新服务的软件版本与旧平台(即第一集群)的保持一致,如果不一致就需要做兼容处理。
S203:对目标软件执行兼容处理操作,以使兼容处理后的第二软件版本与第一软件版本一致,进入S204;
其中,本步骤建立在判断第一软件版本与第二软件版本不一致的前提下,可以根据第一软件版本对目标软件执行兼容处理操作,最终达到兼容处理后的目标软件的软件版本与第一软件版本一致的目的。作为一种优选的实施方式,可以通过替换第二集群原有的rpm包的方法,新的rpm包使用旧集群的程序制作出来,这样安装后版本就能与第一集群的软件版本一样。在本实施例的基础上为了目标软件可以使用第一集群的存储目录,使用目标数据,可以保持第二集群的配置与第一集群的配置一致。
S204:根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件。
本实施例通过对第一节点和第二节点对应的软件版本进行了比对,当存在第一节点对应的旧服务的软件版本与第二节点对应的新服务的软件版本不一致的情况下,需要进行软件版本兼容处理操作,以便目标软件可以使用第一集群的目标数据。
下面请参见图3,图3为本申请实施例所提供的一种目标软件的启动方法的流程图;本实施例是对图1对应的实施例中S102的进一步介绍,本实施例对如何启动第一节点的服务进行了具体的描述,可以将本实施例与图1对应的实施例进行结合得到更为优选的实施方式,本实施例的具体步骤可以包括:
S301:根据第一节点与第二节点的对应关系确定每一第二节点对应的目标软件;
S302:按照预设顺序在第二节点中安装并启动目标软件;
其中,启动目标软件的过程具体为通过读取目标数据启动第二节点的目标软件。
本实施例默认在启动某一第二节点的目标软件之前会停止该第二节点对应的第一节点的原服务,再启动目标软件。由于第二集群中可以存在多个第二节点,若统一对所有的第二节点进行启动目标软件的操作将会存在业务中断的状况,因此在本实施例中可以按照预设顺序选择当前时刻需要启动的第二节点对应的服务,分批次的对第二集群中的第二节点执行目标软件的安装启动操作。
由于集群中很多服务都是高可用运行的,其中一个节点出问题并不会造成服务中断,整个集群还能正常对外提供服务。因此,作为一种优选的实施方式,可以采取逐个替换服务的节点(即逐个的用第二节点替换第一节点),这样可以保证服务不中断,出错还不会带来影响,可简单恢复到原来的状态。每个服务的每个节点的替换过程可以包括以下步骤:首先使用第二集群的部署服务方式来安装好相应的目标软件,保留第一集群中的原软件;其次,在安装新的服务完成后,停止原有的服务;最后目标软件通过使用原软件相同的配置文件读取原来的数据来启动程序。上述这种优选的实施方式保持每个服务逐个节点接管,可以实现对外不中断服务。另外,这种安装软件使用冗余的方式,部署多一次,两套软件同时能存在,可以实现原服务的快速恢复。
在上述优选的实施方式的基础上,在启动目标软件之后还可以进行以下改进:判断目标软件是否在第二节点中正常运行;若否,则停止目标软件,并通过读取目标数据启动第二节点对应的第一节点的服务。上述改进通过失败回滚的方式当目标软件在第二节点上启动失败或者运行不正常的时候,停止第二节点上的新服务,然后把第一集群中对应的节点的服务启动,这样就能恢复到替换前的状态。
下面请参见图4,图4为本申请实施例所提供的一种集群的远程数据拷贝方法的流程图;
S401:断开第一远程数据服务器的连接,并将第一远程数据服务器的全部数据拷贝至第二远程数据服务器;
S402:将第二集群的所有第二节点切换至第二远程数据服务器。
由于远程数据(如保存在zookeeper上的kafka远程数据)会影响集群的协调,但一般不会实时更新,外界不会直接访问服务的远程数据,所以很多时候与远程数据的服务器短暂中断并不会影响对外提供的服务,并且远程数据通常很少全部拷贝的时间很短。因此,远程数据的迁移可以通过断开第一集群与远程数据服务器的连接,将第一集群对应的远程数据服务器上的数据全部拷贝到第二集群,切换第二集群的所有第二节点到新的远程数据服务器。具体的,可以通过修改dns服务器的方式就能整体切换。可以将第一集群对应的数据分成本地数据(即目标数据,如kafka的生产数据)和远程数据(如zookeeper),针对特点采用不同的方式接管,先接管本地数据,再切换远程的数据,远程元数据量少影响小使用直接拷贝的方式。
当然,为了达到最优的实施效果可以将图1、图2、图3和图4对应的实施例进行结合得到最为优选的实施方式。通过接管第一集群的数据,减少大量的数据拷贝。先把要接管的服务的第一节点添加到第二集群的管理平台中,然后把对应的软件重复装到相同的位置,停止了旧的服务,新的服务使用旧的数据启动,新的服务由新的平台来管理,这样就能完成接管。由于新服务启动时直接使用原来的存储数据只要配置一致即可,因此改动量很少。上述过程使用的数据还是原来第一集群中的数据,没有迁移的过程,不会存在数据丢失的状况。新服务的节点逐个起来,原来的高可用集群停止一两个节点是没有任何影响,可以保证对外服务不中断。上述过程没有数据迁移、备份等操作,因此操作简单,风险较低。由于存在失败回滚流程,万一目标软件启动失败,可以直接把新服务停止把原来的服务启动,集群的稳定性较高。
请参见图5,图5为本申请实施例所提供的一种集群接管系统的结构示意图;
该系统可以包括:
数据确定模块100,用于将第一集群中的所有第一节点添加至第二集群的管理平台中,并通过管理平台确定每一第一节点中的目标数据;其中,第二集群包括与每一所述第一节点对应的第二节点;
接管模块200,用于根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件,并通过读取目标数据启动第二节点的目标软件,以便第二集群接管第一集群的服务;其中,目标软件为提供第一节点中对应服务的软件。
本实施例通过将第一集群中的第一节点添加到第二集群的管理平台中,可以通过管理平台管理第一节点,进而确定每一第一节点对应的目标数据,目标数据为第一节点上运行提供某服务的相关软件时使用到的数据。第二集群中存在有与所有第一节点一一对应的第二节点,进一步本实施例在第二节点安装对应的目标软件,并利用之前确定的目标数据启动目标软件以实现在第二节点上提供第一节点对应的相关服务,当所有的第二节点均利用对应的目标数据启动目标软件之后可以实现第二集群接管第一集群的服务。由于上述集群接管过程中,第二集群利用的是第一集群中的目标数据启动目标软件,并不存在数据拷贝的操作。数据拷贝操作涉及数据的传输和存储等操作,因此可能会存在由于网络状况影响数据传输效率、数据存储过程中数据丢失和数据损坏问题,而且当第一集群的目标数据的数据量过大时数据拷贝操作需要消耗过多的时间,数据拷贝操作会降低集群接管效率。由于本申请读取目标数据相当于实时获取目标数据,不涉及数据传输和数据存储,能够避免数据拷贝操作过程中带来的数据丢失、数据损坏、传输效率较低等问题。因此本实施例可以避免集群接管过程中拷贝数据丢失的情况,提高集群接管的稳定性。
进一步的,接管模块200包括:
版本检测单元,用于确定第一节点对应的服务的第一软件版本;还用于判断目标软件的第二软件版本与第一软件版本是否一致;
版本兼容单元,用于当第二软件版本与第一软件版本不一致时,对目标软件执行兼容处理操作,以使兼容处理后的第二软件版本与第一软件版本一致;
软件安装单元,用于根据第一节点与第二节点的对应关系在第二节点中安装对应的目标软件;
软件启动单元,用于通过读取目标数据启动第二节点的目标软件。
进一步的,接管模块200包括:
软件确定单元,用于根据第一节点与第二节点的对应关系确定每一第二节点对应的目标软件;
启动单元,用于按照预设顺序在第二节点中安装并启动目标软件;其中,启动目标软件的过程具体为通过读取目标数据启动第二节点的目标软件。
进一步的,该系统还包括:
服务停止模块,用于停止第二节点对应的第一节点的服务。
进一步的,该系统还包括:
回滚模块,用于判断目标软件是否在第二节点中正常运行;若否,则停止目标软件,并通过读取目标数据启动第二节点对应的第一节点的服务。
进一步的,该系统还包括:
远程数据服务切换模块,用于断开第一远程数据服务器的连接,并将第一远程数据服务器的全部数据拷贝至第二远程数据服务器;还用于将第二集群的所有第二节点切换至第二远程数据服务器。
由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请还提供了一种电子设备,可以包括存储器和处理器,存储器中存有计算机程序,处理器调用存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然电子设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (14)

1.一种集群接管方法,其特征在于,包括:
将第一集群中的所有第一节点添加至第二集群的管理平台中以便所述第二集群的管理平台对所述第一集群中的所有第一节点进行管理,并通过所述管理平台确定每一所述第一节点中的目标数据;其中,所述第二集群包括与每一所述第一节点对应的第二节点;
根据所述第一节点与所述第二节点的对应关系在所述第二节点中安装对应的目标软件,并通过读取所述目标数据启动所述第二节点的目标软件,以便所述第二集群接管所述第一集群的服务;其中,所述目标软件为提供所述第一节点中对应服务的软件。
2.根据权利要求1所述集群接管方法,其特征在于,根据所述第一节点与所述第二节点的对应关系在所述第二节点中安装对应的目标软件包括:
确定所述第一节点对应的服务的第一软件版本;
判断所述目标软件的第二软件版本与所述第一软件版本是否一致;
若否,则对所述目标软件执行兼容处理操作,以使兼容处理后的第二软件版本与所述第一软件版本一致;
根据所述第一节点与所述第二节点的对应关系在所述第二节点中安装对应的目标软件。
3.根据权利要求1所述集群接管方法,其特征在于,根据所述第一节点与所述第二节点的对应关系在所述第二节点中安装对应的目标软件,并通过读取所述目标数据启动所述第二节点的目标软件,包括:
根据所述第一节点与所述第二节点的对应关系确定每一所述第二节点对应的目标软件;
按照预设顺序在所述第二节点中安装并启动所述目标软件;其中,启动所述目标软件的过程具体为通过读取所述目标数据启动所述第二节点的目标软件。
4.根据权利要求1所述集群接管方法,其特征在于,所述通过读取所述目标数据启动所述第二节点的目标软件之前,还包括:
停止所述第二节点对应的所述第一节点的服务。
5.根据权利要求1所述集群接管方法,其特征在于,在通过读取所述目标数据启动所述第二节点的目标软件之后,还包括:
判断所述目标软件是否在所述第二节点中正常运行;
若否,则停止所述目标软件,并通过读取所述目标数据启动所述第二节点对应的所述第一节点的服务。
6.根据权利要求1至5任一项所述集群接管方法,其特征在于,在所述第二集群接管所述第一集群的服务之后,还包括:
断开第一远程数据服务器的连接,并将所述第一远程数据服务器的全部数据拷贝至第二远程数据服务器;
将所述第二集群的所有第二节点切换至所述第二远程数据服务器。
7.一种集群接管系统,其特征在于,包括:
数据确定模块,用于将第一集群中的所有第一节点添加至第二集群的管理平台中以便所述第二集群的管理平台对所述第一集群中的所有第一节点进行管理,并通过所述管理平台确定每一所述第一节点中的目标数据;其中,所述第二集群包括与每一所述第一节点对应的第二节点;
接管模块,用于根据所述第一节点与所述第二节点的对应关系在所述第二节点中安装对应的目标软件,并通过读取所述目标数据启动所述第二节点的目标软件,以便所述第二集群接管所述第一集群的服务;其中,所述目标软件为提供所述第一节点中对应服务的软件。
8.根据权利要求7所述集群接管系统,其特征在于,所述接管模块包括:
版本检测单元,用于确定所述第一节点对应的服务的第一软件版本;还用于判断所述目标软件的第二软件版本与所述第一软件版本是否一致;
版本兼容单元,用于当所述第二软件版本与所述第一软件版本不一致时,对所述目标软件执行兼容处理操作,以使兼容处理后的第二软件版本与所述第一软件版本一致;
软件安装单元,用于根据所述第一节点与所述第二节点的对应关系在所述第二节点中安装对应的目标软件;
软件启动单元,用于通过读取所述目标数据启动所述第二节点的目标软件。
9.根据权利要求7所述集群接管系统,其特征在于,所述接管模块包括:
软件确定单元,用于根据所述第一节点与所述第二节点的对应关系确定每一所述第二节点对应的目标软件;
启动单元,用于按照预设顺序在所述第二节点中安装并启动所述目标软件;其中,启动所述目标软件的过程具体为通过读取所述目标数据启动所述第二节点的目标软件。
10.根据权利要求7所述集群接管系统,其特征在于,还包括:
服务停止模块,用于停止所述第二节点对应的所述第一节点的服务。
11.根据权利要求7所述集群接管系统,其特征在于,还包括:
回滚模块,用于判断所述目标软件是否在所述第二节点中正常运行;若否,则停止所述目标软件,并通过读取所述目标数据启动所述第二节点对应的所述第一节点的服务。
12.根据权利要求7至11任一项所述集群接管系统,其特征在于,还包括:
远程数据服务切换模块,用于断开第一远程数据服务器的连接,并将所述第一远程数据服务器的全部数据拷贝至第二远程数据服务器;还用于将所述第二集群的所有第二节点切换至所述第二远程数据服务器。
13.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述集群接管方法的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述集群接管方法的步骤。
CN201910248079.2A 2019-03-29 2019-03-29 一种集群接管方法、系统及相关组件 Active CN111756562B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910248079.2A CN111756562B (zh) 2019-03-29 2019-03-29 一种集群接管方法、系统及相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910248079.2A CN111756562B (zh) 2019-03-29 2019-03-29 一种集群接管方法、系统及相关组件

Publications (2)

Publication Number Publication Date
CN111756562A CN111756562A (zh) 2020-10-09
CN111756562B true CN111756562B (zh) 2023-07-14

Family

ID=72672348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910248079.2A Active CN111756562B (zh) 2019-03-29 2019-03-29 一种集群接管方法、系统及相关组件

Country Status (1)

Country Link
CN (1) CN111756562B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873534A (zh) * 2012-12-18 2014-06-18 中国移动通信集团公司 一种应用集群迁移方法及装置
CN104239493A (zh) * 2014-09-09 2014-12-24 北京京东尚科信息技术有限公司 跨集群数据迁移方法和系统
CN106603592A (zh) * 2015-10-15 2017-04-26 中国电信股份有限公司 一种用于基于服务模型的应用集群迁移的方法和迁移装置
CN106844510A (zh) * 2016-12-28 2017-06-13 北京五八信息技术有限公司 一种分布式数据库集群的数据迁移方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2843210B1 (fr) * 2002-08-02 2005-10-14 Meiosys Procede de migration de connexions dans une architecture multi-ordinateurs, procede pour realiser une continuite de fonctionnement mettant en oeuvre ce procede de migration, et systeme multi-ordinateurs ainsi equipe.
US7730486B2 (en) * 2005-02-28 2010-06-01 Hewlett-Packard Development Company, L.P. System and method for migrating virtual machines on cluster systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873534A (zh) * 2012-12-18 2014-06-18 中国移动通信集团公司 一种应用集群迁移方法及装置
CN104239493A (zh) * 2014-09-09 2014-12-24 北京京东尚科信息技术有限公司 跨集群数据迁移方法和系统
CN106603592A (zh) * 2015-10-15 2017-04-26 中国电信股份有限公司 一种用于基于服务模型的应用集群迁移的方法和迁移装置
CN106844510A (zh) * 2016-12-28 2017-06-13 北京五八信息技术有限公司 一种分布式数据库集群的数据迁移方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"大小文件跨网络集群快速迁移协议";何雄;《中国优秀硕士学位论文全文数据库信息科技辑》;20160215;全文 *

Also Published As

Publication number Publication date
CN111756562A (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
CN107515776B (zh) 业务不间断升级方法、待升级节点和可读存储介质
US20210064442A1 (en) Implementing An Application Manifest In A Node-Specific Manner Using An Intent-Based Orchestrator
US10956374B2 (en) Data recovery method, apparatus, and system
WO1995027941A1 (fr) Methode de mise a jour et de retablissement d'un fichier systeme
CN109634638B (zh) 一种集群软件升级方法、装置、设备及介质
CN112463450B (zh) 一种增量备份管理方法、系统、电子设备及存储介质
US20120324436A1 (en) Method of updating versioned software using a shared cache
CN102681917A (zh) 一种操作系统及其修复方法
CN111176900A (zh) 一种分布式存储系统及其数据恢复方法、装置和介质
CN111240892A (zh) 数据备份方法及装置
CN101877655A (zh) 网络管理系统、网管服务器和方法
CN112130761A (zh) 一种存储系统的扩容方法、系统及相关装置
US20130086572A1 (en) Generation apparatus, generation method and computer readable information recording medium
CN112860787A (zh) 分布式主从系统中主节点的切换方法、主节点设备和存储介质
CN114510464A (zh) 一种高可用数据库的管理方法和管理系统
CN111444039B (zh) 缓存数据回退方法以及缓存数据回退装置
CN111756562B (zh) 一种集群接管方法、系统及相关组件
CN115658390A (zh) 容器容灾方法、系统、装置、设备及计算机可读存储介质
CN112231150B (zh) 数据库集群中故障数据库恢复方法和装置
CN115048238A (zh) 一种节点自动恢复方法、装置、设备及介质
CN114546591A (zh) 镜像文件共享方法、容器集群管理系统及相关设备
CN114168261A (zh) 一种基于OpenStack管理裸金属实例的高可用方法及装置
CN114968656A (zh) 一种数据回滚方法、装置、设备及介质
CN112925612A (zh) 一种基于Kubernetes的监控服务静态配置管理方法
CN112612652A (zh) 分布式存储系统异常节点重启方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant