CN113535464B - 一种容灾备份方法、服务器、集群系统和存储装置 - Google Patents

一种容灾备份方法、服务器、集群系统和存储装置 Download PDF

Info

Publication number
CN113535464B
CN113535464B CN202010306903.8A CN202010306903A CN113535464B CN 113535464 B CN113535464 B CN 113535464B CN 202010306903 A CN202010306903 A CN 202010306903A CN 113535464 B CN113535464 B CN 113535464B
Authority
CN
China
Prior art keywords
group
management server
group management
backup
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010306903.8A
Other languages
English (en)
Other versions
CN113535464A (zh
Inventor
肖迁
官俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hytera Communications Corp Ltd
Original Assignee
Hytera Communications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hytera Communications Corp Ltd filed Critical Hytera Communications Corp Ltd
Priority to CN202010306903.8A priority Critical patent/CN113535464B/zh
Publication of CN113535464A publication Critical patent/CN113535464A/zh
Application granted granted Critical
Publication of CN113535464B publication Critical patent/CN113535464B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup

Abstract

本发明公开了一种容灾备份方法、服务器、集群系统和存储装置。该容灾备份方法应用于包括多个组管理服务器的集群系统,所述方法包括:第一组管理服务器接收第二组管理服务器发送的第一伙伴建立请求;其中,所述第一伙伴建立请求是在确定所述第二组管理服务器不为所述第一组管理服务器的备份节点后发送的;响应于所述第一伙伴建立请求与所述第二组管理服务器建立伙伴关系,以作为所述第二组管理服务器的备份节点;将所述第二组管理服务器的数据备份至本地中。通过上述方法,本发明能够高效地实现组管理服务器的关键数据的备份。

Description

一种容灾备份方法、服务器、集群系统和存储装置
技术领域
本发明涉及集群通信技术领域,特别是涉及一种容灾备份方法、服务器、集群系统及存储装置。
背景技术
宽带集群标准MCPTT(Mission Critical Push To Talk,关键任务一键通)协议规定了所有网络上的组服务都依赖于GMS(Group management server,组管理服务器),一旦本地系统中的GMS出现故障,相关的组的联系、预建立组、群组呼叫等业务都会受到影响,因此相应的数据与功能备份机制显得十分重要。
目前针对MCPTT标准架构的容灾备份机制少有涉及,传统服务器往往采用异地容灾的静态备份手段,因此往往系统结构、实现方式非常复杂,并且需要专有硬件从而导致容灾备份的成本高昂。
发明内容
本发明主要解决的技术问题提供一种容灾备份方法、服务器、集群系统及存储装置,能够高效地实现组管理服务器的关键数据的备份。
为解决上述技术问题,本发明采用的一个技术方案是提供一种容灾备份方法,所述方法应用于包括多个组管理服务器的集群系统,所述方法包括:第一组管理服务器接收第二组管理服务器发送的第一伙伴建立请求;其中,所述第一伙伴建立请求是在确定所述第二组管理服务器不为所述第一组管理服务器的备份节点后发送的;响应于所述第一伙伴建立请求与所述第二组管理服务器建立伙伴关系,以作为所述第二组管理服务器的备份节点;将所述第二组管理服务器的数据备份至本地中。
为解决上述技术问题,本发明采用的另一个技术方案是提供一种服务器,所述服务器包括:相互耦接的通信电路、存储器和处理器;所述通信电路用于与其他服务器或者终端客户端之间进行通信;所述存储器用于存储程序数据;所述处理器执行所述程序数据,用于实现如上所述的方法。
为解决上述技术问题,本发明采用的另一个技术方案是提供一种集群系统,所述集群系统包括互相连接的多个组管理服务器;每个所述组管理服务器工作时实现如上所述的方法。
为解决上述技术问题,本发明采用的另一个技术方案是提供一种存储装置,所述存储装置存储有程序数据,所述程序数据能够被执行以实现如上所述的方法。
本发明的有益效果是:区别于现有技术的情况,本申请通过第一组管理服务器接收第二组管理服务器发送的第一伙伴建立请求,其中,所述第一伙伴建立请求是在确定所述第二组管理服务器不为所述第一组管理服务器的备份节点后发送的;然后响应于所述第一伙伴建立请求与所述第二组管理服务器建立伙伴关系,以作为所述第二组管理服务器的备份节点,将所述第二组管理服务器的数据备份至本地中。上述第一组管理服务器与第二组管理服务器之间形成单向备份关系的方式,由于第一组管理服务器和第二组管理服务器之间不能互相作为彼此的备份节点,故可以避免两个组管理服务器之间由于相互备份彼此数据而带来的分布式不一致性以及数据节点链条传输的复杂性,从而可以提升组管理服务器对数据的备份效率,并且上述方式不改变集群系统的构架、不增加专用硬件备份设备、也无需进行静态备份配置,能够简单高效地实现组管理服务器的关键数据的备份。
附图说明
图1是本发明提供的一种容灾备份方法的第一实施例的流程示意图;
图2是本发明提供的一种容灾备份方法的第二实施例的流程示意图;
图3是图2中步骤S204中关于代理执行所述第二组管理服务器的工作的方法的流程示意图;
图4是图3中步骤S302的具体流程示意图;
图5是本发明提供的容灾备份方法的一应用场景中组服务器执行代理工作的时序示意图;
图6a是本发明提供的容灾备份方法的另一应用场景中组服务器的内部虚拟结构示意图;
图6b是本发明提供的容灾备份方法的另一应用场景中组服务器执行代理工作的时序示意图;
图7是本发明提供的一种容灾备份方法的第三实施例的流程示意图;
图8a-8d是本发明提供的容灾备份方法的又一应用场景中各组服务器的容灾备份原理示意图;
图9是图7中步骤S704的具体流程示意图;
图10是本发明提供的容灾备份方法的再一应用场景中组服务器之间建立伙伴关系的时序示意图;
图11是本发明提供的一种服务器一实施例的结构示意图;
图12是本发明提供的一种集群系统的一实施例的结构示意图;
图13是本发明提供的一种存储装置一实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,均属于本发明保护的范围。
请参阅图1,图1是本发明提供的一种容灾备份方法的第一实施例的流程示意图。本申请提供的容灾备份方法应用于包括多个组管理服务器的集群系统,本实施例中的容灾备份方法包括以下步骤:
S101:第一组管理服务器接收第二组管理服务器发送的第一伙伴建立请求;其中,第一伙伴建立请求是在确定第二组管理服务器不为第一组管理服务器的备份节点后发送的。
可以理解的是,宽带集群标准MCPTT协议规定了所有网络上的组服务都依赖于组管理服务器,一旦本地系统中的组管理服务器出现故障,则相关的组的联系、预建立组、群组呼叫等业务都会受到影响,因此相应的数据与功能备份机制显得十分重要。然而,若两个组管理服务器之间互相作为彼此的备份节点,则可能带来集群系统的分布式不一致性,例如出现一个组管理服务器故障而导致另一组管理服务器在系统中失去备份数据,故本申请采用两个组管理服务器之间形成单向备份关系的方式,即第一组管理服务器和第二组管理服务器之间不能互相作为彼此的备份节点,因此当确定第二组管理服务器不为第一组管理服务器的备份节点后,第二组管理服务器会发送第一伙伴建立请求给第一组管理服务器,即请求第一组管理服务器作为第二组管理服务器的备份节点。
S102:响应于第一伙伴建立请求与第二组管理服务器建立伙伴关系,以作为第二组管理服务器的备份节点。
可以理解的是,在第一组管理服务器接收到第二组管理服务器发送的第一伙伴建立请求之后,第一组管理服务器可以响应第一伙伴建立请求,从而与第二组管理服务器建立伙伴关系,在第一组管理服务器与第二组管理服务器建立伙伴关系后,第一组管理服务器即为第二组管理服务器的备份节点。
S103:将第二组管理服务器的数据备份至本地中。
可以理解的是,由于第一组管理服务器为第二组管理服务器的备份节点,于是第一组管理服务器可以将第二组管理服务器的数据备份至本地中,即完成第二组管理服务器的数据的容灾备份工作。
本实施例中,本申请通过第一组管理服务器接收第二组管理服务器发送的第一伙伴建立请求,其中,第一伙伴建立请求是在确定第二组管理服务器不为第一组管理服务器的备份节点后发送的;然后响应于第一伙伴建立请求与第二组管理服务器建立伙伴关系,以作为第二组管理服务器的备份节点,将第二组管理服务器的数据备份至本地中。上述第一组管理服务器与第二组管理服务器之间形成单向备份关系的方式,由于第一组管理服务器和第二组管理服务器之间不能互相作为彼此的备份节点,故可以避免两个组管理服务器之间由于相互备份彼此数据而带来的分布式不一致性以及数据节点链条传输的复杂性,从而可以提升组管理服务器对数据的备份效率,并且上述方式不改变集群系统的构架、不增加专用硬件备份设备、也无需进行静态备份配置,能够简单高效地实现组管理服务器的关键数据的备份。
请参阅图2,图2是本发明提供的一种容灾备份方法的第二实施例的流程示意图。本实施例中的容灾备份方法包括以下步骤:
S201:第一组管理服务器接收第二组管理服务器发送的第一伙伴建立请求;其中,第一伙伴建立请求是在确定第二组管理服务器不为第一组管理服务器的备份节点后发送的。
S202:响应于第一伙伴建立请求与第二组管理服务器建立伙伴关系,以作为第二组管理服务器的备份节点。
S203:将第二组管理服务器的数据备份至本地中。
在本实施场景中,本实施例提供的步骤S201-S203与本申请提供的容灾备份方法的第一实施例中的步骤S101-S103基本类似,此处不再赘述。与本申请的容灾备份方法的第一实施例的区别在于,本实施例中的容灾备份方法还包括步骤:
S204:在检测出第二组管理服务器故障时,代理执行第二组管理服务器的工作,并将自身数据和第二组管理服务器的数据备份至作为第一组管理服务器的备份节点的组管理服务器。
可以理解的是,由于第一组管理服务器为第二组管理服务器的备份节点,第一组管理服务器中备份有第二组管理服务器的数据,因此,在第二组管理服务器发生故障时,可以由第一组管理服务器代理第二组管理服务器的职责,执行第二组管理服务器的工作。另外,此时第二组管理服务器已经发生故障,第一组管理服务器代理执行第二组管理服务器的工作,因此,原来第二组管理服务器的数据需要再由另外的组管理服务器进行备份,即第一组管理服务器可以将自身数据和第二组管理服务器的数据备份至作为第一组管理服务器的备份节点的组管理服务器中。
S205:在第二组管理服务器的故障排除后,获取对第二组管理服务器的本地备份数据以及在代理工作期间的数据,并利用获取的数据对第二组管理服务器的数据进行修复。
可以理解的是,在第二组管理服务器的故障排除后,第二组管理服务器需要重新执行原来的工作,因此第一组管理服务器可以利用原本第二组管理服务器的本地备份数据对第二组管理服务器的数据进行修复,另外,由于在第二组管理服务器的故障时第一组管理服务器代理执行了第二组管理服务器的工作,期间产生了一些新的数据,因此在对第二组管理服务器的数据进行修复时,第一组管理服务器应将在代理工作期间的数据也修复至第二组管理服务器,从而使得第二组管理服务器可以重新执行原来群组的工作。
请参阅图3,图3是图2中步骤S204中关于代理执行第二组管理服务器的工作的方法的流程示意图。在一实施方式中,步骤S204包括:
S301:从自身数据库中检索出第二组管理服务器管理的至少一个群组的用户设备信息。
由于第一组管理服务器需要代理执行第二组管理服务器的工作,又因为其将第二组管理服务器的数据备份至本地中,因此第一组管理服务器可以从自身数据库中检索出原先第二组管理服务器所管理的群组中的群组用户的用户设备信息。
S302:根据用户设备信息,代理对至少一个群组的用户设备的管理工作。
可以理解的是,在第一组管理服务器检索出群组用户的用户设备信息后,即可以根据用户设备信息与群组用户进行通信,从而可以代理对群组用户的用户设备的管理工作。
本实施例中,一旦某个组管理服务器发生故障,则与其建立伙伴关系的作为其备份节点的组管理服务器可以代理其职责工作,此时作为其备份节点的组管理服务器为代理组管理服务器,该代理组管理服务器从自己的数据库中查询检索出原故障的组管理服务器的所有群组用户的终端客户端,启动跟这些用户的终端客户端的数据动态更新流程,实现代理对这些用户的终端客户端的管理工作。通过这种方式,用户的终端客户端在无需静态容灾备份配置并且业务不中断的情况下,可以高效实现动态数据更新,从而提高集群系统的容灾备份能力。
请参阅图4,图4是图3中步骤S302的具体流程示意图。进一步地,步骤S302可以包括:
S401:根据用户设备信息,向每个用户设备发送握手信号。
S402:接收到群组的任一用户设备对握手信号的应答,并验证群组的用户设备的身份授权信息。
S403:在验证通过后与群组的用户设备进行业务数据的交互。
由于第一组管理服务器需要代理执行第二组管理服务器的工作,因此第一组管理服务器与群组用户的用户设备之间需要进行身份授权信息的验证,在验证成功后才可以实现第一组管理服务器与用户设备所在群组的组业务数据的交互。具体地,第一组管理服务器可以根据从自身数据库中检索出的用户设备信息,来向每个用户设备发送握手信号;当用户设备接收到该握手信号后可以响应该信号并发送应答到第一组管理服务器;在第一组管理服务器接收到群组的任一用户设备对握手信号的应答后,进行验证群组的用户设备的身份授权信息,在身份授权信息验证通过后,第一组管理服务器即可以与群组的用户设备进行业务数据的交互。
进一步地,上述在验证通过后与群组的用户设备进行业务数据的交互的步骤,具体可以包括:对群组的用户设备在第二组管理服务器未故障时发起的组业务数据进行交互,并接收用户设备在进行动态交互参数更新后反馈的组业务信息动态更新结果;和/或执行群组的用户设备发起的新的组业务服务。可以理解的是,在第二组管理服务器发生故障之前,某群组的用户设备可能已经发起了组业务,因此第一组管理服务器在代理执行第二组管理服务器的工作时,需要对这些已经发起了的组业务进行管理,即第一组管理服务器需要对群组的用户设备在第二组管理服务器未故障时发起的组业务数据进行交互,并接收用户设备在进行动态交互参数更新后反馈的组业务信息动态更新结果;另外,在第一组管理服务器代理执行第二组管理服务器的工作后,群组的用户设备可能会发起新的组业务,此时第一组管理服务器需要对这些新发起的组业务进行管理,即第一组管理服务器需要执行群组的用户设备发起的新的组业务服务。
请结合图5,图5是本发明提供的容灾备份方法的一应用场景中组服务器执行代理工作的时序示意图。在一具体应用场景中,当某个组管理服务器发生故障后,与其建立伙伴关系的作为其备份节点的组管理服务器可以代理其职责工作,此时作为其备份节点的组管理服务器为代理组管理服务器,该代理组管理服务器履行动态容灾备份功能的处理流程如下:在确定需要代理执行故障组管理服务器的功能后,代理组管理服务器从自己数据库中检索出原故障组管理服务器的所有群组用户的地址信息,启动跟每个群组用户的终端客户端的数据动态更新流程;代理组管理服务器向群组成员的终端客户端发送握手信号,在发送握手信号后代理组管理服务器会等待群组用户的终端客户端的响应;相应地,群组用户的终端客户端在接收到后会响应代理组管理服务器的握手信号,然后双方进行身份授权信息的验证并实现群组成员的终端客户端归属组业务数据的交换;在实现群组成员的终端客户端归属组业务数据的交换的过程中,群组用户的终端客户端会进行内部动态交互参数的更新,然后终端客户端向代理组管理服务器反馈组业务信息动态更新结果,然后由代理组管理服务器执行原故障组管理服务器的所有群组成员的终端客户端发起的新组业务服务。
进一步地,第一组管理服务器内部虚拟有代理服务器和第二组管理服务器的对象模型,且代理服务器和对象模型之间构建有数据交互通道;上述执行群组的用户设备发起的新的组业务服务的步骤,具体包括:通过代理服务器、对象模型以及两者之间的数据交互通道,模拟出代理执行第二组管理服务器的工作处理流程;依据模拟出的工作处理流程执行群组的用户设备发起的新的组业务服务。请结合图6a和图6b,其中,图6a是本发明提供的容灾备份方法的另一应用场景中组服务器的内部虚拟结构示意图,图6b是本发明提供的容灾备份方法的另一应用场景中组服务器执行代理工作的时序示意图。可以理解的是,由于代理组管理服务器的内部采用宽带集群标准MCPTT协议下的代理服务器的处理流程,即代理组管理服务器内部虚拟有代理服务器,且为了提高代理组管理服务器执行故障组管理服务器的工作的效率,在代理组管理服务器的内部虚拟出故障组管理服务器的对象模型,于是可以构建起代理服务器与对象模型之间的数据、信令交互通道。当代理组管理服务器外部的终端客户端发起组业务请求时,由于该组业务请求原本应该由故障组管理服务器进行处理,但是现在需要代理组管理服务器代为处理,因此在代理组管理服务器接收到终端客户端发起的组业务请求后,其内部利用模拟出来的代理服务器、对象模型以及两者之间的数据交互通道,从而可以模拟出原来故障组管理服务器处理组业务请求的工作处理流程。例如,终端客户端向代理组管理服务器发送SUBSCRIBE消息以请求创建一次订阅关系,由于代理服务器接收终端客户端的SUBSCRIBE消息并创建了相应的订阅关系,代理服务器向终端客户端发送200to SUBSCRIBE响应消息,以表示订阅已被接受且用户已被授权订阅请求的资源,然后代理服务器在NOTIFY消息中向终端客户端回馈当前资源的状态;另一方面,代理组管理服务器内部模拟该处理组业务请求的工作处理流程,由代理服务器向对象模型发送SUBSCRIBE消息以请求创建订阅关系,对象模型接收代理服务器的SUBSCRIBE消息并创建了相应的订阅关系,对象模型向代理服务器发送200to SUBSCRIBE响应消息,以表示订阅已被接受且用户已被授权订阅请求的资源,然后对象模型在NOTIFY消息中向代理服务器回馈当前资源的状态;接着通过代理服务器将NOTIFY消息发送至终端客户端,终端客户端在收到代理服务器发送的NOTIFY请求后,将进行匹配检查,如果找到相应的匹配,终端客户端可以创建新的订阅或对话,并对代理服务器回送关于NOTIFY消息的200to NOTIFY响应消息,然后通过代理服务器将200to NOTIFY响应消息发送至对象模型,从而使得代理组管理服务器可以完整实现处理组业务请求的工作的处理流程效果,即可实现代理组管理服务器对故障组管理服务器的动态容灾目的。
请参阅图7,图7是本发明提供的一种容灾备份方法的第三实施例的流程示意图。本实施例中的容灾备份方法包括以下步骤:
S701:第一组管理服务器接收第二组管理服务器发送的第一伙伴建立请求;其中,第一伙伴建立请求是在确定第二组管理服务器不为第一组管理服务器的备份节点后发送的。
S702:响应于第一伙伴建立请求与第二组管理服务器建立伙伴关系,以作为第二组管理服务器的备份节点。
S703:将第二组管理服务器的数据备份至本地中。
在本实施场景中,本实施例提供的步骤S701-S703与本申请提供的容灾备份方法的第一实施例中的步骤S101-S103基本类似,此处不再赘述。与本申请的容灾备份方法的第一实施例的区别在于,本实施例中的容灾备份方法还包括步骤:
S704:按照预设选择策略,从集群系统中选择出第三组管理服务器,以作为第一组管理服务器的备份节点;其中,第一组管理服务器不为第三组管理服务器的备份节点。
S705:将本地数据备份至第三组管理服务器中。
可以理解的是,第一组管理服务器与第二组管理服务器之间形成了单向备份关系,即第一组管理服务器和第二组管理服务器之间不能互相作为彼此的备份节点,例如第一组管理服务器为第二组管理服务器的备份节点,于是第一组管理服务器可以将第二组管理服务器的数据备份至本地中,即完成第二组管理服务器的数据的容灾备份工作;而第一组管理服务器的本地数据同样需要备份至其他的组管理服务器中,因此,第一组管理服务器可以按照预设选择策略,从集群系统中选择出第三组管理服务器来作为第一组管理服务器的备份节点,其中,第一组管理服务器不为第三组管理服务器的备份节点;然后,第一组管理服务器将本地数据备份至第三组管理服务器中。
进一步地,本实施例中的容灾备份方法在步骤S705之后还包括步骤:
S706:在检测出第三组管理服务器发生故障时,按照预设选择策略,从集群系统中重新选择出第一组管理服务器的备份节点,并执行上述对第一组管理服务器的备份节点执行的步骤。
可以理解的是,第三组管理服务器为第一组管理服务器的备份节点,第三组管理服务器中备份有第一组管理服务器的数据,因此,在第三组管理服务器发生故障时,第一组管理服务器需要重新寻找一个新的备份节点,于是第一组管理服务器可以按照预设选择策略,从集群系统中重新选择出一个新的组管理服务器作为第一组管理服务器的备份节点,并将本地数据备份至作为第一组管理服务器的备份节点的新的组管理服务器中。
作为一种可实施方式,上述预设选择策略包括选择出的组管理服务器与自身之间的矢量路径最短,且自身不为选择出的组管理服务器的备份节点。可以理解的是,通过需要选择备份节点的组管理服务器不为被选择的组管理服务器的备份节点的方式,即两个组管理服务器之间不能互相作为彼此的备份节点,故可以避免两个组管理服务器之间由于相互备份彼此数据而带来的分布式不一致性以及数据节点链条传输的复杂性,从而可以提升组管理服务器对数据的备份效率;另外,通过选择矢量路径最短的链路关系,使得整个系统的数据的传输可以实现路径最短,可以有效提高了数据传输的效率。
进一步地,上述步骤S705具体可以包括:按照定时模式或业务触发模式,将本地数据备份至第三组管理服务器中;接收第三组管理服务器反馈的数据备份结果。可以理解的是,第三组管理服务器作为第一组管理服务器的备份节点,其备份有第一组管理服务器的数据,但是第一组管理服务器的数据会进行更新,因此第三组管理服务器需要对第一组管理服务器的备份数据进行更新;在一实施方式中,第一组管理服务器可以按照定时模式将本地数据备份至第三组管理服务器中,即每隔预设时间就将本地数据备份至第三组管理服务器中,例如为一小时、一天、两天、一周或者其他时间长度;在其他实施方式中,第一组管理服务器也可以按照业务触发模式将本地数据备份至第三组管理服务器中,即在第一组管理服务器接收到新的组业务后,就将本地数据备份至第三组管理服务器中。在将本地数据备份至第三组管理服务器后,第三组管理服务器会向第一组管理服务器反馈数据备份结果,第一组管理服务器在接收到第三组管理服务器反馈的数据备份结果后,即可以知道数据备份是否成功。
请参阅图8a-8d,图8a-8d是本发明提供的容灾备份方法的又一应用场景中各组服务器的容灾备份原理示意图。本申请中,每个组管理服务器节点在节点拓扑中、在自身能力范围(例如自身的荷载情况满足作为备份节点的要求)内可以接受其他组管理服务器节点发送的伙伴建立请求,并且在接受某组管理服务器的请求并建立了伙伴关系之后,不能选择该组管理服务器作为自己的备份节点,即单向伙伴节点关系。在单向伙伴节点关系中,请求建立伙伴关系的节点为请求节点,响应伙伴建立请求并履行备份数据任务的节点为备份节点。如图8a所示,组管理服务器A是组管理服务器E的备份节点,组管理服务器A中备份有组管理服务器E的数据;而组管理服务器A是组管理服务器B的请求节点,组管理服务器B是组管理服务器A的备份节点,并且组管理服务器B还是组管理服务器C的备份节点,因此,组管理服务器B中备份有组管理服务器A和组管理服务器C的数据;而组管理服务器B是组管理服务器D的请求节点,组管理服务器D是组管理服务器B的备份节点,组管理服务器D中备份有组管理服务器B的数据;而组管理服务器D是组管理服务器C的请求节点,组管理服务器C是组管理服务器D的备份节点,组管理服务器C中备份有组管理服务器D的数据;这样就构建了一个以单向伙伴节点关系为纽带的节点拓扑关系。可以理解的是,根据本申请设计的单向伙伴节点关系的容灾备份处理逻辑,各组管理服务器节点数据动态更新过程中,不必考虑组管理服务器节点间分布式数据一致性引起的相关问题。
可以理解的是,节点拓扑中任一组管理服务器节点发生故障后的基本处理原则:当任一请求节点发现其备份节点发生故障,则重新在网络拓扑中发起伙伴建立请求,以重新确定其新的备份节点,并完成其数据备份过程;当某一请求节点发生故障,则其备份节点可以完成该请求节点的数据修复工作,并代理该请求节点的工作职能,以履行该请求节点所有功能,同时该备份节点需要在自己对应的备份节点将自身数据和该请求节点的数据以融合后的数据形态完成数据备份。
请结合图8a和图8b,当组管理服务器A发生了故障,首先选择组管理服务器A作为其备份节点的组管理服务器E需要重新发起伙伴建立请求,例如组管理服务器E向组管理服务器C发送伙伴建立请求,如果组管理服务器C答应了该请求,则组管理服务器C为组管理服务器E新的备份节点,组管理服务器C可以完成对组管理服务器E的数据备份;同时作为组管理服务器A的备份节点的组管理服务器B检测到组管理服务器A发生故障,则组管理服务器B需要代理履行组管理服务器A的功能职责,即组管理服务器B需要履行组管理服务器A+组管理服务器B两者的职能任务,同时作为组管理服务器B的备份节点的组管理服务器D,需要将组管理服务器A+组管理服务器B的合并数据进行数据备份。
请结合图8a和图8c,当组管理服务器D发生了故障,首先选择组管理服务器D作为其备份节点的组管理服务器B需要重新发起伙伴建立请求,由于组管理服务器B为组管理服务器A和组管理服务器C的备份节点,因此组管理服务器B只能向组管理服务器E发送伙伴建立请求,如果组管理服务器E答应了该请求,则组管理服务器E为组管理服务器B新的备份节点,组管理服务器E可以完成对组管理服务器B的数据备份;同时作为组管理服务器D的备份节点的组管理服务器C检测到组管理服务器D发生故障,则组管理服务器C需要代理履行组管理服务器D的功能职责,即组管理服务器C需要履行组管理服务器D+组管理服务器C两者的职能任务,同时作为组管理服务器C的备份节点的组管理服务器B,需要将组管理服务器C+组管理服务器D的合并数据进行数据备份。
请结合图8a和图8c,同样地,当组管理服务器B发生了故障,首先选择组管理服务器B作为其备份节点的组管理服务器A以及组管理服务器C均需要重新发起伙伴建立请求;由于组管理服务器A为组管理服务器E的备份节点,因此组管理服务器A只能向组管理服务器D或者组管理器C发送伙伴建立请求,如果组管理服务器D答应了该请求,则组管理服务器D为组管理服务器A新的备份节点,组管理服务器D可以完成对组管理服务器A的数据备份;而由于组管理服务器C为组管理服务器D的备份节点,因此组管理服务器C只能向组管理服务器E或者组管理器A发送伙伴建立请求,如果组管理服务器E答应了该请求,则组管理服务器E为组管理服务器C新的备份节点,组管理服务器E可以完成对组管理服务器C的数据备份;同时作为组管理服务器B的备份节点的组管理服务器D检测到组管理服务器B发生故障,则组管理服务器D需要代理履行组管理服务器B的功能职责,即组管理服务器D需要履行组管理服务器B+组管理服务器D两者的职能任务,同时作为组管理服务器D的备份节点的组管理服务器C,需要将组管理服务器B+组管理服务器D的合并数据进行数据备份。
请参阅图9,图9是图7中步骤S704的具体流程示意图。在一实施方式中,步骤S704包括:
S901:按照预设选择策略,从集群系统中选择出第三组管理服务器。
S902:向第三组管理服务器发送第二伙伴建立请求。
S903:响应于第三管理服务器对第二伙伴建立请求的应答,与第三组管理服务器建立伙伴关系,以将第三管理服务器确定为第一组管理服务器的备份节点。
可以理解的是,由于第一组管理服务器的本地数据同样需要备份至其他的组管理服务器中,因此,第一组管理服务器可以按照预设选择策略,从集群系统中选择出第三组管理服务器来作为第一组管理服务器的备份节点,当确定第一组管理服务器不为第三组管理服务器的备份节点后,第一组管理服务器会发送第二伙伴建立请求给第三组管理服务器,即请求第三组管理服务器作为第一组管理服务器的备份节点;在第三组管理服务器接收到第一组管理服务器发送的第二伙伴建立请求之后,第三组管理服务器可以答应该第二伙伴建立请求,并发送对该第二伙伴建立请求的应答到第一组管理服务器,第一组管理服务器响应该应答,从而与第三组管理服务器建立伙伴关系,在第一组管理服务器与第三组管理服务器建立伙伴关系后,即将第三管理服务器确定为第一组管理服务器的备份节点。
同时,上述步骤S702具体可以包括:在确定自身能够作为第二组管理服务器的备份节点时,向第二组管理服务器发送对的第一伙伴建立请求的应答,以与第二组管理服务器建立伙伴关系。可以理解的是,在第一组管理服务器接收了第一伙伴建立请求后,第一组管理服务器需要先确定自身能否作为第二组管理服务器的备份节点,例如确认自身的荷载是否超过预设的阈值,当自身荷载较小时,则可以确定自身能够作为第二组管理服务器的备份节点,于是可以向第二组管理服务器发送对的第一伙伴建立请求的应答,即接受第二组管理服务器的伙伴建立请求,以与第二组管理服务器建立伙伴关系。
请参阅图10,图10是本发明提供的容灾备份方法的再一应用场景中组服务器之间建立伙伴关系的时序示意图。在一具体应用场景中,组管理服务器A作为请求节点向组管理服务器B发送伙伴建立请求,即请求组管理服务器B作为组管理服务器A的备份节点;首先,组管理服务器A在已经获取的网络节点拓扑中,根据最短路径最优算法选择出链路关系中的组管理服务器B,于是向组管理服务器B发起建立伙伴关系的伙伴建立请求;组管理服务器B在接收到该伙伴建立请求后,会根据自身链路情况决定是否允许组管理服务器A与其建立伙伴关系,可以理解的是,组管理服务器B可以接受多个组管理服务器发送的伙伴建立请求;在组管理服务器B答应组管理服务器A的伙伴建立请求后,组管理服务器A与组管理服务器B之间进行数据的单向备份流程,例如组管理服务器A可以按照定时模式或者业务触发模式来使组管理服务器B完成的其数据备份,在完成数据备份后,组管理服务器B会向组管理服务器A发送数据同步过程的结果反馈;当组管理服务器B检测到组管理服务器A发生故障时,则组管理服务器B会启动应急流程,组管理服务器B可以承担起组管理服务器A的工作,同时向组管理服务器B的备份节点请求进行数据备份。
请参阅图11,图11是本发明提供的一种服务器一实施例的结构示意图。本申请中的服务器110包括相互耦接的通信电路1100、存储器1102和处理器1104;通信电路1100用于与其他服务器或者终端客户端之间进行通信;存储器1102用于存储程序数据;处理器1104执行该程序数据,用于实现上述的任意一种容灾备份方法。
本申请服务器110实施例的具体相关内容请参见上述容灾备份方法实施例中的详细说明。
请参阅图12,图12是本发明提供的一种集群系统的一实施例的结构示意图。本申请中的集群系统12包括互相连接的多个组管理服务器120;每个组管理服务器120工作时实现上述的任意一种容灾备份方法。
本申请中,集群系统12中的两个组管理服务器120之间形成单向备份关系,任意两个组管理服务器120之间不能互相作为彼此的备份节点,故可以避免两个组管理服务器120之间由于相互备份彼此数据而带来的分布式不一致性以及数据节点链条传输的复杂性,从而可以提升组管理服务器120对数据的备份效率,并且上述方式不改变集群系统12的构架、不增加专用硬件备份设备、也无需进行静态备份配置,能够简单高效地实现集群系统12中组管理服务器120的关键数据的备份。
本申请提供的集群系统实施例的具体相关内容请参见上述容灾备份方法实施例中的详细说明。
请参阅图13,图13是本发明提供的一种存储装置一实施例的结构示意图。本申请中的存储装置130中存储有程序数据1300,程序数据1300能够被执行以实现如上所述的容灾备份方法。该存储装置130可以是服务器中的存储芯片、SD卡等可读写存储的工具,也可以是服务器等等。
在本申请所提供的几个实施例中,应该理解到,所揭露的容灾备份方法、服务器、集群系统及存储装置,可以通过其它的方式实现。例如,以上所描述的设备结构实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (13)

1.一种容灾备份方法,其特征在于,所述方法应用于包括多个组管理服务器的集群系统,所述方法包括:
第一组管理服务器接收第二组管理服务器发送的第一伙伴建立请求;其中,所述第一伙伴建立请求是在确定所述第二组管理服务器不为所述第一组管理服务器的备份节点后发送的;
响应于所述第一伙伴建立请求与所述第二组管理服务器建立伙伴关系,以作为所述第二组管理服务器的备份节点;
将所述第二组管理服务器的数据备份至本地中;
其中,所述方法还包括:
在检测出所述第二组管理服务器故障时,代理执行所述第二组管理服务器的工作,并将自身数据和所述第二组管理服务器的数据备份至作为所述第一组管理服务器的备份节点的组管理服务器;
其中,在所述代理执行所述第二组管理服务器的工作的步骤之后,所述方法包括:
在所述第二组管理服务器的故障排除后,获取对第二组管理服务器的本地备份数据以及在代理工作期间的数据,并利用所述获取的数据对所述第二组管理服务器的数据进行修复;
其中,所述第一组管理服务器内部虚拟有代理服务器和所述第二组管理服务器的对象模型,且所述代理服务器和所述对象模型之间构建有数据交互通道;通过所述代理服务器、所述对象模型以及两者之间的数据交互通道,模拟出代理执行所述第二组管理服务器的工作处理流程。
2.如权利要求1所述的容灾备份方法,其特征在于,所述代理执行所述第二组管理服务器的工作的步骤,包括:
从自身数据库中检索出所述第二组管理服务器管理的至少一个群组的用户设备信息;
根据所述用户设备信息,代理对所述至少一个群组的用户设备的管理工作。
3.如权利要求2所述的容灾备份方法,其特征在于,所述根据所述用户设备信息,代理对所述至少一个群组的用户设备的管理工作的步骤,包括:
根据所述用户设备信息,向每个所述用户设备发送握手信号;
接收到所述群组的任一用户设备对所述握手信号的应答,并验证所述群组的用户设备的身份授权信息;
在验证通过后与所述群组的用户设备进行业务数据的交互。
4.如权利要求3所述的容灾备份方法,其特征在于,所述在验证通过后与所述群组的用户设备进行业务数据的交互的步骤,包括:
对所述群组的用户设备在第二组管理服务器未故障时发起的组业务数据进行交互,并接收所述用户设备在进行动态交互参数更新后反馈的组业务信息动态更新结果;和/或
执行所述群组的用户设备发起的新的组业务服务。
5.如权利要求4所述的容灾备份方法,其特征在于,
所述执行所述群组的用户设备发起的新的组业务服务,包括:
依据所述模拟出的工作处理流程执行所述群组的用户设备发起的新的组业务服务。
6.如权利要求1所述的容灾备份方法,其特征在于,还包括:
按照预设选择策略,从所述集群系统中选择出第三组管理服务器,以作为所述第一组管理服务器的备份节点;其中,所述第一组管理服务器不为所述第三组管理服务器的备份节点;
将本地数据备份至所述第三组管理服务器中。
7.如权利要求6所述的容灾备份方法,其特征在于,在所述将本地数据备份至所述第三组管理服务器中的步骤之后,所述方法包括:
在检测出所述第三组管理服务器发生故障时,按照预设选择策略,从所述集群系统中重新选择出第一组管理服务器的备份节点,并执行上述对第一组管理服务器的备份节点执行的步骤。
8.如权利要求6所述的容灾备份方法,其特征在于,所述预设选择策略包括选择出的组管理服务器与自身之间的矢量路径最短,且自身不为所述选择出的组管理服务器的备份节点。
9.如权利要求6所述的容灾备份方法,其特征在于,所述将本地数据备份至所述第三组管理服务器中的步骤,包括:
按照定时模式或业务触发模式,将本地数据备份至所述第三组管理服务器中;
接收所述第三组管理服务器反馈的数据备份结果。
10.如权利要求6所述的容灾备份方法,其特征在于,所述按照预设选择策略,从所述集群系统中选择出第三组管理服务器,以作为所述第一组管理服务器的备份节点,包括:
按照预设选择策略,从所述集群系统中选择出第三组管理服务器;
向所述第三组管理服务器发送第二伙伴建立请求;
响应于所述第三组管理服务器对所述第二伙伴建立请求的应答,与所述第三组管理服务器建立伙伴关系,以将所述第三组管理服务器确定为所述第一组管理服务器的备份节点;
所述响应于所述第一伙伴建立请求与所述第二组管理服务器建立伙伴关系,包括:
在确定自身能够作为所述第二组管理服务器的备份节点时,向所述第二组管理服务器发送对所述的第一伙伴建立请求的应答,以与所述第二组管理服务器建立伙伴关系。
11.一种服务器,其特征在于,所述服务器包括:相互耦接的通信电路、存储器和处理器;所述通信电路用于与其他服务器或者终端客户端之间进行通信;所述存储器用于存储程序数据;所述处理器执行所述程序数据,用于实现如权利要求1-10任一项所述的方法。
12.一种集群系统,其特征在于,所述集群系统包括互相连接的多个组管理服务器;每个所述组管理服务器工作时实现如权利要求1-10任一项所述的方法。
13.一种存储装置,其特征在于,存储有程序数据,所述程序数据能够被执行以实现如权利要求1-10任一项所述的方法。
CN202010306903.8A 2020-04-17 2020-04-17 一种容灾备份方法、服务器、集群系统和存储装置 Active CN113535464B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010306903.8A CN113535464B (zh) 2020-04-17 2020-04-17 一种容灾备份方法、服务器、集群系统和存储装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010306903.8A CN113535464B (zh) 2020-04-17 2020-04-17 一种容灾备份方法、服务器、集群系统和存储装置

Publications (2)

Publication Number Publication Date
CN113535464A CN113535464A (zh) 2021-10-22
CN113535464B true CN113535464B (zh) 2024-02-02

Family

ID=78093514

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010306903.8A Active CN113535464B (zh) 2020-04-17 2020-04-17 一种容灾备份方法、服务器、集群系统和存储装置

Country Status (1)

Country Link
CN (1) CN113535464B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102281563A (zh) * 2010-06-11 2011-12-14 海能达通信股份有限公司 一种通信系统、用在通信系统中的切换方法和网管服务器
CN104679611A (zh) * 2015-03-05 2015-06-03 浙江宇视科技有限公司 数据资源复制方法以及装置
WO2018076972A1 (zh) * 2016-10-28 2018-05-03 华为技术有限公司 一种故障切换方法、装置及系统
CN108282349A (zh) * 2017-01-05 2018-07-13 湖南移商动力网络技术有限公司 基于集群服务器故障处理技术
CN108874590A (zh) * 2018-06-16 2018-11-23 武汉商启网络信息有限公司 一种云主机自动备份与恢复的系统
CN109067865A (zh) * 2018-07-26 2018-12-21 郑州云海信息技术有限公司 建立存储系统伙伴关系的方法及装置
CN110087227A (zh) * 2019-04-26 2019-08-02 中湾慧科(深圳)科技有限公司 一种基于ims架构的分布式呈现业务的系统及方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8549180B2 (en) * 2004-10-22 2013-10-01 Microsoft Corporation Optimizing access to federation infrastructure-based resources
US7490205B2 (en) * 2005-03-14 2009-02-10 International Business Machines Corporation Method for providing a triad copy of storage data
CN104937570A (zh) * 2013-01-29 2015-09-23 惠普发展公司,有限责任合伙企业 从原始图像备份数据恢复文件系统对象
CN108984335B (zh) * 2017-06-02 2022-04-29 伊姆西Ip控股有限责任公司 备份和恢复数据的方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102281563A (zh) * 2010-06-11 2011-12-14 海能达通信股份有限公司 一种通信系统、用在通信系统中的切换方法和网管服务器
CN104679611A (zh) * 2015-03-05 2015-06-03 浙江宇视科技有限公司 数据资源复制方法以及装置
WO2018076972A1 (zh) * 2016-10-28 2018-05-03 华为技术有限公司 一种故障切换方法、装置及系统
CN108282349A (zh) * 2017-01-05 2018-07-13 湖南移商动力网络技术有限公司 基于集群服务器故障处理技术
CN108874590A (zh) * 2018-06-16 2018-11-23 武汉商启网络信息有限公司 一种云主机自动备份与恢复的系统
CN109067865A (zh) * 2018-07-26 2018-12-21 郑州云海信息技术有限公司 建立存储系统伙伴关系的方法及装置
CN110087227A (zh) * 2019-04-26 2019-08-02 中湾慧科(深圳)科技有限公司 一种基于ims架构的分布式呈现业务的系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NCU-HA:A Lightweight HA System for Kernel-Based Virtual Machine;Yen-Lin Lee等;《2017 International Conference on Platform Technology and Service》;1-6 *
一种基于主-备份节点同步映射的VNF热备份机制;刘胜珍等;《电讯技术》;第59卷(第03期);329-336 *

Also Published As

Publication number Publication date
CN113535464A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
US7518983B2 (en) Proxy response apparatus
JP3974652B2 (ja) 通信システムにおけるノードのためのハードウェアおよびデータ冗長アーキテクチャ
US20130139178A1 (en) Cluster management system and method
CN111327650A (zh) 数据传输方法、装置、设备及存储介质
CN110971702A (zh) 服务调用方法、装置、计算机设备及存储介质
CN112218342A (zh) 一种实现核心网子切片容灾的方法、装置和系统
CN114036236A (zh) 多网关集群系统
WO2017071384A1 (zh) 报文处理的方法及装置
CN112671554A (zh) 一种节点故障处理方法及相关装置
US20240106708A1 (en) Fabric availability and synchronization
CN108366087B (zh) 一种基于分布式文件系统的iscsi服务实现方法和装置
CN112492030B (zh) 数据存储方法、装置、计算机设备和存储介质
MXPA02006896A (es) Metodo y aparato para proporcionar comunicaciones confiables en una red inteligente.
CN113535464B (zh) 一种容灾备份方法、服务器、集群系统和存储装置
CN111880932A (zh) 一种基于多网口的数据存储方法及装置
CN111385324A (zh) 一种数据通信方法、装置、设备和存储介质
CN114090342A (zh) 存储容灾的链路管理方法及消息执行节点、存储控制集群
US7885184B2 (en) Method and apparatus for re-establishing anonymous data transfers
CN108712297A (zh) 一种物联网节点设备自主切换网关的方法
CN114422335A (zh) 通信方法、装置、服务器及存储介质
US11757987B2 (en) Load balancing systems and methods
CN106357744A (zh) Smb客户端重连集群的方法、系统及smb客户端
CN110890989A (zh) 一种通道连接方法及装置
CN114095342B (zh) 备份的实现方法及装置
CN114915545B (zh) 基于dhcp网络集群的应用调度部署管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant