CN101616440A - 多级双机系统及其倒换方法 - Google Patents

多级双机系统及其倒换方法 Download PDF

Info

Publication number
CN101616440A
CN101616440A CN200910161526A CN200910161526A CN101616440A CN 101616440 A CN101616440 A CN 101616440A CN 200910161526 A CN200910161526 A CN 200910161526A CN 200910161526 A CN200910161526 A CN 200910161526A CN 101616440 A CN101616440 A CN 101616440A
Authority
CN
China
Prior art keywords
shipper
level
standby host
main frame
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910161526A
Other languages
English (en)
Other versions
CN101616440B (zh
Inventor
顾明
王少勇
卢广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XFusion Digital Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2009101615267A priority Critical patent/CN101616440B/zh
Publication of CN101616440A publication Critical patent/CN101616440A/zh
Application granted granted Critical
Publication of CN101616440B publication Critical patent/CN101616440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及移动通信技术,公开了一种多级双机系统及其倒换方法,所述方法包括:一级双机主机与二级双机主机链路故障后,检测一级双机主机与二级双机备机链路;如果一级双机主机与二级双机备机链路正常,则所述二级双机进行倒换,如果一级双机主机与二级双机备机链路故障,则所述一级双机进行倒换。本发明能够处理多级双机系统中更多的故障情况,降低故障对系统运行的影响。

Description

多级双机系统及其倒换方法
技术领域
本发明涉及移动通信技术,具体涉及一种多级双机系统及其倒换方法。
背景技术
目前,为了提高系统的可靠性,使系统能够持续对外提供服务,通常使用双机互备的方法来对外提供服务。组成双机的两台机器各自有静态IP地址,且公用一个浮动IP地址,通过浮动IP地址能够访问到双机中的主用机。
当系统规模较大,无法由一套双机服务器(两台服务器组成双机)完成服务时,需要由多套双机服务器组合起来完成服务,这些双机服务器共同组成一套系统。在该系统中,多套双机间地位不同,其中一套双机运行管理程序,负责管理整个系统。为此,可以将此类系统看作一套一级双机与多套二级双机组成的多级双机系统。
在这种多级双机系统中,每个双机的倒换策略将会影响整个系统的可靠性。
在现有技术中,通常对一级双机与二级双机分别采用不同的倒换策略,具体如下:
二级双机倒换策略:主机不能正常工作而备机能够正常工作,则二级双机发生倒换。
一级双机倒换策略:主机不能管理所有二级双机的主机而备机能管理时,一级双机发生倒换。其中,一级双机是否能管理二级双机的主机或备机,通常是通过检测一级双机是否能与二级双机的浮动IP地址通信来判断,如果能够通信,则表明能管理,否则表明不能管理。
采用现有倒换策略,无法解决部分可恢复的故障,从而影响了系统的运行。
发明内容
本发明实施例提供一种多级双机系统及其倒换方法,以便能够处理多级双机系统中更多的故障情况,降低故障对系统运行的影响。
本发明实施例提供一种多级双机系统,包括:一级双机和至少一套二级双机;所述一级双机包括:一级双机主机和一级双机备机;所述二级双机包括:二级双机主机和二级双机备机;
所述一级双机主机,用于检测与二级双机主机链路,并在检测到与二级双机主机链路故障后,检测与二级双机备机链路;如果检测到与二级双机备机链路故障,则与所述一级双机备机进行倒换;
所述二级双机,用于检测与一级双机之间的链路,在一级双机主机与二级双机主机链路故障,一级双机主机与二级双机备机链路正常的情况下,进行倒换。
本发明实施例提供一种多级双机系统倒换方法,包括:
一级双机主机与二级双机主机链路故障后,检测一级双机主机与二级双机备机链路;
如果一级双机主机与二级双机备机链路正常,则所述二级双机进行倒换,如果一级双机主机与二级双机备机链路故障,则所述一级双机进行倒换。
本发明实施例提供的多级双机系统及其倒换方法,在一级双机主机与二级双机主机链路故障后,检测一级双机主机与二级双机备机链路;如果一级双机主机与二级双机备机链路正常,则由所述二级双机进行倒换,否则所述一级双机进行倒换。因而无需在每种故障倒换过程中都中断全系统的工作,而且能够触发恢复系统的倒换。
附图说明
图1是本发明实施例多级双机系统的一种结构示意图;
图2是本发明实施例多级双机系统倒换方法的一种流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。
本发明实施例多级双机系统及其倒换方法,在一级双机主机与二级双机主机链路故障后,检测一级双机主机与二级双机备机链路;如果一级双机主机与二级双机备机链路正常,则二级双机进行倒换,一级双机等待二级双机倒换;否则所述一级双机进行倒换。
本发明实施例多级双机系统,包括:一级双机和至少一套二级双机;所述一级双机包括:一级双机主机和一级双机备机;所述二级双机包括:二级双机主机和二级双机备机。
当然,本发明实施例多级双机系统及其倒换方法并不仅限于上述两级双机系统,依照本发明实施例的思想,还可以将所述多级系统及其倒换方法扩展到更多级别的双机系统,比如三级双机系统、四级双机系统等,而且,每级双机中可以有一套或多套双机。
为了使描述更清楚,下面以包括两套二级双机的两级双机系统为例对本发明实施例进行说明。
如图1所示,是本发明实施例多级双机系统的一种结构示意图。
在该实施例中,包括:一级双机100,二级双机201和二级双机202。其中:
一级双机100包括一级双机A和一级双机B,其中,一级双机A作为一级双机主机,一级双机B作为一级双机备机;
二级双机201包括二级双机C和二级双机D,其中,二级双机C作为二级双机主机,二级双机D作为二级双机备机;
二级双机202包括二级双机E和二级双机F,其中,二级双机E作为二级双机主机,二级双机F作为二级双机备机。
在本发明实施例中,一级双机A检测与二级双机主机链路,假设检测到与二级双机C的链路故障,则继续检测与二级双机D的链路;
如果一级双机A检测到与二级双机D的链路正常,则一级双机A与一级双机B不进行倒换,而是等待二级双机200进行倒换,也就是说,对于二级双机倒换能够解决的故障问题,避免通过一级双机倒换来解决。如果二级双机倒换仍不能解决该故障问题,再考虑进行一级双机的倒换。
如果一级双机A检测到与二级双机D的链路故障,则一级双机A与一级双机B进行倒换。当然,在这种情况下,如果一级双机B与二级双机C的链路故障,而且一级双机B与二级双机D的链路也故障,则无法通过倒换解决该故障问题。在这种情况下,一级双机100也可以不进行倒换。
因此,在具体实现时,一级双机A检测到与二级双机D的链路故障后,可以通知一级双机B检测与二级双机201的链路,一级双机B将检测结果发送给一级双机A,由一级双机A决定是否进行倒换。当然,本发明实施例不限于这种实现方式,还可以有其他实现方式。比如,一级双机B也可以实时或周期地检测与每套二级双机的链路是否故障,并将检测结果发送给一级双机A,由一级双机A决定是否进行倒换。再比如,一级双机B还可以根据检测结果直接判断是否进行一级双机倒换,并在判断结果是需要进行一级双机倒换时,通知一级双机A进行倒换。
一级双机B在检测与二级双机201的链路状态时,可以按以下过程进行检测:
首先,一级双机B检测与二级双机C的链路,如果检测到与二级双机C的链路正常,则将检测结果发送给一级双机A,一级双机A收到该检测结果后,确定进行一级双机倒换;其次,一级双机B如果检测到与二级双机C的链路故障,则再检测与二级双机D的链路,如果检测到与二级双机D的链路正常,则将检测结果发送给一级双机A,一级双机A根据该检测结果,进行一级双机倒换。
在上述链路状态的检测过程中,一级双机100需要掌握全系统的倒换逻辑,因此要求一级双机A和一级双机B不仅要知道各个二级双机的浮动IP地址,而且要知道各个二级双机的主机和备机所具有的静态IP地址。具体地,可以通过系统配置,将各级双机中的主机和备机的静态和浮动IP地址配置到一级双机中,比如可以将其分别保存到一级双机A和一级双机B中,也可以将其保存到一级双机系统的一个公共存储区中。以使一级双机A和一级双机B根据该静态IP地址检测与该静态IP地址对应的二级双机的链路是否正常。
在有多套二级双机时,比如,图1中有两套二级双机,在这种情况下,有可能同时存在不同的链路故障,因此,为了减少由于一级双机倒换而扩大故障的严重度,在本发明实施例中,在上述一级双机B检测到与二级双机C或二级双机D的链路正常,将检测结果发送给一级双机A之前,还可以先检测与其他二级双机链路是否有故障。具体判断原则如下:如果检测到与一套二级双机中的主机或备机之一无故障,就认为与此套二级双机链路正常;如果检测到与此套二级双机的主机和备机都故障,则认为与此套二级双机链路故障。
如果没有故障,或者有故障但所述系统中所有与所述一级双机备机链路正常的二级双机的权重和高于所述系统中所有与所述一级双机主机链路正常的二级双机的权重和,再将检测结果发送给一级双机A。也就是说,在一级双机倒换后不仅能够消除某些故障,而且还会产生新故障的情况下,需要将一级双机倒换前链路正常的所有双机的权重和,与倒换后链路正常的所有双机的权重和进行比较,根据比较结果再决定是否需要进行一级双机倒换。
比如,图1中,在一级双机B检测到与二级双机C或二级双机D的链路正常,将检测结果发送给一级双机A之前,还需要检测与二级双机E或二级双机F的链路是否有故障。如果没有故障,则将检测结果发送给一级双机A;如果有故障,则进一步检测二级双机201与二级双机202的权重,需要说明的是,每套双机中的主机和备机具有相同的权重。如果二级双机201的权重高于二级双机202的权重,则一级双机B将计算结果通知一级双机A;反之,则不通知。
在本发明实施例中,并不限于上述实现方式,即由一级双机备机进行与二级双机链路的检测,并根据检测结果判断是否需要进行一级双机倒换。
在本发明的另一实施例中,还可以由一级双机备机进行与二级双机链路的检测,并将检测结果通知一级双机主机,由一级双机主机进行判断是否需要进行一级双机倒换。
具体地,所述一级双机备机检测与二级双机主机和备机的链路,并将检测结果发送给所述一级双机主机;所述一级双机主机,还用于在检测到与二级双机备机链路故障后,并且所述一级双机备机通知的检测结果是所述一级双机备机与二级双机主机或备机链路正常时,进行倒换。
同样,在有多套二级双机的情况下,有可能同时存在不同的链路故障,因此,为了减少由于一级双机倒换而扩大故障的严重度,在本发明实施例中,所述一级双机主机还用于在有多套二级双机时,与所述一级双机备机进行倒换前,根据所述一级双机备机发送的检测结果确定所述一级双机备机与其他二级双机链路是否有故障;如果没有故障或者有故障但所述系统中所有与所述一级双机备机链路正常的二级双机的权重和高于所述系统中所有与所述一级双机主机链路正常的二级双机的权重和,则与所述一级双机备机进行倒换,否则不进行倒换。当然,所述系统中所有与所述一级双机备机链路正常的二级双机的权重和、以及所述系统中所有与所述一级双机主机链路正常的二级双机的权重和,可以由一级双机备机计算得到并报告给一级双机主机,也可以由一级双机主机根据一级双机备机发送的一级双机备机与各套二级双机链路的状态计算得到。
在本发明实施例中,二级双机独立进行检测并根据检测结果进行倒换。比如,图1中所示的二级双机201。其中,二级双机C检测与一级双机的浮动IP链路,在二级双机C检测到与一级双机的浮动IP链路故障后,发送检测结果给二级双机D;二级双机D检测与一级双机的浮动IP链路,如果正常,则将检测结果发送给二级双机C;二级双机C根据所述检测结果,与二级双机D进行倒换。
当然,本发明实施例并不仅限于上述检测方式,二级双机D也可以实时或周期地检测与一级双机的浮动IP链路,并将检测结果发送给二级双机C,二级双机C根据二级双机D的检测结果决定是否进行二级双机倒换。
本发明实施例多级双机系统,无需在每种故障倒换过程中都中断全系统的工作,而且能够触发恢复系统的倒换。
如图2所示,是本发明实施例多级双机系统倒换方法的一种流程图。
步骤21,一级双机主机与二级双机主机链路故障。
步骤22,检测一级双机主机与二级双机备机链路是否正常;如果是,则执行步骤23,否则执行步骤24。
具体地,在一级双机主机检测与二级双机备机链路时,可以根据预先配置的二级双机备机的静态IP地址进行检测,即一级双机主机检测是否能与二级双机备机的静态IP地址通信,如果能够通信,则表明链路正常,否则表明链路故障。
步骤23,等待二级双机进行倒换。
也就是说,在这种情况下,即无需一级双机倒换,仅通过二级双机倒换就能解决该故障问题的情况,本发明实施例不进行一级双机倒换,因而无需中断全系统的工作,减少了对系统的影响。
步骤24,一级双机进行倒换。
当然,假设同时存在多种故障,比如一级双机主机与二级双机主备机链路或一级双机备机与二级双机主备机链路都有故障(即后面表1中序号为1的故障),在这种情况下,即使一级双机进行倒换也无法解决该故障,只有采取其他方式,比如更换二级双机等来解决。
因此,为了避免不必要的一次双机倒换,在本发明实施例中,还可进一步包括以下步骤:
一级双机主机检测到与二级双机备机链路故障后,不立即与一级双机备机进行倒换,而是先由一级双机备机对一级双机备机与二级双机间的链路进行检测,根据检测结果再决定是否进行一级双机倒换。即如果一级双机备机与二级双机主机或备机链路正常,则一级双机进行倒换;否则一级双机不进行倒换。
具体地,一级双机备机可以按照以下过程进行链路检测:
首先,一级双机备机检测与二级双机主机的链路状态,如果链路正常,则通知一级双机主机,以使一级双机进行倒换;否则,一级双机备机继续检测与二级双机备机的链路状态,如果链路正常,则通知一级双机主机,以使一级双机进行倒换;否则不进行通知。
同样,一级双机备机对与二级双机之间的链路检测也是根据预先配置的二级双机主机和备机的静态IP地址进行检测,具体与一级双机主机的检测方式相同,在此不再赘述。
需要说明的是,在有多套二级双机时,可能会同时出现不同的链路故障,而且,当一级双机倒换后不仅能够恢复故障,而且还会产生新的故障,在这种情况下,可以将倒换前链路正常的所有双机的权重和与倒换后链路正常的所有双机权重和进行比较,根据比较结果来决定是否进行一级双机倒换。
假设一级双机备机与m个二级双机链路正常,与n个二级双机链路故障;而一级双机主机与a个二级双机链路正常,与b个二级双机链路故障;x为各个二级双机的权重(在此假设各二级双机的权重相同),则
Figure G2009101615267D00081
为一级双机倒换后一级双机备用所能够通信的二级双机权重之和;
为一级双机倒换前一级双机主用所能够通讯的二级双机权重之和;
比较两者的大小,如果前者大,则一级双机进行倒换;否则一级双机不倒换。
当前,上面是假设各二级双机的权重相同,根据实现需要,各二级双机也可以设定不同的权重。同样,对于有多级双机的情况,各级双机中的多套双机也可以设定不同的权重。
因此,为了减少由于一级双机倒换而扩大故障严重程度,在上述一级双机备机进行链路检测的过程中,还可以包括以下步骤:在一级双机备机检测到与本二级双机主机或备机链路正常,一级双机进行倒换之前,还要进一步检测一级双机备机与其他二级双机主机或备机链路是否有故障;如果没有故障,或者有故障但所述系统中所有与所述一级双机备机链路正常的二级双机的权重和高于所述系统中所有与所述一级双机主机链路正常的二级双机的权重和,则执行所述一级双机进行倒换的步骤;否则,禁止执行所述一级双机进行倒换的步骤。
当然,本发明实施例并不仅限于上述这种实现方式,即由一级双机备机进行与二级双机链路的检测,并根据检测结果判断是否需要进行一级双机倒换,并通知一级双机主机进行双机倒换。
在本发明的另一实施例中,还可以由一级双机备机进行与二级双机链路的检测,并将检测结果发送给一级双机主机,由一级双机主机进行判断是否需要进行一级双机倒换。
具体地,所述一级双机备机检测与二级双机主机和备机的链路,并将检测结果发送给所述一级双机主机;所述一级双机主机,还用于在检测到与二级双机备机链路故障后,并且所述一级双机备机通知的检测结果是所述一级双机备机与二级双机主机或备机链路正常时,进行倒换。
同样,在有多套二级双机的情况下,有可能同时存在不同的链路故障,因此,为了减少由于一级双机倒换而扩大故障的严重度,在本发明实施例中,所述一级双机主机还用于在有多套二级双机时,与所述一级双机备机进行倒换前,根据所述一级双机备机的检测结果确定所述一级双机备机与其他二级双机链路是否有故障;如果没有故障或者有故障但所述系统中所有与所述一级双机备机链路正常的二级双机的权重和高于所述系统中所有与所述一级双机主机链路正常的二级双机的权重和,则与所述一级双机备机进行倒换,否则不进行倒换。
在本发明实施例多级双机系统倒换方法中,各套二级双机需要独立进行检测,并根据检测结果决定是否进行二级双机倒换。具体地,在正常情况下,二级双机主机与一级双机的浮动IP链路正常,在该链路出现故障后,如果二级双机备机检测与一级双机的浮动IP链路状态正常,则二级双机进行倒换;否则二级双机不进行倒换。
本发明实施例多级双机系统倒换方法,无需在每种故障倒换过程中都中断全系统的工作,而且能够触发恢复系统的倒换。
下面继续结合图1所示的多级双机系统对本发明实施例进行详细说明。
以一级双机100与二级双机201间故障为例,共有下列16种故障,如下表1所示。
  序号   A-C   A-D   B-C   B-D   能否恢复   一级双机   二级双机
  1   0   0   0   0   无法恢复
  2   0   0   0   1   能(两级倒换)   先倒换   后倒换
  3   0   0   1   0   能   倒换
  4   0   0   1   1   能   倒换
  5   0   1   0   0   能   等待二级双机倒换   倒换
  6   0   1   0   1   能   等待二级双机倒换   倒换
  7   0   1   1   0   能   等待二级双机倒换   倒换
  8   0   1   1   1   能   等待二级双机倒换   倒换
  9   1   0   0   0   系统正常
  10   1   0   0   1   系统正常
  11   1   0   1   0   系统正常
  12   1   0   1   1   系统正常
  13   1   1   0   0   系统正常
  14   1   1   0   1   系统正常
  15   1   1   1   0   系统正常
  16   1   1   1   1   系统正常
表1
其中,0表示对应的链路故障,1表示对应的链路正常。序号为9至16的故障,系统仍然正常工作;序号为1的故障只能通过更换设备来解决,在此不予考虑。
依照现有技术,只能解决表1中序号为3、4、7、8这四种故障,而本发明实施例多级双机系统倒换方法能够解决序号为2、3、4、5、6、7、8这七种故障。其中,序号为3、6、7、8这四种故障只需进行二级倒换即可使系统恢复正常;序号为3、4的故障需要经过两次判断确定是否进行一级倒换;序号为2的故障需要经过三次确定是否进行一级倒换。
下面分别对这三类故障的处理过程进行详细说明。
例1:一级双机A与二级双机C链路故障,但一级双机A与二级双机D链路正常,即A-C故障,A-D正常,也即序号为5、6、7、8的故障。
一级双机的处理流程如下:
当一级双机A与二级双机201间管理中断后,一级双机A首先检测与此二级双机D的链路状态,检测结果为链路正常,则一级双机A等待二级双机201倒换(可以设置相应的等待时间)。
二级双机的处理流程如下:
当一级双机A与二级双机C间管理中断后,二级双机D通过一级双机的浮动IP地址检测与一级双机的链路状态,检测结果为A-D链路正常,二级双机201发生倒换。
例2:一级双机A与二级双机C链路故障,但是与二级双机202链路正常;一级双机A与二级双机D链路故障,但一级双机B与二级双机C链路正常;即:A-C故障,A-D故障,B-C正常,也即序号为3、4的故障。
一级双机的处理流程如下:
当一级双机与一套二级双机(二级双机201)间管理中断后,一级双机A首先检测与二级双机D的链路状态,检测结果为链路故障,一级双机B检查与二级双机C的链路状态,检测结果为链路正常,说明一级双机倒换后能够与二级双机201恢复正常。
由于具有两套二级双机,因此还需要判断一级双机倒换后对二级双机202的影响,所以一级双机B还要检测与二级双机E的链路状态。
如果链路正常(说明倒换后,一级双机与两套二级双机都连通,而倒换前只与二级双机202连通,二级双机201与二级双机202的权重之和一定大于二级双机202的权重),因此一级双机倒换;如果链路故障,还需要进一步检测(与二级双机202还可能连通,通过两级倒换)一级双机B与二级双机202中二级双机F的链路的状态。
如果链路正常,说明一级双机倒换后,二级双机202也会接着发生倒换(两级倒换,即表格中序号为2的故障恢复场景;保证一级双机B与二级双机202仍然连通),所以一级双机发生倒换(因为倒换后与二级双机201和二级双机202都会连通,而倒换前只与二级双机202连通,二级双机201与二级双机202的权重之和一定大于二级双机202的权重)。如果链路故障,说明一级双机倒换后,一定丢失与二级双机202的通信(倒换前与二级双机202连通,倒换后能与二级双机201连通),这时需要比较二级双机201与二级双机202的权重,如果二级双机201权重大于二级双机202的权重,则一级双机进行倒换,倒换后仍然与权重高的二级双机201双机连通;否则一级双机不进行倒换。
二级双机的处理流程如下:
当一级双机A与二级双机C间管理中断后,二级双机D通过一级双机的浮动IP地址检测与一级双机的链路状态,检测结果为A-D故障,此时二级双机201不进行倒换。如果一级双机发生了倒换,二级双机201在一定时间后,又会发现与一级双机浮动IP链路正常(因为一级双机发生了倒换)。
例3:一级双机A与二级双机C和二级双机D链路故障,但是与二级双机202链路正常,一级双机A与二级双机D链路故障,一级双机B与二级双机C链路故障,但一级双机B与二级双机D链路正常;即:A-C故障,A-D故障,B-C故障,B-D正常,也即序号为2的故障。
一级双机的处理流程如下:
当一级双机A与二级双机201间管理中断后,一级双机A首先检测与二级双机D的链路状态,检测结果为链路故障,一级双机B检测与二级双机C的链路状态,检测结果为链路故障。一级双机B再检测与二级双机C的链路状态,检测结果为链路正常,说明发生两级倒换后一级双机100与二级双机201间链路能够恢复。
由于具有两套二级双机,因此还需要判断一级倒换后对二级双机202的影响,所以一级双机B还需要检测与二级双机E的链路状态。
如果检测结果为链路正常,说明一级双机倒换后,与两套二级双机都连通,而一级双机倒换前只与二级双机202连通,二级双机201与二级双机202的权重之和一定大于二级双机202的权重,因此一级双机倒换。如果检测结果为链路故障,还需要进一步确认(与二级双机202还可能连通)一级双机B与二级双机F的链路状态。
如果状态为正常,说明一级双机倒换后,二级双机202也会接着发生倒换(两级倒换,即表格中序号为2的故障恢复场景;保证一级双机与二级双机202仍然连通),所以一级双机发生倒换(因为倒换后一级双机B与二级双机201和二级双机202都会连通,而倒换前只与二级双机202连通,二级双机201与二级双机202的权重之和一定大于二级双机202的权重)。如果状态为故障,说明一级双机倒换后,一定丢失与二级双机202的通信(倒换前与二级双机202连通,倒换后能与二级双机201连通);这时需要比较二级双机201与二级双机202的权重,如果二级双机201权重大于二级双机202的权重,则一级双机进行倒换,倒换后仍然与权重高的二级双机201连通;否则一级双机不进行倒换。
二级双机的处理流程如下:
当一级双机A与二级双机C间管理中断后,二级双机D通过一级双机的浮动IP地址检测与一级双机的链路状态,检测结果为A-D故障,此时二级双机201不进行倒换。如果一级双机发生了倒换(启动两级倒换的场景),二级双机D(双机201当前备机)在一定时间后,又会发现与一级双机浮动IP链路正常,而二级双机C(双机201当前主机)仍然与一级双机浮动IP链路故障,说明此时二级双机201需要发生倒换,二级双机201倒换后链路恢复正常。
可见,本发明实施例多级双机系统及其倒换方法,无需在每种故障倒换过程中都中断全系统的工作,而且能够触发恢复系统的倒换。例如,一级双机A与二级双机C链路故障,并且一级双机B与二级双机C链路故障,依照现有技术的倒换策略,全系统不会发生倒换,在这种情况下,二级双机201就会彻底脱离一级双机的管理。而按照本发明实施例的方法,只需二级双机201进行倒换,全系统便能恢复正常。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如:ROM/RAM、磁碟、光盘等。
以上对本发明实施例进行了详细介绍,本文中应用了具体实施方式对本发明进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及设备;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1、一种多级双机系统,包括:一级双机和至少一套二级双机;所述一级双机包括:一级双机主机和一级双机备机;所述二级双机包括:二级双机主机和二级双机备机;其特征在于,
所述一级双机主机,用于检测与二级双机主机链路,并在检测到与二级双机主机链路故障后,检测与二级双机备机链路;如果检测到与二级双机备机链路故障,则与所述一级双机备机进行倒换;
所述二级双机,用于检测与一级双机之间的链路,在一级双机主机与二级双机主机链路故障,一级双机主机与二级双机备机链路正常的情况下,进行倒换。
2、根据权利要求1所述的系统,其特征在于,
所述一级双机备机,用于在一级双机主机检测到与二级双机主机和备机链路故障后,检测与二级双机的链路,如果检测到与二级双机主机或备机链路正常时,则向所述一级双机主机发送检测结果;
所述一级双级主机,还用于根据所述一级双机备机的检测结果与所述一级双机备机进行倒换。
3、根据权利要求2所述的系统,其特征在于,
所述一级双机备机还用于,在有多套二级双机时,检测与其他二级双机链路是否有故障;如果没有故障,或者有故障但所述系统中所有与所述一级双机备机链路正常的二级双机的权重和高于所述系统中所有与所述一级双机主机链路正常的二级双机的权重和,则将检测结果通知所述一级双机主机。
4、根据权利要求1所述的系统,其特征在于,
所述一级双机备机,用于检测与二级双机主机和备机的链路,并将检测结果通知所述一级双机主机;
所述一级双机主机,还用于在检测到与二级双机主机和备机链路故障后,并且所述一级双机备机通知的检测结果是所述一级双机备机与二级双机主机或备机链路正常时,进行倒换。
5、根据权利要求4所述的系统,其特征在于,
所述一级双机主机,还用于在有多套二级双机时,根据所述一级双机备机通知的检测结果确定所述一级双机备机与其他二级双机链路是否有故障;如果没有故障或者有故障但所述系统中所有与所述一级双机备机链路正常的二级双机的权重和高于所述系统中所有与所述一级双机主机链路正常的二级双机的权重和,则与所述一级双机备机进行倒换,否则不进行倒换。
6、根据权利要求2或4所述的系统,其特征在于,
所述一级双机主机或备机,利用二级双机主机的静态IP地址检测与二级双机主机链路是否正常,利用二级双机备机的静态IP地址检测与二级双机备机链路是否正常。
7、根据权利要求1-5任一项所述的系统,其特征在于,
所述二级双机主机,用于检测与一级双机的浮动IP链路;
所述二级双机备机,用于在所述二级双机主机检测到与所述一级双机的浮动IP链路故障后,检测与一级双机的浮动IP链路,如果正常,则向所述二级双机主机发送检测结果;
所述二级双机主机,还用于根据所述二级双机备机的检测结果与所述二级双机备机进行倒换。
8、一种多级双机系统倒换方法,其特征在于,包括:
一级双机主机与二级双机主机链路故障后,检测一级双机主机与二级双机备机链路;
如果一级双机主机与二级双机备机链路正常,则所述二级双机进行倒换,如果一级双机主机与二级双机备机链路故障,则所述一级双机进行倒换。
9、根据权利要求8所述的方法,其特征在于,所述一级双机进行倒换具体包括:
如果一级双机备机与二级双机主机或备机链路正常,则所述一级双机进行倒换。
10、根据权利要求8所述的方法,其特征在于,所述方法还包括:
一级双机主机利用二级双机主机的静态IP地址检测与二级双机主机链路是否正常,以及利用二级双机备机的静态IP地址检测与二级双机备机链路是否正常。
11、根据权利要求9或10所述的方法,其特征在于,所述方法还包括:
一级双机备机利用二级双机备机的静态IP地址检测与二级双机备机链路是否正常,以及利用二级双机主机的静态IP地址检测与二级双机主机链路是否正常。
12、根据权利要求9所述的方法,其特征在于,所述方法还包括:
如果有多套二级双机,则在所述一级双机备机与本二级双机主机或备机链路正常,所述一级双机进行倒换之前,检测所述一级双机备机与其他二级双机链路是否有故障;
如果没有故障,或者有故障但所述系统中所有与所述一级双机备机链路正常的二级双机的权重和高于所述系统中所有与所述一级双机主机链路正常的二级双机的权重和,则执行所述一级双机进行倒换的步骤;
否则,禁止执行所述一级双机进行倒换的步骤。
13、根据权利要求8、9、10、12中任一项所述的方法,其特征在于,所述方法还包括:
二级双机主机与一级双机的浮动IP链路故障后,如果二级双机备机与一级双机的浮动IP链路状态正常,则二级双机进行倒换。
CN2009101615267A 2009-07-31 2009-07-31 多级双机系统及其倒换方法 Active CN101616440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101615267A CN101616440B (zh) 2009-07-31 2009-07-31 多级双机系统及其倒换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101615267A CN101616440B (zh) 2009-07-31 2009-07-31 多级双机系统及其倒换方法

Publications (2)

Publication Number Publication Date
CN101616440A true CN101616440A (zh) 2009-12-30
CN101616440B CN101616440B (zh) 2012-05-23

Family

ID=41495765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101615267A Active CN101616440B (zh) 2009-07-31 2009-07-31 多级双机系统及其倒换方法

Country Status (1)

Country Link
CN (1) CN101616440B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107317694A (zh) * 2016-04-27 2017-11-03 深圳市深信服电子科技有限公司 集群中备机的链路检测方法及终端

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100353680C (zh) * 2004-02-25 2007-12-05 华为技术有限公司 实现多级通信设备备份的装置及其主备倒换的方法
CN101485139B (zh) * 2006-07-28 2011-09-14 中兴通讯股份有限公司 一种基于网元的分布式主备管理的方法及系统
CN101447858B (zh) * 2008-01-17 2012-01-11 中兴通讯股份有限公司 双机热备份系统中实现虚拟路由冗余协议同步倒换的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107317694A (zh) * 2016-04-27 2017-11-03 深圳市深信服电子科技有限公司 集群中备机的链路检测方法及终端
CN107317694B (zh) * 2016-04-27 2020-06-19 深信服科技股份有限公司 集群中备机的链路检测方法及终端

Also Published As

Publication number Publication date
CN101616440B (zh) 2012-05-23

Similar Documents

Publication Publication Date Title
CN103580902B (zh) 一种计算机信息系统及其动态容灾方法
CN102629225B (zh) 双控制器磁盘阵列、存储系统以及数据存储路径切换方法
CN100452759C (zh) 具有改进的故障转移通知的ip冗余
CN101588304B (zh) 一种vrrp的实现方法和设备
CN101714109B (zh) 双cpu系统主板的控制方法及设备
CN105337780B (zh) 一种服务器节点配置方法及物理节点
CN105095001A (zh) 分布式环境下虚拟机异常恢复方法
CN105933407A (zh) 一种实现Redis集群高可用的方法及系统
CN101873223A (zh) 基于ip切换的n+m服务备份机制
CN101216793A (zh) 一种多处理器系统故障恢复的方法及装置
CN103491134A (zh) 一种监控容器的方法、装置与代理服务系统
CN101482829A (zh) 集群系统、处理装置及集群系统冗余方法
CN105577444A (zh) 一种无线控制器管理方法及无线控制器
CN111030877A (zh) 主备设备切换方法和装置
CN113254205A (zh) 负载均衡系统、方法、装置、电子设备及存储介质
JP4836979B2 (ja) 二重化プログラマブルコントローラ
CN102891767B (zh) 一种链路保护方法、网元及系统
CN102487332B (zh) 故障处理方法、装置和系统
CN101616440B (zh) 多级双机系统及其倒换方法
CN103186435A (zh) 系统错误处理方法与使用该方法的服务器系统
CN104780067A (zh) 一种端口扩展设备的重启方法和装置
CN108459977A (zh) 一种存储系统中多控制器之间的io转发方法及装置
CN102271049A (zh) 通信设备状态设置方法、装置和系统
JP3621634B2 (ja) 冗長構成切替システム
CN113794541A (zh) 一种主备切换管理方法、装置、设备及机器可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211222

Address after: 450046 Floor 9, building 1, Zhengshang Boya Plaza, Longzihu wisdom Island, Zhengdong New Area, Zhengzhou City, Henan Province

Patentee after: xFusion Digital Technologies Co., Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right