CN107547257B - 一种服务器集群实现方法及装置 - Google Patents

一种服务器集群实现方法及装置 Download PDF

Info

Publication number
CN107547257B
CN107547257B CN201710575069.0A CN201710575069A CN107547257B CN 107547257 B CN107547257 B CN 107547257B CN 201710575069 A CN201710575069 A CN 201710575069A CN 107547257 B CN107547257 B CN 107547257B
Authority
CN
China
Prior art keywords
target interface
interface board
cpu
cluster
notification message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710575069.0A
Other languages
English (en)
Other versions
CN107547257A (zh
Inventor
彭剑远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN201710575069.0A priority Critical patent/CN107547257B/zh
Publication of CN107547257A publication Critical patent/CN107547257A/zh
Application granted granted Critical
Publication of CN107547257B publication Critical patent/CN107547257B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种服务器集群实现方法及装置,该方法包括:当检测到目标接口板发生故障时,向其它目标接口板发送通知消息,所述通知消息用于向所述其它目标接口板通知所述目标接口板发生故障,所述通知消息中携带有所述目标接口板的CPU的标识信息。应用本发明实施例可以缩短服务器集群中服务器故障的感知时间,提高服务器集群中服务器故障的响应效率。

Description

一种服务器集群实现方法及装置
技术领域
本发明涉及网络通信技术领域,尤其涉及一种服务器集群实现方法及装置。
背景技术
服务器集群就是指将多个服务器集中起来一起进行同一种服务,在客户端看来就像是只有一个服务器。集群可以利用多个服务器进行并行计算从而获得很高的计算速度,也可以用多个服务器做备份,从而使得在任何一个服务器发生故障的情况下,整个集群还是能正常运行。
一旦在服务器上安装并运行了集群服务(如安装支持集群功能的指定软件,例如,SDN(Soft Defined Network,软件自动网络)控制器,或其它管理软件等),该服务器即可加入群集。集群化操作可以减少单点故障数量,并且实现了集群化资源的高可用性。
然而实践发现,在现有服务器集群实现方案中,服务器集群中各服务器之间通过心跳机制监测集群内其它服务器的活跃状态;当某个服务器故障时,其它服务器需要经过几个心跳周期的时间才能感知到并进行响应,响应效率较差。
发明内容
本发明提供一种服务器集群实现方法及装置,以解决服务器集群中服务器故障时其它服务器响应效率差的问题。
根据本发明实施例的第一方面,提供一种服务器集群实现方法,应用于网络通信设备的主控板,所述网络通信设备还包括多个部署有中央处理单元CPU和硬盘的目标接口板,所述CPU集成有网卡,所述目标接口板的转发芯片与所述CPU的网卡的网口连接,所述目标接口板的CPU上运行有支持集群功能的软件,并运行有集群服务,该方法包括:
当检测到目标接口板发生故障时,向其它目标接口板发送通知消息,所述通知消息用于向所述其它目标接口板通知所述目标接口板发生故障,所述通知消息中携带有所述目标接口板的CPU的标识信息。
根据本发明实施例的第二方面,提供一种服务器集群实现方法,应用于网络通信设备的目标接口板的中央处理单元CPU,所述网络通信设备包括主控板和多个所述目标接口板,所述目标接口板部署有所述CPU和硬盘,所述CPU集成有网卡,所述目标接口板的转发芯片与所述CPU的网卡的网口连接,所述目标接口板的CPU上运行有支持集群功能的软件,并运行有集群服务,该方法包括:
接收主控板发送的通知消息,该通知消息携带有发生故障的目标接口板的CPU的标识信息;
根据预设集群策略响应所述通知消息。
根据本发明实施例的第三方面,提供一种服务器集群实现装置,应用于网络通信设备的主控板,所述网络通信设备还包括多个部署有中央处理单元CPU和硬盘的目标接口板,所述CPU集成有网卡,所述目标接口板的转发芯片与所述CPU的网卡的网口连接,所述目标接口板的CPU上运行有支持集群功能的软件,并运行有集群服务,该装置包括:
检测单元,用于检测目标接口板是否发生故障;
发送单元,用于当所述检测单元检测到目标接口板发送故障时,向其它目标接口板发送通知消息,所述通知消息用于向所述其它目标接口板通知所述目标接口板发生故障,所述通知消息中携带有所述目标接口板的CPU的标识信息。
根据本发明实施例的第四方面,提供一种服务器集群实现装置,应用于网络通信设备的目标接口板的中央处理单元CPU,所述网络通信设备包括主控板和多个所述目标接口板,所述目标接口板部署有所述CPU和硬盘,所述CPU集成有网卡,所述目标接口板的转发芯片与所述CPU的网卡的网口连接,所述目标接口板的CPU上运行有支持集群功能的软件,并运行有集群服务,该装置包括:
接收单元,用于接收主控板发送的通知消息,该通知消息携带有发生故障的目标接口板的CPU的标识信息;
响应单元,用于根据预设集群策略响应所述通知消息。
应用本发明实施例,通过在网络通信设备的目标接口板上部署CPU和硬盘,并在该CPU上集成网卡,目标接口板的转发芯片与其上部署的CPU的网卡的网口连接;进而,通过在目标接口板的CPU上运行支持集群功能的软件,并运行集群服务,以使网络通信设备的多个目标接口板形成服务器集群;当主控板检测到目标接口板发送故障时,向其它目标接口板发送通知消息,以使未发生故障的其它目标接口板的CPU能够及时感知目标接口板发生故障,并进行响应,缩短了服务器集群中服务器故障的感知时间,提高了服务器集群中服务器故障的响应效率。
附图说明
图1是本发明实施例提供的一种框式架构的网络通信设备的结构示意图;
图2是本发明实施例提供的一种服务器集群实现方法的流程示意图;
图3是本发明实施例提供的一种服务器集群实现方法的流程示意图;
图4是本发明实施例提供的一种交换机的架构示意图;
图5是本发明实施例提供的一种服务器集群实现装置的结构示意图;
图6是本发明实施例提供的一种服务器集群实现装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,下面先对本发明实施例适用的系统架构进行简单说明。
本发明实施例提供的服务器集群实现方法可以适用于框式结构的网络通信设备,如交换机、路由器等。
请参见图1,为本发明实施例提供的一种框式架构的网络通信设备的结构示意图,如图1所示,该网络通信设备可以包括主控板以及多个部署有CPU(Center Process Unit,中央处理单元)和硬盘的接口板(本文中称为目标接口板),其中,目标接口板上部署的CPU集成有网卡,从而,各目标接口板上相当于集成了一台小型服务器,上面可以安装各种软件。
在图1所示的网络设备中,目标接口板的CPU上可以运行支持集群功能的软件,如SDN控制器或其它支持集群功能的管理软件等,并运行集群服务,从而,多个目标接口板上集成的小型服务器形成服务器集群。
为便于描述,下文中以运行有上述软件的CPU作为服务器集群中的服务器为例进行说明。
在图1所示网络通信设备中,目标接口板的转发芯片与其上部署的CPU的网卡的网口连接;当目标接口板发生故障,如发生重启或被拔出时,主控板可以感知,并向未发生故障的其它目标接口板发送通知消息;由于目标接口板上部署的CPU的网卡的网口与其所在的目标接口板的转发芯片连接,因此,未发生故障的其它目标接口板上部署的CPU可以接收到该通知消息,从而感知到服务器集群中有服务器发送故障,进而根据预设集群策略进行响应。
需要说明的是,下文中若未特殊说明,所提及的软件均指支持集群功能的软件。
为了使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。
请参见图2,为本发明实施例提供的一种服务器集群实现方法的流程示意图,其中,该服务器集群实现方法可以应用于图1所示网络通信设备的主控板,如图2所示,该服务器集群实现方法可以包括以下步骤:
步骤201、当检测到目标接口板发生故障时,向其它目标接口板发送通知消息,该通知消息用于向其它目标接口板通知该目标接口板发生故障,该通知消息中携带有目标接口板的CPU的标识信息。
本发明实施例中,当任一目标接口板发生故障时,如发生重启或被拔出,主控板均能感知;此时,主控板可以向未发生故障的其它目标接口板发送通知消息,以通知有目标接口板发生了故障,进而,当未发生故障的其它目标接口板发现自身集成的小型服务器与发生故障的目标接口板上集成的小型服务器形成服务器集群(即安装有相同的软件,并运行有集群服务)时,该未发生故障的其它目标接口板可以按照预设集群策略进行响应。
在本发明其中一个实施例中,上述向其它目标接口板发送通知消息,可以包括:
根据目标接口板上安装的软件,向安装有相同软件的其它目标接口板发送通知消息。
在该实施例中,主控板上可以记录各目标接口板上安装的软件,当主控板检测到目标接口板发生故障时,主控板可以根据发生故障的目标接口板上安装的软件,确定与该发生故障的目标接口板安装有相同软件的其它目标接口板(未发生故障的接口板),并针对性地向该与发生故障的目标接口板安装有相同软件的其它目标接口板发送通知消息,以减少无效通知消息的发送,节省系统资源。
请参见图3,为本发明实施例提供的一种服务器集群实现方法的流程示意图,其中,该服务器集群实现方法可以应用于第一目标接口板上部署的CPU,其中,该第一目标接口板可以为图1所示网络通信设备包括的任一的目标接口板,如图3所示,该服务器集群实现方法可以包括以下步骤:
步骤301、接收主控板发送的通知消息,该通知消息携带有发生故障的目标接口板的CPU的标识信息。
本发明实施例中,主控板向目标接口板发送用于通知网络通信设备中存在目标接口板发生故障的通知消息的具体实现可以参见图2所示方法流程中的相关描述,本发明实施例在此不再赘述。
步骤302、根据预设集群策略响应该通知消息。
本发明实施例中,由于第一目标接口板上部署的CPU的网卡的网口与其所在的目标接口板连接,因此,第一目标接口板上部署的CPU可以接收到主控板向该第一目标接口板发送的通知消息,进而,该第一目标接口板上部署的CPU可以根据该通知消息确定服务器集群内是否存在服务器发生故障。
需要注意的是,在本发明实施例中,第一目标接口板接收到主控板发送的通知消息时,在响应该通知消息之前,需要先判断第一目标接口板与该发生故障的目标接口板是否安装有相同的软件,即判断第一目标接口板与该发生故障的目标接口板是否属于同一服务器集群;若第一目标接口板与该发生故障的目标接口板安装有相同的软件(即第一目标接口板与该发生故障的目标接口板属于同一服务器集群),则确定需要响应该通知消息;否则(即第一目标接口板与该发生故障的目标接口板不属于同一服务器集群),确定不需要响应该通知消息。
在本发明其中一个实施例中,上述根据预设集群策略响应该通知消息,可以包括:
当发生故障的目标接口板上部署的CPU为服务器集群中的主服务器时,重新选举所述服务器集群中的主服务器。
在该实施例中,当第一目标接口板的CPU接收到主控板发送的通知消息,且确定发生故障的目标接口板上部署的CPU为服务器集群中的主服务器时,第一目标接口板上部署的CPU需要与服务器集群中的未发生故障的其它目标接口板上部署的CPU重新选举新的主服务器。
例如,可以将服务器集群包括的未发生故障的目标接口板上部署的CPU中网卡的MAC(Media Access Control,媒体访问控制)地址最小(或最大)的CPU选举为服务器集群中新的主服务器。
值得说明的是,当发生故障的目标接口板上部署的CPU为服务器集群中的主服务器,且第一目标接口板上部署的CPU确定服务器集群内不存在其它目标接口板上部署的CPU时,第一目标接口板上部署的CPU直接成为新的主服务器。
在本发明另一个实施例中,上述根据预设集群策略响应该通知消息,可以包括:
当发生故障的目标接口板上部署的CPU为服务器集群中的备服务器时,进行业务切换处理。
在该实施例中,当服务器集群中的各服务器之间存在负载分担的关系时,第一目标接口板的CPU接收到主控板发送的通知消息,并确定发生故障的目标接口板的CPU为服务器集群中的备服务器时,第一目标接口板的CPU需要按照预设集群策略进行业务切换处理,以将发生故障的目标接口板的CPU上的业务切换给服务器集群中未发生故障的服务器进行处理。
为了使本领域技术人员更好地理解本发明实施例提供的技术方案,下面结合具体应用场景对本发明实施例提供的技术方案进行说明。
请参见图4,为本发明实施例提供的一种交换机的架构示意图,如图4所示,该交换机包括背板410、主控板420以及目标接口板431、432和433,其中,主控板420与目标接口板431、432、433都连接在背板410上;目标接口板431、432和433上部署有CPU和硬盘,该CPU集成有网卡(MAC地址分别为MAC1、MAC2和MAC3),各目标接口板的转发芯片与其上部署的CPU的网卡的网口连接;各目标接口板的CPU上运行有SDN控制器,并运行有集群服务,即目标接口板431、432和433的CPU形成SDN控制器集群。
基于图4所示的应用场景,本发明实施例提供的服务器集群实现方法的流程如下:
1、当主控板检测到目标接口板发生故障时,向其它目标接口板发送通知消息;
在该实施例中,假设发生故障的目标接口板为目标接口板431,当主控板检测到目标接口板431发生故障,如重启或被拔出时,主控板可以向目标接口板432和433发送通知消息;
其中,该通知消息的消息格式可以采用Openflow协议的形式,通过对现有Openflow协议进行扩展,新增一种TLV(Type,length,Value,类型、长度、值)字段用于表示目标接口板发生故障,该TVL字段中可以携带发生故障的目标接口板的CPU的网卡的MAC地址;
在该实施例中,主控板向目标接口板432和433发送的通知消息的新增TLV中携带的MAC地址为MAC1;
2、目标接口板432(目标接口板433)的CPU接收到主控板发送的通知消息,获取该通知消息中携带的MAC地址(MAC1),确定目标接口板431的CPU上运行的SDN控制器发生故障;
3、若目标接口板431的CPU上运行的SDN控制器为主SDN控制器,则目标接口板432和目标接口板433的CPU上运行的SDN控制器需要根据预设集群算法,重新选举新的主SDN控制器;
4、若目标接口板431的CPU上运行的SDN控制器为备SDN控制器,且SDN控制器集群中各SDN控制器之间存在负载分担的关系,则目标接口板432和目标接口板433的CPU上运行的SDN控制器需要根据预设集群算法,进行业务切换处理,将目标接口板431的CPU上运行的SDN控制器处理的业务切换到目标接口板432和目标接口板433的CPU上运行的SDN控制器处理。
通过以上描述可以看出,在本发明实施例提供的技术方案中,通过在网络通信设备的目标接口板上部署CPU和硬盘,并在该CPU上集成网卡,目标接口板的转发芯片与其上部署的CPU的网卡的网口连接;进而,通过在目标接口板的CPU上运行支持集群功能的软件,并运行集群服务,以使网络通信设备的多个目标接口板形成服务器集群;当主控板检测到目标接口板发送故障时,向其它目标接口板发送通知消息,以使未发生故障的其它目标接口板的CPU能够及时感知目标接口板发生故障,并进行响应,缩短了服务器集群中服务器故障的感知时间,提高了服务器集群中服务器故障的响应效率。
请参见图5,为本发明实施例提供的一种服务器集群实现装置的结构示意图,其中,该装置可以应用于上述方法实施例中的主控板,如图5所示,该装置可以包括:
检测单元510,用于检测目标接口板是否发生故障;
发送单元520,用于当检测单元510检测到目标接口板发送故障时,向其它目标接口板发送通知消息,通知消息用于向其它目标接口板通知目标接口板发生故障,通知消息中携带有目标接口板的CPU的标识信息。
在可选实施例中,发送单元520,具体用于根据目标接口板上安装的软件,向安装有相同软件的其它目标接口板发送通知消息。
请参见图6,为本发明实施例提供的一种服务器集群实现装置的结构示意图,其中,该装置可以应用于上述方法实施例中的目标接口板的CPU,如图6所示,该装置可以包括:
接收单元610,用于接收主控板发送的通知消息,该通知消息携带有发生故障的目标接口板的CPU的标识信息;
响应单元620,用于根据预设集群策略响应通知消息。
在可选实施例中,响应单元620,具体用于当发生故障的目标接口板上部署的CPU为服务器集群中的主服务器时,重新选举服务器集群中的主服务器。
在可选实施例中,响应单元620,具体用于当发生故障的目标接口板上部署的CPU为服务器集群中的备服务器时,进行业务切换处理。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
由上述实施例可见,通过在网络通信设备的目标接口板上部署CPU和硬盘,并在该CPU上集成网卡,目标接口板的转发芯片与其上部署的CPU的网卡的网口连接;进而,通过在目标接口板的CPU上运行支持集群功能的软件,并运行集群服务,以使网络通信设备的多个目标接口板形成服务器集群;当主控板检测到目标接口板发送故障时,向其它目标接口板发送通知消息,以使未发生故障的其它目标接口板的CPU能够及时感知目标接口板发生故障,并进行响应,缩短了服务器集群中服务器故障的感知时间,提高了服务器集群中服务器故障的响应效率。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (8)

1.一种服务器集群实现方法,应用于网络通信设备的主控板,其特征在于,所述网络通信设备还包括多个部署有中央处理单元CPU和硬盘的目标接口板,所述CPU集成有网卡,所述目标接口板的转发芯片与所述CPU的网卡的网口连接,所述目标接口板的CPU上运行有支持集群功能的软件,并运行有集群服务,该方法包括:
当检测到目标接口板发生故障时,根据已记录的各目标接口板安装的软件,确定与发生故障的目标接口板安装有相同软件的其它目标接口板,并向该与发生故障的目标接口板安装有相同软件的其它目标接口板发送通知消息,其中,安装有相同软件的目标接口板属于同一服务器集群,所述通知消息用于向所述其它目标接口板通知所述目标接口板发生故障,所述通知消息中携带有所述目标接口板的CPU的标识信息。
2.一种服务器集群实现方法,其特征在于,应用于网络通信设备的目标接口板的中央处理单元CPU,所述网络通信设备包括主控板和多个所述目标接口板,所述目标接口板部署有所述CPU和硬盘,所述CPU集成有网卡,所述目标接口板的转发芯片与所述CPU的网卡的网口连接,所述目标接口板的CPU上运行有支持集群功能的软件,并运行有集群服务,该方法包括:
接收主控板发送的通知消息,该通知消息携带有发生故障的目标接口板的CPU的标识信息;
判断本目标接口板与所述发生故障的目标接口板是否安装有相同的软件,安装有相同软件的目标接口板属于同一服务器集群;
如果是,根据预设集群策略响应所述通知消息。
3.根据权利要求2所述的方法,其特征在于,所述根据预设集群策略响应所述通知消息,包括:
当发生故障的目标接口板上部署的CPU为服务器集群中的主服务器时,重新选举所述服务器集群中的主服务器。
4.根据权利要求2所述的方法,其特征在于,所述根据预设集群策略响应所述通知消息,包括:
当发生故障的目标接口板上部署的CPU为服务器集群中的备服务器时,进行业务切换处理。
5.一种服务器集群实现装置,应用于网络通信设备的主控板,其特征在于,所述网络通信设备还包括多个部署有中央处理单元CPU和硬盘的目标接口板,所述CPU集成有网卡,所述目标接口板的转发芯片与所述CPU的网卡的网口连接,所述目标接口板的CPU上运行有支持集群功能的软件,并运行有集群服务,该装置包括:
检测单元,用于检测目标接口板是否发生故障;
发送单元,用于当所述检测单元检测到目标接口板发生故障时,根据已记录的各目标接口板安装的软件,确定与发生故障的目标接口板安装有相同软件的其它目标接口板,并向该与发生故障的目标接口板安装有相同软件的其它目标接口板发送通知消息,其中,安装有相同软件的目标接口板属于同一服务器集群,所述通知消息用于向所述其它目标接口板通知所述目标接口板发生故障,所述通知消息中携带有所述目标接口板的CPU的标识信息。
6.一种服务器集群实现装置,其特征在于,应用于网络通信设备的目标接口板的中央处理单元CPU,所述网络通信设备包括主控板和多个所述目标接口板,所述目标接口板部署有所述CPU和硬盘,所述CPU集成有网卡,所述目标接口板的转发芯片与所述CPU的网卡的网口连接,所述目标接口板的CPU上运行有支持集群功能的软件,并运行有集群服务,该装置包括:
接收单元,用于接收主控板发送的通知消息,该通知消息携带有发生故障的目标接口板的CPU的标识信息;
响应单元,用于判断本目标接口板与所述发生故障的目标接口板是否安装有相同的软件,安装有相同软件的目标接口板属于同一服务器集群;如果是,根据预设集群策略响应所述通知消息。
7.根据权利要求6所述的装置,其特征在于,
所述响应单元,具体用于当发生故障的目标接口板上部署的CPU为服务器集群中的主服务器时,重新选举所述服务器集群中的主服务器。
8.根据权利要求6所述的装置,其特征在于,
所述响应单元,具体用于当发生故障的目标接口板上部署的CPU为服务器集群中的备服务器时,进行业务切换处理。
CN201710575069.0A 2017-07-14 2017-07-14 一种服务器集群实现方法及装置 Active CN107547257B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710575069.0A CN107547257B (zh) 2017-07-14 2017-07-14 一种服务器集群实现方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710575069.0A CN107547257B (zh) 2017-07-14 2017-07-14 一种服务器集群实现方法及装置

Publications (2)

Publication Number Publication Date
CN107547257A CN107547257A (zh) 2018-01-05
CN107547257B true CN107547257B (zh) 2021-08-24

Family

ID=60971173

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710575069.0A Active CN107547257B (zh) 2017-07-14 2017-07-14 一种服务器集群实现方法及装置

Country Status (1)

Country Link
CN (1) CN107547257B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112564931B (zh) * 2019-09-25 2022-08-19 华为技术有限公司 一种故障处理方法、装置和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059764A (zh) * 2007-05-16 2007-10-24 杭州华三通信技术有限公司 一种实现分布式设备的控制方法
CN101178634A (zh) * 2006-11-08 2008-05-14 联想(北京)有限公司 刀片服务器及其应用的存储实现方法
CN102970167A (zh) * 2012-11-26 2013-03-13 华为技术有限公司 集群系统中网络节点的故障检测方法、网络节点和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102326358B (zh) * 2008-10-29 2013-12-04 华为技术有限公司 一种集群系统扩容方法、装置及集群系统
CN102411637B (zh) * 2011-12-30 2013-07-24 创新科软件技术(深圳)有限公司 分布式文件系统的元数据管理方法
CN103297396B (zh) * 2012-02-28 2016-05-18 国际商业机器公司 群集系统中管理故障转移的装置和方法
CN104994071B (zh) * 2015-05-28 2018-11-09 新华三技术有限公司 宽带远程接入服务器设备的备份方法及装置
CN106331098B (zh) * 2016-08-23 2020-01-21 东方网力科技股份有限公司 一种服务器集群系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178634A (zh) * 2006-11-08 2008-05-14 联想(北京)有限公司 刀片服务器及其应用的存储实现方法
CN101059764A (zh) * 2007-05-16 2007-10-24 杭州华三通信技术有限公司 一种实现分布式设备的控制方法
CN102970167A (zh) * 2012-11-26 2013-03-13 华为技术有限公司 集群系统中网络节点的故障检测方法、网络节点和系统

Also Published As

Publication number Publication date
CN107547257A (zh) 2018-01-05

Similar Documents

Publication Publication Date Title
US11323307B2 (en) Method and system of a dynamic high-availability mode based on current wide area network connectivity
EP3620905B1 (en) Method and device for identifying osd sub-health, and data storage system
US9600380B2 (en) Failure recovery system and method of creating the failure recovery system
CN102355369B (zh) 虚拟化集群系统及其处理方法和设备
CN102710457B (zh) 一种跨网段的n+1备份方法及装置
CN106330475B (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
WO2016058307A1 (zh) 资源的故障处理方法及装置
US9886358B2 (en) Information processing method, computer-readable recording medium, and information processing system
US10318392B2 (en) Management system for virtual machine failure detection and recovery
CN102394914A (zh) 集群脑裂处理方法和装置
CN112217658B (zh) 一种堆叠分裂处理方法及装置
US11349706B2 (en) Two-channel-based high-availability
CN101873223A (zh) 基于ip切换的n+m服务备份机制
CN104158707A (zh) 一种检测并处理集群脑裂的方法和装置
CN103036701A (zh) 一种跨网段的n+1备用方法及装置
CN110535714B (zh) 一种仲裁方法及相关装置
CN107547257B (zh) 一种服务器集群实现方法及装置
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
CN111181764A (zh) 一种基于ovs的主备切换方法及其系统
CN107682188B (zh) 一种故障感知方法和装置
US8438261B2 (en) Failover scheme with service-based segregation
US10516625B2 (en) Network entities on ring networks
CN111510336B (zh) 一种网络设备状态管理方法及装置
US9798633B2 (en) Access point controller failover system
CN109462639B (zh) 端口扩展设备管理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant