CN105553735A - 一种堆叠系统故障处理方法、设备及堆叠系统 - Google Patents

一种堆叠系统故障处理方法、设备及堆叠系统 Download PDF

Info

Publication number
CN105553735A
CN105553735A CN201510990103.1A CN201510990103A CN105553735A CN 105553735 A CN105553735 A CN 105553735A CN 201510990103 A CN201510990103 A CN 201510990103A CN 105553735 A CN105553735 A CN 105553735A
Authority
CN
China
Prior art keywords
pile system
fault
member device
information
fault handling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510990103.1A
Other languages
English (en)
Other versions
CN105553735B (zh
Inventor
董琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN201510990103.1A priority Critical patent/CN105553735B/zh
Publication of CN105553735A publication Critical patent/CN105553735A/zh
Application granted granted Critical
Publication of CN105553735B publication Critical patent/CN105553735B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明的实施例提供了一种堆叠系统故障处理方法、设备及堆叠系统,涉及通信技术领域,能够提高堆叠系统故障恢复的效率。该方法包括:主控设备检测堆叠系统中是否有成员设备为故障设备;若堆叠系统中有成员设备为故障设备,主控设备向堆叠系统中所有成员设备发送故障处理信息,以便于堆叠系统中所有成员设备收到故障处理信息,成员设备根据故障处理信息进行故障恢复。本发明的实施例用于堆叠系统故障处理。

Description

一种堆叠系统故障处理方法、设备及堆叠系统
技术领域
本发明涉及通信技术领域,尤其涉及一种堆叠系统故障处理方法、设备及堆叠系统。
背景技术
在网络连接中,为了保持网络的稳定性与可靠性,通常都使用一些备份连接,以提高网络的健壮性,这里的备份连接被称为冗余链路.但是冗余链路也会使网络存在环路,使网络资源消耗增加,甚至造成网络中断。针对上述问题,现有技术提出了一种堆叠技术,能够在提高网络的健壮性的同时,降低网络资源消耗并简化网络设计。堆叠技术是通过堆叠链路连接将多台网络设备如交换机连接在一起组成堆叠系统(StackingSystem,SS),以便在有限的空间内提供尽可能多的端口。具体的,通过堆叠技术形成的堆叠系统常常由多台配置相同的设备通过堆叠链路连接而成,对外呈现为一台虚拟的较大型的设备。堆叠系统中的这些网络设备统称为堆叠系统的成员设备,参与堆叠的成员设备中,其中一台设备为主控设备(Master),其他设备都为从属设备(Slave)。其中主控设备处于激活状态(Active),充当管理者和控制者的角色,其配置生效;而从属设备则处于备用状态(Standby),其配置不生效。
但是,堆叠系统通常会出现一系列的异常情况,虽然现有技术中针对堆叠系统分裂、堆叠系统合并等情况存在相应的检测与自动恢复对策,但针对出上述情况以外的其他堆叠系统异常,则无相应的自动恢复措施。例如在堆叠系统中,堆叠成员设备之间通过堆叠线路传递报文,当因堆叠线路自身原因导致报文丢失时,需要针对报文具体类型而进行不同的异常恢复处理,处理过程复杂;又如在堆叠系统中,堆叠成员设备之间通过堆叠线路传递报文,在堆叠系统由多个堆叠成员组成的情况下,会存在部分堆叠线路的数据流量负载过重,而部分堆叠线路的数据流量负载较轻的情况,由于堆叠系统内成员设备之间的转发路径是提前确定的,所以不能实时感知变化并进行流量的负载调节。在上述情况中,成员设备均自行处理相关的异常并进行故障恢复,或者需要用户感知相关异常或故障后进行人为干预,才能使堆叠系统恢复正常,从而使堆叠系统占用资源较多,降低了堆叠系统的效率,并使堆叠系统稳定性变差。
发明内容
本发明的实施例提供的一种堆叠系统故障处理方法、设备及堆叠系统,能够提高堆叠系统故障处理的效率,减少堆叠系统中进行故障处理所消耗资源,保证堆叠系统的容错性及稳定性。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供了一种堆叠系统故障处理方法,应用于由多个成员设备组成的堆叠系统,多个成员设备中包括一个主控设备,包括:主控设备检测堆叠系统中是否有成员设备为故障设备;若堆叠系统中有成员设备为故障设备,主控设备向堆叠系统中所有成员设备发送故障处理信息,以便于堆叠系统中所有成员设备收到故障处理信息,成员设备根据故障处理信息进行故障恢复。
在第一方面的第一种可能的实现方式中,该方法还包括:主控设备获取堆叠系统中成员设备的设备信息,并根据设备信息检测堆叠系统中是否存在故障设备;若堆叠系统中存在故障设备,主控设备根据设备信息与故障类型信息获取故障处理信息,并向堆叠系统中所有成员设备发送故障处理信息,主控设备预设故障类型信息。
结合第一方面或者第一方面第一种可能的实现方式,在第二种可能的实现方式中,故障处理信息包括:成员设备标识、故障模块标识、故障事件标识、故障优先级、故障恢复行为标识。
结合第一方面第一种可能的实现方式,在第三种可能的实现方式中,故障类型信息包括:故障模块标识、故障事件标识、故障优先级、故障恢复行为标识。
第二方面,本发明实施例提供了一种堆叠系统故障处理方法,应用于由多个成员设备组成的堆叠系统,多个成员设备中包括一个主控设备,该方法包括:成员设备接收主控设备发送的故障处理信息;当堆叠系统中所有成员设备均收到故障处理信息,成员设备根据故障处理信息进行故障恢复。
在第二方面的第一种可能的实现方式中,该方法还包括:当堆叠系统中所有成员设备收到故障处理信息后,成员设备根据自身设备信息与故障处理信息,获取相应的故障恢复行为与故障优先级,并根据故障优先级依次执行相应的故障恢复行为。
结合第二方面,或者第二方面第一种可能的实现方式,在第二种可能的实现方式中,该方法还包括:当成员设备为故障设备时,设置故障设备的堆叠主控角色选举资格为无效,并通知堆叠系统内其它成员设备,故障设备不具有主控角色选举资格;当成员设备为非故障设备时,设置所述非故障设备的堆叠主控角色选举资格为有效,并通知堆叠系统内其它成员设备,非故障设备具有主控角色选举资格。
第三方面,本发明实施例提供了一种主控设备,应用于由多个成员设备组成的堆叠系统,多个成员设备中包括主控设备,该主控设备包括:检测单元,用于检测堆叠系统中是否有成员设备为故障设备;发送单元,用于当检测单元检测到堆叠系统中有成员设备为故障设备,向堆叠系统中所有成员设备发送故障处理信息,以便于堆叠系统中所有成员设备收到故障处理信息,成员设备根据故障处理信息进行故障恢复。
在第三方面的第一种可能的实现方式中,该主控设备还包括:获取单元,用于获取堆叠系统中成员设备的设备信息;检测单元具体用于根据设备信息检测堆叠系统中是否存在故障设备;若检测单元检测到堆叠系统中存在故障设备,获取单元还用于根据设备信息与故障类型信息获取故障处理信息;发送单元具体用于向堆叠系统中所有成员设备发送故障处理信息,主控设备预设故障类型信息。
第四方面,本发明实施例提供了一种成员设备,应用于由多个成员设备组成的堆叠系统,多个成员设备中包括主控设备,该成员设备包括:接收单元,用于接收主控设备发送的故障处理信息;处理单元,用于当堆叠系统中所有成员设备均收到故障处理信息,根据故障处理信息进行故障恢复。
在第四方面的第一种可能的实现方式中,成员设备还包括:处理单元还用于当堆叠系统中所有成员设备收到故障处理信息后,根据成员设备自身设备信息与故障处理信息,获取相应的故障恢复行为与故障优先级,并根据故障优先级依次执行相应的故障恢复行为。
结合第四方面或者第四方面第一种可能的实现方式,在第二种可能的实现方式中,该成员设备还包括:处理单元还用于当成员设备为故障设备时,设置故障设备的堆叠主控角色选举资格为无效,并通知堆叠系统内其它成员设备,故障设备不具有主控角色选举资格;当所述成员设备为非故障设备时,设置所述故障设备的堆叠主控角色选举资格为有效,并通知堆叠系统内其它成员设备,非故障设备具有主控角色选举资格。
第五方面,本发明实施例提供了一种堆叠系统,由多个成员设备组成,包括一个第三方面或第三方面任一种可能的实现方式中的主控设备,和至少一个第四方面或第四方面任一种可能的实现方式中的成员设备。
本发明的实施例提供的一种堆叠系统故障处理方法、设备及堆叠系统,包括:首先主控设备检测堆叠系统中是否有成员设备为故障设备;其次主控设备向堆叠系统中所有成员设备发送故障处理信息;成员设备判断是否堆叠系统中所有成员设备收到故障处理信息;成员设备根据故障处理信息进行故障恢复。因此上述实施例提供的堆叠系统故障处理方法在堆叠系统中存在故障设备且线路连接正常时,主控设备通过向堆叠系统中所有成员设备发送统一的故障恢复信息,使成员设备在堆叠系统中所有成员设备均收到该故障恢复信息后,能够根据自身设备信息与该故障恢复信息,获取该成员设备针对自身故障或堆叠系统中其他成员设备故障在自身进行故障恢复所需要的故障恢复信息,从而使堆叠系统中的成员设备能够根据主控设备发送的统一的故障恢复信息,在堆叠系统中出现不同的故障时,获取相应的故障恢复信息,并根据该故障恢复信息进行故障恢复,从而提高堆叠系统故障处理的效率,减少堆叠系统中进行故障处理所消耗资源,保证堆叠系统的容错性及稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的实施例提供的一种堆叠系统的结构示意图;
图2为本发明的实施例提供的一种堆叠系统故障处理方法的流程示意图;
图3为本发明的另一实施例提供的一种堆叠系统故障处理方法的流程示意图;
图4为本发明的实施例提供的一种堆叠系统的主控设备的结构示意图;
图5为本发明的另一实施例提供的一种堆叠系统的主控设备的结构示意图;
图6为本发明的实施例提供的一种堆叠系统的成员设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形的术语如“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。同时还应当理解,本申请中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
本发明的实施例提供了一种堆叠系统,该堆叠系统由多个成员设备组成,该堆叠系统中包括至少一个作为主控设备的成员设备。
示例性的,参照图1所示:该堆叠系统由四台成员设备构成,其中成员设备2为主控设备,成员设备1、成员设备3、成员设备4均为从属设备。
参照图2所示,本发明的实施例提供了上述实施例所述的堆叠系统的一种故障处理方法,具体包括如下步骤:
201、主控设备检测堆叠系统中是否有成员设备为故障设备。
需要说明的是,堆叠系统中包括多个成员设备,其中只有一个主控设备,主控设备实现堆叠系统对外的实现功能,而主控设备之外的其他成员设备则是备用设备,为从属设备,从属设备的配置是不生效的,仅在主控设备发生故障或其他原因不能正常完成该堆叠系统对外的职能时,才会从从属设备中选取出一个替代成为主控设备。
其中,主控设备检测堆叠系统中是否有成员设备为故障设备可以为:主控设备向堆叠系统中所有成员设备索取设备信息,收到堆叠系统中所有成员设备发来的设备信息后,根据所获得的成员设备的设备信息判断堆叠系统中是否有成员设备出现故障,即堆叠系统中是否有故障设备,其中若成员设备不向主控设备发送设备信息,则视为成员设备出现故障,成员设备为故障设备;主控设备检测堆叠系统中是否存有成员设备为故障设备也可以为:堆叠系统中成员设备因出现故障向主控设备发送故障报文,主控设备根据故障报文获取成员设备为故障设备,其中故障报文包括成员设备所出现故障的故障信息,故障信息可以包括故障模块标识、故障事件标识,故障模块标识是对成员设备中出现故障的模块的标识,故障事件标识是对所出现故障的标识,只要故障信息能够使主控设备获取成员设备所出现故障内容即可,本实施例对于故障信息具体组成不做限定。
若堆叠系统中有成员设备为故障设备,则执行步骤202。
202、主控设备向堆叠系统中所有成员设备发送故障处理信息。
其中,故障处理信息包括故障设备对所出现的故障进行故障恢复所需要的信息,也可以还包括故障设备对有可能出现的其他故障进行故障恢复所需要的信息,或堆叠系统中任何一个成员设备对堆叠系统中有可能出现的故障进行故障恢复所需要的信息。故障处理信息可以事先设置在主控设备中,也可以由主控设备根据堆叠系统中故障设备所出现故障获取,只要能够根据故障处理信息对成员设备所出现故障进行处理即可,本实施例对于故障处理信息具体组成不做限定。
203、成员设备确定是否堆叠系统中所有成员设备收到故障处理信息。
成员设备确定是否堆叠系统中所有成员设备收到故障处理信息,包括:成员设备通过获取确认信息以确定堆叠系统中所有成员设备均收到故障信息,其中确认信息包括由主控设备向成员设备发送,也可以包括成员设备间相互发送。示例性的:主控设备根据成员设备所发送的反馈信息判断是否该成员设备收到故障处理信息,当主控设备收到堆叠系统中所有成员设备发送的反馈信息后,认为堆叠系统中所有成员设备均收到故障处理信息,主控设备向堆叠系统中所有成员设备发送确认信息,以通知堆叠系统中所有成员设备均收到故障处理信息,其中反馈信息为成员设备在收到故障处理信息后,向主控设备发送针对故障处理信息的反馈信息。
当成员设备确定堆叠系统中所有成员设备收到故障处理信息,则执行步骤204。
204、成员设备根据故障处理信息进行故障恢复。
根据故障处理信息进行故障恢复,包括成员设备确认堆叠系统中所有成员设备收到故障处理信息后,根据自身所出现的故障,结合所收到的故障处理信息中获取所需的故障恢复信息,并根据所获取的故障恢复信息在该成员设备上进行故障恢复;若成员设备自身并未出现故障,则结合所收到的故障处理信息获取在该成员设备上进行未出现故障处理所需的未出现故障处理信息,并根据该未出现故障处理信息对该成员设备进行故障恢复。
本发明的实施例提供的堆叠系统故障处理方法,包括:首先主控设备检测堆叠系统中是否有成员设备为故障设备;其次主控设备向堆叠系统中所有成员设备发送故障处理信息;成员设备判断是否堆叠系统中所有成员设备收到故障处理信息;成员设备根据故障处理信息进行故障恢复。因此上述实施例提供的堆叠系统故障处理方法在堆叠系统中存在故障设备且线路连接正常时,主控设备通过向堆叠系统中所有成员设备发送统一的故障恢复信息,使成员设备在堆叠系统中所有成员设备均收到该故障恢复信息后,能够根据自身设备信息与该故障恢复信息,获取该成员设备针对自身故障或堆叠系统中其他成员设备故障在自身进行故障恢复所需要的故障恢复信息,从而使堆叠系统中的成员设备能够根据主控设备发送的统一的故障恢复信息,在堆叠系统中出现不同的故障时,获取相应的故障恢复信息,并根据该故障恢复信息进行故障恢复,从而提高堆叠系统故障处理的效率,减少堆叠系统中进行故障处理所消耗资源,保证堆叠系统的容错性及稳定性。
参照图3所示,本发明的实施例提供一种堆叠系统故障处理方法,包括如下步骤:
301、主控设备获取堆叠系统中成员设备的设备信息。
具体示例参照上述步骤201,这里不再赘述。
其中设备信息包括故障模块标识、故障事件标识,其中故障模块标示是对成员设备中出现故障模块的标识,故障事件标示是对成员设备所出现故障的标识。
302、主控设备根据设备信息检测堆叠系统中是否有成员设备为故障设备。
其中,主控设备根据在步骤301中获得的堆叠系统中成员设备的设备信息,检测该成员设备是否出现故障。
示例性的,参照图1所示堆叠系统主控设备,成员设备3向成员设备2即主控设备发送设备信息,该设备信息包括故障模块标示A,故障事件标示B,其中故障模块标示A表示成员设备3中的A模块出现故障,故障事件标示B表示成员设备3中出现的故障为B,主控设备根据上述设备信息获得成员设备3中的A模块出现B故障。
303、主控设备根据设备信息与故障类型信息获取故障处理信息。
故障类型信息是对堆叠系统中成员设备可能出现故障进行故障恢复所需的信息,包括故障模块标识、故障事件标识、故障优先级、故障恢复行为标识,其中故障模块标示是对成员设备中出现故障模块的标识,故障事件标示是对成员设备所出现故障的标识,故障恢复行为标示是对成员设备出现故障后进行相应的故障恢复行为的标识,故障优先级是对进行故障恢复行为的先后顺序的标示。故障类型信息可以事先设置在主控设备上,也可以事先由主控设备根据堆叠网络中故障模块发来的设备信息获取,只要根据故障类型信息获得故障进行故障恢复所需要的信息即可。
其中,故障处理信息包括成员设备对所出现的故障进行故障恢复所需要的信息,也可以还包括成员设备对有可能出现的其他故障进行故障恢复所需要的信息,或堆叠系统中任何一个成员设备对堆叠系统中有可能出现的故障进行故障恢复所需要的信息,其中故障可以是出现在该成员设备上,也可以是出现在其他成员设备上。故障处理信息可以事先设置在主控设备中,也可以主控设备根据堆叠系统中故障设备所出现故障获取,只要能够根据故障处理信息对成员设备所出现故障进行处理即可,本实施例对于故障处理信息具体组成不做限定。
主控设备根据在步骤301中获得的堆叠系统中成员设备的设备信息,以及事先在主控设备中的故障类型信息,获取用于在堆叠系统中对成员设备进行故障恢复的故障处理信息。
304、主控设备向堆叠系统中所有成员设备发送故障处理信息。
主控设备将步骤302中获取的故障处理信息向堆叠系统中所有成员设备发送,其中主控设备可以将故障处理信息向堆叠系统中所有成员设备广播发送,也可由将故障处理信息由堆叠系统中的成员设备进行转发,使堆叠系统中每一个成员设备收到该堆叠故障信息。
305、成员设备确定堆叠系统中所有成员设备收到故障处理信息。
具体示例参照上述步骤203,这里不再赘述。
当确定堆叠系统中所有成员设备收到故障处理信息,则执行步骤306。
306、成员设备根据自身设备信息与故障处理信息,获取相应的故障恢复行为与故障优先级,并根据故障优先级依次进行相应的故障恢复。
当堆叠系统中的成员设备在确定堆叠系统中所有成员设备收到故障处理信息,成员设备根据故障处理信息并结合自身设备信息获取在当前状况下该成员设备需要进行的故障恢复行为以及与该故障恢复行为对应的故障优先级。示例性的:参照图1所示堆叠系统主控设备,成员设备3根据自身设备信息与收到的故障处理信息,获取故障处理行为A、故障优先级B,成员设备4根据自身设备信息与收到的故障处理信息,获取故障处理行为C、故障优先级D,其中故障优先级D优先于故障优先级B,因此首先成员设备4根据故障处理行为C进行故障恢复,其次成员设备3根据故障处理行为A进行故障恢复。
更进一步的,基于上述实施例内容,当堆叠系统中成员设备与主控设备间出现数据同步故障,参照图3所示,在步骤306后,还包括如下步骤:
307、成员设备判断该成员设备是否为故障设备。
成员设备根据自身设备信息判断自身是否为故障设备,若该成员设备为故障设备,则执行步骤308,若该成员设备不为故障设备,则执行步骤309。
308、设置故障设备的堆叠主控角色选举资格为无效,并通知堆叠系统内其它成员设备,故障设备不具有主控角色选举资格。
设置故障设备的堆叠主控角色选举资格为无效,即不允许该故障设备参与堆叠系统主控角色选举。
309设置非故障设备的堆叠主控角色选举资格为有效,并通知堆叠系统内其它成员设备,非故障设备具有主控角色选举资格。
设置故障设备的堆叠主控角色选举资格为有效,并通知堆叠系统内其它成员设备,即堆叠系统内其它成员设备接受该非故障设备参与堆叠系统主控角色选举。
本发明的实施例提供的堆叠系统故障处理方法,首先主控设备获取堆叠系统中成员设备的设备信息;其次主控设备根据设备信息检查堆叠系统中是否存在故障设备;主控设备根据设备信息与故障类型信息获取故障处理信息;主控设备向堆叠系统中所有成员设备发送故障处理信息;成员设备确定堆叠系统中所有成员设备收到故障处理信息;成员设备根据自身设备信息与故障处理信息,获取相应的故障恢复行为与故障优先级,并根据故障优先级依次进行相应的故障恢复;成员设备判断成员设备是否为故障设备;若为故障设备则设置故障设备的堆叠主控角色选举资格为无效,并通知堆叠系统内其它成员设备,故障设备不具有主控角色选举资格;若为非故障设备则设置非故障设备的堆叠主控角色选举资格为有效,并通知堆叠系统内其它成员设备,非故障设备具有主控角色选举资格。因此上述实施例提供的堆叠系统故障处理方法在堆叠系统中存在故障设备且线路连接正常时,当堆叠系统中所有成员设备均收到该故障恢复信息,成员设备能够根据自身设备信息与该故障恢复信息,获取该成员设备针对自身故障或堆叠系统中其他成员设备故障在自身进行故障恢复所需要的故障恢复信息与恢复该故障的优先级,从而使堆叠系统中的成员设备能够根据主控设备发送的统一的故障恢复信息,在堆叠系统中出现不同的故障时,获取相应的故障恢复信息与恢复该故障的优先级,并根据该优先级依次进行相应的故障恢复,从而提高堆叠系统故障恢复的效率,降低堆叠系统中进行故障恢复所需要系统与网络资源,保证堆叠系统的容错性及稳定性。
参照图4所示,本发明的实施例提供了主控设备,用于上述的堆叠系统并实现堆叠系统故障处理方法,具体包括:
检测单元401,用于检测堆叠系统中是否有成员设备为故障设备。
需要说明的是,堆叠系统中包括多个成员设备,其中只有一个主控设备,主控设备实现堆叠系统对外的实现功能,而主控设备之外的其他成员设备则是备用设备,处于备用状态,备用设备的配置是不生效的,仅在主控设备发生故障或其他原因不能正常完成该堆叠系统对外的职能时,才会从备用设备中选取出一个替代成为主控设备。
其中,检测单元401检测堆叠系统中是否存在故障设备可以为:检测单元401向堆叠系统中所有成员设备索取设备信息,收到堆叠系统中所有成员设备发来的设备信息后,根据所获得的成员设备的设备信息判断堆叠系统中是否有成员设备出现故障,即堆叠系统中是否有故障设备,其中若成员设备不向主控设备发送设备信息,则视为成员设备出现故障;检测单元401检测堆叠系统中是否存在故障设备也可以为:堆叠系统中成员设备因出现故障向检测单元401发送故障报文,其中故障报文包括成员设备所出现故障的故障信息,故障信息可以包括故障模块标识、故障事件标识,故障模块标识是对成员设备中出现故障的模块的标识,故障事件标识是对所出现故障的标识,只要故障信息能够使检测单元401获取成员设备所出现故障内容即可,本实施例对于故障信息具体组成不做限定。检测单元401将检测结果向发送单元402发送。
发送单元402,用于当检测单元201检测到堆叠系统中有成员设备为故障设备,向堆叠系统中所有成员设备发送故障处理信息,以便于堆叠系统中所有成员设备收到故障处理信息,成员设备根据故障处理信息进行故障恢复。
其中,故障处理信息包括故障设备对所出现的故障进行故障恢复所需要的信息,也可以还包括故障设备对有可能出现的其他故障进行故障恢复所需要的信息,或堆叠系统中任何一个成员设备对堆叠系统中有可能出现的故障进行故障恢复所需要的信息。故障处理信息可以事先设置在主控设备中,也可以主控设备根据堆叠系统中故障设备所出现故障获取,只要能够根据故障处理信息对成员设备所出现故障进行处理即可,本实施例对于故障处理信息具体组成不做限定。
本发明的实施例提供的一种堆叠系统的主控设备,包括:检测单元,用于检测堆叠系统中是否存在故障设备;发送单元,用于当堆叠系统中存在故障设备,向堆叠系统中所有成员设备发送故障处理信息。因此上述实施例提供的堆叠系统的主控设备在堆叠系统中存在故障设备且线路连接正常时,主控设备通过向堆叠系统中所有成员设备发送统一的故障恢复信息,以便成员设备在堆叠系统中所有成员设备均收到该故障恢复信息后,根据自身设备信息与该故障恢复信息,获取该成员设备针对自身故障或堆叠系统中其他成员设备故障在自身进行故障恢复所需要的故障恢复信息,从而使堆叠系统中的成员设备能够根据主控设备发送的统一的故障恢复信息,在堆叠系统中出现不同的故障时,获取相应的故障恢复信息,并根据该故障恢复信息进行故障恢复,简化了堆叠系统中进行故障恢复的过程,降低了堆叠系统中进行故障恢复所需要系统与网络资源,从而提高了堆叠系统故障恢复的通用性,保证堆叠系统的容错性及稳定性。
具体的,参照图5所示,在上述实施例中,主控设备还预设故障类型信息,主控设备还包括:
获取单元403,用于获取所述堆叠系统中成员设备的设备信息。
其中设备信息参照上述实施例,具体的,设备信息包括故障模块标识、故障事件标识,其中故障模块标示是对成员设备中出现故障模块的标识,故障事件标示是对成员设备所出现故障的标识。
检测单元401具体用于:根据设备信息检测堆叠系统中是否存在故障设备,即根据获得的堆叠系统中成员设备的设备信息,检测该成员设备是否出现故障。
获取单元403还用于:若检测单元401检测到堆叠系统中存在故障设备,获取单元403根据设备信息与故障类型信息获取故障处理信息。
故障类型信息是对堆叠系统中成员设备可能出现故障进行故障恢复所需的信息,包括故障模块标识、故障事件标识、故障优先级、故障恢复行为标识,其中故障模块标示是对成员设备中出现故障模块的标识,故障事件标示是对成员设备所出现故障的标识,故障恢复行为标示是对成员设备出现故障后进行相应的故障恢复行为的标识,故障优先级是对进行故障恢复行为的先后顺序的标示。故障类型信息可以事先设置在主控设备上,也可以事先由主控设备根据堆叠网络中故障模块发来的设备信息获取,只要根据故障类型信息获得故障进行故障恢复所需要的信息即可。
发送单元402具体用于:向堆叠系统中所有成员设备发送故障处理信息。
故障处理信息包括成员设备对所出现的故障进行故障恢复所需要的信息,也可以还包括成员设备对有可能出现的其他故障进行故障恢复所需要的信息,或堆叠系统中任何一个成员设备对堆叠系统中有可能出现的故障进行故障恢复所需要的信息,其中故障可以是出现在该成员设备上,也可以是出现在其他成员设备上。故障处理信息可以事先设置在主控设备中,也可以主控设备根据堆叠系统中故障设备所出现故障获取,只要能够根据故障处理信息对成员设备所出现故障进行处理即可,本实施例对于故障处理信息具体组成不做限定。
获取单元403根据堆叠系统中成员设备的设备信息,以及事先位于主控设备中的故障类型信息,获取用于在堆叠系统中对成员设备进行故障恢复的故障处理信息。
发送单元402将故障处理信息向堆叠系统中所有成员设备发送,其中发送单元402可以将故障处理信息向堆叠系统中所有成员设备广播发送,也可由将故障处理信息由堆叠系统中的成员设备进行转发,使堆叠系统中每一个成员设备收到该堆叠故障信息。
本发明的实施例提供的一种堆叠系统的主控设备,包括:获取单元,用于获取所述堆叠系统中成员设备的设备;检测单元,根据设备信息检测堆叠系统中是否存在故障设备;获取单元还用于:若检测单元检测到堆叠系统中存在故障设备,获取单元根据设备信息与故障类型信息获取故障处理信息;发送单元,用于当堆叠系统中存在故障设备,向堆叠系统中所有成员设备发送故障处理信息。因此上述实施例提供的堆叠系统中的主控设备在堆叠系统中存在故障设备且线路连接正常时,主控设备获取堆叠系统中存在故障设备的信息,并根据事先在主控设备上的故障类型信息与堆叠系统中故障设备的信息获取统一的故障恢复信息,并向堆叠系统中所有成员设备发送该故障恢复信息,以便于成员设备在堆叠系统中所有成员设备均收到该故障恢复信息后,根据自身设备信息与该故障恢复信息,获取该成员设备针对自身故障或堆叠系统中其他成员设备故障在自身进行故障恢复所需要的故障恢复信息与恢复该故障的优先级,从而使堆叠系统中的成员设备能够根据主控设备发送的统一的故障恢复信息,在堆叠系统中出现不同的故障时,获取相应的故障恢复信息与恢复该故障的优先级,并根据该优先级依次进行相应的故障恢复,简化了堆叠系统中进行故障恢复的过程,降低了堆叠系统中进行故障恢复所需要的系统与网络资源,从而提高了堆叠系统故障恢复的通用性,保证堆叠系统的容错性及稳定性。
参照图6所示,本发明的实施例提供了成员设备,用于上述的堆叠系统并实现堆叠系统故障处理方法,具体包括:
接收单元601,用于接收主控设备发送的故障处理信息。
处理单元602,用于当堆叠系统中所有成员设备均收到故障处理信息,根据故障处理信息进行故障恢复。
其中处理单元602通过获取确认信息以确定堆叠系统中所有成员设备均收到故障信息,其中确认信息包括由主控设备向成员设备发送,也可以包括成员设备间相互发送。示例性的:主控设备根据成员设备所发送的反馈信息判断是否该成员设备收到故障处理信息,当主控设备收到堆叠系统中所有成员设备发送的反馈信息后,认为堆叠系统中所有成员设备均收到故障处理信息,主控设备向堆叠系统中所有成员设备发送确认信息,以通知堆叠系统中所有成员设备均收到故障处理信息,其中反馈信息为成员设备在收到故障处理信息后,向主控设备发送针对故障处理信息的反馈信息。
处理单元602根据故障处理信息进行故障恢复,包括处理单元602确认堆叠系统中所有成员设备收到故障处理信息后,根据处理单元602所在成员设备所出现的故障,结合所收到的故障处理信息中获取所需的故障恢复信息,并根据所获取的故障恢复信息在该成员设备上进行故障恢复;若该成员设备自身并未出现故障,则结合所收到的故障处理信息获取在该成员设备上进行未出现故障处理所需的未出现故障处理信息,并根据该未出现故障处理信息对该成员设备进行故障恢复。
本发明的实施例提供的一种堆叠系统的成员设备,包括:接收单元,用于接收主控设备发送的故障处理信息。处理单元,用于当堆叠系统中所有成员设备均收到故障处理信息,根据故障处理信息进行故障恢复。因此上述实施例提供的堆叠系统的成员设备在堆叠系统中存在故障设备且线路连接正常时,成员设备在堆叠系统中所有成员设备均收到故障恢复信息后,根据自身设备信息与该故障恢复信息,获取该成员设备针对自身故障或堆叠系统中其他成员设备故障在自身进行故障恢复所需要的故障恢复信息,从而使堆叠系统中的成员设备能够根据主控设备发送的统一的故障恢复信息,在堆叠系统中出现不同的故障时,获取相应的故障恢复信息,并根据该故障恢复信息进行故障恢复,简化了堆叠系统中进行故障恢复的过程,降低了堆叠系统中进行故障恢复所需要系统与网络资源,从而提高了堆叠系统故障恢复的通用性,保证堆叠系统的容错性及稳定性。
具体的,参照图6所示,在上述实施例中,处理单元602具体用于:当所述堆叠系统中所有成员设备收到所述故障处理信息后,根据成员设备自身设备信息与所述故障处理信息,获取相应的故障恢复行为与故障优先级,并根据故障优先级依次执行所述相应的故障恢复行为。
当处理单元602确定堆叠系统中所有成员设备收到故障处理信息,处理单元602根据故障处理信息,并结合处理单元602所在成员设备自身的设备信息获取在当前状况下该成员设备需要进行的故障恢复行为以及与该故障恢复行为对应的故障优先级。示例性的:参照图1所示堆叠系统主控设备,成员设备3根据自身设备信息与收到的故障处理信息,获取故障处理行为A、故障优先级B,成员设备4根据自身设备信息与收到的故障处理信息,获取故障处理行为C、故障优先级D,其中故障优先级D优先于故障优先级B,因此首先成员设备4根据故障处理行为C进行故障恢复,其次成员设备3根据故障处理行为A进行故障恢复。
更进一步的,参照图6所示,在上述实施例中,当堆叠系统中成员设备与主控设备间出现数据同步故障,处理单元602还用于判断成员设备是否为故障设备,若成员设备为故障设备,处理单元602设置故障设备的堆叠主控角色选举资格为无效,并通知堆叠系统内其它成员设备,故障设备不具有主控角色选举资格,即不允许该故障设备参与堆叠系统主控角色选举;若成员设备为非故障设备,处理单元602设置非故障设备的堆叠主控角色选举资格为有效,并通知堆叠系统内其它成员设备,非故障设备具有主控角色选举资格,并通知堆叠系统内其它成员设备,即堆叠系统内其它成员设备接受该非故障设备参与堆叠系统主控角色选举。
本发明的实施例提供的一种堆叠系统的成员设备,包括:接收单元,用于接收主控设备发送的故障处理信息;处理单元,用于当堆叠系统中所有成员设备均收到故障处理信息,根据故障处理信息进行故障恢复;处理单元具体用于当所述堆叠系统中所有成员设备收到所述故障处理信息后,根据成员设备自身设备信息与所述故障处理信息,获取相应的故障恢复行为与故障优先级,并根据故障优先级依次执行所述相应的故障恢复行为,当成员设备为故障设备时,设置故障设备的堆叠主控角色选举资格为无效,并通知堆叠系统内其它成员设备,故障设备不具有主控角色选举资格,当成员设备为非故障设备时,设置非故障设备的堆叠主控角色选举资格为有效,并通知堆叠系统内其它成员设备,非故障设备具有主控角色选举资格。因此上述实施例提供的堆叠系统的成员设备在堆叠系统中存在故障设备且线路连接正常时,成员设备在堆叠系统中所有成员设备均收到故障恢复信息,根据自身设备信息与故障恢复信息,获取该成员设备针对自身故障或堆叠系统中其他成员设备故障在自身进行故障恢复所需要的故障恢复信息与恢复该故障的优先级,从而使堆叠系统中的成员设备能够根据主控设备发送的统一的故障恢复信息,在堆叠系统中出现不同的故障时,获取相应的故障恢复信息与恢复该故障的优先级,并根据该优先级依次进行相应的故障恢复,简化了堆叠系统中进行故障恢复的过程,降低了堆叠系统中进行故障恢复所需要系统与网络资源,从而提高了堆叠系统故障恢复的通用性,保证堆叠系统的容错性及稳定性。
本发明的实施例提供了一种堆叠系统,该堆叠系统由多个成员设备组成,该堆叠系统中包括一个上述实施例中的主控设备,和至少一个上述实施例中的成员设备。
本发明的实施例提供的堆叠系统故障处理方法、设备及系统,包括:首先主控设备检测堆叠系统中是否有成员设备为故障设备;其次主控设备向堆叠系统中所有成员设备发送故障处理信息;成员设备判断是否堆叠系统中所有成员设备收到故障处理信息;成员设备根据故障处理信息进行故障恢复。因此上述实施例提供的堆叠系统故障处理方法在堆叠系统中存在故障设备且线路连接正常时,主控设备通过向堆叠系统中所有成员设备发送统一的故障恢复信息,使成员设备在堆叠系统中所有成员设备均收到该故障恢复信息后,能够根据自身设备信息与该故障恢复信息,获取该成员设备针对自身故障或堆叠系统中其他成员设备故障在自身进行故障恢复所需要的故障恢复信息,从而使堆叠系统中的成员设备能够根据主控设备发送的统一的故障恢复信息,在堆叠系统中出现不同的故障时,获取相应的故障恢复信息,并根据该故障恢复信息进行故障恢复,从而提高堆叠系统故障处理的效率,减少堆叠系统中进行故障处理所消耗资源,保证堆叠系统的容错性及稳定性。
其中,需要说明的是,本实施例中的各个单元可以为单独设立的处理器或传感器,也可以集成在某一个处理器或传感器中实现,此外,也可以以程序代码的形式存储于触控点识别装置的存储器中,由处理器调用并执行以上各个单元的功能。这里所述的处理器可以是一个中央处理器(英文全称:CentralProcessingUnit,英文简称:CPU),或者是被配置成实施本发明实施例的一个或多个集成电路(英文全称:IntegratedCircuit,英文简称:IC);传感器可以是一个电子元件,或者是多个电子元件组成的电路结构,或是被配置成实施本发明实施例的一个或多个集成电路。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (13)

1.一种堆叠系统故障处理方法,其特征在于,应用于由多个成员设备组成的堆叠系统,所述多个成员设备中包括一个主控设备,该方法包括:
所述主控设备检测所述堆叠系统中是否有成员设备为故障设备;
若所述堆叠系统中有成员设备为故障设备,所述主控设备向所述堆叠系统中所有成员设备发送故障处理信息,以便于所述堆叠系统中所有成员设备收到所述故障处理信息,所述成员设备根据所述故障处理信息进行故障恢复。
2.根据权利要求1所述的堆叠系统故障处理方法,其特征在于:
所述主控设备检测所述堆叠系统中是否有成员设备为故障设备,包括:
所述主控设备获取所述堆叠系统中成员设备的设备信息,并根据所述设备信息检测所述堆叠系统中是否存在故障设备;
若所述堆叠系统中有成员设备为故障设备,所述主控设备向所述堆叠系统中所有成员设备发送故障处理信息,包括:
若所述堆叠系统中存在故障设备,所述主控设备根据所述设备信息与故障类型信息获取所述故障处理信息,并向所述堆叠系统中所有成员设备发送所述故障处理信息,所述主控设备预设所述故障类型信息。
3.根据权利要求1或2所述的堆叠系统故障处理方法,其特征在于:
所述故障处理信息包括:成员设备标识、故障模块标识、故障事件标识、故障优先级、故障恢复行为标识。
4.根据权利要求2所述的堆叠系统故障处理方法,其特征在于:
所述故障类型信息包括:故障模块标识、故障事件标识、故障优先级、故障恢复行为标识。
5.一种堆叠系统故障处理方法,其特征在于,应用于由多个成员设备组成的堆叠系统,所述多个成员设备中包括一个主控设备,该方法包括:
所述成员设备接收所述主控设备发送的故障处理信息;
当所述堆叠系统中所有成员设备均收到所述故障处理信息,所述成员设备根据所述故障处理信息进行故障恢复。
6.根据权利要求5所述的堆叠系统故障处理方法,其特征在于:
所述当所述堆叠系统中所有成员设备收到所述故障处理信息,根据所述故障处理信息进行故障恢复,包括:
当所述堆叠系统中所有成员设备收到所述故障处理信息后,所述成员设备根据自身设备信息与所述故障处理信息,获取相应的故障恢复行为与故障优先级,并根据所述故障优先级依次执行所述相应的故障恢复行为。
7.根据权利要求5或6所述的堆叠系统故障处理方法,其特征在于:
所述当所述堆叠系统中所有成员设备收到所述故障处理信息,根据所述故障处理信息进行故障恢复,包括:
当所述成员设备为故障设备时,设置所述故障设备的堆叠主控角色选举资格为无效,并通知堆叠系统内其它成员设备,所述故障设备不具有主控角色选举资格;
当所述成员设备为非故障设备时,设置所述非故障设备的堆叠主控角色选举资格为有效,并通知堆叠系统内其它成员设备,所述非故障设备具有主控角色选举资格。
8.一种主控设备,其特征在于,应用于由多个成员设备组成的堆叠系统,所述多个成员设备中包括所述主控设备,该主控设备包括:
检测单元,用于检测所述堆叠系统中是否有成员设备为故障设备;
发送单元,用于当所述检测单元检测到所述堆叠系统中有成员设备为故障设备,向所述堆叠系统中所有成员设备发送故障处理信息,以便于所述堆叠系统中所有成员设备收到所述故障处理信息,所述成员设备根据所述故障处理信息进行故障恢复。
9.根据权利要求8所述的主控设备,其特征在于,所述主控设备还包括:
获取单元,用于获取所述堆叠系统中成员设备的设备信息;
所述检测单元具体用于根据所述设备信息检测所述堆叠系统中是否存在故障设备;
若所述检测单元检测到所述堆叠系统中存在故障设备,所述获取单元还用于根据所述设备信息与故障类型信息获取所述故障处理信息;
所述发送单元具体用于向所述堆叠系统中所有成员设备发送所述故障处理信息,所述主控设备预设所述故障类型信息。
10.一种成员设备,应用于由多个成员设备组成的堆叠系统,所述多个成员设备中包括所述主控设备,该成员设备包括:
接收单元,用于接收所述主控设备发送的故障处理信息;
处理单元,用于当所述堆叠系统中所有成员设备均收到所述故障处理信息,根据所述故障处理信息进行故障恢复。
11.根据权利要求10所述的成员设备,其特征在于,所述成员设备还包括:
所述处理单元具体用于当所述堆叠系统中所有成员设备收到所述故障处理信息后,根据所述成员设备自身设备信息与所述故障处理信息,获取相应的故障恢复行为与故障优先级,并根据所述故障优先级依次执行所述相应的故障恢复行为。
12.根据权利要求10或11所述的成员设备,其特征在于,所述成员设备还包括:
所述处理单元具体用于:
当所述成员设备为故障设备时,设置所述故障设备的堆叠主控角色选举资格为无效,并通知堆叠系统内其它成员设备,所述故障设备不具有主控角色选举资格;
当所述成员设备为非故障设备时,设置所述非故障设备的堆叠主控角色选举资格为有效,并通知堆叠系统内其它成员设备,所述非故障设备具有主控角色选举资格。
13.一种堆叠系统,由多个成员设备组成,其特征在于,所述堆叠系统中包括一个权利要求8或9所述的主控设备,和至少一个权利要求10-12任一项所述的成员设备。
CN201510990103.1A 2015-12-24 2015-12-24 一种堆叠系统故障处理方法、设备及堆叠系统 Active CN105553735B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510990103.1A CN105553735B (zh) 2015-12-24 2015-12-24 一种堆叠系统故障处理方法、设备及堆叠系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510990103.1A CN105553735B (zh) 2015-12-24 2015-12-24 一种堆叠系统故障处理方法、设备及堆叠系统

Publications (2)

Publication Number Publication Date
CN105553735A true CN105553735A (zh) 2016-05-04
CN105553735B CN105553735B (zh) 2018-10-12

Family

ID=55832675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510990103.1A Active CN105553735B (zh) 2015-12-24 2015-12-24 一种堆叠系统故障处理方法、设备及堆叠系统

Country Status (1)

Country Link
CN (1) CN105553735B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107682188A (zh) * 2017-09-29 2018-02-09 新华三技术有限公司 一种故障感知方法和装置
CN107704345A (zh) * 2016-08-09 2018-02-16 迈普通信技术股份有限公司 自动化测试中堆叠设备的管理方法及装置
CN108900415A (zh) * 2018-08-31 2018-11-27 华东计算技术研究所(中国电子科技集团公司第三十二研究所) Mlag接口故障下的主从设备切换方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006004A (ja) * 2001-06-25 2003-01-10 Mitsubishi Electric Corp 障害発生通知抑止装置および障害発生通知抑止方法
US20050111350A1 (en) * 2003-11-20 2005-05-26 Shinya Kano Method and apparatus for designing backup communication path, and computer product
CN101741619A (zh) * 2009-12-24 2010-06-16 中国人民解放军信息工程大学 面向容忍入侵的自治愈j2ee应用服务器及其自治愈方法
CN101917287A (zh) * 2010-08-04 2010-12-15 杭州华三通信技术有限公司 一种irf故障处理方法和irf故障检测系统
US20110320591A1 (en) * 2009-02-13 2011-12-29 Nec Corporation Access node monitoring control apparatus, access node monitoring system, access node monitoring method, and access node monitoring program
CN103856357A (zh) * 2014-03-21 2014-06-11 迈普通信技术股份有限公司 一种堆叠系统故障处理方法及堆叠系统
CN104935466A (zh) * 2015-06-17 2015-09-23 杭州华三通信技术有限公司 一种故障处理方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006004A (ja) * 2001-06-25 2003-01-10 Mitsubishi Electric Corp 障害発生通知抑止装置および障害発生通知抑止方法
US20050111350A1 (en) * 2003-11-20 2005-05-26 Shinya Kano Method and apparatus for designing backup communication path, and computer product
US20110320591A1 (en) * 2009-02-13 2011-12-29 Nec Corporation Access node monitoring control apparatus, access node monitoring system, access node monitoring method, and access node monitoring program
CN101741619A (zh) * 2009-12-24 2010-06-16 中国人民解放军信息工程大学 面向容忍入侵的自治愈j2ee应用服务器及其自治愈方法
CN101917287A (zh) * 2010-08-04 2010-12-15 杭州华三通信技术有限公司 一种irf故障处理方法和irf故障检测系统
CN103856357A (zh) * 2014-03-21 2014-06-11 迈普通信技术股份有限公司 一种堆叠系统故障处理方法及堆叠系统
CN104935466A (zh) * 2015-06-17 2015-09-23 杭州华三通信技术有限公司 一种故障处理方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张可: "复合故障诊断技术综述", 《控制理论与应用》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704345A (zh) * 2016-08-09 2018-02-16 迈普通信技术股份有限公司 自动化测试中堆叠设备的管理方法及装置
CN107704345B (zh) * 2016-08-09 2021-03-16 迈普通信技术股份有限公司 自动化测试中堆叠设备的管理方法及装置
CN107682188A (zh) * 2017-09-29 2018-02-09 新华三技术有限公司 一种故障感知方法和装置
CN108900415A (zh) * 2018-08-31 2018-11-27 华东计算技术研究所(中国电子科技集团公司第三十二研究所) Mlag接口故障下的主从设备切换方法及系统
CN108900415B (zh) * 2018-08-31 2021-06-22 华东计算技术研究所(中国电子科技集团公司第三十二研究所) Mlag接口故障下的主从设备切换方法及系统

Also Published As

Publication number Publication date
CN105553735B (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
CN103580902B (zh) 一种计算机信息系统及其动态容灾方法
CN101150430B (zh) 一种通过心跳机制实现网络接口板倒换的方法
CN101324855B (zh) 辅助cpu工作状态的检测方法、系统、组件及多cpu设备
CN111385107B (zh) 一种服务器的主备切换处理方法及装置
CN102047643B (zh) 用于在服务器故障的事件中能使客户端应用更快恢复的方法
US20070270984A1 (en) Method and Device for Redundancy Control of Electrical Devices
CN105553735A (zh) 一种堆叠系统故障处理方法、设备及堆叠系统
CN105577444A (zh) 一种无线控制器管理方法及无线控制器
JP4487260B2 (ja) 多重系システム
EP1837763A2 (en) Protection of devices in a redundant configuration
CN113645048B (zh) 网卡切换方法、装置以及现场可编程逻辑门阵列fpga
WO2014050493A1 (ja) 予備系装置、運用系装置、冗長構成システム、及び負荷分散方法
CN101980478A (zh) 设备故障的检测处理方法、装置和网络设备
JP4879823B2 (ja) 監視制御システム
JP5548160B2 (ja) 障害監視用ノード装置および障害検知回復方法
JP3325785B2 (ja) 計算機の故障検出・回復方式
JP2012075009A (ja) 冗長化装置及び冗長化プログラム
JP3419979B2 (ja) 装置状態管理方法およびデータ通信システム
JP2013025365A (ja) 二重化システムにおける予備装置の障害通知方法
JP6238919B2 (ja) 監視制御システム
JP2007026038A (ja) パス監視システム,パス監視方法,およびパス監視プログラム
CN107241267B (zh) 一种oam切换方法及网络设备
JP2006285845A (ja) 耐障害性を有する情報通信システムおよび耐障害性を有する情報通信装置
JPH06290126A (ja) 計算機システム障害監視方式
CN117950300A (zh) 一种基于控制器的冗余控制方法、系统及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant