CN103840959B - 故障检测方法及相关设备和堆叠系统 - Google Patents

故障检测方法及相关设备和堆叠系统 Download PDF

Info

Publication number
CN103840959B
CN103840959B CN201210482460.3A CN201210482460A CN103840959B CN 103840959 B CN103840959 B CN 103840959B CN 201210482460 A CN201210482460 A CN 201210482460A CN 103840959 B CN103840959 B CN 103840959B
Authority
CN
China
Prior art keywords
communication equipment
port
processor
signal
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210482460.3A
Other languages
English (en)
Other versions
CN103840959A (zh
Inventor
王晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201210482460.3A priority Critical patent/CN103840959B/zh
Priority to PCT/CN2013/087656 priority patent/WO2014079383A1/zh
Priority to ES13856267.3T priority patent/ES2644358T3/es
Priority to EP13856267.3A priority patent/EP2919417B1/en
Publication of CN103840959A publication Critical patent/CN103840959A/zh
Priority to US14/720,253 priority patent/US9632885B2/en
Application granted granted Critical
Publication of CN103840959B publication Critical patent/CN103840959B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/065Generation of reports related to network devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明公开了一种故障检测方法及相关设备和堆叠系统。其中,一种故障检测方法,应用于堆叠系统,第一通信设备包括第一业务板和第二业务板,第一业务板包括第一处理器和第一器件,第二业务板包括第二处理器和第二器件,第二器件接收来自第一器件的第一信号,基于第一信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则通知第二处理器第二通信设备部分或整体失效。本发明实施例提供方案提高故障检测效率和可靠性。

Description

故障检测方法及相关设备和堆叠系统
技术领域
本发明涉及通信技术领域,具体涉及一种故障检测方法及相关设备和堆叠系统。
背景技术
当前,堆叠技术(包括堆叠和集群技术等)在数通设备应用广泛,而堆叠技术大多都是通过如以太、高速以太等数据通道连接,将多台数通设备组建成一个堆叠系统。使用数据通道建立的堆叠系统,每一台数通设备与邻接数通设备之间可能只有数据通道。数通设备通常包括至少1个业务板,每个业务板包括至少1个用于业务处理的处理器。
在邻接通信设备部分或整体失效时,通常需要本端通信设备自身通过检测来发现故障,以便及时进行相应的应急处理,现有技术通常是由本端通信设备中用于业务处理的处理器来直接监测各数据通道的端口状态,并由该处理器根据监测结果判断邻接通信设备是否部分或整体失效。实践发现,监测邻接通信设备是否部分或整体失效的现有机制通常需较长时间且可靠性低,已难以满足快速故障处理需求。
发明内容
本发明实施例提供一种故障检测方法及相关设备和堆叠系统,以期提高故障检测效率和可靠性。
本发明第一方面提供一种故障检测方法,应用于堆叠系统,所述堆叠系统包括第一通信设备和第二通信设备,其中,所述第一通信设备包括第一业务板和第二业务板,所述第一业务板包括第一处理器和第一器件,所述第二业务板包括第二处理器和第二器件,其中,所述第一处理器和所述第二处理器用于业务处理,所述第一通信设备和第二通信设备通过M个端口互联,所述第一器件包括处理器和/或可编程逻辑器件,所述第二器件包括处理器和/或可编程逻辑器件;
其中,所述故障检测方法包括:
所述第二器件接收来自所述第一器件的第一信号,基于所述第一信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第一信号由所述第一器件在接收到所述第一业务板的N1个端口发起的端口异常中断信号之后发送,所述第一信号指示出所述第二通信设备的N1个端口存在异常,所述N1个端口为所述M个端口中的部分或者全部端口。
结合第一方面,在第一种可能的实施方式中,
所述第一通信设备还包括第三业务板,所述第三业务板包括第三处理器和第三器件,其中,所述第三处理器用于业务处理,所述第三器件包括处理器和/或可编程逻辑器件;
所述方法还包括:所述第二器件接收来自所述第三器件的第二信号,基于所述第二信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第二信号由所述第三器件在接收到所述第三业务板的N2个端口发起的端口异常中断信号之后发送,所述第二信号指示出所述第二通信设备的N2个端口存在异常,所述N2个端口为所述M个端口中的部分端口。
结合第一方面或第一方面的第一种可能的实施方式,在第二种可能的实施方式中,所述方法还包括:所述第二器件接收所述第二业务板的N3个端口发起的端口异常中断信号,其中,所述N3个端口为所述M个端口中的部分端口,基于所述N3更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效。
结合第一方面或第一方面的第一种可能的实施方式或第一方面的第二种可能的实施方式,在第三种可能的实施方式中,所述若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,包括:
若更新后的所述第二通信设备当前的异常端口总数等于所述M,则通知第二处理器所述第二通信设备整体失效;或者,若更新后的所述第二通信设备当前的异常端口总数大于或等于所述M-X1,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述X1小于所述M;或者,若更新后的所述第二通信设备当前的异常端口总数大于或等于X2%*M,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述X2大于0且小于或等于100。
结合第一方面或第一方面的第一种可能的实施方式或第一方面的第二种可能的实施方式或第一方面的第三种可能的实施方式,在第四种可能的实施方式中,所述堆叠系统还包括第三通信设备,其中,所述第一通信设备和所述第三通信设备通过Y个端口互联;
所述故障检测方法还包括:
所述第二器件接收来自所述第一器件的第四信号,基于所述第四信号所指示的所述第三通信设备的异常端口数,更新所述第三通信设备当前的异常端口总数,若更新后的所述第三通信设备当前的异常端口总数满足所述第三通信设备对应的失效确认条件,则通知所述第二处理器所述第三通信设备部分或整体失效,其中,所述第四信号由所述第一器件在接收到所述第一业务板的W1个端口发起的端口异常中断信号之后发送,所述第四信号指示出所述第三通信设备的W1个端口存在异常,所述W1个端口为所述Y个端口中的部分或者全部端口。
本发明第二方面提供一种通信设备,所述通信设备通过M个端口与第二通信设备互联,其中,所述通信设备包括:第一业务板和第二业务板,所述第一业务板包括:第一处理器和第一器件,所述第二业务板包括:第二处理器和第二器件,其中,所述第一处理器和所述第二处理器用于业务处理,所述第一器件包括处理器和/或可编程逻辑器件,所述第二器件包括处理器和/或可编程逻辑器件;
所述第二器件,用于接收来自所述第一器件的第一信号,基于所述第一信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第一信号由所述第一器件在接收到所述第一业务板的N1个端口发起的端口异常中断信号之后发送,所述第一信号指示出所述第二通信设备的N1个端口存在异常,所述N1个端口为所述M个端口中的部分或者全部端口。
结合第二方面,在第一种可能的实施方式中,所述通信设备还包括第三业务板,所述第三业务板包括第三处理器和第三器件,其中,所述第三处理器用于业务处理,所述第三器件包括处理器和/或可编程逻辑器件;
所述第二器件还用于,接收来自所述第三器件的第二信号,基于所述第二信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第二信号由所述第三器件在接收到所述第三业务板的N2个端口发起的端口异常中断信号之后发送,所述第二信号指示出所述第二通信设备的N2个端口存在异常,所述N2个端口为所述M个端口中的部分端口。
结合第二方面或第二方面的第一种可能的实施方式,在第二种可能的实施方式中,所述第二器件还用于,接收所述第二业务板的N3个端口发起的端口异常中断信号,其中,所述N3个端口为所述M个端口中的部分端口,基于所述N3更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效。
结合第二方面或第二方面的第一种可能的实施方式或第二方面的第二种可能的实施方式,在第三种可能的实施方式中,所述通信设备还与第三通信设备通过Y个端口互联;
所述第二器件还用于,接收来自所述第一器件的第四信号,基于所述第四信号所指示的所述第三通信设备的异常端口数,更新所述第三通信设备当前的异常端口总数,若更新后的所述第三通信设备当前的异常端口总数满足所述第三通信设备对应的失效确认条件,则通知所述第二处理器所述第三通信设备部分或整体失效,其中,所述第四信号由所述第一器件在接收到所述第一业务板的W1个端口发起的端口异常中断信号之后发送,所述第四信号指示出所述第三通信设备的W1个端口存在异常,所述W1个端口为所述Y个端口中的部分或者全部端口。
本发明第三方面提供一种堆叠系统,所述堆叠系统包括:
互联的多个通信设备,其中,所述多个通信设备中的至少一个为如上述实施例提供的所述的通信设备。
由上可见,本实施例在堆叠系统的通信设备中的业务板上,增设用于故障检测的器件(如第一器件和第二器件),该器件可包括处理器和/或可编程逻辑器件,利用专用器件来进行端口故障检测,例如当第二器件接收来自第一器件的第一信号,基于第一信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则可通知第二处理器第二通信设备部分或整体失效。由于将故障检测和业务板正常业务处理工作分离,业务板上负责业务处理的处理器(如第一处理器和第二处理器)的性能得到释放,且利用专用器件来进行故障检测,有利于提高故障检测效率和可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1-a是本发明实施例提供的一种堆叠系统的架构示意图;
图1-b是本发明实施例提供的另一种堆叠系统的架构示意图;
图1-c是本发明实施例提供的另一种堆叠系统的架构示意图;
图1-d是本发明实施例提供的另一种堆叠系统的架构示意图;
图2是本发明实施例提供一种故障检测方法的流程示意图;
图3-a是本发明实施例提供的另一种堆叠系统的架构示意图;
图3-b是本发明实施例提供的另一种堆叠系统的架构示意图;
图4-a是本发明实施例提供的一种通信设备的示意图;
图4-b是本发明实施例提供的另一种通信设备的示意图;
图4-c是本发明实施例提供的另一种通信设备的示意图;
图4-d是本发明实施例提供的另一种通信设备的示意图。
具体实施方式
本发明实施例提供一种故障检测方法及相关设备和堆叠系统,以期提高故障检测效率和可靠性。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
以下分别进行详细说明。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明故障检测方法的一个实施例,其中,该故障检测方法可应用于堆叠系统,该堆叠系统可包括:第一通信设备和第二通信设备,其中,第一通信设备可包括:第一业务板和第二业务板,第一业务板可包括:第一处理器和第一器件,第二业务板可包括第二处理器和第二器件,其中,第一处理器和第二处理器用于业务处理,第一通信设备和第二通信设备通过M个端口互联,第一器件包括处理器和/或可编程逻辑器件,第二器件包括处理器和/或可编程逻辑器件。其中,故障检测方法包括:第二器件接收来自第一器件的第一信号,基于第一信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则可通知第二处理器第二通信设备部分或整体失效,其中第一信号由第一器件在接收到第一业务板的N1个端口发起的端口异常中断信号之后发送,第一信号指示出第二通信设备的N1个端口存在异常,上述N1个端口为上述M个端口中的部分或者全部端口。
首先参见图1-a和图2,其中,图1-a为本发明实施例提供的一种堆叠系统的架构示意图,图2为本发明实施例提供的一种故障检测方法的流程示意图。图1-a所示堆叠系统包括第一通信设备101和第二通信设备102,其中,第一通信设备101可包括:第一业务板和第二业务板,第一业务板可包括:第一处理器和第一器件,第二业务板可包括:第二处理器和第二器件,其中,第一处理器和第二处理器用于业务处理,其中,第一通信设备和第二通信设备通过M个端口互联,第一器件包括处理器和/或可编程逻辑器件,第二器件包括处理器和/或可编程逻辑器件。
如图2所示,本发明实施例提供的一种故障检测方法,可应用于图1-a所示架构的堆叠系统或可应用于经过形变或扩展的类似堆叠系统,方法具体可包括如下内容:
201、第二器件接收来自第一器件的第一信号,
其中,第一信号(第一信号例如可以是中断信号或者其它类型的信号)可由第一器件在接收到第一业务板的N1个端口发起的端口异常中断信号之后发送,第一信号可指示出第二通信设备的N1个端口存在异常。若第一通信设备和第二通信设备通过M个端口互联,则上述N1个端口可为上述M个端口中的部分或者全部端口。
在本发明的一些实施例中,第一业务板与第二通信设备之间可存在N1个互联的端口,或者,第一业务板与第二通信设备之间互联的端口也可能多余N1个。进一步的,可为不同通信设备或者不同业务板之间互联的端口可分配不同的端口组号,以便根据端口组号来区分不同端口的互联情况。
202、第二器件基于第一信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数。
在本发明的一些实施例中,例如可设第二通信设备当前的异常端口总数的初始值为0,第二器件在首次接收到用于指示第二通信设备的异常端口数的信号(如第一信号)之后,可将收到的信号所指示第二通信设备的异常端口数和上述初始值累加以得到第二通信设备当时的异常端口总数,而后续第二器件在每次收到用于指示第二通信设备的异常端口数的信号之后,便可将收到的信号所指示第二通信设备的异常端口数累加到最新得到的第二通信设备当前的异常端口总数,进而实现更新第二通信设备当前的异常端口总数。
203、若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则第二器件可通知第二处理器第二通信设备部分或整体失效。
在本发明的一些实施例中,第二器件可通过向第二处理器发送中断信号或其它信号,来通知第二处理器第二通信设备部分或整体失效。第二处理器若获知第二通信设备出现部分获知整体失效,则第二处理器可进行与第二通信设备相关的故障应急处理,例如第二处理器可进行相应业务备份、发布故障告警等操作。
在本发明的一些实施例中,第二业务板可以是普通的业务板,也可以是通信设备中的控制板。
例如图1-b所示,在本发明的一些实施例中,若第一通信设备还包括第三业务板,第三业务板包括第三处理器和第三器件,其中,第三处理器用于业务处理,第三器件包括处理器和/或可编程逻辑器件;则方法还可包括:第二器件接收来自第三器件的第二信号(第二信号例如可以是中断信号或者其它类型的信号),基于第二信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则通知第二处理器第二通信设备部分或整体失效,其中,第二信号由第三器件在接收到第三业务板的N2个端口发起的端口异常中断信号之后发送,第二信号指示出第二通信设备的N2个端口存在异常,上述N2个端口为上述M个端口中的部分端口。这样就在一定程度上实现了多个单点链路故障的汇聚和处理,有利于提高故障检测的可靠性。
例如图1-c所示,在本发明的一些实施例中,若第二业务板与第二通信设备之间也存在互联端口,则方法还可包括:第二器件接收第二业务板的N3个端口发起的端口异常中断信号,其中,上述N3个端口为上述M个端口中的部分端口,基于上述N3更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则通知第二处理器第二通信设备部分或整体失效。这样就在一定程度上实现了多个单点链路故障的汇聚和处理,有利于提高故障检测的可靠性。
在本发明的一些实施例中,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则通知第二处理器第二通信设备部分或整体失效,可包括:若更新后的第二通信设备当前的异常端口总数等于上述M,则通知第二处理器第二通信设备整体失效;或者,若更新后的第二通信设备当前的异常端口总数大于或等于上述M-X1,则通知第二处理器第二通信设备部分或整体失效,其中,上述X1小于上述M;或者,若更新后的第二通信设备当前的异常端口总数大于或等于X2%*M,则通知第二处理器第二通信设备部分或整体失效,其中,上述X2大于0且小于或等于100。
例如图1-d所示,在本发明一些实施例中,若上述堆叠系统还包括第三通信设备,第一通信设备和第三通信设备通过Y个端口互联;上述故障检测方法还可包括:第二器件接收来自第一器件的第四信号,基于第四信号所指示的第三通信设备的异常端口数,更新第三通信设备当前的异常端口总数,若更新后的第三通信设备当前的异常端口总数满足第三通信设备对应的失效确认条件,则通知第二处理器第三通信设备部分或整体失效,其中,第四信号由第一器件在接收到第一业务板的W1个端口发起的端口异常中断信号之后发送,第四信号指示出第三通信设备的W1个端口存在异常,上述W1个端口为上述Y个端口中的部分或者全部端口。
在本发明的一些实施例中,若更新后的第三通信设备当前的异常端口总数满足第三通信设备对应的失效确认条件,则通知第二处理器第三通信设备部分或整体失效,可包括:若更新后的第三通信设备当前的异常端口总数等于上述Y,则通知第二处理器第三通信设备整体失效;或者,若更新后的第三通信设备当前的异常端口总数大于或等于上述Y-X3,则通知第二处理器第三通信设备部分或整体失效,其中,上述X3小于上述Y;或者,若更新后的第三通信设备当前的异常端口总数大于或等于X4%*M,则通知第二处理器第三通信设备部分或整体失效,其中,上述X4大于0且小于或等于100。
可以理解,对于存在多个通信设备的情况,每个通信设备均可按照上述方式来进行邻接通信设备的故障检测,此处不再额外举例。
由上可见,本实施例在堆叠系统的通信设备中的业务板上,增设用于故障检测的器件(如第一器件和第二器件),该器件可包括处理器和/或可编程逻辑器件,利用专用器件来进行端口故障检测,例如当第二器件接收来自第一器件的第一信号,基于第一信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则可通知第二处理器第二通信设备部分或整体失效。由于将故障检测和业务板正常业务处理工作分离,业务板上负责业务处理的处理器(如第一处理器和第二处理器)的性能得到释放,且利用专用硬件来进行故障检测,有利于提高故障检测效率和可靠性。
为便于更好的理解,下面通过举例两个具体场景进行描述。
参见图3-a,其中,图3-a为本发明实施例提供的另一种堆叠系统的架构示意图。图3-a所示堆叠系统包括第一通信设备301和第二通信设备302,其中,第一通信设备301可包括:第一业务板、控制板和第三业务板。其中,第一业务板可包括:第一处理器和第一可编程逻辑器件,控制板可包括:第二处理器和第二可编程逻辑器件,第三业务板可包括:第三处理器和第三可编程逻辑器件,其中,第一处理器、第二处理器和第三处理器用于业务处理,其中第一通信设备301和第二通信设备302通过6个端口(T1~T6)互联。
在一种可能应用场景下,假设第一可编程逻辑器件在接收到第一业务板的3个端口(T1~T3)发起的端口异常中断信号,第一可编程逻辑器件可向第二可编程逻辑器件发送第一中断信号,其中,第一中断信号指示第二通信设备的异常端口数为3。第二可编程逻辑器件接收到来自第一可编程逻辑器件的第一中断信号后,基于第一中断信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数为3(0+3=3),第二可编程逻辑器件判断出更新后的第二通信设备当前的异常端口总数仍小于6,因此,暂时不满足第二通信设备对应的失效确认条件,故第二可编程逻辑器件目前不通知第二处理器第二通信设备整体失效。之后,假设第三可编程逻辑器接收到第三业务板的3个端口(T4~T6)发起的端口异常中断信号之后,第三可编程逻辑器件可向第二可编程逻辑器件发送第二中断信号,第二中断信号指示第二通信设备的异常端口数为3。第二可编程逻辑器件接收来自第三可编程逻辑器件的第二中断信号后,基于第二中断信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数为6(3+3=6),第二可编程逻辑器件判断出更新后的第二通信设备当前的异常端口总数等于6,因此满足第二通信设备对应的失效确认条件,第二可编程逻辑器件向第二处理器发送中断信号,以通知第二处理器第二通信设备整体失效。
在另一种可能应用场景下,假设当第二通信设备当前的异常端口总数小于4时不上报第二通信设备失效,当第二通信设备当前的异常端口总数大于或等于4且小于6时,可上报第二通信设备部分失效,当第二通信设备当前的异常端口总数等于6时,可上报第二通信设备整体失效。
假设第一可编程逻辑器件在接收到第一业务板的2个端口(T1~T2)发起的端口异常中断信号,第一可编程逻辑器件可向第二可编程逻辑器件发送第一中断信号,其中,第一中断信号指示第二通信设备的异常端口数为2。第二可编程逻辑器件接收到来自第一可编程逻辑器件的第一中断信号后,基于第一中断信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数为2(0+2=2),第二可编程逻辑器件判断出更新后的第二通信设备当前的异常端口总数小于4或6,因此,暂时不满足第二通信设备对应的失效确认条件,故第二可编程逻辑器件目前不通知第二处理器第二通信设备部分或整体失效。之后,假设第三可编程逻辑器接收到第三业务板的3个端口(T4~T6)发起的端口异常中断信号之后,第三可编程逻辑器件可向第二可编程逻辑器件发送第二中断信号,第二中断信号指示第二通信设备的异常端口数为3。第二可编程逻辑器件接收来自第三可编程逻辑器件的第二中断信号后,基于第二中断信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数为5(2+3=5),第二可编程逻辑器件判断出更新后的第二通信设备当前的异常端口总数是大于4且小于6的,因此,满足第二通信设备对应的失效确认条件,第二可编程逻辑器件向第二处理器发送中断信号,以通知第二处理器第二通信设备部分失效,其中,通知整体失效的中断信号可不同于通知部分失效的中断信号。
参见图3-b,其中,图3-b为本发明实施例提供的另一种堆叠系统的架构示意图。图3-b所示堆叠系统包括第一通信设备301和第二通信设备302,其中,第一通信设备301可包括:第一业务板、控制板和第三业务板。其中,第一业务板可包括:第一处理器和第一可编程逻辑器件,控制板可包括:第二处理器和第二可编程逻辑器件,第三业务板可包括:第三处理器和第三可编程逻辑器件,其中,第一处理器、第二处理器和第三处理器用于业务处理,其中第一通信设备301和第二通信设备302通过8个端口(T1~T8)互联。
在一种可能应用场景下,假设第一可编程逻辑器件在接收到第一业务板的3个端口(T1~T3)发起的端口异常中断信号,第一可编程逻辑器件可向第二可编程逻辑器件发送第一中断信号,其中,第一中断信号指示第二通信设备的异常端口数为3。第二可编程逻辑器件接收到来自第一可编程逻辑器件的第一中断信号后,基于第一中断信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数为3(0+3=3),第二可编程逻辑器件判断出更新后的第二通信设备当前的异常端口总数仍小于8,因此,暂时不满足第二通信设备对应的失效确认条件,故第二可编程逻辑器件目前不通知第二处理器第二通信设备整体失效。之后,假设第三可编程逻辑器接收到第三业务板的3个端口(T4~T6)发起的端口异常中断信号之后,第三可编程逻辑器件可向第二可编程逻辑器件发送第二中断信号,第二中断信号指示第二通信设备的异常端口数为3。第二可编程逻辑器件接收来自第三可编程逻辑器件的第二中断信号后,基于第二中断信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数为6(3+3=6),第二可编程逻辑器件判断出更新后的第二通信设备当前的异常端口总数仍小于8,因此,暂时不满足第二通信设备对应的失效确认条件,故第二可编程逻辑器件目前不通知第二处理器第二通信设备整体失效,再之后,第二可编程逻辑器接收到控制板的2个端口(T4~T6)发起的端口异常中断信号,第二可编程逻辑器更新第二通信设备当前的异常端口总数为8(3+3+2=8),因此满足第二通信设备对应的失效确认条件,第二可编程逻辑器件向第二处理器发送中断信号,以通知第二处理器第二通信设备整体失效。
在另一种可能应用场景下,假设当第二通信设备当前的异常端口总数小于5时不上报第二通信设备失效,当第二通信设备当前的异常端口总数大于或等于5且小于8时,可上报第二通信设备部分失效,当第二通信设备当前的异常端口总数等于8时,可上报第二通信设备整体失效。
假设第一可编程逻辑器件在接收到第一业务板的3个端口(T1~T2)发起的端口异常中断信号,第一可编程逻辑器件可向第二可编程逻辑器件发送第一中断信号,其中,第一中断信号指示第二通信设备的异常端口数为3。第二可编程逻辑器件接收到来自第一可编程逻辑器件的第一中断信号后,基于第一中断信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数为3(0+3=3),第二可编程逻辑器件判断出更新后的第二通信设备当前的异常端口总数小于5或8,因此,暂时不满足第二通信设备对应的失效确认条件,故第二可编程逻辑器件目前不通知第二处理器第二通信设备部分或整体失效。之后,假设第三可编程逻辑器接收到第三业务板的3个端口(T4~T6)发起的端口异常中断信号,第三可编程逻辑器件可向第二可编程逻辑器件发送第二中断信号,第二中断信号指示第二通信设备的异常端口数为3。第二可编程逻辑器件接收来自第三可编程逻辑器件的第二中断信号后,基于第二中断信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数为6(3+3=6),第二可编程逻辑器件判断出更新后的第二通信设备当前的异常端口总数是等于6的(即大于5且小于8),因此,满足第二通信设备的部分失效确认条件,第二可编程逻辑器件向第二处理器发送中断信号,以通知第二处理器第二通信设备部分失效。再之后,第二可编程逻辑器又接收到控制板的2个端口(T4~T6)发起的端口异常中断信号,第二可编程逻辑器更新第二通信设备当前的异常端口总数为8(3+3+2=8),因此满足第二通信设备对应的整体失效确认条件,第二可编程逻辑器件向第二处理器发送中断信号,以通知第二处理器第二通信设备整体失效,其中,通知整体失效的中断信号可不同于通知部分失效的中断信号。
可以看出,上述两个举例中利用专用硬件(如第一可编程逻辑器件、第二可编程逻辑器件和第三可编程逻辑器件)来进行端口故障检测,例如当第二可编程逻辑器件接收来自第一器件的第一中断信号,基于第一中断信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则可通知第二处理器第二通信设备部分或整体失效。由于将故障检测和业务板正常业务处理工作分离,业务板上负责业务处理的处理器(如第一处理器和第二处理器)的性能得到释放,且利用专用硬件来进行故障检测,有利于提高故障检测效率和可靠性。
可以理解,上述场景仅为举例,在实际应用中可根据场景不同和实际需要进行适应变化。
为便于更好的实施本发明实施例的上述方案,下面还提供用于实施上述方案的相关装置。
参见图4-a,本发明实施例提供的一种通信设备400,可包括:第一业务板410和第二业务板420,其中,第一业务板410包括:第一处理器411和第一器件412,第二业务板420包括第二处理器421和第二器件422,其中,第一处理器411和第二处理器421用于业务处理,第一器件412包括处理器和/或可编程逻辑器件,第二器件422包括处理器和/或可编程逻辑器件;通信设备400可通过M个端口与第二通信设备互联。
其中,第二器件422,用于接收来自第一器件412的第一信号,基于第一信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则通知第二处理器424第二通信设备部分或整体失效,其中,第一信号由第一器件412在接收到第一业务板的N1个端口发起的端口异常中断信号之后发送,第一信号指示出第二通信设备的N1个端口存在异常,上述N1个端口为上述M个端口中的部分或者全部端口。
参见图4-b,在本发明的一些实施例中,通信设备400还可包括第三业务板430,第三业务板430包括第三处理器431和第三器件432,其中,第三处理器430用于业务处理,第三器件432包括处理器和/或可编程逻辑器件。
其中,第二器件422还用于,接收来自第三器件432的第二信号,基于第二信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则通知第二处理器421第二通信设备部分或整体失效,其中第二信号由第三器件432在接收到第三业务板的N2个端口发起的端口异常中断信号之后发送,第二信号指示出第二通信设备的N2个端口存在异常,上述N2个端口为上述M个端口中的部分端口。
参见图4-c,在本发明的一些实施例中,第二器件422还用于,接收第二业务板的N3个端口发起的端口异常中断信号,其中,上述N3个端口为上述M个端口中的部分端口,基于上述N3更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则通知第二处理器421第二通信设备部分或整体失效。
参见图4-d,在本发明的一些实施例中,通信设备400还可与第三通信设备通过Y个端口互联;
第二器件421还可用于,接收来自第一器件412的第四信号,基于第四信号所指示的第三通信设备的异常端口数,更新第三通信设备当前的异常端口总数,若更新后的第三通信设备当前的异常端口总数满足第三通信设备对应的失效确认条件,则通知第二处理器第三通信设备部分或整体失效,其中,第四信号由第一器件在接收到第一业务板的W1个端口发起的端口异常中断信号之后发送,第一信号指示出第三通信设备的W1个端口存在异常,上述W1个端口为上述Y个端口中的部分或者全部端口。
其中,本实施例的各通信设备例如可以是服务器,路由器、交换机或其它网络设备。
可以理解的是,本实施例的通信设备400的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可见,本实施例在通信设备400中的业务板上增设用于故障检测的器件(如第一器件和第二器件),该器件可包括处理器和/或可编程逻辑器件,利用专用器件来进行端口故障检测,例如当第二器件接收来自第一器件的第一信号,基于第一信号所指示的第二通信设备的异常端口数,更新第二通信设备当前的异常端口总数,若更新后的第二通信设备当前的异常端口总数满足第二通信设备对应的失效确认条件,则可通知第二处理器第二通信设备部分或整体失效。由于将故障检测和业务板正常业务处理工作分离,业务板上负责业务处理的处理器(如第一处理器和第二处理器)的性能得到释放,且利用专用器件来进行故障检测,有利于提高故障检测效率和可靠性。
本发明实施例还提供一种堆叠系统,其中,互联的多个通信设备,该多个通信设备中的至少一个如通信设备400。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的故障监测方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种故障检测方法,应用于堆叠系统,其特征在于,所述堆叠系统包括第一通信设备和第二通信设备,其中,所述第一通信设备包括第一业务板和第二业务板,所述第一业务板包括第一处理器和第一器件,所述第二业务板包括第二处理器和第二器件,其中,所述第一处理器和所述第二处理器用于业务处理,所述第一通信设备和第二通信设备通过M个端口互联,所述第一器件包括处理器和/或可编程逻辑器件,所述第二器件包括处理器和/或可编程逻辑器件;
其中,所述故障检测方法包括:
所述第二器件接收来自所述第一器件的第一信号,基于所述第一信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第一信号由所述第一器件在接收到所述第一业务板的N1个端口发起的端口异常中断信号之后发送,所述第一信号指示出所述第二通信设备的N1个端口存在异常,所述N1个端口为所述M个端口中的部分或者全部端口。
2.根据权利要求1所述的方法,其特征在于,
所述第一通信设备还包括第三业务板,所述第三业务板包括第三处理器和第三器件,其中,所述第三处理器用于业务处理,所述第三器件包括处理器和/或可编程逻辑器件;
所述方法还包括:所述第二器件接收来自所述第三器件的第二信号,基于所述第二信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第二信号由所述第三器件在接收到所述第三业务板的N2个端口发起的端口异常中断信号之后发送,所述第二信号指示出所述第二通信设备的N2个端口存在异常,所述N2个端口为所述M个端口中的部分端口。
3.根据权利要求1或2所述的方法,其特征在于,
所述方法还包括:所述第二器件接收所述第二业务板的N3个端口发起的端口异常中断信号,其中,所述N3个端口为所述M个端口中的部分端口,基于所述N3更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效。
4.根据权利要求1或2所述的方法,其特征在于,
所述若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,包括:
若更新后的所述第二通信设备当前的异常端口总数等于所述M,则通知第二处理器所述第二通信设备整体失效;或者,若更新后的所述第二通信设备当前的异常端口总数大于或等于所述M-X1,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述X1小于所述M;或者,若更新后的所述第二通信设备当前的异常端口总数大于或等于X2%*M,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述X2大于0且小于或等于100。
5.根据权利要求1或2所述的方法,其特征在于,
所述堆叠系统还包括第三通信设备,其中,所述第一通信设备和所述第三通信设备通过Y个端口互联;
所述故障检测方法还包括:
所述第二器件接收来自所述第一器件的第四信号,基于所述第四信号所指示的所述第三通信设备的异常端口数,更新所述第三通信设备当前的异常端口总数,若更新后的所述第三通信设备当前的异常端口总数满足所述第三通信设备对应的失效确认条件,则通知所述第二处理器所述第三通信设备部分或整体失效,其中,所述第四信号由所述第一器件在接收到所述第一业务板的W1个端口发起的端口异常中断信号之后发送,所述第四信号指示出所述第三通信设备的W1个端口存在异常,所述W1个端口为所述Y个端口中的部分或者全部端口。
6.一种通信设备,其特征在于,所述通信设备通过M个端口与第二通信设备互联,其中,所述通信设备包括:第一业务板和第二业务板,所述第一业务板包括:第一处理器和第一器件,所述第二业务板包括:第二处理器和第二器件,其中,所述第一处理器和所述第二处理器用于业务处理,所述第一器件包括处理器和/或可编程逻辑器件,所述第二器件包括处理器和/或可编程逻辑器件;
所述第二器件,用于接收来自所述第一器件的第一信号,基于所述第一信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第一信号由所述第一器件在接收到所述第一业务板的N1个端口发起的端口异常中断信号之后发送,所述第一信号指示出所述第二通信设备的N1个端口存在异常,所述N1个端口为所述M个端口中的部分或者全部端口。
7.根据权利要求6所述的通信设备,其特征在于,
所述通信设备还包括第三业务板,所述第三业务板包括第三处理器和第三器件,其中,所述第三处理器用于业务处理,所述第三器件包括处理器和/或可编程逻辑器件;
所述第二器件还用于,接收来自所述第三器件的第二信号,基于所述第二信号所指示的所述第二通信设备的异常端口数,更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效,其中,所述第二信号由所述第三器件在接收到所述第三业务板的N2个端口发起的端口异常中断信号之后发送,所述第二信号指示出所述第二通信设备的N2个端口存在异常,所述N2个端口为所述M个端口中的部分端口。
8.根据权利要求6或7所述的通信设备,其特征在于,
所述第二器件还用于,接收所述第二业务板的N3个端口发起的端口异常中断信号,其中,所述N3个端口为所述M个端口中的部分端口,基于所述N3更新所述第二通信设备当前的异常端口总数,若更新后的所述第二通信设备当前的异常端口总数满足所述第二通信设备对应的失效确认条件,则通知所述第二处理器所述第二通信设备部分或整体失效。
9.根据权利要求6或7所述的通信设备,其特征在于,
所述通信设备还与第三通信设备通过Y个端口互联;
所述第二器件还用于,接收来自所述第一器件的第四信号,基于所述第四信号所指示的所述第三通信设备的异常端口数,更新所述第三通信设备当前的异常端口总数,若更新后的所述第三通信设备当前的异常端口总数满足所述第三通信设备对应的失效确认条件,则通知所述第二处理器所述第三通信设备部分或整体失效,其中,所述第四信号由所述第一器件在接收到所述第一业务板的W1个端口发起的端口异常中断信号之后发送,所述第四信号指示出所述第三通信设备的W1个端口存在异常,所述W1个端口为所述Y个端口中的部分或者全部端口。
10.一种堆叠系统,其特征在于,所述堆叠系统包括:
互联的多个通信设备,其中,所述多个通信设备中的至少一个为如权利要求6至9任一项所述的通信设备。
CN201210482460.3A 2012-11-23 2012-11-23 故障检测方法及相关设备和堆叠系统 Active CN103840959B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201210482460.3A CN103840959B (zh) 2012-11-23 2012-11-23 故障检测方法及相关设备和堆叠系统
PCT/CN2013/087656 WO2014079383A1 (zh) 2012-11-23 2013-11-22 故障检测方法及相关设备和堆叠系统
ES13856267.3T ES2644358T3 (es) 2012-11-23 2013-11-22 Método de detección de fallos y dispositivo asociado
EP13856267.3A EP2919417B1 (en) 2012-11-23 2013-11-22 Fault detection method and related device
US14/720,253 US9632885B2 (en) 2012-11-23 2015-05-22 Fault detection method and related device and stack system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210482460.3A CN103840959B (zh) 2012-11-23 2012-11-23 故障检测方法及相关设备和堆叠系统

Publications (2)

Publication Number Publication Date
CN103840959A CN103840959A (zh) 2014-06-04
CN103840959B true CN103840959B (zh) 2017-11-17

Family

ID=50775556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210482460.3A Active CN103840959B (zh) 2012-11-23 2012-11-23 故障检测方法及相关设备和堆叠系统

Country Status (5)

Country Link
US (1) US9632885B2 (zh)
EP (1) EP2919417B1 (zh)
CN (1) CN103840959B (zh)
ES (1) ES2644358T3 (zh)
WO (1) WO2014079383A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106764689B (zh) * 2016-12-28 2023-06-23 陕西中烟工业有限责任公司 堆垛机故障照明装置与堆垛机

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7321981B1 (en) * 2001-02-28 2008-01-22 Cisco Technology, Inc. Multi-port line card redundancy technique for an intermediate network node
US7085224B1 (en) * 2001-06-14 2006-08-01 Cisco Technology, Inc. Method and apparatus for fast failure detection in switched LAN networks
US7085958B2 (en) * 2003-01-17 2006-08-01 International Business Machines Corporation System and method for isolating a faulty switch, storage device or SFP in a daisy-chained configuration
US8098571B2 (en) * 2004-10-28 2012-01-17 Alcatel Lucent Stack manager protocol with automatic set up mechanism
CN101247275B (zh) * 2008-03-18 2011-02-09 杭州华三通信技术有限公司 一种中断上报方法和网络设备
CN101610182B (zh) * 2009-06-26 2011-09-07 杭州华三通信技术有限公司 堆叠中多主用设备冲突检测方法及堆叠成员设备
CN102208987A (zh) * 2010-03-29 2011-10-05 鸿富锦精密工业(深圳)有限公司 主板管理控制器网络配置系统及方法
US8862944B2 (en) * 2010-06-24 2014-10-14 International Business Machines Corporation Isolation of faulty links in a transmission medium
CN102164056B (zh) * 2011-03-17 2013-07-24 杭州华三通信技术有限公司 堆叠链路聚合故障检测方法和堆叠设备
CN102255751A (zh) * 2011-06-30 2011-11-23 杭州华三通信技术有限公司 一种堆叠冲突的处理方法和设备

Also Published As

Publication number Publication date
ES2644358T3 (es) 2017-11-28
EP2919417A4 (en) 2015-11-25
WO2014079383A1 (zh) 2014-05-30
US20150254147A1 (en) 2015-09-10
EP2919417B1 (en) 2017-09-06
CN103840959A (zh) 2014-06-04
EP2919417A1 (en) 2015-09-16
US9632885B2 (en) 2017-04-25

Similar Documents

Publication Publication Date Title
CN101702663B (zh) 一种环网拓扑信息的更新方法和装置
CN102724030A (zh) 一种高可靠性的堆叠系统
CN101068185B (zh) 以太环网报文处理方法及应用该方法的以太环网保护系统
CN101729426B (zh) 一种虚拟路由冗余协议主备用设备快速切换的方法及系统
CN103856357A (zh) 一种堆叠系统故障处理方法及堆叠系统
US7787363B2 (en) Dual-purpose uplinks used in a fault-tolerant stack
CN102754390B (zh) 以太网环保护倒换方法、网络设备及系统
CN103560955A (zh) 冗余设备切换方法及装置
CN110838962B (zh) 船用网络系统及船舶系统
CN108933744B (zh) 一种报文转发方法及装置
CN108804260A (zh) 一种srio系统倒换的方法和装置
CN101237343B (zh) 故障时快速切换的方法及快速切换系统
CN102611610A (zh) 一种多条相同路径隧道集中管理的方法和系统
CN101599906B (zh) 端口状态设置的方法及装置
CN104394012B (zh) 集群路由器、mpu及其故障的确定方法、感知控制器
CN103840959B (zh) 故障检测方法及相关设备和堆叠系统
CN102651712B (zh) 多处理器系统的节点路由方法、控制器及多处理器系统
CN101883045B (zh) 一种堆叠系统的合并方法、系统及装置
EP2693706A1 (en) Method and device for implementing multi-protection overlapped protection groups
CN110535792A (zh) 多节点装置及其备援通信方法
US7210069B2 (en) Failure recovery in a multiprocessor configuration
CN101729349B (zh) 一种基于rrpp的主环通道连通性检测方法及装置
JP5387589B2 (ja) 無線伝送装置
CN103944781A (zh) 一种防止堆叠系统单边分裂的方法及系统
CN103891204A (zh) 链路倒换的方法和交换设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant