CN111224803A - 一种堆叠系统中多主检测方法及堆叠系统 - Google Patents

一种堆叠系统中多主检测方法及堆叠系统 Download PDF

Info

Publication number
CN111224803A
CN111224803A CN201811414958.XA CN201811414958A CN111224803A CN 111224803 A CN111224803 A CN 111224803A CN 201811414958 A CN201811414958 A CN 201811414958A CN 111224803 A CN111224803 A CN 111224803A
Authority
CN
China
Prior art keywords
detection
state
port group
main detection
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811414958.XA
Other languages
English (en)
Other versions
CN111224803B (zh
Inventor
李金涛
孟非
王治平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201811414958.XA priority Critical patent/CN111224803B/zh
Priority to PCT/CN2019/110110 priority patent/WO2020103586A1/zh
Publication of CN111224803A publication Critical patent/CN111224803A/zh
Application granted granted Critical
Publication of CN111224803B publication Critical patent/CN111224803B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/22Arrangements for detecting or preventing errors in the information received using redundant apparatus to increase reliability

Abstract

本发明实施例公开了一种堆叠系统中多主检测方法及堆叠系统,其中该多主检测方法包括:检测多主检测端口组状态和多主检测端口组的第一多主检测定时器状态;当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文。如此,不仅可以实现堆叠系统多主检测报文的冗余保护,还可以将闲置的堆叠端口组带宽充分利用,提高了物理资源的利用效率。

Description

一种堆叠系统中多主检测方法及堆叠系统
技术领域
本发明实施例涉及但不限于一种堆叠系统中多主检测方法及堆叠系统。
背景技术
堆叠系统是一种网络虚拟化技术,就是把多台可以单独运行的物理设备组合成一台逻辑设备,彼此之间通过协议发现对方,并通过一定的机制选择一台主设备,其它设备担任转发角色。整个堆叠系统通过各成员设备控制平面之间的心跳保活报文来维护堆叠系统的稳定。
堆叠系统主要有以下优势:1、堆叠系统对所有成员设备进行统一管理,简化了管理;2、堆叠系统形中运行的各种控制协议感知不到多个成员设备的存在,简化了网络;3、堆叠系统支持跨设备的链路聚合,可以实现协议级和设备级跨设备链路备份,提高了转发可靠性。
但是当控制平面的心跳报文收发超时,则堆叠系统会分裂为各个成员独立运行,由于原来堆叠系统内各个成员共用IP和Mac,因此分裂后,网络中将出现两台或两台以上的IP、基Mac相同的设备,严重影响网络的正常运行。
发明内容
有鉴于此,本发明实施例提供了一种堆叠系统中多主检测方法,包括:检测多主检测端口组状态和多主检测端口组的第一多主检测定时器状态;
当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文。
本发明实施例还提供了一种堆叠系统,包括:
检测单元,用于检测多主检测端口组状态和多主检测端口组的第一多主检测定时器状态;
管理单元,用于当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文。
本发明实施例还提供了一种堆叠系统,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述的多主监测方法。
本发明实施例还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息处理程序,所述信息处理程序被处理器执行时实现上述多主监测方法的步骤。
与相关技术相比,本发明实施例提供了一种堆叠系统中多主检测方法及堆叠系统,其中该多主检测方法包括:检测多主检测端口组状态和多主检测端口组的第一多主检测定时器状态;当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文。如此,不仅可以实现堆叠系统多主检测报文的冗余保护,还可以将闲置的堆叠端口组带宽充分利用,提高了物理资源的利用效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为现有堆叠系统的结构示意图;
图2为本发明实施例一提供的堆叠系统中多主检测方法的流程示意图;
图3为本发明实施例二提供的堆叠系统中多主检测方法的流程示意图;
图4为本发明实施例三提供的堆叠系统中多主检测方法的流程示意图;
图5为本发明实施例四提供的堆叠系统的结构示意图;
图6为本发明实施例五提供的堆叠系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1为现有堆叠系统的结构示意图。在现有的交换机堆叠组网方案中,涉及堆叠应用的端口有三种,如图3所示,第一种是控制平面的级联端口(级联链路组),用于传输管理堆叠系统的心跳保活报文,形成堆叠系统;第二种是转发平面(也称为业务平面)的堆叠端口(堆叠链路组),用于传输堆叠系统中各成员设备间的业务数据报文;第三种是转发平面的多主检测端口(多主检测链路组),用于多主检测。当堆叠系统异常分裂后,备设备会自动退避,以免影响主设备的正常转发。由于现有堆叠系统中多主检测报文只能通过转发平面的多主检测端口组传输,一旦多主检测端口、线缆等出现故障导致多主检测报文处理超时,那么堆叠系统异常分裂时,网络中将会出现两台或两台以上同IP的设备,严重影响网络的正常运行。
为此,本发明提供了一种新的多主检测技术方案,当多主检测端口故障时,利用转发平面的堆叠端口传输多主检测报文,如此,不仅可以实现堆叠系统多主检测报文的冗余保护,还可以将闲置的堆叠端口组带宽充分利用,提高了物理资源的利用效率。
实施例一
图2为本发明实施例一提供的堆叠系统中多主检测方法的流程示意图。如图2所示,该多主检测方法,包括:
步骤201,检测多主检测端口组状态和多主检测端口组的第一多主检测定时器状态;
步骤202,当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文。
其中,在多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文之前,该方法还包括:
在堆叠系统上配置所述堆叠端口组;
在所述堆叠系统上配置所述多主检测报文冗余备份组,并将所述多主检测报文冗余备份组关联到所述堆叠端口组。
其中,在多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文之后,该方法还包括:
当所述多主检测端口组状态恢复为UP且所述第一多主检测定时器状态恢复为正常状态时,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文,并恢复通过所述多主检测端口组收发多主检测报文。
其中,在通过堆叠端口组收发多主检测报文之后,该方法还包括:
检测所述堆叠端口组的第二多主检测定时器状态;
当所述第二多主检测定时器状态为超时状态时,判断所述第一多主检测定时器状态;
当所述第一多主检测定时器状态为正常状态时,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文,并恢复通过所述多主检测端口组收发多主检测报文;
当所述第一多主检测定时器状态仍为超时状态时,进行堆叠分裂流程。
其中,当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,该方法还包括:
为所述堆叠端口组创建并启动第二多主检测定时器;
并在停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文时,删除所述第二多主检测定时器。
其中,当多主检测端口组没有在预设定时器周期内接收到多主检测报文时,所述第一多主检测定时器状态为超时状态;
当多主检测端口组故障在预设定时器周期内接收到多主检测报文时,所述第一多主检测定时器状态为正常状态。
其中,当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,由控制平面向所述堆叠端口组发送启动start消息,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文;
当所述多主检测端口组状态恢复为UP且所述第一多主检测定时器状态恢复为正常状态时,由控制平面向所述堆叠端口组发送第一停止stop消息,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文;
当所述第二多主检测定时器状态为超时状态时,由所述堆叠端口向所述控制平面发送第二停止stop消息,所述控制平面收到所述第二stop消息后,判断所述第一多主检测定时器状态;当所述第一多主检测定时器状态恢复为正常状态时,由控制平面向所述堆叠端口组发送第一停止stop消息,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文。
本发明实施例一提供的技术方案,根据堆叠系统中多主检测端口状态及多主检测报文定时器状态将多主检测报文检测功能切换至堆叠端口组运行。不仅可以实现堆叠系统多主检测报文的冗余保护,还可以将闲置的堆叠端口组带宽充分利用,提高了物理资源的利用效率。
下面通过两个具体的实施例详细阐述上述技术方案。
实施例二
堆叠系统中堆叠端口组在部署网络组网时主要采用多个大带宽端口进行捆绑,而实际运行中只有少量业务需要通过堆叠端口组进行跨成员设备转发。因此,堆叠端口组带宽是有一部分闲置的,在堆叠端口组基础上生成多主检测报文冗余备份组传输多主检测报文,不仅可以实现堆叠系统多主检测报文的冗余保护,还可以将闲置的堆叠端口组带宽充分利用,提高了物理资源的利用效率。
本发明实施例二提供的技术方案,要求堆叠系统的转发平面存在堆叠端口,并利用转发平面的堆叠端口传输多主检测报文,即利用堆叠系统中现有的堆叠端口组生成多主检测报文冗余备份组,根据堆叠系统中多主检测端口状态及多主检测报文定时器状态将多主检测报文检测功能切换至堆叠端口组运行。
图3为本发明实施例二提供的堆叠系统中多主检测方法的流程示意图。如图3所示,该多主检测方法,包括:
步骤301,在堆叠系统上配置堆叠端口组;
其中,现有堆叠系统中,通过多主检测端口组(包含一个或者多个多主检测端口)发送接收(收发)多主检测报文,为现有技术,在此不再赘述。
多主检测端口组多主检测报文的处理优先级高于其它上送CPU的报文,多主检测报文是整个堆叠系统异常分裂后备设备退避的关键。各速率类型的端口均可以加入到堆叠端口组内。加入到堆叠端口组内的成员不能再被其它业务使用。
步骤302,在堆叠系统上配置多主检测报文冗余备份组并关联到所述堆叠端口组;
其中,可以通过配置单元在堆叠系统上配置多主检测报文冗余备份组并绑定到配置的堆叠端口组上。
步骤303,检测多主检测端口组状态和多主检测端口组的第一多主检测定时器状态;
其中,当堆叠系统检测到多主检测端口组状态为UP且多主检测端口组的第一多主检测定时器状态为正常状态,则继续通过转发平面的多主检测端口组传输多主检测报文,此为现有技术,在此不再赘述。
步骤304,当堆叠系统检测到多主检测端口组内所有的端口状态均为DOWN或多主检测端口组的第一多主检测定时器状态为超时状态时,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文;
其中,多主检测端口组内所有端口状态为DOWN后,多主检测报文预设定时周期内接收不到,第一多主检测定时器进入超时状态。
步骤305,多主检测报文冗余备份组开始发送接收多主检测报文,保障堆叠系统正常运行;
其中,控制平面在检测到多主检测端口DOWN或者保活定时器(第一多主检测定时器)超时后可以向堆叠端口组发送消息,由堆叠端口组自己维护,并将堆叠端口组的保活定时器(第一多主检测定时器)状态通知控制平面。也可以由主设备的控制平面直接将多主检测报文发送到堆叠端口组,再由堆叠端口组上送到备设备的控制平面。
步骤306,当堆叠系统检测多主检测端口状态为UP且多主检测端口的第一多主检测定时器状态为正常状态时,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文,并恢复通过所述多主检测端口组收发多主检测报文;
其中,当堆叠系统检测到多主检测端口状态变为UP后,多主检测端口的心跳报文能够正常发出,多主检测定时器状态转为正常,如此多主检测报文冗余备份组停止发送心跳报文,并且恢复由多主检测端口组发送接收多主检测报文,保障堆叠系统正常运行。
本发明实施例二提供的技术方案,通过在堆叠系统上创建多主检测报文的冗余备份组,当现有堆叠系统中多主检测端口或者线缆等出现故障导致多主检测报文处理超时,堆叠系统多主检测报文自动切换至冗余备份组继续检测,更好的保障多主检测报文正常传输处理,使堆叠系统可以稳定运行。
实施例三
本发明实施例三提供的技术方案,利用堆叠系统的堆叠端口组创建多主检测报文的冗余备份组,当现有堆叠系统中多主检测端口组或者线缆等出现故障导致多主检测报文处理超时,堆叠系统多主检测功能自动切换至多主检测报文冗余备份组,保证了堆叠系统的稳定性,充分利用堆叠系统中堆叠端口组闲置带宽,提高了用户满意度。
图4为本发明实施例三提供的堆叠系统中多主检测方法的流程示意图。如图4所示,该多主检测方法,包括:
步骤401,当堆叠系统检测到多主检测端口组内所有的端口状态均为DOWN或多主检测端口组的第一多主检测定时器状态为超时状态时,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文;
其中,当主设备的控制平面检测到因链路故障导致多主检测端口组的第一多主检测报文定时器超时,则创建并启动堆叠端口组的第二多主检测报文定时器,同时将多主检测报文由多主检测报文冗余备份组发向堆叠端口组,当堆叠端口组从冗余备份组接收到多主检测报文后直接上送到备设备的控制平面,这样控制平面仍然继续维护多主检测报文,只是报文路径发生了变化。
具体而言,当多主检测端口组发生故障导致定时器超时,控制平面会向堆叠端口组发送“start”消息,目的是让堆叠端口组继续维护多主检测报文的定时发送,堆叠端口组收到控制平面发来的“start”消息,向控制平面回复“ack”确认,并同时启动多主检测报文冗余备份组关联的堆叠端口组的定时器(第二多主检测定时器),发送多主检测报文,后面的多主检测由堆叠端口组独立完成。堆叠端口组需要定期上报控制平面“status”消息,控制平面回应“ack”消息进行确认,这个过程来维护控制平面和堆叠端口组的连通性。
步骤402,当堆叠系统检测到堆叠端口组的第二多主检测定时器状态为超时状态时,再次判断第一多主检测定时器状态,当第一多主检测定时器状态转为正常状态,则执行步骤403;当第一多主检测定时器状态仍为超时状态,则执行步骤404;
其中,多主检测定时器除了在多主检测端口组运行,也会可选的在冗余备份组上运行;多主检测报文发送时,定时器周期工作,每定时器周期发送一个多主检测报文。多主检测报文接收时,一定定时器周期内未接收到多主检测报文,定时器进入超时状态。进入定时器超时状态前内接收到了多主检测报文,则定时器仍处于正常状态。
步骤403,使堆叠端口组停止发送多主检测报文,恢复由多主检测端口组收发多主检测报文;
其中,当第一多主检测定时器因链路恢复接收到了多主检测报文后,更改第一多主检测报文定时器状态为正常,并删除第二多主检测定时器,停止向转发平面发送多主检测报文,并开始通过多主检测端口组发送多主检测报文。
具体而言,当主设备的控制平面在多主检测定时器超时前收到了多主检测报文,则将保活定时器置为正常状态,向堆叠端口组发送第一“stop”消息,使堆叠端口组停止发送多主检测报文。堆叠端口组应删除第二多主检测定时器,并停止发送多主检测报文,返回“ack”确认消息。
步骤403,进行堆叠分裂流程。
具体而言,当堆叠端口组因故障导致第二多主检测定时器超时,会向主设备的控制平面发送第二“stop”消息,控制平面接收到第二“stop”消息后,判断控制平面保活定时器(第一多主检测定时器)的状态,判断控制平面保活定时器(第一多主检测定时器)状态为超时状态,则进行堆叠分裂流程,并返回“ack”消息。堆叠系统分裂后,选择其中一个成员继续工作,其它成员应停止所有转发工作,并关闭除堆叠口外的所有端口。
本发明实施例三提供的技术方案,利用堆叠系统的堆叠端口组创建多主检测报文的冗余备份组,当现有堆叠系统中多主检测端口组或者线缆等出现故障导致多主检测报文处理超时,堆叠系统多主检测功能自动切换至多主检测报文冗余备份组,保证了堆叠系统的稳定性,付出的代价是仅仅是占用堆叠系统中堆叠端口组闲置带宽,并没有增加设备的负担,也充分利用堆叠系统中堆叠端口组闲置带宽,提高了用户满意度。
实施例四
本发明实施例四提供了一种堆叠系统,利用堆叠系统的堆叠端口组创建多主检测报文的冗余备份组,当堆叠系统中多主检测端口组或者线缆等出现故障导致多主检测报文处理超时,堆叠系统多主检测功能自动切换至多主检测报文冗余备份组,保证了堆叠系统的稳定性,充分利用堆叠系统中堆叠端口组闲置带宽,提高了用户满意度。
图5为本发明实施例四提供的堆叠系统的结构示意图。如图5所示,该堆叠系统包括:
检测单元,用于检测多主检测端口组状态和多主检测端口组的第一多主检测定时器状态;
管理单元,用于当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文。
其中,该堆叠系统还包括:
配置单元,用于在堆叠系统上配置所述堆叠端口组;还用于在所述堆叠系统上配置所述多主检测报文冗余备份组,并将所述多主检测报文冗余备份组关联到所述堆叠端口组。
其中,所述管理单元,还用于当所述多主检测端口组状态为UP且所述第一多主检测定时器状态为正常状态时,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文,并恢复通过所述多主检测端口组收发多主检测报文。
其中,所述检测单元,还用于检测所述堆叠端口组的第二多主检测定时器状态;
所述管理单元,还用于当所述第二多主检测定时器状态为超时状态时,判断所述第一多主检测定时器状态;
当所述第一多主检测定时器状态恢复为正常状态时,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文,并恢复通过所述多主检测端口组收发多主检测报文;
当所述第一多主检测定时器状态仍为超时状态时,进行堆叠分裂流程。
其中,所述管理单元,还用于为所述堆叠端口组创建并启动第二多主检测定时器;并在停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文时,删除所述第二多主检测定时器。
其中,当多主检测端口组没有在预设定时器周期内接收到多主检测报文时,所述第一多主检测定时器状态为超时状态;
当多主检测端口组在预设定时器周期内接收到多主检测报文时,所述第一多主检测定时器状态恢复为正常状态。
其中,该堆叠系统,还包括:
消息发送单元,用于当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,由控制平面向所述堆叠端口组发送启动start消息,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文;
当所述多主检测端口组状态恢复为UP且所述第一多主检测定时器状态恢复为正常状态时,由控制平面向所述堆叠端口组发送第一停止stop消息,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文;
当所述第二多主检测定时器状态为超时状态时,由所述堆叠端口向所述控制平面发送第二停止stop消息,所述控制平面收到所述第二stop消息后,判断所述第一多主检测定时器状态;当所述第一多主检测定时器状态恢复为正常状态时,由控制平面向所述堆叠端口组发送第一停止stop消息,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文。
本发明实施例四提供的技术方案,通过在交换机堆叠系统上配置多主检测报文冗余备份端口组,当交换机堆叠系统,多主检测端口或者线缆等出现故障导致多主检测报文处理超时,堆叠系统多主检测功能自动切换至转发平面的冗余备份组运行,更好的保障堆叠系统的稳定性,同时还充分利用了堆叠系统中堆叠端口组闲置带宽,提高了用户的满意度。
下面通过一个具体的实施例详细阐述上述技术方案。
实施例五
图6为本发明实施例五提供的堆叠系统的结构示意图。如图6所示,该堆叠系统包括:
配置模块,用于在堆叠系统上配置堆叠端口组及创建多主检测报文冗余备份组,并将所述多主检测报文冗余备份组关联到所述堆叠端口组;
其中,可以通过人机交互界面,在堆叠系统上配置堆叠端口组,多主检测报文冗余备份组关联到堆叠端口组。
报文收发模块,用于堆叠系统上接收或者发送来自成员设备的多主检测报文;
其中,报文收发模块根据设置的定时器间隔进行报文的构造和发送,同时对于接收到的多主检测报文上送CPU处理。
其中,当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文;当所述多主检测端口组状态为UP且所述第一多主检测定时器状态为正常状态时,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文,并恢复通过所述多主检测端口组收发多主检测报文。上述过程中,都可以通过报文收发模块进行多主检测报文的收发。
报文处理模块,用于堆叠系统上对报文收发模块接收到的多主检测报文进行处理;
其中,如何处理多主检测报文为现有技术,在此不再赘述。
多主检测定时器模块,用于堆叠系统上处理多主检测报文发送时间间隔和多主检测报文超时计算;
其中,多主检测定时器除了在多主检测端口组运行,也会可选的在冗余备份组上运行;多主检测报文发送时,定时器周期工作,每定时器周期发送一个多主检测报文。多主检测报文接收时,一定定时器周期内未接收到多主检测报文,定时器进入超时状态。进入定时器超时状态前内接收到了多主检测报文,则定时器仍处于正常状态。
消息交互模块,用于堆叠系统的多主检测端口组和堆叠端口组的消息传递;
其中,控制平面、堆叠端口之间的“start”消息、“status”消息、“stop”消息、“ack”消息都可以通过消息交互模块进行发送。具体的,当多主检测端口组发生故障导致定时器超时,控制平面会向堆叠端口组发送“start”消息,目的是让堆叠端口组继续维护多主检测报文的定时发送,堆叠端口组收到控制平面发来的“start”消息,向控制平面回复“ack”确认,并同时启动冗余备份端口组定时器,发送多主检测报文,后面的多主检测由堆叠端口组独立完成。堆叠端口组需要定期上报控制平面“status”消息,控制平面回应“ack”消息进行确认,这个过程来维护控制平面和堆叠端口组的连通性。当堆叠端口组因故障导致多主检测定时器超时,会向控制平面发送“stop”消息,控制平面接收到“stop”消息后,判断控制平面保活定时器的超时状态,则进行堆叠分裂流程,并返回“ack”消息。当控制平面在多主检测定时器超时前收到了多主检测报文,则将保活定时器置为正常状态,向堆叠端口组发送“stop”消息,使堆叠端口组停止发送多主检测报文。堆叠端口组应删除多主检测定时器,并停止发送多主检测报文,返回“ack”确认消息。
可选的,消息交互模块也可以不进行消息的传递,而直接进行多主检测报文的下发和上送。
堆叠系统模块,用于各成员设备的堆叠系统建立和分裂。
上述实施例四中的检测单元可以由实施例五中的多主检测定时器模块实现,上述实施例四中的管理单元可以由实施例五中的报文收发模块和消息交互模块实现,上述实施例四中的配置单元可以由实施例五中的配置模块实现。
本发明实施例五提供的技术方案,在堆叠端口组基础上生成多主检测报文冗余组传输多主检测报文,不仅可以实现堆叠系统多主检测报文的冗余保护,还可以将闲置的堆叠端口组带宽充分利用,提高了物理资源的利用效率。
本发明实施例还提供了一种堆叠系统,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任一项所述的多主检测方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有信息处理程序,所述信息处理程序被处理器执行时实现上述任一项所述多主检测方法的步骤。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种堆叠系统中多主检测方法,包括:
检测多主检测端口组状态和多主检测端口组的第一多主检测定时器状态;
当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文。
2.根据权利要求1所述的多主检测方法,其特征在于,在多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文之前,该方法还包括:
在堆叠系统上配置所述堆叠端口组;
在所述堆叠系统上配置所述多主检测报文冗余备份组,并将所述多主检测报文冗余备份组关联到所述堆叠端口组。
3.根据权利要求2所述的多主检测方法,其特征在于,在多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文之后,该方法还包括:
当所述多主检测端口组状态为UP且所述第一多主检测定时器状态为正常状态时,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文,并恢复通过所述多主检测端口组收发多主检测报文。
4.根据权利要求2所述的多主检测方法,其特征在于,在通过堆叠端口组收发多主检测报文之后,该方法还包括:
检测所述堆叠端口组的第二多主检测定时器状态;
当所述第二多主检测定时器状态为超时状态时,判断所述第一多主检测定时器状态;
当所述第一多主检测定时器状态为正常状态时,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文,并恢复通过所述多主检测端口组收发多主检测报文;
当所述第一多主检测定时器状态仍为超时状态时,进行堆叠分裂流程。
5.根据权利要求4所述的多主检测方法,其特征在于,当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,该方法还包括:
为所述堆叠端口组创建并启动第二多主检测定时器;
并在停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文时,删除所述第二多主检测定时器。
6.根据权利要求1所述的多主检测方法,其特征在于,
当多主检测端口组没有在预设定时器周期内接收到多主检测报文时,所述第一多主检测定时器状态为超时状态;
当多主检测端口组在预设定时器周期内接收到多主检测报文时,所述第一多主检测定时器状态为正常状态。
7.根据权利要求1、3或4所述的多主检测方法,其特征在于,
当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,由控制平面向所述堆叠端口组发送启动start消息,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文;
当所述多主检测端口组状态恢复为UP且所述第一多主检测定时器状态恢复为正常状态时,由控制平面向所述堆叠端口组发送第一停止stop消息,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文;
当所述第二多主检测定时器状态为超时状态时,由所述堆叠端口向所述控制平面发送第二停止stop消息,所述控制平面收到所述第二stop消息后,判断所述第一多主检测定时器状态;当所述第一多主检测定时器状态恢复为正常状态时,由控制平面向所述堆叠端口组发送第一停止stop消息,停止所述多主检测报文冗余备份组通过所述堆叠端口组收发多主检测报文。
8.一种堆叠系统,其特征在于,包括:
检测单元,用于检测多主检测端口组状态和多主检测端口组的第一多主检测定时器状态;
管理单元,用于当多主检测端口组内所有的端口状态均为DOWN或所述第一多主检测定时器状态为超时状态时,启动多主检测报文冗余备份组开始通过堆叠端口组收发多主检测报文。
9.一种堆叠系统,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的多主监测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息处理程序,所述信息处理程序被处理器执行时实现如权利要求1至7中任一项所述多主监测方法的步骤。
CN201811414958.XA 2018-11-23 2018-11-23 一种堆叠系统中多主检测方法及堆叠系统 Active CN111224803B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811414958.XA CN111224803B (zh) 2018-11-23 2018-11-23 一种堆叠系统中多主检测方法及堆叠系统
PCT/CN2019/110110 WO2020103586A1 (zh) 2018-11-23 2019-10-09 一种堆叠系统中多主检测方法及堆叠系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811414958.XA CN111224803B (zh) 2018-11-23 2018-11-23 一种堆叠系统中多主检测方法及堆叠系统

Publications (2)

Publication Number Publication Date
CN111224803A true CN111224803A (zh) 2020-06-02
CN111224803B CN111224803B (zh) 2023-08-04

Family

ID=70773661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811414958.XA Active CN111224803B (zh) 2018-11-23 2018-11-23 一种堆叠系统中多主检测方法及堆叠系统

Country Status (2)

Country Link
CN (1) CN111224803B (zh)
WO (1) WO2020103586A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115396385A (zh) * 2021-05-19 2022-11-25 中国移动通信集团浙江有限公司 堆叠交换机快速恢复业务的方法、装置及计算设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102307137A (zh) * 2011-07-13 2012-01-04 北京星网锐捷网络技术有限公司 管理报文发送和接收方法、装置、堆叠交换机和堆叠系统
CN103546322A (zh) * 2013-10-28 2014-01-29 杭州华三通信技术有限公司 堆叠链路故障处理方法和设备
CN105656645A (zh) * 2014-11-12 2016-06-08 杭州华三通信技术有限公司 堆叠系统的故障处理的决策方法和装置
CN105743801A (zh) * 2014-12-08 2016-07-06 中兴通讯股份有限公司 一种堆叠系统的流量转发的方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102006184B (zh) * 2010-11-09 2013-01-02 福建星网锐捷网络有限公司 堆叠链路管理方法、装置及网络设备
CN102164056B (zh) * 2011-03-17 2013-07-24 杭州华三通信技术有限公司 堆叠链路聚合故障检测方法和堆叠设备
CN106034038B (zh) * 2015-03-13 2019-04-12 新华三技术有限公司 防止多冲突堆叠的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102307137A (zh) * 2011-07-13 2012-01-04 北京星网锐捷网络技术有限公司 管理报文发送和接收方法、装置、堆叠交换机和堆叠系统
CN103546322A (zh) * 2013-10-28 2014-01-29 杭州华三通信技术有限公司 堆叠链路故障处理方法和设备
CN105656645A (zh) * 2014-11-12 2016-06-08 杭州华三通信技术有限公司 堆叠系统的故障处理的决策方法和装置
CN105743801A (zh) * 2014-12-08 2016-07-06 中兴通讯股份有限公司 一种堆叠系统的流量转发的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115396385A (zh) * 2021-05-19 2022-11-25 中国移动通信集团浙江有限公司 堆叠交换机快速恢复业务的方法、装置及计算设备
CN115396385B (zh) * 2021-05-19 2023-07-21 中国移动通信集团浙江有限公司 堆叠交换机快速恢复业务的方法、装置及计算设备

Also Published As

Publication number Publication date
CN111224803B (zh) 2023-08-04
WO2020103586A1 (zh) 2020-05-28

Similar Documents

Publication Publication Date Title
CN110912780B (zh) 一种高可用集群检测方法、系统及受控终端
US20200267069A1 (en) Link switching method, link switching device, network communication system, and computer-readable storage medium
US7869376B2 (en) Communicating an operational state of a transport service
EP1982447B1 (en) System and method for detecting and recovering from virtual switch link failures
US9385944B2 (en) Communication system, path switching method and communication device
CN102315975B (zh) 一种基于irf系统的故障处理方法及其设备
WO2009023996A1 (fr) Procédé de mise en œuvre d'une interconnexion de réseau par l'intermédiaire d'une agrégation de liaisons
CN107465613B (zh) 链路聚合接口通信状态切换方法及装置
CN105656645A (zh) 堆叠系统的故障处理的决策方法和装置
WO2017124791A1 (zh) 链路检测方法及装置
CN110351127B (zh) 一种优雅重启的方法、设备及系统
CN109218232B (zh) 一种实现Mux机的方法、设备及系统
CN112822102B (zh) 链路切换方法、装置、设备、系统及存储介质
US20230111966A1 (en) Ethernet storage system, and information notification method and related apparatus thereof
US20140050092A1 (en) Load sharing method and apparatus
WO2017000096A1 (zh) 一种链路恢复方法和网络设备
CN103220189A (zh) 一种mad检测备份方法和设备
CN109150709B (zh) 一种实现Mux机的方法、设备及系统
CN111224803B (zh) 一种堆叠系统中多主检测方法及堆叠系统
WO2011150780A1 (zh) 触发路由切换的方法和服务运营商侧运营商边缘设备
CN101848165B (zh) 控制通信链路中断后恢复的方法和接口板
CN115152192B (zh) Pce受控网络可靠性
CN110677283B (zh) 一种网络双冗余快速切换的方法
WO2014044088A1 (zh) L2tp网络的保护方法、装置及系统
CN115102897B (zh) 一种基于链路聚合的堆叠分裂保护方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant