CN112073236A - 堆叠系统的故障处理方法、框式交换机、堆叠系统及介质 - Google Patents

堆叠系统的故障处理方法、框式交换机、堆叠系统及介质 Download PDF

Info

Publication number
CN112073236A
CN112073236A CN202010913847.4A CN202010913847A CN112073236A CN 112073236 A CN112073236 A CN 112073236A CN 202010913847 A CN202010913847 A CN 202010913847A CN 112073236 A CN112073236 A CN 112073236A
Authority
CN
China
Prior art keywords
frame
switch
frame switch
main control
stacking system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010913847.4A
Other languages
English (en)
Other versions
CN112073236B (zh
Inventor
孟策
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN202010913847.4A priority Critical patent/CN112073236B/zh
Publication of CN112073236A publication Critical patent/CN112073236A/zh
Application granted granted Critical
Publication of CN112073236B publication Critical patent/CN112073236B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种堆叠系统的故障处理方法、框式交换机、堆叠系统及可读存储介质,所述堆叠系统包括至少两个框式交换机,各个所述框式交换机之间通信连接,所述框式交换机包括业务板以及至少一个主控板,所述堆叠系统的故障处理方法包括以下步骤:第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,获取所述第二框式交换机中业务板的通信地址,所述第一框式交换机与所述第二框式交换机互为主备关系;基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令,提高了堆叠系统的可靠性。

Description

堆叠系统的故障处理方法、框式交换机、堆叠系统及介质
技术领域
本发明涉及通信技术领域,尤其涉及堆叠系统的故障处理方法、框式交换机、堆叠系统及可读存储介质。
背景技术
堆叠系统是指将至少两个框式交换机堆叠在一起的交换机集群,且框式交换机包括业务板以及主控板。在某些情况下,可包括多块业务板、两块互为主备关系的主用主控板和备用主控板。
现有的堆叠系统一般是通过主控板组堆叠或业务板组堆叠的方式将框式交换机堆叠在一起,而无论是哪种堆叠方式,主用框式交换机和备用框式交换机均要求其主控板至少一个是可用的。因此,主用框式交换机或备用框式交换机的所有主控板均异常时,会导致异常的框式交换机的业务全部中断,从而影响堆叠系统的可靠性。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种堆叠系统的故障处理方法、框式交换机、堆叠系统及可读存储介质,旨在提高堆叠系统的可靠性。
为实现上述目的,本发明提供一种堆叠系统的故障处理方法,所述堆叠系统包括至少两个框式交换机,各个所述框式交换机之间通信连接,所述框式交换机包括业务板以及至少一个主控板,所述堆叠系统的故障处理方法包括以下步骤:
第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,获取所述第二框式交换机中业务板的通信地址,所述第一框式交换机与所述第二框式交换机互为主备关系;
基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令。
可选地,所述基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令的步骤之前,还包括:
基于所述通信地址向所述第二框式交换机中的业务板发送第一控制请求,使所述业务板存储所述第一框式交换机的设备标识,以供所述业务板对所述第一框式交换机的主控板发送的所述第一控制指令进行验证。
可选地,所述第一框式交换机为备用框式交换机,所述第二框式交换机为主用框式交换机,且所述堆叠系统包括至少三个框式交换机,所述第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,所述堆叠系统的故障处理方法还包括:
所述第一框式交换机升级为主用框式交换机;
向其他框式交换机的主控板发送第二控制指令,以控制所述堆叠系统中的所述其他框式交换机,所述其他框式交换机为所述堆叠系统中除所述第一框式交换机以及所述第二框式交换机之外的框式交换机。
可选地,所述基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令的步骤之后,还包括:
在其他框式交换机中确定目标框式交换机,所述其他框式交换机为所述堆叠系统中除所述第一框式交换机以及所述第二框式交换机之外的框式交换机;
向所述目标框式交换机发送升级请求,使所述目标框式交换机基于所述升级请求升级为所述第一框式交换机的备用框式交换机。
可选地,所述其他框式交换机包括至少两个,所述在其他框式交换机中确定目标框式交换机的步骤包括:
获取各个所述其他框式交换机的优先级;
将优先级最高的所述其他框式交换机作为所述目标框式交换机。
可选地,所述将优先级最高的所述其他框式交换机作为所述目标框式交换机的步骤包括:
在优先级最高的所述其他框式交换机大于或等于两个时,获取优先级最高的所述其他框式交换机的启动时间;
将启动时间最早的所述其他框式交换机作为所述目标框式交换机。
可选地,所述第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,获取所述第二框式交换机中业务板的通信地址的步骤之前,还包括:
向所述第二框式交换机的各个主控板发送主动探测信息;
基于所述第二框式交换机每个主控板对所述主动探测信息的反馈情况,确定所述第二框式交换机的各个主控板是否发生故障;或
基于所述第二框式交换机的各个主控板发送的被动探测信息情况,确定所述第二框式交换机的各个主控板是否发生故障。
可选地,在所述第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,获取所述第二框式交换机中业务板的通信地址的步骤之前,还包括:
与所述第二框式交换机的主控板通信,并接收所述第二框式交换机发送的设备信息,其中,所述设备信息包括所述第二框式交换机的业务板的通信地址。
此外,为实现上述目的,本发明还提出了一种框式交换机,所述框式交换机包括:存储器、至少一个主控板及存储在所述存储器上并可在所述主控板上运行的故障处理程序,所述故障处理程序在被主控板执行时实现如上述的堆叠系统的故障处理方法的步骤。
此外,为实现上述目的,本发明还提出了一种堆叠系统,所述堆叠系统包括至少两个框式交换机,所述框式交换机之间通信连接,所述框式交换机包括:存储器、至少一个主控板及存储在所述存储器上并可在所述主控板上运行的故障处理程序,所述故障处理程序在被主控板执行时实现如上述的堆叠系统的故障处理方法的步骤。
此外,为实现上述目的,本发明还提出一种可读存储介质,所述可读存储介质上存储有故障处理程序,所述故障处理程序被主控板执行时实现如上所述的堆叠系统的故障处理方法的步骤。
本发明实施例提出的一种堆叠系统的故障处理方法、框式交换机、堆叠系统及可读存储介质,所述堆叠系统包括至少两个框式交换机,各个所述框式交换机之间通信连接,所述框式交换机包括业务板以及至少一个主控板,所述堆叠系统的故障处理方法包括以下步骤:第一框式交换机检测到第二框式交换机的各个主控板发生故障时,获取第二框式交换机中业务板的通信地址,其中第一框式交换机与第二框式交换机互为主备关系,并基于所述通信地址向第二框式交换机中的业务板发送第一控制指令,从而达成了控制第二框式交换机的业务板的效果,避免了第二框式交换机的业务全部中断,提高了堆叠系统的可靠性。
附图说明
图1是本发明实施例方案涉及的框式交换机的硬件架构示意图;
图2为本发明堆叠系统的故障处理方法第一实施例的流程示意图;
图3为本发明堆叠系统的业务板组堆叠方式以及正常情况下的管理报文的数据流向;
图4为本发明堆叠系统的业务板组堆叠方式在CPU故障时的管理报文的数据流向;
图5为本发明堆叠系统的主控板组堆叠方式以及正常情况下的管理报文的数据流向;
图6为本发明堆叠系统的主控板组堆叠方式在CPU故障时的管理报文的数据流向。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
现有的堆叠系统一般是通过主控板组堆叠或业务板组堆叠的方式将框式交换机堆叠在一起,而无论是哪种堆叠方式,主用框式交换机和备用框式交换机均要求其主控板至少一个是可用的。因此,主用框式交换机或备用框式交换机的所有主控板均异常时,会导致异常的框式交换机的业务全部中断,从而影响堆叠系统的可靠性。
为解决上述缺陷,本发明实施例提出一种堆叠系统的故障处理方法、框式交换机、堆叠系统及可读存储介质,其中,所述堆叠系统包括至少两个框式交换机,各个所述框式交换机之间通信连接,所述框式交换机包括业务板以及至少一个主控板,所述堆叠系统的故障处理方法包括以下步骤:
第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,获取所述第二框式交换机中业务板的通信地址,所述第一框式交换机与所述第二框式交换机互为主备关系;
基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令。
由于在第一框式交换机检测到第二框式交换机的各个主控板发生故障时,获取第二框式交换机中业务板的通信地址,其中第一框式交换机与第二框式交换机互为主备关系,并基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令,从而达成了控制第二框式交换机的业务板的效果,避免了第二框式交换机的业务全部中断,提高了堆叠系统的可靠性。
如图1所示,图1是本发明实施例方案涉及的框式交换机的硬件架构示意图。
如图1所示,该框式交换机可以包括:主控板1001,例如CPU,业务板1002,用户接口1003,网络接口1004,存储器1005,通信总线1006。其中,通信总线1006用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘等,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述主控板1001的存储装置。
本领域技术人员可以理解,图1中示出的框式交换机的硬件架构并不构成对框式交换机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及故障处理程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;主控板1001可以用于调用存储器1005中存储的故障处理程序,并执行以下操作:
第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,获取所述第二框式交换机中业务板的通信地址;
基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令。
进一步地,主控板1001可以用于调用存储器1005中存储的故障处理程序,还执行以下操作:
基于所述通信地址向所述第二框式交换机中的业务板发送第一控制请求,使所述业务板存储所述第一框式交换机的设备标识,以供所述业务板对所述第一框式交换机的主控板发送的所述第一控制指令进行验证。
进一步地,主控板1001可以用于调用存储器1005中存储的故障处理程序,还执行以下操作:
所述第一框式交换机升级为主用框式交换机;
向其他框式交换机的主控板发送第二控制指令,以控制所述堆叠系统中的所述其他框式交换机,所述其他框式交换机为所述堆叠系统中除所述第一框式交换机以及所述第二框式交换机之外的框式交换机。
进一步地,主控板1001可以用于调用存储器1005中存储的故障处理程序,还执行以下操作:
在其他框式交换机中确定目标框式交换机,所述其他框式交换机为所述堆叠系统中除所述第一框式交换机以及所述第二框式交换机之外的框式交换机;
向所述目标框式交换机发送升级请求,使所述目标框式交换机基于所述升级请求升级为所述第一框式交换机的备用框式交换机。
进一步地,主控板1001可以用于调用存储器1005中存储的故障处理程序,还执行以下操作:
获取各个所述其他框式交换机的优先级;
将优先级最高的所述其他框式交换机作为所述目标框式交换机。
在优先级最高的所述其他框式交换机大于或等于两个时,获取优先级最高的所述其他框式交换机的启动时间;
将启动时间最早的所述其他框式交换机作为所述目标框式交换机。
进一步地,主控板1001可以用于调用存储器1005中存储的故障处理程序,还执行以下操作:
向所述第二框式交换机的各个主控板发送主动探测信息;
基于所述第二框式交换机每个主控板对所述主动探测信息的反馈情况,确定所述第二框式交换机的各个主控板是否发生故障;或
基于所述第二框式交换机的各个主控板发送的被动探测信息情况,确定所述第二框式交换机的各个主控板是否发生故障。
进一步地,主控板1001可以用于调用存储器1005中存储的故障处理程序,还执行以下操作:
与所述第二框式交换机的主控板通信,并接收所述第二框式交换机发送的设备信息,其中,所述设备信息包括所述第二框式交换机的业务板的通信地址。
如图2所示,图2是本发明堆叠系统的故障处理方法的第一实施例中,所述堆叠系统的故障处理方法包括以下步骤:
步骤S010、第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,获取所述第二框式交换机中业务板的通信地址,所述第一框式交换机与所述第二框式交换机互为主备关系;
步骤S020、基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令。
在本实施例中,所述堆叠系统包括至少两个框式交换机,各个框式交换机之间通信连接;所述第一框式交换机与所述第二框式交换机互为主备关系;所述框式交换机包括业务板以及至少一个主控板;所述业务板是进行数据转发处理的数据处理板,包括相关接口或者专门功能处理模块;主控板为进行数据管理以及其他控制的控制板,包括处理器;具体地,业务板的数据转发处理规则是主控板下发的规则。
第一框式交换机的主控板在检测到第二框式交换机的主控板都发生故障时,获取存储器中第二框式交换机的业务板信息,所述业务板信息可以包括业务板的数量、类型以及通信地址等;然后在接收到需要第二框式交换机的业务板进行数据转发处理的请求时,根据该请求生成第一控制指令,并基于通信地址向第二框式交换机的业务板,以使业务板在接收到第一框式交换机的第一控制指令时,执行第一控制指令,从而实现数据的转发处理。
在本实施例公开的技术方案中,在第一框式交换机检测到第二框式交换机的各个主控板发生故障时,获取第二框式交换机中业务板的通信地址,并基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令,从而达成了控制第二框式交换机的业务板的效果,避免了第二框式交换机的业务全部中断,提高了堆叠系统的可靠性。
可选地,基于第一实施例,在本发明堆叠系统的故障处理方法的第二实施例中,所述步骤S020之前,还包括以下步骤:
步骤S030、基于所述通信地址向所述第二框式交换机中的业务板发送第一控制请求,使所述业务板存储所述第一框式交换机的设备标识,以供所述业务板对所述第一框式交换机的主控板发送的所述第一控制指令进行验证。
第一框式交换机的主控板在获取第二框式交换机的业务板的业务板信息后,生成第一控制请求,并将生成的第一控制请求发送至获取的通信地址对应的业务板,示例性地,在第二框式交换机中存在两个业务板时,基于第一业务板的通信地址向第一业务板发送第一控制请求,并基于第二业务板的通信地址向第二业务板发送第一控制请求。
第二框式交换机的业务板接收到第一框式交换机发送的第一控制请求时,对第一控制请求进行验证,并在验证通过后,获取第一控制请求中携带的第一框式交换机的设备标识,并将该设备标识保存,其中,本方案并不对第一控制请求的验证过程做具体限定。
第二框式交换机的业务板在第一控制请求验证通过后,生成第一控制应答,并基于第一控制请求将第一控制应答反馈至第一框式交换机。第一框式交换机的主控板在接收到第一控制应答后,开始对第二框式交换机的业务板进行控制,具体地,可以基于第二框式交换机的业务板的类型生成相应的控制指令,然后将生成的控制指令发送至第二框式交换机的业务板。第二框式交换机的业务板接收到第一控制指令后,验证第一控制指令携带是设备标识与存储中存储的第一框式交换机的设备标识是否一致,并在一致时执行该控制指令,还可以在执行结束后,向第一框式交换机发送执行结果。
在本实施例公开的技术方案中,由于在第一框式交换机检测到第二框式交换机的各个主控板发生故障时,获取第二框式交换机中业务板的通信地址,并基于通信地址向第二框式交换机中的业务板发送第一控制请求,使得该业务板存储第一框式交换机的设备标识,以供该业务板响应第一框式交换机发送的控制指令,从而达成了控制第二框式交换机的业务板的效果,避免了第二框式交换机的业务全部中断,提高了堆叠系统的可靠性。
可选地,基于第一实施例,在本发明堆叠系统的故障处理方法的第三实施例中,所述堆叠系统的故障处理方法,还包括:
步骤S040、所述第一框式交换机升级为主用框式交换机;
步骤S050、向其他框式交换机的主控板发送第二控制指令,以控制所述堆叠系统中的所述其他框式交换机,所述其他框式交换机为所述堆叠系统中除所述第一框式交换机以及所述第二框式交换机之外的框式交换机。
在本实施例中,所述第一框式交换机与所述第二框式交换机互为主备关系,具体地,本实施例应用在所述第一框式交换机为备用框式交换机,所述第二框式交换机为主用框式交换机,且所述堆叠系统包括至少三个框式交换机;所述其他框式交换机为堆叠系统中除第一框式交换机与第二框式交换机之外的框式交换机;第二控制请求是第一框式交换机用于控制其他框式交换机的主控板的控制请求;所述其他框式交换机为堆叠系统中除第一框式交换机以及第二框式交换机之外的框式交换机。
第一框式交换机的主控板升级为主用框式交换机,然后生成第二控制请求,获取存储器中存储的其他框式交换机的通信地址,然后基于每个其他框式交换机的通信地址向每个其他框式交换机发送第二控制请求。
其他框式交换机接收到第一框式交换机发送的第二控制请求时,对第二控制请求进行验证,并在验证通过后,获取第二控制请求中携带的第二框式交换机的设备标识,并将该设备标识保存,其中,本方案并不对第二控制请求的验证过程做具体限定。
其他框式交换机在第二控制请求验证通过后,生成第二控制应答,并基于第二控制请求将第二控制应答反馈至第一框式交换机。第一框式交换机的主控板在接收到第二控制应答后,开始对发送第二控制应答的其他框式交换机进行控制,具体地,可以生成用于控制其他框式交换机的第二控制指令,然后将生成的第二控制指令发送至对应的其他框式交换机。其他框式交换机接收到第二控制指令后,验证第二控制指令携带是设备标识与存储中存储的第一框式交换机的设备标识是否一致,并在一致时执行第二控制指令,还可以在执行结束后,向第一框式交换机发送执行结果。
在本实施例公开的技术方案中,通过向堆叠系统的其他框式交换机发送第二控制指令,以对其他框式交换机进行控制,使得第一框式交换机从备用框式交换机升级成主用框式交换机,从而控制了整个堆叠系统,避免由于主用框式交换机故障而中止堆叠系统的服务,提高了堆叠系统的可靠性。
可选地,基于第一实施例,在本发明堆叠系统的故障处理方法的第四实施例中,所述步骤S020之后,还包括:
步骤S060、在其他框式交换机中确定目标框式交换机,所述其他框式交换机为所述堆叠系统中除所述第一框式交换机以及所述第二框式交换机之外的框式交换机;
步骤S070、向所述目标框式交换机发送升级请求,使所述目标框式交换机基于所述升级请求升级为所述第一框式交换机的备用框式交换机。
在本实施例中,所述堆叠系统包括至少三个框式交换机;所述其他框式交换机为堆叠系统中除第一框式交换机与第二框式交换机之外的框式交换机;所述目标交换机是第一框式交换机在其他框式交换机中选取的备用框式交换机;所述升级请求是第一框式交换机向目标框式交换机的升级请求,以将目标框式交换机从成员框式交换机升级为第一框式交换机的备用框式交换机;所述其他框式交换机为堆叠系统中除第一框式交换机以及第二框式交换机之外的框式交换机。
第一框式交换机的主控板在其他框式交换机中确定目标框式交换机,然后生成升级请求,并获取目标框式交换机的通信地址,基于目标框式交换机的通信地址向目标框式交换机发送升级请求。
目标框式交换机接收到第一框式交换机发送的升级请求时,验证升级请求,在升级请求验证成功后,向第一框式交换机发送升级应答,并向第一框式交换机发送目标框式交换机的设备信息,具体地,该设备信息可以包括主控板的通信地址、备用主控板的通信地址以及业务板的通信地址。
示例性地,验证升级请求时,可以比对升级请求中携带的第一框式交换机的设备标识与存储器中存储的堆叠系统的主用框式交换机的设备标识,在设备标识一致时,判定升级请求验证成功,该验证过程仅用于举例说明,并不限定升级请求的验证过程。
第一框式交换机在接收到目标框式交换机发送的升级应答后,将向目标框式交换机发送第一框式交换机的设备信息。第一框式交换机接收并保存目标框式交换机的设备信息。目标框式交换机接收并保存第一框式交换机的设备信息。
示例性地,所述步骤S060进一步包括:
步骤S061、获取各个所述其他框式交换机的优先级;
步骤S062、将优先级最高的所述其他框式交换机作为所述目标框式交换机。
在本实施例中,所述堆叠系统中至少有两个其他框式交换机,各个所述框式交换机均有其对应的优先级。
第一框式交换机的主控板获取堆叠系统中各个其他框式交换机的优先级,比对获取的各个优先级,并将优先级最高的其他框式交换机作为目标框式交换机。
示例性地,所述步骤S062进一步包括:
步骤S0621、在优先级最高的所述其他框式交换机大于或等于两个时,获取优先级最高的所述其他框式交换机的启动时间;
步骤S0622、将启动时间最早的所述其他框式交换机作为所述目标框式交换机。
在本实施例中,第一框式交换机的主控板在优先级最高的其他框式交换机大于或等于两个时,获取各个优先级最高的其他框式交换机的启动时间,然后比对各个启动时间,并将启动时间最早的其他框式交换机作为目标框式交换机。
在本实施例公开的技术方案中,通过在其他框式交换机中选取框式交换机升级为备用框式交换机,使得第一框式交换机以及备用框式交换机互为主备关系,互相检测,从而在第一框式交换机发生故障时,由备用框式交换机及时接替第一框式交换机的工作,避免中断堆叠系统的服务,从而提高了堆叠系统的可靠性。
可选地,基于前述实施例,在本发明堆叠系统的故障处理方法的第五实施例中,所述步骤S010之前,还包括:
步骤S080、向所述第二框式交换机的各个主控板发送主动探测信息;
步骤S090、基于所述第二框式交换机每个主控板对所述主动探测信息的反馈情况,确定所述第二框式交换机的各个主控板是否发生故障;或
步骤S100、基于所述第二框式交换机的各个主控板发送的被动探测信息情况,确定所述第二框式交换机的各个主控板是否发生故障。
在本实施例中,第一框式交换机的主控板定时向第二框式交换机的主控板发送主动探测信息。第二框式交换机的主控板接收到第一框式交换机发送的主动探测信息时,基于主动探测信息向第一框式交换机反馈应答信息;示例性地,在第二框式交换机包括至少两个主控板时,每个主控板在板接收到第一框式交换机发送的主动探测信息时,均会基于主动探测信息向第一框式交换机反馈应答信息,其中,每个主控板发送的应答信息均是第二框式交换机发送的应答信息。
第一框式交换机在预设时间间隔内没有接收到第二框式交换机发送的应答信息时,判定第二框式交换机的各个主控板发生故障;在第一框式交换机接收到第二框式交换机的主控板发送的应答信息时。
具体地,第二框式交换机的主控板也可以定时向第一框式交换机的主控板发送主动探测信息。第一框式交换机的主控板接收到第二框式交换机发送的主动探测信息时,基于主动探测信息向第二框式交换机反馈应答信息。
或者,第二框式交换机的各个主控板会定时向第一框式交换机发送被动探测信息;第一框式交换机在预设时间间隔内没有接收到第二框式交换机发送的被动探测信息时,判定第二框式交换机的各个主控板发生故障;在第一框式交换机接收到第二框式交换机的主控板发送的被动探测信息时。
具体地,第一框式交换机的各个主控板会定时向第二框式交换机发送被动探测信息;第二框式交换机在预设时间间隔内没有接收到第一框式交换机发送的被动探测信息时,判定第一框式交换机的各个主控板发生故障;在第二框式交换机接收到第一框式交换机的主控板发送的被动探测信息时。
在本实施例公开的技术方案中,通过定时向第二框式交换机发送主动探测信息,并在预设时间间隔内没有接收到第二框式交换机发送的应答信息时,或者,在预设时间间隔内没有接收到第二框式交换机发送的被动探测信息时,判定第二框式交换机的各个主控板均发生故障,从而监测第二框式交换机,使得第二框式交换机发生故障后,第一框式交换机能及时接管第二框式交换机是业务板,避免中断第二框式交换机的业务服务。
可选地,基于前述实施例,在本发明堆叠系统的故障处理方法的第六实施例中,所述步骤S010之前,还包括:
步骤S110、与所述第二框式交换机的主控板通信,并接收所述第二框式交换机发送的设备信息,其中,所述设备信息包括所述第二框式交换机的业务板的通信地址。
在本实施例中,所述设备信息至少包括业务板的通信地址;第一框式交换机与第二框式交换机互为主备关系。
第一框式交换机与第二框式交换机进行通信,同时接收第二交换机发送的设备信息,然后获取设备信息中的业务板的通信地址,并将第二框式交换机的业务板的通信地址保存在存储器中。
具体地,第一框式交换机还可以向第二框式交换机发送第一框式交换机的设备信息。第二框式交换机接收到第一框式交换机的设备地址时,获取第一框式交换机的设备信息中的业务板地址信息,并将第一框式交换机的业务板的通信地址保存在第二框式交换机的存储器中。
在本实施例公开的技术方案中,通过获取第二框式交换机的业务板地址,使得第二框式交换机故障后,第一框式交换机可以根据第二框式交换机的业务板的通信地址向第二框式交换机的业务板发送控制请求,从而达成控制第二框式交换机的业务板的效果,避免中断第二框式交换机的业务服务。
此外,本发明实施例还提出一种框式交换机,所述框式交换机包括存储器、主控板及存储在所述存储器上并可在所述主控板上运行的故障处理程序,所述故障处理程序被所述主控板执行时实现如上各个实施例所述的堆叠系统的故障处理方法的步骤。
此外,本发明实施例还提出一种堆叠系统,所述堆叠系统包括至少两个框式交换机,各个所述框式交换机之间通信连接,所述框式交换机包括业务板以及至少两个主控板,所述框式交换机包括存储器、主控板及存储在所述存储器上并可在所述主控板上运行的故障处理程序,所述故障处理程序被所述主控板执行时实现如上各个实施例所述的堆叠系统的故障处理方法的步骤。
此外,本发明实施例还提出一种可读存储介质,所述可读存储介质上存储有故障处理程序,所述故障处理程序被主控板执行时实现如上各个实施例所述的堆叠系统的故障处理方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台框式交换机(可以是PC机等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (11)

1.一种堆叠系统的故障处理方法,其特征在于,所述堆叠系统包括至少两个框式交换机,各个所述框式交换机之间通信连接,所述框式交换机包括业务板以及至少一个主控板,所述堆叠系统的故障处理方法包括以下步骤:
第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,获取所述第二框式交换机中业务板的通信地址,所述第一框式交换机与所述第二框式交换机互为主备关系;
基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令。
2.如权利要求1所述的堆叠系统的故障处理方法,其特征在于,所述基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令的步骤之前,还包括:
基于所述通信地址向所述第二框式交换机中的业务板发送第一控制请求,使所述业务板存储所述第一框式交换机的设备标识,以供所述业务板对所述第一框式交换机的主控板发送的所述第一控制指令进行验证。
3.如权利要求1所述的堆叠系统的故障处理方法,其特征在于,所述第一框式交换机为备用框式交换机,所述第二框式交换机为主用框式交换机,且所述堆叠系统包括至少三个框式交换机,所述第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,所述堆叠系统的故障处理方法还包括:
所述第一框式交换机升级为主用框式交换机;
向其他框式交换机的主控板发送第二控制指令,以控制所述堆叠系统中的所述其他框式交换机,所述其他框式交换机为所述堆叠系统中除所述第一框式交换机以及所述第二框式交换机之外的框式交换机。
4.如权利要求1所述的堆叠系统的故障处理方法,其特征在于,所述基于所述通信地址向所述第二框式交换机中的业务板发送第一控制指令的步骤之后,还包括:
在其他框式交换机中确定目标框式交换机,所述其他框式交换机为所述堆叠系统中除所述第一框式交换机以及所述第二框式交换机之外的框式交换机;
向所述目标框式交换机发送升级请求,使所述目标框式交换机基于所述升级请求升级为所述第一框式交换机的备用框式交换机。
5.如权利要求4所述的堆叠系统的故障处理方法,其特征在于,所述其他框式交换机包括至少两个,所述在其他框式交换机中确定目标框式交换机的步骤包括:
获取各个所述其他框式交换机的优先级;
将优先级最高的所述其他框式交换机作为所述目标框式交换机。
6.如权利要求5所述的堆叠系统的故障处理方法,其特征在于,所述将优先级最高的所述其他框式交换机作为所述目标框式交换机的步骤包括:
在优先级最高的所述其他框式交换机大于或等于两个时,获取优先级最高的所述其他框式交换机的启动时间;
将启动时间最早的所述其他框式交换机作为所述目标框式交换机。
7.如权利要求1-6任一项所述的堆叠系统的故障处理方法,其特征在于,所述第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,获取所述第二框式交换机中业务板的通信地址的步骤之前,还包括:
向所述第二框式交换机的各个主控板发送主动探测信息;
基于所述第二框式交换机每个主控板对所述主动探测信息的反馈情况,确定所述第二框式交换机的各个主控板是否发生故障;或
基于所述第二框式交换机的各个主控板发送的被动探测信息情况,确定所述第二框式交换机的各个主控板是否发生故障。
8.如权利要求1-6任一项所述的堆叠系统的故障处理方法,其特征在于,在所述第一框式交换机检测到第二框式交换机的各个所述主控板发生故障时,获取所述第二框式交换机中业务板的通信地址的步骤之前,还包括:
与所述第二框式交换机的主控板通信,并接收所述第二框式交换机发送的设备信息,其中,所述设备信息包括所述第二框式交换机的业务板的通信地址。
9.一种框式交换机,其特征在于,所述框式交换机包括:存储器、业务板、至少一个主控板及存储在所述存储器上并可在所述主控板上运行的故障处理程序,所述故障处理程序被所述主控板执行时实现如权利要求1至8中任一项所述的堆叠系统的故障处理方法的步骤。
10.一种堆叠系统,其特征在于,所述堆叠系统包括至少两个框式交换机,各个所述框式交换机之间通信连接,所述框式交换机包括:存储器、至少一个主控板及存储在所述存储器上并可在所述主控板上运行的故障处理程序,所述故障处理程序被所述主控板执行时实现如权利要求1至8中任一项所述的堆叠系统的故障处理方法的步骤。
11.一种可读存储介质,其特征在于,所述可读存储介质上存储有故障处理程序,所述故障处理程序被主控板执行时实现如权利要求1至8中任一项所述的堆叠系统的故障处理方法的步骤。
CN202010913847.4A 2020-09-01 2020-09-01 堆叠系统的故障处理方法、框式交换机、堆叠系统及介质 Active CN112073236B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010913847.4A CN112073236B (zh) 2020-09-01 2020-09-01 堆叠系统的故障处理方法、框式交换机、堆叠系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010913847.4A CN112073236B (zh) 2020-09-01 2020-09-01 堆叠系统的故障处理方法、框式交换机、堆叠系统及介质

Publications (2)

Publication Number Publication Date
CN112073236A true CN112073236A (zh) 2020-12-11
CN112073236B CN112073236B (zh) 2023-09-08

Family

ID=73666628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010913847.4A Active CN112073236B (zh) 2020-09-01 2020-09-01 堆叠系统的故障处理方法、框式交换机、堆叠系统及介质

Country Status (1)

Country Link
CN (1) CN112073236B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113067780A (zh) * 2021-03-15 2021-07-02 杭州迪普科技股份有限公司 虚拟交换矩阵的流量处理方法及电子设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060023640A1 (en) * 2004-07-29 2006-02-02 Zarlink Semiconductor Inc. Remote control of a switching node in a stack of switching nodes
CN101183992A (zh) * 2007-12-28 2008-05-21 中兴通讯股份有限公司 一种堆叠系统内设备管理方法
US7593320B1 (en) * 2004-04-30 2009-09-22 Marvell International, Ltd. Failover scheme for stackable network switches
JP2009224866A (ja) * 2008-03-13 2009-10-01 Nec Corp スタック構成の障害検出装置、障害検出システム、障害検出方法及びプログラム
CN101707555A (zh) * 2009-11-25 2010-05-12 杭州华三通信技术有限公司 一种堆叠系统中的数据交互方法及装置
CN101841735A (zh) * 2009-03-17 2010-09-22 华为技术有限公司 框式交换机及堆叠系统以及堆叠后故障处理方法
US20100329111A1 (en) * 2009-06-26 2010-12-30 H3C Technologies Co., Ltd. Multi-Active Detection Method And Stack Member Device
CN102130817A (zh) * 2010-01-20 2011-07-20 杭州华三通信技术有限公司 堆叠系统中保持流量不中断的方法和机框交换机
CN109039887A (zh) * 2018-09-10 2018-12-18 迈普通信技术股份有限公司 一种堆叠系统故障处理方法以及设备
CN109347755A (zh) * 2018-08-10 2019-02-15 锐捷网络股份有限公司 一种用于堆叠设备的备份方法及系统
CN110635968A (zh) * 2019-09-27 2019-12-31 深信服科技股份有限公司 堆叠双活检测通道的监控方法、装置、设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7593320B1 (en) * 2004-04-30 2009-09-22 Marvell International, Ltd. Failover scheme for stackable network switches
US20060023640A1 (en) * 2004-07-29 2006-02-02 Zarlink Semiconductor Inc. Remote control of a switching node in a stack of switching nodes
CN101183992A (zh) * 2007-12-28 2008-05-21 中兴通讯股份有限公司 一种堆叠系统内设备管理方法
JP2009224866A (ja) * 2008-03-13 2009-10-01 Nec Corp スタック構成の障害検出装置、障害検出システム、障害検出方法及びプログラム
CN101841735A (zh) * 2009-03-17 2010-09-22 华为技术有限公司 框式交换机及堆叠系统以及堆叠后故障处理方法
US20100329111A1 (en) * 2009-06-26 2010-12-30 H3C Technologies Co., Ltd. Multi-Active Detection Method And Stack Member Device
CN101707555A (zh) * 2009-11-25 2010-05-12 杭州华三通信技术有限公司 一种堆叠系统中的数据交互方法及装置
CN102130817A (zh) * 2010-01-20 2011-07-20 杭州华三通信技术有限公司 堆叠系统中保持流量不中断的方法和机框交换机
CN109347755A (zh) * 2018-08-10 2019-02-15 锐捷网络股份有限公司 一种用于堆叠设备的备份方法及系统
CN109039887A (zh) * 2018-09-10 2018-12-18 迈普通信技术股份有限公司 一种堆叠系统故障处理方法以及设备
CN110635968A (zh) * 2019-09-27 2019-12-31 深信服科技股份有限公司 堆叠双活检测通道的监控方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
许江来;张晖;崔帅;王亚琦;: "一种实现堆叠网络交换机快速切换控制的方法", 无线电工程, no. 12 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113067780A (zh) * 2021-03-15 2021-07-02 杭州迪普科技股份有限公司 虚拟交换矩阵的流量处理方法及电子设备

Also Published As

Publication number Publication date
CN112073236B (zh) 2023-09-08

Similar Documents

Publication Publication Date Title
US9154503B2 (en) Authorization method and terminal device
CN111767347B (zh) 共识算法的切换方法、装置、节点设备及存储介质
US8931065B2 (en) OTA bootstrap method and system
EP1950931A1 (en) Devices, system and method for distributing and synchronizing service data
CN106790291B (zh) 一种入侵检测提示方法及装置
CN105553993A (zh) 一种远程服务调用方法、装置及服务器
CN111143023B (zh) 一种资源变更的方法及装置、设备、存储介质
CN111147314A (zh) 交换机升级方法、装置及存储介质
CN109768980B (zh) 服务器访问方法、装置、移动终端及计算机可读存储介质
CN112073236A (zh) 堆叠系统的故障处理方法、框式交换机、堆叠系统及介质
CN110597662B (zh) 备份数据自动验证方法、装置、用户设备及存储介质
CN102111754B (zh) 一种多模设备软件升级方法及多模设备
CN115085993A (zh) 数据校验方法、装置及域控制器
CN108092829B (zh) 集群分裂的处理方法、sdn控制器及存储介质
CN114095498B (zh) 集群环境的部署方法、系统、计算机设备及存储介质
CN115665035A (zh) 一种信息处理方法、装置、第一节点及存储介质
CN114500237A (zh) 一种通信方法和系统
CN114650317A (zh) 一种微服务系统以及微服务注册、发现和保活方法
CN113568669A (zh) 基于正交架构的业务板卡启动方法、业务板卡及正交设备
CN108540440A (zh) Ddos攻击解决方法、服务器及计算机可读存储介质
EP2110982B1 (en) A charging method and system for communication service in a communication network
CN113660288B (zh) 基于区块链系统的用户号码绑定方法和绑定系统
CN113098975B (zh) 一种跨平台发布应用的方法和装置
JP6056164B2 (ja) 複数ネットワークによる認証装置、認証方法、認証システム、及びそのためのプログラム
CN116033371A (zh) 一种集群终端设置备机的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant