CN111585835A - 一种带外管理系统的控制方法、装置和存储介质 - Google Patents
一种带外管理系统的控制方法、装置和存储介质 Download PDFInfo
- Publication number
- CN111585835A CN111585835A CN202010313070.8A CN202010313070A CN111585835A CN 111585835 A CN111585835 A CN 111585835A CN 202010313070 A CN202010313070 A CN 202010313070A CN 111585835 A CN111585835 A CN 111585835A
- Authority
- CN
- China
- Prior art keywords
- target board
- board
- received
- determining
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000011084 recovery Methods 0.000 claims description 49
- 238000012545 processing Methods 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 19
- 238000001514 detection method Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000002159 abnormal effect Effects 0.000 description 8
- 230000001360 synchronised effect Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000001145 finger joint Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/18—Network architectures or network communication protocols for network security using different networks or channels, e.g. using out of band channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/10—Network architectures or network communication protocols for network security for controlling access to devices or network resources
- H04L63/101—Access control lists [ACL]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Environmental & Geological Engineering (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明公开了一种带外管理系统的控制方法、装置和存储介质,其中,方法包括:业务板块检测目标板的状态;基于所述目标板的状态确定所述目标板处于故障状态时,业务板块获取控制转发权限,根据所述控制转发权限实现对交换机的控制;其中,所述控制转发权限表征针对L2SW的权限。
Description
技术领域
本发明涉及交换机技术,尤其涉及一种带外管理系统的控制方法、装置和计算机可读存储介质。
背景技术
交换机的控制信息、管理信息通常由带外管理通路传输,如心跳报文、表项同步等;若带外管理通路存在异常,业务板块无法接收到带外信息,会造成表项不一致引起报文转发异常、心跳报文丢失引起交换机整机失效等,给用户业务的稳定性带来影响。
发明内容
有鉴于此,本发明的主要目的在于提供一种带外管理系统的控制方法、装置和计算机可读存储介质。
为达到上述目的,本发明的技术方案是这样实现的:
本发明实施例提供了一种带外管理系统的控制方法,所述方法包括:
业务板块检测目标板的状态;
基于所述目标板的状态确定所述目标板处于故障状态时,获取控制转发权限,根据所述控制转发权限实现对交换机的控制;其中,所述控制转发权限表征针对二层媒体介入控制层芯片(L2 SW)的权限。
上述方案中,所述业务板块检测目标板的状态,包括以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障通告信号;
所述基于所述目标板的状态确定所述目标板处于故障状态,包括以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定未接收到所述目标板的心跳报文时,确定所述目标板处于故障状态;
相应于检测是否接收到故障通告信号,确定接收到所述故障通告信号时,确定所述目标板处于故障状态。
上述方案中,所述获取控制转发权限,包括:
向控制模块发送获取请求;所述控制模块用于控制所述控制转发权限的拥有权;所述获取请求由所述控制模块执行;
接收针对所述获取请求的回复消息,基于所述回复消息确定是否获取所述控制转发权限。
上述方案中,所述根据所述控制转发权限实现对交换机的控制之后,所述方法还包括:
检测目标板的恢复状态;
基于所述目标板的恢复状态确定所述目标板处于待工作状态时,取消所述控制转发权限;取消后,所述控制转发权限由所述目标板获取。
上述方案中,所述检测目标板的恢复状态,包括以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障恢复信号;
所述基于所述目标板的恢复状态确定所述目标板处于待工作状态,包括以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定接收到所述目标板的心跳报文时,确定所述目标板处于待工作状态;
相应于检测是否接收到故障恢复信号,确定接收到所述故障恢复信号时,确定所述目标板处于待工作状态。
本发明实施例提供一种带外管理系统的控制装置,所述装置包括:第一处理模块、第二处理模块;其中,
所述第一处理模块,用于检测目标板的状态;
所述第二处理模块,用于基于所述目标板的状态确定所述目标板处于故障状态时,获取控制转发权限,根据所述控制转发权限实现对交换机的控制;其中,所述控制转发权限表征针对L2 SW的权限。
上述方案中,所述第一处理模块,用于执行以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障通告信号;
所述第二处理模块,用于执行以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定未接收到所述目标板的心跳报文时,确定所述目标板处于故障状态;
相应于检测是否接收到故障通告信号,确定接收到所述故障通告信号时,确定所述目标板处于故障状态。
上述方案中,所述第二处理模块,用于向控制模块发送获取请求;所述获取请求由所述控制模块执行;
接收针对所述获取请求的回复消息,基于所述回复消息确定是否获取所述控制转发权限。
上述方案中,所述装置还包括:第三处理模块,用于根据所述控制转发权限实现对交换机的控制之后,检测目标板的恢复状态;
所述第二处理模块,还用于基于所述目标板的恢复状态确定所述目标板处于待工作状态时,取消所述控制转发权限;取消后,所述控制转发权限由所述目标板获取。
上述方案中,所述第三处理模块,还用于执行以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障恢复信号;
所述第二处理模块,还用于执行以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定接收到所述目标板的心跳报文时,确定所述目标板处于待工作状态;
相应于检测是否接收到故障恢复信号,确定接收到所述故障恢复信号时,确定所述目标板处于待工作状态。
发明实施例提供了一种带外管理系统的控制装置,所述装置包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,
所述处理器用于运行所述计算机程序时,执行上述任一项带外管理系统的控制方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以上任一项所述带外管理系统的控制方法的步骤。
本发明实施例所提供的带外管理系统的控制方法、装置和计算机可读存储介质,业务板块检测目标板的状态;基于所述目标板的状态确定所述目标板处于故障状态时,获取控制转发权限,根据所述控制转发权限实现对交换机的控制;其中,所述控制转发权限表征针对L2 SW的权限;如此,在目标板发生故障时,由业务板块实现对相应控制,保证对L2SW的管理不会混乱,从而保证交换机整机仍可运行、即业务正常运行,并且无需增加成本。
附图说明
图1为一种带外管理通路的示意图;
图2为一种交换机的示意图;
图3为一种主管理板和备管理板实现控制的示意图;
图4为一种单管理板实现控制的示意图;
图5为本发明实施例提供的一种带外管理系统的控制方法的流程示意图;
图6为本发明实施例提供的另一种带外管理系统的控制方法的流程示意图;
图7(a)和(b)为本发明实施例提供的一种带外管理系统的控制方法的应用场景示意图;
图8为本发明实施例提供的另一种带外管理系统的控制方法的应用场景示意图;
图9为本发明实施例提供的一种带外管理系统的控制装置的结构示意图;
图10为本发明实施例提供的另一种带外管理系统的控制装置的结构示意图。
具体实施方式
在结合实施例对本发明再作进一步详细的说明之前,首先以下对涉及到的名称做进一步说明。
心跳报文:管理板与各业务板块之间的心跳报文;一般由管理板周期性发起心跳报文,业务板块收到管理板发送的心跳报文后,再回复一心跳报文通告管理板。若双方有一方故障,那么正常的一方无法收到心跳报文或者未回复心跳报文,由此可判断对方处于故障状态;
管理数据报文:指管理板与业务板块管理数据同步报文,比如各业务板块通过管理数据报文将自身媒体介入控制层(MAC,Media Access Control)、地址解析协议(ARP,Address Resolution Protocol)、三层(L3,Layer 3)等表项信息同步至管理板,再由管理板下发至其他各业务板块,实现对交换机的表项同步。管理数据报文是支承交换机业务正常运行的关键;其次还有类似于温度、电源等信息的数据报文同步至管理板,也是管理数据报文;
SW:SWITCH的缩写,表示交换媒体介入控制层(MAC,Media Access Control)芯片;
L2 SW:具有二层功能的交换MAC芯片;在带外管理平面中,通常作为心跳报文、管理数据报文的转发芯片,是带外管理平面的核心;
L2 SW的管理接口:指二层MAC芯片的管理接口,常见的有高速串行计算机扩展总线标准(PCIe,Peripheral component interconnect express)、串行外设接口(SPI,Serial Peripheral Interface)、串行管理接口(SMI,Serial Management Interface)等,管理板(具体指管理板的中央处理器(CPU,Central Processing Unit))通过L2 SW的管理接口来配置L2 SW芯片内的转发规则、优先级等;
带外管理通路:在机架式产品中,通常指连接管理板与业务板块的物理链路,作为两者之间通信的链路,比如1000baxe-x、100base-t等都可以作为带外管理通路;
带外管理平面:狭义地指承载交换机的机框内部的带外数据转发与处理的平面,一般包含CPU、L2 SW、低速总线等。带外管理平面可以分为两类:一类是由低速总线拓扑(如控制器局域网络(CAN,Controller Area Network)总线、两线式串行总线(I2C,Inter-Integrated Circuit)等)构成的管理通路,主要用来管理控制机框内部的风扇、电源等,这些低速总线虽重要,但故障时一般不影响用户业务;另一类是由L2 SW构成的带外报文转发通路,主要用于实现主管理板与业务板块之间通信,完成协议同步、表项同步等报文的转发;
主管理板:作为带外管理平面的控制者(Master),整机内所有的带外数据都同步到主管理板,并由主管理板的CPU分析后分发同步至各业务板块;所述整机指包括机框、管理板、业务板块等的设备,如交换机。
业务板块:用于承载用户业务数据的转发(比如用户上网、视频流量通过业务板块转发),业务板块受主管理板管理。
以下对相关带外管理通路的相关技术进行说明。
图1为一种带外管理通路的示意图;如图1所示,其管理板可以包括CPU和L2 SW,所述CPU通过L2 SW的串行器(serdes)或其他物理链路连接到各个业务板块上,组成一套带外管理通路,常规的冗余设计方法是管理板1+1冗余(即设置备管理板),构成带外管理通路。
图2为一种交换机的示意图;如图2所示,所述交换机具体为一种框式交换机(也称机架式交换机)中,所述框式交换机通常包含:主控卡(即管理板)、业务卡(即业务板块)、电源模块、风扇模块等(Clos架构的交换机还包含交换网板等);L2 SW一般放置在主控卡上,主控卡与各业务卡通过带外管理通路作为带外数据的连接通道;业务卡主要承载用户数据的转发;
正常运行时,可以设置两张主控卡做主从备份(针对设有主管理板、备管理板的情况),主管理板接管整机内的风扇、电源,也保持与业务卡的带外通信,同时将管理信息同步至备管理板。
图3为一种主管理板和备管理板实现控制的示意图;如图3所示,整机有主、备两块管理板,且主、备两块管理板均正常工作,则无需采用本发明实施例提供的方法,由正常的主管理板(具体指主管理板的CPU)管理L2 SW,并管理整机的带外管理通路。
图4为一种单管理板实现控制的示意图;如图4所示,当主管理板的CPU发生故障时,优先做主备倒换,原来的备管理板接管工作,此时也无需采用本发明实施例提供的方案。
结合上述方案发现,管理板出现故障,带外管理系统处于失效状态,业务运行受到影响;这里,管理板出现故障包括两种情况,一为单管理板设计时,主管理板出现故障;二为1+1冗余设计(即设有备管理板的设计)时,两张管理板均出现故障;另外,设置备管理板的设计,在提高可用性的同时,用户需要购买两张管理板增加备份,增加了成本。
在本发明的各种实施例中,业务板块检测目标板的状态;基于所述目标板的状态确定所述目标板处于故障状态时,获取控制转发权限,根据所述控制转发权限实现对交换机的控制;其中,所述控制转发权限表征针对L2 SW的权限。
下面结合实施例对本发明再作进一步详细的说明。
图5为本发明实施例提供的一种带外管理系统的控制方法的流程示意图;如图5所示,所述带外管理系统的控制方法包括:
步骤501、业务板块检测目标板的状态;
步骤502、基于所述目标板的状态确定所述目标板处于故障状态时,获取控制转发权限,根据所述控制转发权限实现对交换机的控制;其中,所述控制转发权限表征针对L2SW的权限。
本发明实施例中,所述带外管理系统的控制方法应用于交换机;具体应用于交换机的业务板块。
所述业务板块(也可称为业务板、业务卡、业务模块,具体可参考图2),具体指用于承载用户设备业务数据的转发的模块。
这里,所述目标板可以为主管理板、备管理板;
具体地,相应于所述交换机仅包含主管理板(即交换机为单管理板的交换机)的情况下,所述目标板为主管理板;
相应于所述交换机同时包含主管理板和备管理板的情况下,所述目标板为备管理板;这是考虑到正常情况下,当主管理板出现问题时,一般由备管理板执行原先由主管理板执行的控制操作。
具体地,所述业务板块检测目标板的状态,包括以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障通告信号;
相应地,所述基于所述目标板的状态确定所述目标板处于故障状态,包括以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文的情况,确定未接收到所述目标板的心跳报文时,确定所述目标板处于故障状态;
相应于检测是否接收到故障通告信号的情况,确定接收到所述故障通告信号时,确定所述目标板处于故障状态。
本发明实施例考虑到业务板块和管理板之间有心跳报文的传输,从而业务板块可以基于心跳报文判断管理板是否存在故障;
另外,还可以是基于故障通告信息(具体可以主要针对硬件故障,一般硬件发生故障时会产生,并发送给业务板块);
通过上述检测方法无需对交换机多做硬件改进,即可实现状态检测。
具体地,所述业务板块获取控制转发权限,包括以下至少之一:
向控制模块发送获取请求;所述控制模块用于控制所述控制转发权限的拥有权;所述获取请求由所述控制模块执行;
接收针对所述获取请求的回复消息,基于所述回复消息确定是否获取所述控制转发权限。
具体来说,所述控制模块具体为一个对所述控制转发权限的拥有权进行管理的模块。
所述控制模块具体可以通过软件实现,也可以结合硬件实现;
在一实施例中,通过软件实现,可以是针对L2 SW添加一个第一管理接口,针对所述第一管理接口可以设置至少一个通信链路,所述至少一个通信链路中各通信链路分别对应管理板、业务板块,所述第一管理接口接收到针对控制转发权限的获取请求,基于所述获取请求的发送方控制第一管理接口的通信链路的连通对象(即通过控制通信链路是否连通,以控制获取L2 SW的权限的对象为管理板或业务板块)。
在另一实施例中,通过软件和硬件结合实现,可以是针对L2 SW添加至少一个第二管理接口;所述至少一个第二管理接口中各第二管理接口分别对应管理板、业务板块;所述至少一个第二管理接口用于接收针对控制转发权限的获取请求,基于所述获取请求的发送方控制第二管理接口的连接。
在再一实施例中,可以将控制模块理解为一个开关切换电路;所述开关切换电路,包括:在至少一个板块(指管理板、业务板块)之间切换控制该L2 SW的管理接口的多路选择开关,通过所述多路选择开关来选择某个板块管理L2SW,即管理所述控制转发权限。这里,所述开关切换电路可以由复杂可编程逻辑器件(CPLD)等逻辑器件实现。
以上仅仅是提供几种是实现方案,实际应用时并不限制,实现对所述控制转发权限的转交即可。
具体地,所述根据所述控制转发权限实现对交换机的控制之后,所述方法还包括:
检测目标板的恢复状态;
基于所述目标板的恢复状态确定所述目标板处于待工作状态时,取消所述控制转发权限;取消后,所述控制转发权限由所述目标板获取。
具体地,所述检测目标板的恢复状态,包括:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障恢复信号;
所述基于所述目标板的恢复状态确定所述目标板处于待工作状态,包括以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文的情况,确定接收到所述目标板的心跳报文时,确定所述目标板处于待工作状态;
相应于检测是否接收到故障恢复信号的情况,确定接收到所述故障恢复信号时,确定所述目标板处于待工作状态。
所述故障恢复信号在目标板的故障排除后生成,并发送给业务板块。
本发明实施例中,所述目标板还可以是其他业务板块;具体相应于所述交换机包含至少两个业务板块,且存在优先级高于当前业务板块的其他业务板块,则所述目标板可以为所述其他业务板块。这里,所述优先级指获取控制转发权限的优先级。
也就是说,所述目标板可以为管理板(具体分为主管理板、备管理板),还可以为业务板块。
基于此,本发明实施例中,所述方法还包括:检查优先权;
所述检查优先权,包括:
获取预设的优先权顺序,以确定自身的第一优先权;
判断优先权为自身上一级的第一模块;所述第一模块可以为管理板或任一业务板块;所述管理板包括以下至少之一:主管理板、备管理板。
所述检测目标板的状态,包括:
确定所述第一模块处于工作状态(指获取控制转发权限并执行相应工作的状态)时,将所述第一模块作为目标板,检测所述目标板的状态;当基于所述目标板的状态确定所述目标板处于故障状态时,业务板块获取控制转发权限,根据所述控制转发权限实现对交换机的控制。
即在当前业务板块的上一优先级的板块处理工作状态时,执行本发明实施例提供的方法,保证按照优先级顺序,在故障时依次由业务板块进行控制。这可以避免在主管理板故障、但备管理板可正常工作的情况下,业务板块抢先获得控制转发权限。
相应地,所述检测目标板的恢复状态,包括:
确定自身处于工作状态(指获取控制转发权限并执行相应工作的状态)时,将优先级为自身上一级的第一模块作为目标板,检测所述目标板的恢复状态。
所述预设的优先权顺序由开发人员预先设定并保存,一般来说,主管理板的优先权高于备管理板的优先权,所述备管理板的优先权高于各业务板块的优先权;所述各业务板块的优先权可以设置为不同的值。
虽然本发明实施例公开预先确定优先级顺序,但实际应用时,所述优先级顺序可以仅用于区分主管理板、备管理板和各业务板块之间的优先级,各业务板块的优先级可以相同,从而由各优先级自行发送获取请求,由控制模块根据接收的获取请求分配控制转发权限;这里不做限定。
图6为本发明实施例提供的另一种带外管理系统的控制方法的流程示意图,如图6所示,所述带外管理系统的控制方法应用于交换机,所述方法包括:包括:
步骤601、交换机运行后,完成管理板的主从备份,开始正常运行;
这里,主从管理板选举方案,可以基于软件设定的规则,比如启动完成先就绪的为主管理板,当某一种管理板升级为主管理板后,就通告给全局其他板卡,自己为主,另一张管理板将自己保持为从(即备管理板),业务板块接受对应的主管理板控制管理;主管理板同时会实时将交换机的信息同步到备管理板;
步骤602、设置各业务板块控制L2 SW的优先级,异常时各业务板块按优先级接管L2 SW;
若未配置优先级,则默认按照槽位号进行优先级排序;
需要说明的是,考虑本发明实施例的方案采用业务板块在全部管理板异常时接管带外管理平面,但是一般框式交换机中插有多张业务板卡,因此需要对这些业务板块的优先级进行设定,由优先级最高的业务板块来接管;优先级设定的策略,可以基于默认槽位号设置,也可用通过软件设置。
步骤603、判断当前的主管理板功能是否正常;若是,则确定运行正常;若否,则进入步骤604;
具体来说,可以用心跳报文保活实现,即主管理板定期发送心跳报文,备管理板和业务板块在收到心跳报文后答复,双方可确认对方处于正常状态;也可以用硬件的心跳信号(即图5所示方法中的故障通告信号)实现;
故障情况1:主管理板发送心跳报文,但是备管理板和/或业务板块未应答,超出限定的时间长度后,主管理板可判定备管理板和/或业务板块处于异常状态;
故障情况2:备管理板和/或业务板块未收到主管理板的心跳报文,超出时间长度后,备管理板和/或业务板块可判定主管理板异常。
步骤604、判断是否存在正常功能的备管理板,若存在,则进入步骤605,若不存在,则进入步骤606;
适用于主从管理板之间,具体方法可以参照步骤603的方案,通过心跳报文感知对端是否存在故障;
步骤605、备管理板升为主管理板,接管交换机的管理;
具体来说,所述备管理板确定到主管理板异常时,备管理板升级为主管理板,开始接管交换机,即L2 SW的获得控制转发权限,执行相应的工作,如:风扇、电源等信息的收集、与业务板块通信同步协议报文、表项等;
步骤606、业务板块确定管理板均故障,获取L2 SW的控制转发权限;
具体地,所述业务板块确定管理板发生故障可以包括:
确定心跳报文被中断;
接收到管理板的故障通告信号;
所述获取L2 SW的控制转发权限,可以包括:
通过开关切换电路,将L2 SW的控制信号切换到优先级第一的业务板块上,业务板块的CPU开始接管带外管理平面。
所述步骤606的具体步骤已在参照图5所示方法中说明,这里不再赘述。
具体来说,当优先级最高的业务板块在限定的时间长度内没有收到心跳报文(软件通告)或心跳信号中断(硬件通告),此时业务板块认为全部的管理板已处于异常状态(指管理板的CPU异常),业务板块确定自身需要将带外管理平面接管过来。所述业务板块通过开关切换电路获取L2 SW的控制转发权限,从而所述业务板块控制原管理板上的L2 SW,负责与其他业务板块通信,如:下发心跳报文给其他业务板块、处理并下发同步协议报文、表项等。
步骤607、交换机的业务层面不中断,持续运行,同时生成告警以提示管理板故障。
图7(a)和(b)为本发明实施例提供的一种带外管理系统的控制方法的应用场景示意图;
在交换机的全部管理板均发生故障时(两张管理板的情况下,双管理板均发生故障;单张管理板的情况下,单管理板发生故障),此时业务板块确定管理板故障(如:无心跳报文、CPU故障时的硬件通告信号等,具体方法已在图5所示方法中说明,这里不再赘述),业务板块通过控制模块(所述控制模块可以是带使能的74器件(一种高速CMOS器件)、CPLD器件等),将L2 SW的控制接口切换到业务板块上,进而由业务模块控制交换机的带外管理系统;
在这种故障情况下,业务板块1(指接管带外通路的业务板块)通过CPU配置L2 SW,取得类同于管理板对L2 SW的控制转发权限,交换机的心跳报文、表项同步等都汇聚到业务板块1,其他业务板块仍可以正常工作,交换机的业务不会受到影响。
需要说明的是,上述方案中的L2 SW的位置不限定。图8为本发明实施例提供的另一种带外管理系统的控制方法的应用场景示意图;如图8所示,可以将L2 SW独立成一张板块或盒式设备,不再与管理板紧耦合,同时通过控制模块,管理板1、管理板2、业务板块都能控制L2 SW。
图9为本发明实施例提供的一种带外管理系统的控制装置的结构示意图;如图9所示,所述装置包括:第一处理模块、第二处理模块;其中,
所述第一处理模块,用于检测目标板的状态;
所述第二处理模块,用于基于所述目标板的状态确定所述目标板处于故障状态时,获取控制转发权限,根据所述控制转发权限实现对交换机的控制;其中,所述控制转发权限表征针对L2 SW的权限。
具体地,所述第一处理模块,用于执行以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障通告信号;
所述第二处理模块,用于执行以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定未接收到所述目标板的心跳报文时,确定所述目标板处于故障状态;
相应于检测是否接收到故障通告信号,确定接收到所述故障通告信号时,确定所述目标板处于故障状态。
具体地,所述第二处理模块,用于向控制模块发送获取请求;所述获取请求由所述控制模块执行;
接收针对所述获取请求的回复消息,基于所述回复消息确定是否获取所述控制转发权限。
具体地,所述装置还包括:第三处理模块,用于根据所述控制转发权限实现对交换机的控制之后,检测目标板的恢复状态;
所述第二处理模块,还用于基于所述目标板的恢复状态确定所述目标板处于待工作状态时,取消所述控制转发权限;取消后,所述控制转发权限由所述目标板获取。
具体地,所述第三处理模块,还用于执行以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障恢复信号;
所述第二处理模块,还用于执行以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定接收到所述目标板的心跳报文时,确定所述目标板处于待工作状态;
相应于检测是否接收到故障恢复信号,确定接收到所述故障恢复信号时,确定所述目标板处于待工作状态。
需要说明的是:上述实施例提供的带外管理系统的控制装置在进行带外管理系统的控制时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的带外管理系统的控制装置与带外管理系统的控制方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图10为本发明实施例提供的另一种带外管理系统的控制装置的结构示意图。所述装置100包括:处理器1001和用于存储能够在所述处理器上运行的计算机程序的存储器1002;其中,所述处理器1001用于运行所述计算机程序时,执行:检测目标板的状态;基于所述目标板的状态确定所述目标板处于故障状态时,获取控制转发权限,根据所述控制转发权限实现对交换机的控制;其中,所述控制转发权限表征针对L2 SW的权限。
在一实施例中,所述处理器1001还用于运行所述计算机程序时,执行以下至少之一:检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障通告信号;
还执行以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定未接收到所述目标板的心跳报文时,确定所述目标板处于故障状态;
相应于检测是否接收到故障通告信号,确定接收到所述故障通告信号时,确定所述目标板处于故障状态。
在一实施例中,所述处理器1001还用于运行所述计算机程序时,执行:向控制模块发送获取请求;所述控制模块用于控制所述控制转发权限的拥有权;所述获取请求由所述控制模块执行;
接收针对所述获取请求的回复消息,基于所述回复消息确定是否获取所述控制转发权限。
在一实施例中,所述处理器1001还用于运行所述计算机程序时,执行:检测目标板的恢复状态;基于所述目标板的恢复状态确定所述目标板处于待工作状态时,取消所述控制转发权限;取消后,所述控制转发权限由所述目标板获取。
在一实施例中,所述处理器1001还用于运行所述计算机程序时,执行以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障恢复信号;
还执行以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定接收到所述目标板的心跳报文时,确定所述目标板处于待工作状态;
相应于检测是否接收到故障恢复信号,确定接收到所述故障恢复信号时,确定所述目标板处于待工作状态。
需要说明的是:上述实施例提供的带外管理系统的控制装置与带外管理系统的控制方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
实际应用时,所述装置100还可以包括:至少一个网络接口1003。带外管理系统的控制装置100中的各个组件通过总线系统1004耦合在一起。可理解,总线系统1004用于实现这些组件之间的连接通信。总线系统1004除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图10中将各种总线都标为总线系统1004。其中,所述处理器1001的个数可以为至少一个。网络接口1003用于带外管理系统的控制装置100与其他设备之间有线或无线方式的通信。
本发明实施例中的存储器1002用于存储各种类型的数据以支持带外管理系统的控制装置100的操作。
上述本发明实施例揭示的方法可以应用于处理器1001中,或者由处理器1001实现。处理器1001可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1001中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1001可以是通用处理器、数字信号处理器(DSP,DiGital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器1001可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器1002,处理器1001读取存储器1002中的信息,结合其硬件完成前述方法的步骤。
在示例性实施例中,带外管理系统的控制装置100可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable LogicDevice)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或其他电子元件实现,用于执行前述方法。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行:检测目标板的状态;基于所述目标板的状态确定所述目标板处于故障状态时,获取控制转发权限,根据所述控制转发权限实现对交换机的控制;其中,所述控制转发权限表征针对L2 SW的权。
在一实施例中,所述计算机程序被处理器运行时,执行以下至少之一:检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障通告信号;
还执行以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定未接收到所述目标板的心跳报文时,确定所述目标板处于故障状态;
相应于检测是否接收到故障通告信号,确定接收到所述故障通告信号时,确定所述目标板处于故障状态。
在一实施例中,所述计算机程序被处理器运行时,执行:向控制模块发送获取请求;所述控制模块用于控制所述控制转发权限的拥有权;所述获取请求由所述控制模块执行;
接收针对所述获取请求的回复消息,基于所述回复消息确定是否获取所述控制转发权限。
在一实施例中,所述计算机程序被处理器运行时,执行:检测目标板的恢复状态;基于所述目标板的恢复状态确定所述目标板处于待工作状态时,取消所述控制转发权限;取消后,所述控制转发权限由所述目标板获取。
在一实施例中,所述计算机程序被处理器运行时,执行以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障恢复信号;
还执行以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定接收到所述目标板的心跳报文时,确定所述目标板处于待工作状态;
相应于检测是否接收到故障恢复信号,确定接收到所述故障恢复信号时,确定所述目标板处于待工作状态。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种带外管理系统的控制方法,其特征在于,所述方法包括:
业务板块检测目标板的状态;
基于所述目标板的状态确定所述目标板处于故障状态时,获取控制转发权限,根据所述控制转发权限实现对交换机的控制;其中,所述控制转发权限表征针对二层媒体介入控制层芯片L2 SW的权限。
2.根据权利要求1所述的方法,其特征在于,所述业务板块检测目标板的状态,包括以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障通告信号;
所述基于所述目标板的状态确定所述目标板处于故障状态,包括以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定未接收到所述目标板的心跳报文时,确定所述目标板处于故障状态;
相应于检测是否接收到故障通告信号,确定接收到所述故障通告信号时,确定所述目标板处于故障状态。
3.根据权利要求1所述的方法,其特征在于,所述获取控制转发权限,包括:
向控制模块发送获取请求;所述控制模块用于控制所述控制转发权限的拥有权;所述获取请求由所述控制模块执行;
接收针对所述获取请求的回复消息,基于所述回复消息确定是否获取所述控制转发权限。
4.根据权利要求1所述的方法,其特征在于,所述根据所述控制转发权限实现对交换机的控制之后,所述方法还包括:
检测目标板的恢复状态;
基于所述目标板的恢复状态确定所述目标板处于待工作状态时,取消所述控制转发权限;取消后,所述控制转发权限由所述目标板获取。
5.根据权利要求4所述的方法,其特征在于,所述检测目标板的恢复状态,包括以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障恢复信号;
所述基于所述目标板的恢复状态确定所述目标板处于待工作状态,包括以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定接收到所述目标板的心跳报文时,确定所述目标板处于待工作状态;
相应于检测是否接收到故障恢复信号,确定接收到所述故障恢复信号时,确定所述目标板处于待工作状态。
6.一种带外管理系统的控制装置,其特征在于,所述装置包括:第一处理模块、第二处理模块;其中,
所述第一处理模块,用于检测目标板的状态;
所述第二处理模块,用于基于所述目标板的状态确定所述目标板处于故障状态时,获取控制转发权限,根据所述控制转发权限实现对交换机的控制;其中,所述控制转发权限表征针对L2 SW的权限。
7.根据权利要求6所述的装置,其特征在于,所述第一处理模块,用于执行以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障通告信号;
所述第二处理模块,用于执行以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定未接收到所述目标板的心跳报文时,确定所述目标板处于故障状态;
相应于检测是否接收到故障通告信号,确定接收到所述故障通告信号时,确定所述目标板处于故障状态。
8.根据权利要求6所述的装置,其特征在于,所述第二处理模块,用于向控制模块发送获取请求;所述获取请求由所述控制模块执行;
接收针对所述获取请求的回复消息,基于所述回复消息确定是否获取所述控制转发权限。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:第三处理模块,用于根据所述控制转发权限实现对交换机的控制之后,检测目标板的恢复状态;
所述第二处理模块,还用于基于所述目标板的恢复状态确定所述目标板处于待工作状态时,取消所述控制转发权限;取消后,所述控制转发权限由所述目标板获取。
10.根据权利要求9所述的装置,其特征在于,所述第三处理模块,还用于执行以下至少之一:
检测是否可接收到所述目标板的心跳报文;
检测是否接收到故障恢复信号;
所述第二处理模块,还用于执行以下至少之一:
相应于检测是否可接收到所述目标板的心跳报文,确定接收到所述目标板的心跳报文时,确定所述目标板处于待工作状态;
相应于检测是否接收到故障恢复信号,确定接收到所述故障恢复信号时,确定所述目标板处于待工作状态。
11.一种带外管理系统的控制装置,其特征在于,所述装置包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,
所述处理器用于运行所述计算机程序时,执行权利要求1至5任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010313070.8A CN111585835B (zh) | 2020-04-20 | 2020-04-20 | 一种带外管理系统的控制方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010313070.8A CN111585835B (zh) | 2020-04-20 | 2020-04-20 | 一种带外管理系统的控制方法、装置和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111585835A true CN111585835A (zh) | 2020-08-25 |
CN111585835B CN111585835B (zh) | 2022-06-17 |
Family
ID=72124456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010313070.8A Active CN111585835B (zh) | 2020-04-20 | 2020-04-20 | 一种带外管理系统的控制方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111585835B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113193995A (zh) * | 2021-04-22 | 2021-07-30 | 深圳市信锐网科技术有限公司 | 通信设备及其控制方法和计算机可读存储介质 |
CN113259452A (zh) * | 2021-06-01 | 2021-08-13 | 苏州浪潮智能科技有限公司 | 一种风暴控制实现方法、装置、设备及可读存储介质 |
CN114338595A (zh) * | 2021-12-31 | 2022-04-12 | 山石网科通信技术股份有限公司 | 报文的分布式处理方法、装置、存储介质及处理器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040067076A (ko) * | 2003-01-21 | 2004-07-30 | 삼성전자주식회사 | 복수 개의 보드들로 구성된 시스템에 있어 프로세스간통신 진단에 의한 오류 진단 장치 및 방법 |
CN101977139A (zh) * | 2010-07-28 | 2011-02-16 | 北京星网锐捷网络技术有限公司 | 路由转发实现装置、方法及交换设备 |
CN102045332A (zh) * | 2009-10-26 | 2011-05-04 | 杭州华三通信技术有限公司 | 智能弹性架构中处理控制报文的方法和线卡板 |
CN102075343A (zh) * | 2009-11-20 | 2011-05-25 | 杭州华三通信技术有限公司 | 一种实现带外管理的方法、系统和带外管理交换机 |
CN103248526A (zh) * | 2012-02-08 | 2013-08-14 | 迈普通信技术股份有限公司 | 实现带外监控管理的通信设备、方法及主从切换方法 |
-
2020
- 2020-04-20 CN CN202010313070.8A patent/CN111585835B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040067076A (ko) * | 2003-01-21 | 2004-07-30 | 삼성전자주식회사 | 복수 개의 보드들로 구성된 시스템에 있어 프로세스간통신 진단에 의한 오류 진단 장치 및 방법 |
CN102045332A (zh) * | 2009-10-26 | 2011-05-04 | 杭州华三通信技术有限公司 | 智能弹性架构中处理控制报文的方法和线卡板 |
CN102075343A (zh) * | 2009-11-20 | 2011-05-25 | 杭州华三通信技术有限公司 | 一种实现带外管理的方法、系统和带外管理交换机 |
CN101977139A (zh) * | 2010-07-28 | 2011-02-16 | 北京星网锐捷网络技术有限公司 | 路由转发实现装置、方法及交换设备 |
CN103248526A (zh) * | 2012-02-08 | 2013-08-14 | 迈普通信技术股份有限公司 | 实现带外监控管理的通信设备、方法及主从切换方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113193995A (zh) * | 2021-04-22 | 2021-07-30 | 深圳市信锐网科技术有限公司 | 通信设备及其控制方法和计算机可读存储介质 |
CN113259452A (zh) * | 2021-06-01 | 2021-08-13 | 苏州浪潮智能科技有限公司 | 一种风暴控制实现方法、装置、设备及可读存储介质 |
CN113259452B (zh) * | 2021-06-01 | 2021-09-17 | 苏州浪潮智能科技有限公司 | 一种风暴控制实现方法、装置、设备及可读存储介质 |
CN114338595A (zh) * | 2021-12-31 | 2022-04-12 | 山石网科通信技术股份有限公司 | 报文的分布式处理方法、装置、存储介质及处理器 |
CN114338595B (zh) * | 2021-12-31 | 2024-02-02 | 山石网科通信技术股份有限公司 | 报文的分布式处理方法、装置、存储介质及处理器 |
Also Published As
Publication number | Publication date |
---|---|
CN111585835B (zh) | 2022-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111585835B (zh) | 一种带外管理系统的控制方法、装置和存储介质 | |
US20200233762A1 (en) | Method and Apparatus for Redundancy in Active-Active Cluster System | |
US6859889B2 (en) | Backup system and method for distributed systems | |
US20070288585A1 (en) | Cluster system | |
JP2004171370A (ja) | 冗長構成におけるクライアント/サーバ間のアドレス制御方式および方法 | |
US7660234B2 (en) | Fault-tolerant medium access control (MAC) address assignment in network elements | |
TWI677247B (zh) | 多節點裝置及其備援通訊方法 | |
CN110053650B (zh) | 一种列车自动运行系统、列车自动运行系统架构及列车自动运行系统的模块管理方法 | |
JP4806382B2 (ja) | 冗長化システム | |
JP2011000977A (ja) | 入出力部一体型2重系cpuにおける入出力管理方式 | |
CN114124803B (zh) | 设备管理方法、装置、电子设备及存储介质 | |
CN110661599B (zh) | 一种主、备节点间的ha实现方法、装置及存储介质 | |
JP2009003491A (ja) | クラスタシステムにおけるサーバ切り替え方法 | |
JP4414399B2 (ja) | ディスク制御装置 | |
JP5176914B2 (ja) | 伝送装置及び冗長構成部の系切替え方法 | |
WO2017181778A1 (zh) | 一种双主控设备主控之间链路扩展方法及装置 | |
JP2001344125A (ja) | 2重化ノードシステム | |
JP6041056B2 (ja) | 情報処理装置及び方法 | |
JP2003186578A (ja) | 冗長電力を供給する方法および装置 | |
CN109361781B (zh) | 报文转发方法、装置、服务器、系统及存储介质 | |
JP6654662B2 (ja) | サーバ装置およびサーバシステム | |
CN113852514A (zh) | 服务不中断的数据处理系统、处理设备切换方法、连接设备 | |
US8775695B2 (en) | Specific identification information management device, information processing device, and specific identification information setting method | |
CN111510336A (zh) | 一种网络设备状态管理方法及装置 | |
WO2024119777A1 (zh) | 框式设备通信链路异常处理方法、框式设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |