CN113193995A - 通信设备及其控制方法和计算机可读存储介质 - Google Patents
通信设备及其控制方法和计算机可读存储介质 Download PDFInfo
- Publication number
- CN113193995A CN113193995A CN202110440228.2A CN202110440228A CN113193995A CN 113193995 A CN113193995 A CN 113193995A CN 202110440228 A CN202110440228 A CN 202110440228A CN 113193995 A CN113193995 A CN 113193995A
- Authority
- CN
- China
- Prior art keywords
- main control
- control board
- board
- service
- temporary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 114
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000012544 monitoring process Methods 0.000 description 5
- 238000011217 control strategy Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0668—Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明公开了一种通信设备及其控制方法和计算机可读存储介质,所述通信设备的控制方法包括以下步骤:在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数,其中,所述性能参数包括CPU内核数、CPU内核最大工作主频、背板上行端口带宽以及槽位号信息中的至少之一;根据所述性能参数在所述业务板中确定临时主控板;断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接,以使各个所述业务板通过所述临时主控板进行报文转发。本发明能够解决主控板不在位或者发生故障时,报文无法正常交换的问题。
Description
技术领域
本发明涉及通信设备技术领域,特别涉及一种通信设备及其控制方法和计算机可读存储介质。
背景技术
现有的交换机、路由器和服务器等通信设备中,主控板与业务板固定连接在背板上,业务板与另一业务板之间需要通过主控板作为媒介进行报文交换,但是,当主控板不在位或者发生故障时,各业务板之间的通信流量就会断开,导致报文无法正常交换。
发明内容
本发明的主要目的是提供一种通信设备及其控制方法和计算机可读存储介质,解决主控板不在位或者发生故障时,报文无法正常交换的问题。
为实现上述目的,本发明提供了一种通信设备的控制方法,所述通信设备的控制方法包括:
在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数,其中,所述性能参数包括CPU内核数、CPU内核最大工作主频、背板上行端口带宽以及槽位号信息中的至少之一;
根据所述性能参数在所述业务板中确定临时主控板;
断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接,以使各个所述业务板通过所述临时主控板进行报文转发。
可选地,所述获取主控板连接的各个业务板的性能参数的步骤之前包括:
检测所述主控板是否处于不在位状态;
在所述主控板处于在位状态时,检测所述主控板是否发生故障。
可选地,所述检测所述主控板是否处于不在位状态的步骤包括:
获取各个所述主控板的状态信息,其中,所述状态信息包括所述主控板的存储器件的地址、数据以及应答消息中的至少之一;
判断所述状态信息是否有效,其中,在所述状态信息无效时,确定所述主控板处于不在位状态。
可选地,所述检测所述主控板是否处于不在位状态的步骤包括:
获取所述主控板的电平信号;
判断所述电平信号是否为高电平信号,其中,在所述电平信号为高电平信号时,确定所述主控板处于不在位状态。
可选地,所述检测所述主控板是否发生故障的步骤包括:
接收所述主控板发送的心跳信号;
确定在预设时长内是否连续接收到所述心跳信号,其中,在预设时长内未连续接收到所述心跳信号时,确定所述主控板发生故障。
可选地,所述断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接的步骤之后或者同时还包括:
断开管理平面与所述主控板的连接;
控制所述管理平面与所述临时主控板连接,以使所述管理平面通过所述临时主控板进行平面管理。
可选地,所述断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接,以使各个所述业务板通过所述临时主控板进行报文转发的步骤之后包括:
在检测到所述主控板的状态恢复后,断开所述业务板与所述临时主控板的连接,控制所述业务板与所述主控板连接,以使各个所述业务板通过所述主控板进行报文转发。
可选地,所述在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数的步骤之前包括:
确定控制器的使能信号引脚是否使能;
在所述使能信号引脚使能时,执行所述在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数的步骤。
可选地,所述通信设备的控制方法还包括:
在所述主控板处于不在位状态或者发生故障时,向各个所述业务板发送主控板异常信号,以使各个所述业务板缓存待转发的报文。
此外,为实现上述目的,本发明还提出一种通信设备,所述通信设备包括:
获取模块,用于在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数,其中,所述性能参数包括CPU内核数、CPU内核最大工作主频、背板上行端口带宽以及槽位号信息中的至少之一;
确定模块,用于根据所述性能参数在所述业务板中确定临时主控板;
控制模块,用于断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接,以使各个所述业务板通过所述临时主控板进行报文转发。
此外,为实现上述目的,本发明还提出一种通信设备,所述通信设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的通信设备的控制程序,所述通信设备的控制程序被所述处理器执行时实现如以上所述的通信设备的控制方法的步骤。
可选地,所述通信设备还包括依次设置的业务板槽位、冗余背板、主控板槽位以及管理平面,所述管理平面通过所述冗余背板与所述业务板槽位选择性连接或者断开,所述管理平面通过所述冗余背板与所述主控板槽位选择性连接或者断开。
可选地,所述业务板槽位上设有多个业务板,所述主控板槽位上设有多个主控板,所述冗余背板上设有多个高速多路复用器以及低速多路复用器,所述多个业务板之间、所述多个主控板之间以及所述多个高速多路复用器之间通过通信总线连接,每一所述业务板通过所述高速多路复用器与所述主控板选择性连接或者断开,每一所述业务板通过所述高速多路复用器与其他所述业务板选择性连接或者断开,所述管理平面通过所述低速多路复用器与所述业务板槽位以及所述主控板槽位选择性连接或者断开。
可选地,所述冗余背板上还设有控制器,所述控制器通过通信总线与所述高速多路复用器、所述低速多路复用器、所述主控板以及所述业务板连接。
此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有通信设备的控制程序,所述通信设备的控制程序被处理器执行时实现如以上所述的通信设备的控制方法的步骤。
本发明提出了一种通信设备及其控制方法和计算机可读存储介质,在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数,然后根据各个业务板的性能参数在业务板中确定临时主控板,最后断开业务板与主控板的连接,控制业务板与临时主控板连接,以使各个业务板通过临时主控板进行报文转发。这样,本方案中即使主控板不在位或者发生故障,业务板也可以根据临时主控板实现报文的转发,业务板间的通信流量不会断开,解决了主控板不在位或者发生故障时,报文无法正常交换的问题。
附图说明
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
图1为本发明实施例方案涉及的通信设备的硬件架构示意图;
图2为本发明通信设备的控制方法的一种实施例的流程示意图;
图3为本发明通信设备的控制方法的另一种实施例的流程示意图;
图4为本发明通信设备的控制方法的另一种实施例的流程示意图;
图5为本发明通信设备的控制方法的另一种实施例的流程示意图;
图6为本发明实施例方案涉及的通信设备的结构示意图一;
图7为本发明实施例方案涉及的选举临时主控板的比较算法流程图;
图8为本发明实施例方案涉及的通信设备的结构示意图二;
图9为本发明实施例方案涉及的临时主控板与业务板的直接和间接连接示意图;
图10为本发明实施例方案涉及的冗余背板控制连接关系示意图;
图11为本发明实施例方案涉及的检测主控板是否在位或者发生故障的算法流程图
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数;根据所述性能参数在所述业务板中确定临时主控板;断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接,以使各个所述业务板通过所述临时主控板进行报文转发。这样,本方案中即使主控板不在位或者发生故障,业务板也可以根据临时主控板实现报文的转发,业务板间的通信流量不会断开,解决了主控板不在位或者发生故障时,报文无法正常交换的问题。
为了更好地理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
如图1所示,图1是本发明实施例方案涉及的通信设备的硬件架构示意图。
如图1所示,该通信设备可以包括:处理器1001,例如CPU,通信总线1002,存储器1003,主控板1004,业务板1005,冗余背板1006以及管理平面1007。其中,通信总线1002用于实现这些组件之间的连接通信。存储器1003可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的通信设备的结构并不构成对通信设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1003中可以包括操作系统以及通信设备的控制程序。
在图1所示的通信设备中,处理器1001可以用于调用存储器1003中存储的通信设备的控制程序,并执行以下操作:
在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数,其中,所述性能参数包括CPU内核数、CPU内核最大工作主频、背板上行端口带宽以及槽位号信息中的至少之一;
根据所述性能参数在所述业务板中确定临时主控板;
断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接,以使各个所述业务板通过所述临时主控板进行报文转发。
进一步地,处理器1001可以调用存储器1003中存储的通信设备的控制程序,还执行以下操作:
检测所述主控板是否处于不在位状态;
在所述主控板处于在位状态时,检测所述主控板是否发生故障。
进一步地,处理器1001可以调用存储器1003中存储的通信设备的控制程序,还执行以下操作:
获取各个所述主控板的状态信息,其中,所述状态信息包括所述主控板的存储器件的地址、数据以及应答消息中的至少之一;
判断所述状态信息是否有效,其中,在所述状态信息无效时,确定所述主控板处于不在位状态。
进一步地,处理器1001可以调用存储器1003中存储的通信设备的控制程序,还执行以下操作:
获取所述主控板的电平信号;
判断所述电平信号是否为高电平信号,其中,在所述电平信号为高电平信号时,确定所述主控板处于不在位状态。
进一步地,处理器1001可以调用存储器1003中存储的通信设备的控制程序,还执行以下操作:
接收所述主控板发送的心跳信号;
确定在预设时长内是否连续接收到所述心跳信号,其中,在预设时长内未连续接收到所述心跳信号时,确定所述主控板发生故障。
进一步地,处理器1001可以调用存储器1003中存储的通信设备的控制程序,还执行以下操作:
断开管理平面与所述主控板的连接;
控制所述管理平面与所述临时主控板连接,以使所述管理平面通过所述临时主控板进行平面管理。
进一步地,处理器1001可以调用存储器1003中存储的通信设备的控制程序,还执行以下操作:
在检测到所述主控板的状态恢复后,断开所述业务板与所述临时主控板的连接,控制所述业务板与所述主控板连接,以使各个所述业务板通过所述主控板进行报文转发。
进一步地,处理器1001可以调用存储器1003中存储的通信设备的控制程序,还执行以下操作:
确定控制器的使能信号引脚是否使能;
在所述使能信号引脚使能时,执行所述在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数的步骤。
进一步地,处理器1001可以调用存储器1003中存储的通信设备的控制程序,还执行以下操作:
在所述主控板处于不在位状态或者发生故障时,向各个所述业务板发送主控板异常信号,以使各个所述业务板缓存待转发的报文。
参照图2,图2为本发明通信设备的控制方法实施例一的流程示意图,所述通信设备的控制方法包括以下步骤:
步骤S10,在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数,其中,所述性能参数包括CPU内核数、CPU内核最大工作主频、背板上行端口带宽以及槽位号信息中的至少之一;
在本实施例中,执行主体为通信设备或者通信设备的控制装置,可选为通信设备的控制器,通信设备可选为交换机、路由器或者服务器等。
参照图6,图6为本发明实施例方案涉及的通信设备的结构示意图一,如图6所示,所述通信设备包括业务板槽位、冗余背板/连接器、主控板槽位以及管理平面,其中,业务板槽位设有多个业务板,冗余背板/连接器设有多个高速多路复用器、控制器以及管理平面的多路复用器(低速多路复用器),主控板槽位设有多个主控板。多个业务板之间、多个主控板之间以及多个高速多路复用器之间通过通信总线连接;所述业务板通过高速多路复用器与所述主控板选择性连接或者断开,每一业务板通过高速多路复用器与其他业务板选择性连接或者断开;管理平面通过管理平面的多路复用器与业务板和主控板选择性连接或者断开;控制器通过通信总线与高速多路复用器、管理平面的多路复用器、主控板以及业务板连接,控制器还设有使能信号引脚,以开启或者关闭通信设备的高可靠性冗余交换控制功能;管理平面负责设备的风扇调速策略、电源模块信息、功耗管理、状态监控和告警系统等平面管理功能;业务板之间通过主控板进行通信流量交换、报文的转发。
在本实施例中,主控板为通信设备中的核心板卡,主控板主要提供通信设备的管理和控制功能以及数据平面的协议处理功能,负责处理各种通信协议;业务板为通信设备中进行业务处理的板卡,业务板主要提供业务传输的外部物理接口,完成报文接收和发送;冗余背板为通信设备中为业务板和主控板提供连接的槽位,冗余背板用于实现业务板与主控板的选择性连接或者断开,冗余背板还用于实现某一业务板与其他业务板的选择性连接或者断开;管理平面为通信设备中提供给网络管理人员使用TELNET、WEB、SSH、SNMP、RMON等方式来管理设备,并支持、理解和执行管理人员对于网络设备各种网络协议的设置命令的模块,管理平面主要对通信设备的风扇调速策略、电源模块信息、功耗、状态监控和告警系统等功能进行管理。
本发明提出的通信设备的控制方法可以应用于上述通信设备中主控板不在位或者主控板发生故障的应用场景。具体地,控制器检测通信设备的主控板是否处于在位状态或者发生故障,在检测到主控板处于不在位状态或者发生故障时,控制器通过通信总线读取与主控板连接的各个业务板的性能参数,性能参数为用于表征业务板CPU性能的指标参数,性能参数包括CPU内核数、CPU内核最大工作主频、背板上行端口带宽以及槽位号信息中的至少之一。
步骤S20,根据所述性能参数在所述业务板中确定临时主控板;
在本实施例中,控制器在获取到各业务板的性能参数后,根据性能参数在业务板中确定临时主控板,临时主控板为临时代替主控板的业务板,临时主控板是所有业务板中CPU性能最强的业务板,临时主控板代替主控板担任整框业务报文转发、风扇调速策略、功耗管理、状态监控和告警系统等管理平面功能和业务处理与转发的角色。需要说明的是,被选举为临时主控板的业务板不再与其他业务板进行报文交换。
在本实施例中,控制器获取到各个业务板的性能参数后,通过运行比较选举算法,比较各业务板的性能参数,以在业务板中比较选举出临时主控板,其中,比较选举的原则可选为业务板CPU内核数>业务板CPU的内核最大工作主频>业务板上行端口带宽>业务板槽位号较小。
具体地,参照图7,图7为本发明实施例方案涉及的选举临时主控板的比较算法流程图,如图7所示,控制器通过获取业务板CPU的硬件信息、业务带载、槽位ID以及运行状态等信息,先比较各业务板CPU内核数,判断业务板CPU内核数是否存在唯一最大值,若存在唯一最大值,判断主控板是否仍然不在位或者发生故障,若主控板在位且未发生故障,恢复主控板的功能,若主控板仍然不在位或者发生故障,则将CPU内核数最大的业务板选举为临时主控板;若存在多个最大值,去除不是CPU内核数最大值的业务板,然后比较剩余业务板CPU内核最大工作主频,判断剩余业务板CPU内核最大工作主频是否存在唯一最大值,若存在唯一最大值,判断主控板是否仍然不在位或者发生故障,若主控板在位且未发生故障,恢复主控板的功能,若主控板仍然不在位或者发生故障,则将CPU内核最大工作主频最大的业务板选举为临时主控板;若存在多个最大值,去除不是CPU内核最大工作主频最大值的业务板,然后比较剩余业务板的上行端口带宽,判断剩余业务板的上行端口带宽是否存在唯一最大值,若存在唯一最大值,判断主控板是否仍然不在位或者发生故障,若主控板在位且未发生故障,恢复主控板的功能,若主控板仍然不在位或者发生故障,则将业务板上行端口带宽最大的业务板选举为临时主控板;若存在多个最大值,去除不是业务板上行端口带宽最大值的业务板,然后比较剩余业务板的业务板槽位号,确定剩余业务板的业务板槽位号最小值,并判断主控板是否仍然不在位或者发生故障,若主控板在位且未发生故障,恢复主控板的功能,若主控板仍然不在位或者发生故障,则将业务板槽位号最小的业务板选举为临时主控板,其他情况则不选举临时主控板。
在本实施例中,在确认比较选举出性能最优的业务板担任临时主控板之前,需要再次检测主控板是否处于不在位状态或者发生故障,若此时已经检测到主控板状态恢复,控制器结束运行比较选举算法,恢复主控板的正常业务和功能。
可选地,控制器比较选举出临时主控板后,需要循环运行比较选举算法,以保证当前选举出来的临时主控板的CPU性能最优,并且,在每次循环中需要检测主控板的状态是否恢复,以确定是否需要结束运行比较选举算法。通过循环运比较选举算法可以确保当前选举出的临时主控板的性能最优,有效提高了冗余交换控制的可靠性。
步骤S30,断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接,以使各个所述业务板通过所述临时主控板进行报文转发。
在本实施例中,控制器选出临时主控板后,断开业务板与主控板的连接,控制业务板与临时主控板连接以使业务板通过临时主控板进行报文转发。
具体地,控制器选出临时主控板后,执行冗余控制策略,控制选择开启冗余背板的高速多路复用器,各业务板的背板上uplink端口(背板上行端口)与原主控板断开,各业务板的背板上uplink端口与新选举的临时主控板上行端口两两互联,以使业务板通过临时主控板进行报文转发。
在本实施例中,假设通信设备业务板的数量为N,比较选举出的最优临时主控的uplink端口数量记为Q。
当Q≥N-1时:控制器执行冗余控制策略,开启高速多路复用器使得临时主控板与其余业务板uplink端口两两互连。然后再判断其余业务板uplink端口数量,开启高速多路复用器使得其余业务板的uplink端口尽可能的两两互连。参照图8,图8为本发明实施例方案涉及的通信设备的结构示意图二,图8表示Q≥N-1时,主控板处于不在位状态或者发生故障后的通信设备的结构示意图,其中虚线为链路断开,实线为链路连通。
当Q<N-1时:控制器执行冗余控制策略,先判断其余业务板的当前的业务带载能力,开启高速多路复用器使得临时主控板优先与当前带载业务大的业务板uplink端口两两互连,再根据槽位号小优先与其它业务板uplink端口两两互连。剩余的业务板通过开启对应的高速多路复用器使得使其与临时主控板间接相连。参照图9,图9为本发明实施例方案涉及的临时主控板与业务板的直接和间接连接示意图。
在本实施例中,业务板与比较选举出的临时主控板连接后,业务板通过临时主控板进行报文转发,参照图10,图10为本发明实施例方案涉及的冗余背板控制连接关系示意图。
本实施例提供的技术方案中,在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数,然后根据各个业务板的性能参数在业务板中确定临时主控板,最后断开业务板与主控板的连接,控制业务板与临时主控板连接,以使各个业务板通过临时主控板进行报文转发。这样,本方案中即使主控板不在位或者发生故障,业务板也可以根据临时主控板实现报文的转发,业务板间的通信流量不会断开,解决了主控板不在位或者发生故障时,报文无法正常交换的问题。
参照图3,图3为本发明通信设备的控制方法实施例二的流程示意图,基于实施例一,上述S10的步骤之前包括:
步骤S40,检测所述主控板是否处于不在位状态;
在本实施例中,控制器在获取主控板连接的各个业务板的性能参数的步骤之前,先检测主控板是否处于不在位状态。
可选地,通过获取各个主控板的状态信息,判断获取到的主控板的状态信息是否有效,其中,在获取到的主控板的状态信息无效时,确定主控板处于不在位状态,其中,状态信息包括所述主控板的存储器件的地址、数据以及应答消息中的至少之一,主控板的存储器件为主控板通信总线下挂的存储器件。
可选地,通过获取主控板的电平信号,判断获取到的电平信号是否为高电平信号,其中,在获取到的电平信号为高电平信号时,确定主控板处于不在位状态。具体来说,控制器通过通信总线在背板端为电阻上拉状态,在主控板端为接地状态时,当主控板在位时,控制器读取对应比特位为低电平信号;当主控板不在位时,控制器读取对应比特位为高电平信号,即控制器读取对应的比特位为高电平信号时,确定主控板处于不在位状态。
步骤S50,在所述主控板处于在位状态时,检测所述主控板是否发生故障。
在本实施例中,在检测到主控板处于在位状态时,即获取到的主控板的状态信息有效时或者获取到的主控板的电平信号为低电平信号时,控制器检测主控板是否发生故障。控制器通过接收主控板发送的心跳信号,确定预设时长内是否连续接收到心跳信号,若在预设时长内未连续接收到心跳信号,确定主控板发生故障,其中,心跳信号可选为脉冲信号,预设时长根据实际需要确定,本实施例对此不作限定。
具体地,当控制器判断主控板在位之后,控制器通过通信总线读取各主控板下发的心跳信号,主控板在正常运行的时候,向控制器连续发送固定频率的脉冲信号,称为主控板的心跳。在主控板出现重大故障时,向控制器发送的心跳信号停止,控制器无法连续在规定的时间内接收到来自主控板的心跳信号,则判断该主控板发生故障。
在本实施例中,参照图11,图11为本发明实施例方案涉及的检测主控板是否在位或者发生故障的算法流程图,如图11所示,在控制器的使能信号引脚使能时,控制器读取主控板的状态信息(存储器件的地址、数据以及应答消息中的至少之一)或者控制器读取主控板的电平信号,判断主控板的状态信息是否有效或者主控板的电平信号是否为低电平,在主控板的状态信息无效或者主控板的电平信号为高电平时,确定主控板处于不在位状态,在主控板的状态信息有效或者主控板的电平信号为低电平时,确定主控板在位,此时,控制器读取主控板的心跳信号,判断预设时长内是否连续读取到主控板的心跳信号,若在预设时长内未连续读取到主控板的心跳信号,确定主控板发生故障,否则主控板无异常。
进一步地,在确定主控板处于不在位状态或者发生故障时,控制器向各个业务板发送MSU_FAULT信号(主控板异常信号),以通知业务板对待转发的报文进行缓存,待转发的报文可选为优先级较高的重要报文,例如QoS(Quality of Service,服务质量)等优先级高的重要报文,保证在恢复业务前,重要报文不会丢失。
本实施例提供的技术方案中,通过检测主控板是否处于不在位状态或者检测主控板是否发生故障。这样,本方案可以及时确定主控板是否处于在位状态或者发生故障,以及时执行冗余控制策略。
参照图4,图4为本发明通信设备的控制方法实施例三的流程示意图,基于实施例一,上述S30的步骤之后或者同时包括:
步骤S60,断开管理平面与所述主控板的连接;
步骤S70,控制所述管理平面与所述临时主控板连接,以使所述管理平面通过所述临时主控板进行平面管理。
在本实施例中,控制器在断开业务板与主控板的连接,控制业务板与临时主控板连接之后或者同时,控制器通过管理平面的多路复用器断开管理平面与主控板的连接,控制管理平面与临时主控板连接,以使管理平面通过临时主控板进行平面管理,其中,平面管理包括风扇调速策略、功耗管理、状态监控监控和告警系统中的至少之一。需要说明的是,图4中的步骤S60和步骤S70位于步骤S30之后,图4中步骤的先后顺序只是一种可选的实施方式,本实施例随此不作限定。
本实施例提供的技术方案中,通过断开管理平面与临时主控板的连接,然后控制管理平面与临时主控板连接,以使管理平面通过临时主控板进行平面管理,可以解决主控板处于不在位状态或者发生故障时,通信设备的管理平面断开的问题。
参照图5,图5为本发明通信设备的控制方法实施例四的流程示意图,基于实施例一,上述S10的步骤包括:
步骤S11,确定控制器的使能信号引脚是否使能;
在本实施例中,使能信号引脚为控制器的通信设备的HRR_SW_CTRL(Highreliability redundant switching control,高可靠性冗余交换控制功能)信号引脚,在控制器的使能信号引脚使能时,控制器才会执行高可靠性冗余交换控制功能。通信设备出厂默认设置HRR_SW_CTRL引脚为高电平,即默认为关闭控制器的高可靠性冗余交换控制功能。可以通过web客户端、指令配置操作、控制器寄存器写操作进行改变HRR_SW_CTRL信号引脚的电平状态。
在本实施例中,控制器通过获取使能信号引脚的电平信号,判断获取到的电平信号是否为低电平信号来判断使能信号引脚是否使能。
步骤S12,在所述使能信号引脚使能,且在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数,其中,所述性能参数包括CPU内核数、CPU内核最大工作主频、背板上行端口带宽以及槽位号信息中的至少之一。
在本实施例中,在使能信号引脚使能时,即获取到的使能信号引脚的电平信号为低电平信号时,执行在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务办的性能参数的步骤,具体可参考上述实施例一步骤S10的内容,在此不再赘述。
本实施例提供的技术方案中,通过确定控制器的使能信号引脚是否使能,可以进一步提高本方案通信设备的控制方法的可靠性。
基于上述实施例,本发明还提供了一种通信设备的控制装置,上述通信设备的控制装置包括:
获取模块,用于在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数,其中,所述性能参数包括CPU内核数、CPU内核最大工作主频、背板上行端口带宽以及槽位号信息中的至少之一;
确定模块,用于根据所述性能参数在所述业务板中确定临时主控板;
控制模块,用于断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接,以使各个所述业务板通过所述临时主控板进行报文转发。
基于上述实施例,本发明还提供了一种通信设备,上述通信设备可以包括主控板、业务板、冗余背板、管理平面、存储器、处理器及存储在上述存储器上并可在上述处理器上运行的通信设备的控制程序,上述处理器执行上述通信设备的控制程序时,实现如上述任一实施例所述的通信设备的控制方法的步骤。
基于上述实施例,本发明还提供一种计算机可读存储介质,其上存储有通信设备的控制程序,上述通信设备的控制程序被处理器执行时实现如上述任一实施例所述的通信设备的控制方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (15)
1.一种通信设备的控制方法,其特征在于,所述通信设备的控制方法包括:
在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数,其中,所述性能参数包括CPU内核数、CPU内核最大工作主频、背板上行端口带宽以及槽位号信息中的至少之一;
根据所述性能参数在所述业务板中确定临时主控板;
断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接,以使各个所述业务板通过所述临时主控板进行报文转发。
2.如权利要求1所述的通信设备的控制方法,其特征在于,所述获取主控板连接的各个业务板的性能参数的步骤之前包括:
检测所述主控板是否处于不在位状态;
在所述主控板处于在位状态时,检测所述主控板是否发生故障。
3.如权利要求2所述的通信设备的控制方法,其特征在于,所述检测所述主控板是否处于不在位状态的步骤包括:
获取各个所述主控板的状态信息,其中,所述状态信息包括所述主控板的存储器件的地址、数据以及应答消息中的至少之一;
判断所述状态信息是否有效,其中,在所述状态信息无效时,确定所述主控板处于不在位状态。
4.如权利要求2所述的通信设备的控制方法,其特征在于,所述检测所述主控板是否处于不在位状态的步骤包括:
获取所述主控板的电平信号;
判断所述电平信号是否为高电平信号,其中,在所述电平信号为高电平信号时,确定所述主控板处于不在位状态。
5.如权利要求2所述的通信设备的控制方法,其特征在于,所述检测所述主控板是否发生故障的步骤包括:
接收所述主控板发送的心跳信号;
确定在预设时长内是否连续接收到所述心跳信号,其中,在预设时长内未连续接收到所述心跳信号时,确定所述主控板发生故障。
6.如权利要求1所述的通信设备的控制方法,其特征在于,所述断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接的步骤之后或者同时还包括:
断开管理平面与所述主控板的连接;
控制所述管理平面与所述临时主控板连接,以使所述管理平面通过所述临时主控板进行平面管理。
7.如权利要求1所述的通信设备的控制方法,其特征在于,所述断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接,以使各个所述业务板通过所述临时主控板进行报文转发的步骤之后包括:
在检测到所述主控板的状态恢复后,断开所述业务板与所述临时主控板的连接,控制所述业务板与所述主控板连接,以使各个所述业务板通过所述主控板进行报文转发。
8.如权利要求1所述的通信设备的控制方法,其特征在于,所述在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数的步骤之前包括:
确定控制器的使能信号引脚是否使能;
在所述使能信号引脚使能时,执行所述在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数的步骤。
9.如权利要求1所述的通信设备的控制方法,其特征在于,所述通信设备的控制方法还包括:
在所述主控板处于不在位状态或者发生故障时,向各个所述业务板发送主控板异常信号,以使各个所述业务板缓存待转发的报文。
10.一种通信设备,其特征在于,所述通信设备的包括:
获取模块,用于在主控板处于不在位状态或者发生故障时,获取主控板连接的各个业务板的性能参数,其中,所述性能参数包括CPU内核数、CPU内核最大工作主频、背板上行端口带宽以及槽位号信息中的至少之一;
确定模块,用于根据所述性能参数在所述业务板中确定临时主控板;
控制模块,用于断开所述业务板与所述主控板的连接,控制所述业务板与所述临时主控板连接,以使各个所述业务板通过所述临时主控板进行报文转发。
11.一种通信设备,其特征在于,所述通信设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的通信设备的控制程序,所述通信设备的控制程序被所述处理器执行时实现如权利要求1~9中任一项所述的通信设备的控制方法的步骤。
12.如权利要求11所述的通信设备,其特征在于,所述通信设备还包括依次设置的业务板槽位、冗余背板、主控板槽位以及管理平面,所述管理平面通过所述冗余背板与所述业务板槽位选择性连接或者断开,所述管理平面通过所述冗余背板与所述主控板槽位选择性连接或者断开。
13.如权利要求12所述的通信设备,其特征在于,所述业务板槽位上设有多个业务板,所述主控板槽位上设有多个主控板,所述冗余背板上设有多个高速多路复用器以及低速多路复用器,所述多个业务板之间、所述多个主控板之间以及所述多个高速多路复用器之间通过通信总线连接,每一所述业务板通过所述高速多路复用器与所述主控板选择性连接或者断开,每一所述业务板通过所述高速多路复用器与其他所述业务板选择性连接或者断开,所述管理平面通过所述低速多路复用器与所述业务板槽位以及所述主控板槽位选择性连接或者断开。
14.如权利要求13所述的通信设备,其特征在于,所述冗余背板上还设有控制器,所述控制器通过通信总线与所述高速多路复用器、所述低速多路复用器、所述主控板以及所述业务板连接。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有通信设备的控制程序,所述通信设备的控制程序被处理器执行时实现如权利要求1~9中任一项所述的通信设备的控制方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110440228.2A CN113193995A (zh) | 2021-04-22 | 2021-04-22 | 通信设备及其控制方法和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110440228.2A CN113193995A (zh) | 2021-04-22 | 2021-04-22 | 通信设备及其控制方法和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113193995A true CN113193995A (zh) | 2021-07-30 |
Family
ID=76978110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110440228.2A Pending CN113193995A (zh) | 2021-04-22 | 2021-04-22 | 通信设备及其控制方法和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113193995A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101064649A (zh) * | 2007-02-02 | 2007-10-31 | 华为技术有限公司 | 选举超级节点、搜索网络节点或资源的方法、装置及系统 |
CN101188549A (zh) * | 2007-11-27 | 2008-05-28 | 中兴通讯股份有限公司 | 降低m2pa数据丢失的方法及判断mtp3是否发生故障的方法 |
CN101656757A (zh) * | 2009-09-24 | 2010-02-24 | 杭州华三通信技术有限公司 | 一种业务控制处理的方法和系统 |
CN101977139A (zh) * | 2010-07-28 | 2011-02-16 | 北京星网锐捷网络技术有限公司 | 路由转发实现装置、方法及交换设备 |
WO2011079658A1 (zh) * | 2009-12-29 | 2011-07-07 | 中兴通讯股份有限公司 | 一种实现业务主备切换的装置及方法 |
CN203482216U (zh) * | 2013-09-24 | 2014-03-12 | 浙江大华系统工程有限公司 | 一种网络设备 |
CN104038359A (zh) * | 2013-03-06 | 2014-09-10 | 中兴通讯股份有限公司 | 虚拟交换堆叠系统的管理方法及装置 |
CN105471610A (zh) * | 2014-09-05 | 2016-04-06 | 中兴通讯股份有限公司 | 一种使用多板卡保护HQoS的方法和装置 |
CN105871743A (zh) * | 2015-01-21 | 2016-08-17 | 杭州迪普科技有限公司 | 聚合端口状态协商方法以及装置 |
CN107612754A (zh) * | 2017-10-30 | 2018-01-19 | 新华三技术有限公司 | 双向转发链路故障检测方法、装置及网络节点设备 |
CN110213176A (zh) * | 2019-06-28 | 2019-09-06 | 北京东土军悦科技有限公司 | 交换机的报文处理方法、装置、设备及介质 |
CN111585835A (zh) * | 2020-04-20 | 2020-08-25 | 深圳市信锐网科技术有限公司 | 一种带外管理系统的控制方法、装置和存储介质 |
-
2021
- 2021-04-22 CN CN202110440228.2A patent/CN113193995A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101064649A (zh) * | 2007-02-02 | 2007-10-31 | 华为技术有限公司 | 选举超级节点、搜索网络节点或资源的方法、装置及系统 |
CN101188549A (zh) * | 2007-11-27 | 2008-05-28 | 中兴通讯股份有限公司 | 降低m2pa数据丢失的方法及判断mtp3是否发生故障的方法 |
CN101656757A (zh) * | 2009-09-24 | 2010-02-24 | 杭州华三通信技术有限公司 | 一种业务控制处理的方法和系统 |
WO2011079658A1 (zh) * | 2009-12-29 | 2011-07-07 | 中兴通讯股份有限公司 | 一种实现业务主备切换的装置及方法 |
CN101977139A (zh) * | 2010-07-28 | 2011-02-16 | 北京星网锐捷网络技术有限公司 | 路由转发实现装置、方法及交换设备 |
CN104038359A (zh) * | 2013-03-06 | 2014-09-10 | 中兴通讯股份有限公司 | 虚拟交换堆叠系统的管理方法及装置 |
CN203482216U (zh) * | 2013-09-24 | 2014-03-12 | 浙江大华系统工程有限公司 | 一种网络设备 |
CN105471610A (zh) * | 2014-09-05 | 2016-04-06 | 中兴通讯股份有限公司 | 一种使用多板卡保护HQoS的方法和装置 |
CN105871743A (zh) * | 2015-01-21 | 2016-08-17 | 杭州迪普科技有限公司 | 聚合端口状态协商方法以及装置 |
CN107612754A (zh) * | 2017-10-30 | 2018-01-19 | 新华三技术有限公司 | 双向转发链路故障检测方法、装置及网络节点设备 |
CN110213176A (zh) * | 2019-06-28 | 2019-09-06 | 北京东土军悦科技有限公司 | 交换机的报文处理方法、装置、设备及介质 |
CN111585835A (zh) * | 2020-04-20 | 2020-08-25 | 深圳市信锐网科技术有限公司 | 一种带外管理系统的控制方法、装置和存储介质 |
Non-Patent Citations (1)
Title |
---|
方黎: "主备双冗余网络交换机研究", 《信息安全与技术》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2663038B1 (en) | Switch chip port management method, main control board, switch board, and system | |
EP3036873B1 (en) | Dedicated control path architecture for stacked packet switches | |
CN101917337B (zh) | 路由器集群中板间互联的装置及方法 | |
CN112491700B (zh) | 网络路径调整方法、系统、装置、电子设备及存储介质 | |
KR102569484B1 (ko) | 패브릭들 기반 시스템들 상의 불휘발성 메모리 익스프레스의 인터-섀시 관리성을 지원하기 위한 시스템들 및 방법들 | |
CN111343019B (zh) | 一种重连方法、装置和存储介质 | |
US20200136959A1 (en) | Method, Device, and System for Implementing MUX Machine | |
CN111585835B (zh) | 一种带外管理系统的控制方法、装置和存储介质 | |
US9100336B2 (en) | Method for managing a switch chip port, main control board, switch board, and system | |
CN112134775B (zh) | 一种交换机环路检测方法和装置 | |
CN113193995A (zh) | 通信设备及其控制方法和计算机可读存储介质 | |
CN113038299A (zh) | 一种交换机、配置方法、控制方法以及存储介质 | |
CN110912817A (zh) | 一种非管理型交换机链路聚合的产测方法 | |
CN114189471B (zh) | 跨设备链路聚合组主备配置方法、系统、终端及存储介质 | |
CN114979036A (zh) | 一种基于心跳和隔离交换矩阵的网闸的双机热备系统 | |
CN114585009A (zh) | Upf双机热备切换方法、装置、电子设备及存储介质 | |
EP3627766B1 (en) | Method and system for switching between active bng and standby bng | |
CN113497753A (zh) | 一种跨设备链路聚合方法及系统 | |
CN112671549A (zh) | 一种数据处理方法、设备及系统 | |
CN113805788B (zh) | 一种分布式存储系统及其异常处理方法和相关装置 | |
CN115396385B (zh) | 堆叠交换机快速恢复业务的方法、装置及计算设备 | |
JP4035820B2 (ja) | 回線切替装置及びデータ伝送システム及び回線切替方法 | |
CN115134215A (zh) | 一种服务器bmc动态网络联动管理方法及管理系统 | |
CN115996191A (zh) | 端口状态控制方法、装置、网络通信设备及存储介质 | |
KR100603600B1 (ko) | 라우터 프로세서의 제어 경로 구성을 위한 스위칭 장치 및그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210730 |
|
RJ01 | Rejection of invention patent application after publication |