CN105530121B - 一种主从管理板切换控制方法及装置 - Google Patents
一种主从管理板切换控制方法及装置 Download PDFInfo
- Publication number
- CN105530121B CN105530121B CN201510882215.5A CN201510882215A CN105530121B CN 105530121 B CN105530121 B CN 105530121B CN 201510882215 A CN201510882215 A CN 201510882215A CN 105530121 B CN105530121 B CN 105530121B
- Authority
- CN
- China
- Prior art keywords
- slot position
- board
- management board
- management
- position information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0659—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
Abstract
本发明提供一种主从管理板切换控制方法及装置,该方法包括:针对与第一管理板通过带外通路连接的每个板卡,第一管理板通过对应的带外通路向该板卡发送心跳报文;确定在预设时长内未收到该板卡返回的心跳响应报文时,确定第一管理板与该板卡之间的带外通路异常,并记录该带外通路异常的板卡的槽位;周期性统计所有带外通路异常的板卡的槽位,作为第一类槽位信息;接收第二管理板发送的第二类槽位信息,第二槽位信息为第二管理板周期性统计的所有带外通路异常的板卡的槽位;根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制。本发明解决了在带外通路异常情况下,无法进行主从管理板切换的问题,进而在一定程度上避免了网络中断的问题。
Description
技术领域
本发明涉及网络通信技术领域,尤其涉及一种主从管理板切换控制方法及装置。
背景技术
热备是HA(High Available,高可用性群集)高可用性的一种实现机制。在安装两块管理板的设备上,其中一块作为当前正常使用的管理板称为“(全局)主管理板”,另一块作为从管理板,主管理板和从管理板分别与其他板卡通过带内通路连接。当主管理板发生故障时,主从切换将自动进行。从管理板将自动连接并控制系统的BUS(总线),同时原来的主管理板将断开和系统BUS的连接。主从切换完成后,原从管理板将成为主管理板,而原主管理板将重新启动成为从管理板。从管理板不参与设备的管理,而是监控主管理板的运行状态,并接收主管理板同步的信息。
目前,热备系统的管理帧与数据帧和协议帧是分开传输的,数据帧和协议帧通过带内通路传输,管理帧通过带外通路传输,因此带外通道承载的是设备内部的管理报文。主管理板、从管理板以及其他板卡间带外通路部署具体为:系统中的主管理板与从管理板之间有一条带外通路,主管理板与其他板卡之间各有一条带外通路,从管理板也与其他板卡间各有一条带外通路。
当前主从管理板只能检测带内通路是否异常,并在带内通路异常时触发主从管理板切换,无法确定主管理板和从管理板或者主管理板与其他板卡之间的带外通路的是否异常。当主管理板与其它板卡间的带外通路异常,带内通路正常时,主从管理板间的热备信息还能正常交付,此时从管理板认为主管理板还是正常状态,不需要进行主从管理板切换。实际上,此时管理板与其它板卡间的带外通路异常,且不会进行主从管理板切换,导致主管理板无法正常向其他板卡发送管理帧,从而出现主管理板承载的网络业务中断的问题。
发明内容
本发明提供一种主从管理板切换控制方法,用以解决在主管理板与板卡间的带外通路异常情况下,无法进行主从管理板切换而导致的主管理板无法正常向其他板卡发送管理帧所带来的网络业务中断的问题。
一种主从管理板切换控制方法,包括:
针对与第一管理板通过带外通路连接的每个板卡,第一管理板通过对应的带外通路向该板卡发送心跳报文;
确定在预设时长内未收到该板卡返回的心跳响应报文时,确定第一管理板与该板卡之间的带外通路异常,并记录该带外通路异常的板卡的槽位;
周期性统计所有带外通路异常的板卡的槽位,作为第一类槽位信息;以及,
接收第二管理板发送的第二类槽位信息,所述第二槽位信息为第二管理板周期性统计的所有带外通路异常的板卡的槽位;
根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制。
所述方法中,根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制,具体包括:
确定第一类槽位信息中的槽位个数等于第二类槽位信息中的槽位个数时,不进行主从管理板切换。
本发明实施例,第一类槽位信息中的槽位个数等于第二类槽位信息中的槽位个数时,说明第一管理板对应的异常带外通路个数与第二管理对应的异常带外通路个数相同,此时不管第一管理板为主管理板还是从管理板,都不进行组从管理板的切换。
所述方法中,根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制,具体包括:
确定第一类槽位信息中的槽位个数大于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板;
如果是,第一管理板切换为从管理板;
否则,不进行主从管理板切换。
本发明实施例,当第一管理板为主管理板,且第一管理板统计的带外通路异常的板卡的槽位个数大于第二管理板统计的带外通路异常的板卡的槽位个数时,说明第一管理板需要切换为从管理板。
所述方法中,根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制,具体包括:
确定第一类槽位信息中的槽位个数小于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板;
如果是,不进行管理板切换;
如果否,第一管理板切换为主管理板。
本发明实施例,当第一管理板为从管理板,且第一管理板统计的带外通路异常的板卡的槽位个数小于第二管理板统计的带外通路异常的板卡的槽位个数时,说明第一管理板需要切换为主管理板。
所述方法,还包括:
通过与第二管理板之间的带外通路向第二管理板发送心跳报文;
在所述预设时长内未接收到第二管理板返回的心跳响应报文时,确定第一管理板与第二管理板之间的带外通路异常,并将第二管理板的槽位添加到所述第一类槽位信息中,其中,第一管理板与第二管理板之间的带外通路异常时,第二类槽位信息还包括第一管理板的槽位。
所述方法中,根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制,具体包括:
确定第一类槽位信息中包括第二管理板的槽位以及所有板卡的槽位时,复位第一管理板。
本发明实施例,第一管理板与第二管理板之间的带外通路异常,并且,第一管理板与所有板卡的带外通路均异常时,说明第一管理板自身出现问题需要复位第一管理板,并且,如果此时第一管理板为主管理板时,需要切换为从管理板。
所述方法中,所述心跳报文采用如下方式生成:
在管理帧的报文头中的Type字段编辑用于表示所述管理帧为心跳报文的标识,并,在所述管理帧的报文内容中的source slot字段编辑第一管理板的槽位、slot bmp字段编辑所述心跳报文的目的板卡的槽位,得到所述心跳报文。
本发明还提供一种主从管理板切换控制装置,包括:
发送单元,用于针对与第一管理板通过带外通路连接的每个板卡,第一管理板通过对应的带外通路向该板卡发送心跳报文;
确定单元,用于确定在预设时长内未收到该板卡返回的心跳响应报文时,确定第一管理板与该板卡之间的带外通路异常,并记录该带外通路异常的板卡的槽位;
统计单元,用于周期性统计所有带外通路异常的板卡的槽位,作为第一类槽位信息;
接收单元,用于接收第二管理板发送的第二类槽位信息,所述第二槽位信息为第二管理板周期性统计的所有带外通路异常的板卡的槽位;
控制单元,用于根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制。
所述装置中,所述控制单元具体用于:
确定第一类槽位信息中的槽位个数等于第二类槽位信息中的槽位个数时,不进行主从管理板切换。
所述装置中,所述控制单元具体用于:
确定第一类槽位信息中的槽位个数大于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板;
如果是,第一管理板切换为从管理板;
否则,不进行主从管理板切换。
所述装置中,所述控制单元具体用于:
确定第一类槽位信息中的槽位个数小于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板;
如果是,不进行管理板切换;
如果否,第一管理板切换为主管理板。
所述装置中,所述发送单元还用于,通过与第二管理板之间的带外通路向第二管理板发送心跳报文;
所述确定单元还用于,在所述预设时长内未接收到第二管理板返回的心跳响应报文时,确定第一管理板与第二管理板之间的带外通路异常,并将第二管理板的槽位发送给统计单元;
所述统计单元还用于,将所述确定单元发送的第二管理板的槽位添加到所述第一类槽位信息中;
其中,第一管理板与第二管理板之间的带外通路异常时,第二类槽位信息还包括第一管理板的槽位。
所述装置中,所述控制单元还用于:
确定第一类槽位信息中包括第二管理板的槽位以及所有板卡的槽位时,复位第一管理板。
所述装置,还包括:
生成单元,用于采用如下方式生成所述心跳报文:
在管理帧的报文头中的Type字段编辑用于表示所述管理帧为心跳报文的标识,并,在所述管理帧的报文内容中的source slot字段编辑第一管理板的槽位、slot bmp字段编辑所述心跳报文的目的板卡的槽位,得到所述心跳报文。
利用本发明实施例提供的主从管理板切换控制方法及装置,具有以下有益效果:第一管理板通过对应的带外通路向板卡发送心跳报文,以是否收到心跳报文来判断带外通路是否异常,统计所有带外通路异常的板卡的槽位,并结合第二管理板统计的所有带外通路异常的板卡的槽位进行主从管理板的切换控制,从而解决了现有技术中由于不能检测带外通路是否异常而导致的在带外通路异常情况下,无法进行主从管理板切换的问题,进而在一定程度上避免了网络业务中断的问题。
附图说明
图1为本发明实施例提供的主从管理板切换控制方法流程图;
图2为本发明实施例提供的管理板与板卡通过带外通路连接的示意图;
图3为本发明实施例提供的进行主从管理板切换控制的一种实施方式流程图;
图4为本发明实施例提供的进行主从管理板切换控制的另一实施方式流程图;
图5为本发明实施例提供的管理帧格式示意图;
图6为本发明实施例提供的主从管理板切换控制装置示意图。
具体实施方式
下面结合附图和实施例对本发明提供的主从管理板切换控制方法及装置进行更详细地说明。
本发明实施例提供一种主从管理板切换控制方法,如图1所示,包括:
步骤101,针对与第一管理板通过带外通路连接的每个板卡,第一管理板通过对应的带外通路向该板卡发送心跳报文。
具体的,心跳报文中携带第一管理板的槽位,还可以携带板卡的槽位,此时,第一管理板的槽位相当该心跳报文的源槽位,该板卡的槽位相当于目的槽位。其中,管理板或者板卡插在机箱上的卡槽中,槽位具体指机箱上卡槽的标识。
本发明实施例中的板卡不包括管理板,如图2所示,第一管理板(CM1)与每个板卡(LC1、LC2及LC3)通过带外通路连接,并与第二管理板(CM2)通过带外通路连接,第二管理板与每个板卡通过带外通路连接。第一管理板通过带外通路向板卡或者第二管理板发送管理帧,本发明实施例中第一管理板为主管理板时,第二管理板为从管理板,第一管理板为从管理板时,第二管理板为主管理板。由图2可知,每个板卡对应一条带外通路,每个板卡通过与该板卡对应的带外通路与第一管理板连接,针对每个板卡,第一管理板通过与该板卡对应的带外通路向该板卡发送心跳报文。图2中的1、2、3、4、5、6、7分别表示不同的带外通路对应的编号。
优选地,第一管理板每间隔500ms向各个板卡发送一次心跳报文,进一步优选地,第一管理板在同一时刻向各个板卡发送心跳报文。
具体的,第二管理板在向各个板卡发送心跳报文时,可以与第一管理板在同一时刻向各个板卡发送心跳报文。
步骤102,确定在预设时长内未收到该板卡返回的心跳响应报文时,确定第一管理板与该板卡之间的带外通路异常,并记录该带外通路异常的板卡的槽位。
具体的,第一管理板向板卡发送心跳报后,如果第一管理板与该板卡之间的带外通路正常,会在预设时长内收到该板卡通过带外通路返回的心跳响应报文,此时确定该板卡与第一管理板之间的带外通路正常,如果在预设时长内未收到该板卡通过带外通路返回的心跳响应报文,则认为该板卡与第一管理板之间的带外通路异常,并且,第一管理板记录该带外通路异常的板卡的槽位。各个板卡返回的心跳响应报文中携带该板卡的槽位,还可以携带第一管理板的槽位,针对心跳响应报文来说,第一管理板的槽位相当于目的槽位,发送该心跳响应报文的板卡的槽位相当于源槽位。
优选地,预设时长为10ms。也可以为其它值,这里不做限定。
步骤103,周期性统计所有带外通路异常的板卡的槽位,作为第一类槽位信息。
具体的,第一管理板统计所有带外通路异常的板卡的槽位,作为第一类槽位信息,即,该第一类槽位信息中包括所有带外通路异常的板卡的槽位。其中每个板卡对应一个槽位、第一管理板以及第二管理板各对应一个槽位。本统计周期的第一类槽位信息需要根据本统计周期统计得到的所有带外通路异常的板卡的槽位进行更新,即,本统计周期的第一类槽位信息包括本统计周期统计到的所有带外通路异常的板卡的槽位,不包括本统计周期之前的统计周期内统计得到的所有带外通路异常的板卡的槽位。
统计所有带外通路异常的板卡的槽位,具体包括:第一管理板根据所有板卡的槽位以及接收到的心跳响应报文中携带的板卡的槽位,确定未接收到心跳响应报文的板卡的槽位,将这些槽位确定为带外通路异常的板卡的槽位。
优选地,可通过在第一管理板上设置计数器来统计所有带外通路异常的板卡的个数:
第一管理板侧设置一计数器,计数器的初始值可设为1,第一管理板每在预设时长内接收到一个心跳响应报文该计数器的值就加1,第一管理板每隔一定时长判断计数器的值,到达第一管理板判断计数器值的时刻时,第一管理板根据计数器的取值以及在本发送心跳报文的周期内发送出去的心跳报文的个数,计算得到带外通路异常的板卡的个数。或者将该计数器的初始值设为板卡的个数,第一管理板每在预设时长内接收到一个心跳响应报文该计数器的值就减1,到达第一管理板判断计数器值的时刻时,计数器的值为带外通路异常的板卡的个数。
优选地,每间隔500ms统计所有带外通路异常的板卡的槽位,作为第一类槽位信息。
步骤104,接收第二管理板发送的第二类槽位信息,所述第二类槽位信息为第二管理板统计的所有带外通路异常的板卡的槽位。
该步骤104也可在步骤101之前执行,也可在步骤101和步骤102之间执行,也可在步骤102和步骤103之间执行。
具体的,第二管理板也统计与第二管理板之间的带外通路异常的板卡的槽位,并将所有带外通路异常的板卡的槽位作为第二类槽位信息发送给第一管理板。具体的,第二管理板统计与第二管理板之间的带外通路异常的板卡的槽位的方式与第一管理板相同,参见步骤101-步骤104。
步骤105,根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制。
具体的,第二管理板接收第一管理板发送的第一类槽位信息,根据其自身统计的第二类槽位信息,以及接收到的第一类槽位信息,进行主从管理板切换控制,具体切换控制方式可参见第一管理板进行主从切换控制的方式。
本发明实施例,第一管理板通过对应的带外通路向板卡发送心跳报文,以是否收到心跳响应报文来判断带外通路是否异常,统计所有带外通路异常的板卡的槽位,并结合第二管理板统计的所有带外通路异常的板卡的槽位进行主从管理板的切换控制,从而解决了现有技术中由于不能检测带外通路是否异常而导致的在带外通路异常情况下,无法进行主从管理板切换的问题,进而在一定程度上避免了网络业务中断的问题。本发明实施例在带外通路异常的情况下,可进行主从管理板的切换控制,从而保证网络业务不中断。
本发明实施例提供的各个板卡均已插入对应槽位,并且处于非初始化状态的板卡。
作为第一种实施方式,步骤105根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制,具体包括:
确定第一类槽位信息中的槽位个数等于第二类槽位信息中的槽位个数时,不进行主从管理板切换。
具体的,第一类槽位信息中的槽位个数等于第二类槽位信息中的槽位个数时,说明第一管理板对应的异常带外通路个数与第二管理板对应的异常带外通路个数相同,此时不管第一管理板为主管理板还是从管理板,都不进行主从管理板的切换,即不进行主从管理板切换控制。
其中,当第一类槽位信息中的槽位个数等于第二类槽位信息中槽位个数,并且,第一类槽位信息中的槽位与第二类槽位信息中的槽位相同时,复位该槽位对应的板卡,该应用场景中的槽位不包括第二管理板的槽位。
作为第二种实施方式,步骤105根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制,如图3所示,具体包括:
步骤301,确定第一类槽位信息中的槽位个数大于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板,如果是,执行步骤302,否则,执行步骤303。
步骤302,第一管理板切换为从管理板。
具体的,对第一管理板进行复位,第一管理板复位时,第二管理板会自动切换为主管理板,优选地,复位第一管理板,第一管理板复位后,第一管理板为从管理板。
步骤303,不进行主从管理板切换。
优选地,复位第一管理板。
本发明实施例,当第一管理板为主管理板,且第一管理板统计的带外通路异常的板卡的槽位个数大于第二管理板统计的带外通路异常的板卡的槽位个数时,说明第一管理板需要切换为从管理板。通过复位第一管理板,可使由于第一管理板导致的异常的带外通路恢复正常。
作为第三种实施方式,步骤105根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制,如图4所示,具体包括:
步骤401,确定第一类槽位信息中的槽位个数小于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板,如果是,执行步骤402,否则,执行步骤403。
步骤402,不进行主从管理板切换。
步骤403,第一管理板切换为主管理板。
本发明实施例,当第一管理板为从管理板,且第一管理板统计的带外通路异常的板卡的槽位个数小于第二管理板统计的带外通路异常的板卡的槽位个数时,说明第一管理板需要切换为主管理板。
本发明实施例能够确定第一管理板与第二管理板之间的带外通路是否异常。
上述各种实施方式中,确定第一管理板为主管理板时,第二管理板为从管理板,确定第一管理板为从管理板时,第二管理板为主管理板。
进一步地,第一管理板通过与第二管理板之间的带外通路向第二管理板发送心跳报文;
在所述预设时长内未接收到第二管理板返回的心跳响应报文时,确定第一管理板与第二管理板之间的带外通路异常,并将第二管理板的槽位添加到所述第一类槽位信息中,其中,第一管理板与第二管理板之间的带外通路异常时,第二类槽位信息还包括第一管理板的槽位。
本发明实施例能够确定第一管理板与第二管理板之间的带外通路是否异常。具体的,第一管理板与第二管理板之间的带外通路正常情况下,当第一管理板与所有板卡之间的带外通路均正常时,该第一类槽位信息为空,或者,不生成该第一类槽位信息;当第二管理板与所有板卡之间的带外通路均正常时,该第二类槽位信息为空,或者,不生成该第二类槽位信息。
第一管理板与第二管理板之间的带外通路异常情况下,第一类槽位信息还包括第二管理板的槽位,第二类槽位信息还包括第一管理板的槽位,此时,当第一管理板与所有板卡之间的带外通路均正常时,该第一类槽位信息仅包括第二管理板的槽位;当第二管理板与所有板卡之间的带外通路均正常时,该第二类槽位信息仅包括第一管理板的槽位。
第一管理板和第二管理板之间的带外通路异常时,第一管理板的第一类槽位信息中记录第二管理板的槽位,第二管理板的第二类槽位信息相应也记录第一管理板的槽位。则根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制,具体包括:
确定第一类槽位信息中包括第二管理板的槽位以及所有板卡的槽位时,复位第一管理板。此时,不管第一管理板是否为主管理板,均复位第一管理板,如果此时第一管理板为主管理板,那么在第一管理板复位时,第二管理板自动切换为主管理板。其中,所有板卡的槽位为所有与第一管理板通过带外通路连接的板卡的槽位。
本发明实施例中,第一管理板与第二管理板之间的带外通路异常,并且,第一管理板与所有板卡的带外通路均异常时,说明第一管理板自身出现问题,如果此时第一管理板为主管理板则复位第一管理板,复位后的第一管理板为从管理板,如果此时第一管理板为从管理板则直接复位第一管理板。
本发明实施例实施的基础为:第二管理板以及所有板卡均已插入对应的槽位且均处于非初始化状态,即,第二管理板以及所有板卡均在位。
具体的,上述各实施例中,第一管理板根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制的时机为:确定第一管理板和第二管理板在上电后的初次主从选举完成,并且二者在上电后的初次热备完成后,进行主从管理板切换控制。这样可以防止第一管理板和第二管理板上电后还未完成批量热备就进行主从管理板切换控制所带来的整机复位的问题。
第二管理板根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制的时机与第一管理板相同,这里不再赘述。
优选地,所述心跳报文采用如下方式生成:
在管理帧的报文头中的Type字段编辑用于表示所述管理帧为心跳报文的标识,并,在所述管理帧的报文内容中的source slot字段编辑第一管理板(源管理板)的槽位、slot bmp字段编辑所述心跳报文的目的板卡的槽位,得到所述心跳报文。
具体的,向第二管理板发送的心跳报文的生成方式为:在管理帧的报文头中的Type字段编辑用于表示管理帧为心跳报文的标识,并,在管理帧的报文内容中的sourceslot字段编辑第一管理板(源管理板)的槽位,该心跳报文的slot bmp字段编辑第二管理板的槽位,得到该心跳报文。
板卡返回的心跳响应报文的生成方式为:在管理帧的报文头中的Type字段编辑用于表示管理帧为心跳响应报文的标识,并在管理帧的报文内容中的source slot字段编辑发送该心跳响应报文的板卡的槽位,slot bmp字段编辑第一管理板的槽位。
具体的,第二管理板向第一管理板返回的心跳响应报文的生成方式为:在管理帧的报文头中的Type字段编辑用于表示管理帧为心跳响应报文的标识,并,在管理帧的报文内容中的source slot字段编辑第二管理板的槽位,该心跳报文的slot bmp字段编辑第一管理板的槽位,得到该心跳响应报文。
具体的,心跳报文的格式如图5所示,其中,将心跳报文的标识编辑在管理帧的Type字段,用于确定该管理帧是否为心跳报文,具体将Type字段设为与其它类型的报文不同的数值,比如心跳报文的标识为1,即Type字段为1表示该管理帧为心跳报文。图5中的source slot字段代表了发送心跳报文的第一管理板的槽位,slot bmp字段表示接收心跳报文的板卡的槽位或者第二管理板的槽位。该心跳报文中还可添加其它解释说明性的字段,比如TTL表示心跳报文的生存时间,本发明实施例优选将TTL字段设为1,bmp bytes字段表示目前已插入对应槽位且处于非初始状态的板卡的个数,比如bmp bytes字段为:01001011,表示当前已插入对应槽位且处于非初始状态的板卡的个数为4(即bmp bytes字段中1的个数),slot num表示管理板所属机箱的总槽位个数,该字段只允许主管理板设置,version字段表示版本号。
具体的,心跳响应报文的格式与心跳报文的格式类似,只是心跳响应报文中的Type字段中编辑的为心跳响应报文的标识,比如该标识为2,source slot字段代表发送心跳响应报文的板卡的槽位或者第二管理板的槽位,slot bmp字段表示接收心跳响应报文的管理板(本发明实施例为第一管理板)的槽位,其它字段的内容与心跳报文相同。
基于与本发明实施例提供的主从管理板切换控制方法同样的发明构思,本发明实施例还提供一种主从管理板切换控制装置,如图6所示,包括:
发送单元601,用于针对与第一管理板通过带外通路连接的每个板卡,第一管理板通过对应的带外通路向该板卡发送心跳报文;
确定单元602,用于确定在预设时长内未收到该板卡返回的心跳响应报文时,确定第一管理板与该板卡之间的带外通路异常,并记录该带外通路异常的板卡的槽位;
统计单元603,用于周期性统计所有带外通路异常的板卡的槽位,作为第一类槽位信息;
接收单元604,用于接收第二管理板发送的第二类槽位信息,所述第二槽位信息为第二管理板周期性统计的所有带外通路异常的板卡的槽位;
控制单元605,用于根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制。
所述装置中,所述控制单元具体用于:
确定第一类槽位信息中的槽位个数等于第二类槽位信息中的槽位个数时,不进行主从管理板切换。
所述装置中,所述控制单元具体用于:
确定第一类槽位信息中的槽位个数大于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板;
如果是,第一管理板切换为从管理板;
否则,不进行主从管理板切换。
所述装置中,所述控制单元具体用于:
确定第一类槽位信息中的槽位个数小于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板;
如果是,不进行管理板切换;
如果否,第一管理板切换为主管理板。
所述装置中,所述发送单元还用于,通过与第二管理板之间的带外通路向第二管理板发送心跳报文;
所述确定单元还用于,在所述预设时长内未接收到第二管理板返回的心跳响应报文时,确定第一管理板与第二管理板之间的带外通路异常,并将第二管理板的槽位发送给统计单元;
所述统计单元还用于,将所述确定单元发送的第二管理板的槽位添加到所述第一类槽位信息中;
其中,第一管理板与第二管理板之间的带外通路异常时,第二类槽位信息还包括第一管理板的槽位。
所述装置中,所述控制单元还用于:
确定第一类槽位信息中包括第二管理板的槽位以及所有板卡的槽位时,复位第一管理板。
所述装置,还包括:
生成单元,用于采用如下方式生成所述心跳报文:
在管理帧的报文头中的Type字段编辑用于表示所述管理帧为心跳报文的标识,并,在所述管理帧的报文内容中的source slot字段编辑第一管理板的槽位、slot bmp字段编辑所述心跳报文的目的板卡的槽位,得到所述心跳报文。
利用本发明实施例提供的主从管理板切换控制方法及装置,具有以下有益效果:第一管理板通过对应的带外通路向板卡发送心跳报文,以是否收到心跳报文来判断带外通路是否异常,统计所有带外通路异常的板卡的槽位,并结合第二管理板统计的所有带外通路异常的板卡的槽位进行主从管理板的切换控制,从而解决了现有技术中由于不能检测带外通路是否异常而导致的在带外通路异常情况下,无法进行主从管理板切换的问题,进而在一定程度上避免了网络业务中断的问题。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种主从管理板切换控制方法,其特征在于,包括:
针对与第一管理板通过带外通路连接的每个板卡,第一管理板通过对应的带外通路向该板卡发送心跳报文;
确定在预设时长内未收到该板卡返回的心跳响应报文时,确定第一管理板与该板卡之间的带外通路异常,并记录该带外通路异常的板卡的槽位;
周期性统计与第一管理板相连的所有带外通路异常的板卡的槽位,作为第一类槽位信息;以及,
接收第二管理板发送的第二类槽位信息,所述第二类槽位信息为第二管理板周期性统计的与第二管理板相连的所有带外通路异常的板卡的槽位;
根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制;
其中,根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制,具体包括:
确定第一类槽位信息中的槽位个数等于第二类槽位信息中的槽位个数时,不进行主从管理板切换;或者,
确定第一类槽位信息中的槽位个数大于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板;
如果是,第一管理板切换为从管理板;
否则,不进行主从管理板切换;或者,
确定第一类槽位信息中的槽位个数小于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板;
如果是,不进行管理板切换;
如果否,第一管理板切换为主管理板。
2.如权利要求1所述的方法,其特征在于,还包括:
通过与第二管理板之间的带外通路向第二管理板发送心跳报文;
在所述预设时长内未接收到第二管理板返回的心跳响应报文时,确定第一管理板与第二管理板之间的带外通路异常,并将第二管理板的槽位添加到所述第一类槽位信息中,其中,第一管理板与第二管理板之间的带外通路异常时,第二类槽位信息还包括第一管理板的槽位。
3.如权利要求2所述的方法,其特征在于,根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制,具体包括:
确定第一类槽位信息中包括第二管理板的槽位以及所有板卡的槽位时,复位第一管理板。
4.如权利要求1所述的方法,其特征在于,所述心跳报文采用如下方式生成:
在管理帧的报文头中的Type字段编辑用于表示所述管理帧为心跳报文的标识,并,在所述管理帧的报文内容中的source slot字段编辑第一管理板的槽位、slot bmp字段编辑所述心跳报文的目的板卡的槽位,得到所述心跳报文。
5.一种主从管理板切换控制装置,其特征在于,包括:
发送单元,用于针对与第一管理板通过带外通路连接的每个板卡,第一管理板通过对应的带外通路向该板卡发送心跳报文;
确定单元,用于确定在预设时长内未收到该板卡返回的心跳响应报文时,确定第一管理板与该板卡之间的带外通路异常,并记录该带外通路异常的板卡的槽位;
统计单元,用于周期性统计与第一管理板相连的所有带外通路异常的板卡的槽位,作为第一类槽位信息;
接收单元,用于接收第二管理板发送的第二类槽位信息,所述第二类槽位信息为第二管理板周期性统计的与第二管理板相连的所有带外通路异常的板卡的槽位;
控制单元,用于根据第一类槽位信息和第二类槽位信息,进行主从管理板切换控制;
其中,所述控制单元具体用于:
确定第一类槽位信息中的槽位个数等于第二类槽位信息中的槽位个数时,不进行主从管理板切换;或者,
确定第一类槽位信息中的槽位个数大于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板;
如果是,第一管理板切换为从管理板;
否则,不进行主从管理板切换;或者,
确定第一类槽位信息中的槽位个数小于第二类槽位信息中的槽位个数时,判断第一管理板是否为主管理板;
如果是,不进行管理板切换;
如果否,第一管理板切换为主管理板。
6.如权利要求5所述的装置,其特征在于,
所述发送单元还用于,通过与第二管理板之间的带外通路向第二管理板发送心跳报文;
所述确定单元还用于,在所述预设时长内未接收到第二管理板返回的心跳响应报文时,确定第一管理板与第二管理板之间的带外通路异常,并将第二管理板的槽位发送给统计单元;
所述统计单元还用于,将所述确定单元发送的第二管理板的槽位添加到所述第一类槽位信息中;
其中,第一管理板与第二管理板之间的带外通路异常时,第二类槽位信息还包括第一管理板的槽位。
7.如权利要求6所述的装置,其特征在于,所述控制单元还用于:
确定第一类槽位信息中包括第二管理板的槽位以及所有板卡的槽位时,复位第一管理板。
8.如权利要求5所述的装置,其特征在于,还包括:
生成单元,用于采用如下方式生成所述心跳报文:
在管理帧的报文头中的Type字段编辑用于表示所述管理帧为心跳报文的标识,并,在所述管理帧的报文内容中的source slot字段编辑第一管理板的槽位、slot bmp字段编辑所述心跳报文的目的板卡的槽位,得到所述心跳报文。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510882215.5A CN105530121B (zh) | 2015-12-03 | 2015-12-03 | 一种主从管理板切换控制方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510882215.5A CN105530121B (zh) | 2015-12-03 | 2015-12-03 | 一种主从管理板切换控制方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105530121A CN105530121A (zh) | 2016-04-27 |
CN105530121B true CN105530121B (zh) | 2018-12-14 |
Family
ID=55772125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510882215.5A Active CN105530121B (zh) | 2015-12-03 | 2015-12-03 | 一种主从管理板切换控制方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105530121B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106254149B (zh) * | 2016-09-14 | 2019-06-14 | 锐捷网络股份有限公司 | 一种判断板卡被拔出的方法及管理板 |
CN107070731B (zh) * | 2017-06-22 | 2020-02-18 | 迈普通信技术股份有限公司 | 一种主从仲裁方法及系统 |
CN110336701B (zh) * | 2019-07-11 | 2022-03-01 | 超越科技股份有限公司 | 一种高密度双路服务器管理方法及系统 |
CN110908947A (zh) * | 2019-11-26 | 2020-03-24 | 杭州迪普科技股份有限公司 | 框式设备线卡的热插拔方法、装置、主控板及框式设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1878088A (zh) * | 2006-03-07 | 2006-12-13 | 华为技术有限公司 | 热备维护系统及热备维护和故障切换的方法 |
CN101150430A (zh) * | 2007-09-17 | 2008-03-26 | 中兴通讯股份有限公司 | 一种通过心跳机制实现网络接口板倒换的方法 |
CN101989927A (zh) * | 2010-10-20 | 2011-03-23 | 华为技术有限公司 | 一种冗余倒换的处理方法、装置及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101635646B (zh) * | 2009-06-24 | 2012-11-28 | 中兴通讯股份有限公司 | 主/备板卡的倒换方法及系统 |
-
2015
- 2015-12-03 CN CN201510882215.5A patent/CN105530121B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1878088A (zh) * | 2006-03-07 | 2006-12-13 | 华为技术有限公司 | 热备维护系统及热备维护和故障切换的方法 |
CN101150430A (zh) * | 2007-09-17 | 2008-03-26 | 中兴通讯股份有限公司 | 一种通过心跳机制实现网络接口板倒换的方法 |
CN101989927A (zh) * | 2010-10-20 | 2011-03-23 | 华为技术有限公司 | 一种冗余倒换的处理方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN105530121A (zh) | 2016-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105530121B (zh) | 一种主从管理板切换控制方法及装置 | |
CN109104351B (zh) | 列车网络节点和基于CANopen协议的列车网络节点监测方法 | |
CN101511042B (zh) | 一种同步数据的方法及其装置 | |
CN101729305A (zh) | 故障自动恢复的方法、系统和控制网元 | |
CN107682191B (zh) | 一种电力调度网络信息集中管控方法及系统 | |
CN110830324A (zh) | 一种检测数据中心网络连通性的方法、装置及电子设备 | |
CN108881001A (zh) | 基于CANopen协议和以太网协议进行数据转换的网关和方法 | |
CN105099825B (zh) | 一种外置Bypass的安全保护方法及装置 | |
CN105024798A (zh) | 一种时间同步的方法及装置 | |
JP3902509B2 (ja) | 移動通信システム、及びそれに用いる無線基地局とその無線通信モデムの障害復旧方法 | |
CN111130821B (zh) | 一种掉电告警的方法、处理方法及装置 | |
CN109104325B (zh) | 基于CANopen协议的列车网络数据传输方法、系统及其装置 | |
CN101330343A (zh) | 一种网元内交叉单元倒换状态同步方法 | |
CN112671575B (zh) | 工作链路的切换方法及装置、存储介质、电子装置 | |
CN112118499A (zh) | 光网络单元onu掉电告警方法、装置、设备及存储介质 | |
CN106209337A (zh) | 一种时间同步报文发送频率自适应方法、装置及设备 | |
CN104836679B (zh) | 通信异常处理方法及网元设备 | |
CN110519781A (zh) | Rrc时限调整方法及装置、移动终端及可读存储介质 | |
CN115987999A (zh) | 多机系统的主从竞争方法、装置、arm及存储介质 | |
CN112311671B (zh) | 向交换芯片下发聚合链路配置的方法、装置、介质及设备 | |
CN104486787A (zh) | 一种无线链路故障检测方法及装置 | |
CN105681187A (zh) | 一种虚拟路由器冗余协议vrrp备份组管理方法及相关设备 | |
RU165071U1 (ru) | Модульное устройство контроля и управления сигналами релейной защиты и противоаварийной автоматики | |
CN102821033B (zh) | 一种报文传输方法及装置 | |
CN108990086A (zh) | 一种同步网络告警方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: Cangshan District of Fuzhou City, Fujian province 350002 Jinshan Road No. 618 Garden State Industrial Park 19 floor Patentee after: RUIJIE NETWORKS Co.,Ltd. Address before: Cangshan District of Fuzhou City, Fujian province 350002 Jinshan Road No. 618 Garden State Industrial Park 19 floor Patentee before: Beijing Star-Net Ruijie Networks Co.,Ltd. |
|
CP01 | Change in the name or title of a patent holder |