CN104683153B - 一种集群路由器主备mpu控制方法及其系统 - Google Patents

一种集群路由器主备mpu控制方法及其系统 Download PDF

Info

Publication number
CN104683153B
CN104683153B CN201510102342.9A CN201510102342A CN104683153B CN 104683153 B CN104683153 B CN 104683153B CN 201510102342 A CN201510102342 A CN 201510102342A CN 104683153 B CN104683153 B CN 104683153B
Authority
CN
China
Prior art keywords
mpu
backup
message
active
standby
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510102342.9A
Other languages
English (en)
Other versions
CN104683153A (zh
Inventor
陈健强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Bohai IOT Technology Co., Ltd
Original Assignee
Foshan City Light Dispatch Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan City Light Dispatch Network Co Ltd filed Critical Foshan City Light Dispatch Network Co Ltd
Priority to CN201510102342.9A priority Critical patent/CN104683153B/zh
Publication of CN104683153A publication Critical patent/CN104683153A/zh
Application granted granted Critical
Publication of CN104683153B publication Critical patent/CN104683153B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种集群路由器主备MPU控制方法及其系统,其中,所述方法包括:A、机框启动,记录初始主MPU和备份顺序,B、接收两个或两个以上的MPU申请改变为主MPU的请求,C、批准所述两个或两个以上MPU为临时主MPU,D、向初始主MPU发送确认是否故障的请求报文,E、当初始主MPU发出工作正常的回复报文时,向其余备份MPU发出抑制报文,禁止备份MPU向转发单板发出控制报文。通过设置额外的判断机制,在背板阻塞时协调主备MPU的切换,使得路由器有其仅有一个主MPU进行工作,保证了集群路由器的稳定运行。

Description

一种集群路由器主备MPU控制方法及其系统
技术领域
本发明涉及通信技术领域,尤其涉及一种集群路由器主备MPU控制方法及其系统。
背景技术
目前已有的集群路由器基本上为多机框互联的集群路由器结构。集群路由器的每个机框由主控板(Main Processing Unit,简称MPU)管理。为了保证系统的可靠性,采用主MPU配合多个备份MPU的形式来管理系统。机框中的MPU的主备角色一般由机框启动时的处理器(Central Processing Unit,简称CPU)通过一定的算法仲裁来确定,并且不会进行改变。而主备MPU之间通过心跳报文感知对端机框中MPU的状态,该心跳报文在主备MPU的处理器之间传递,当某一端的MPU中的处理器在一段时间内接收不到对端MPU中的处理器发送的心跳报文时,就认为对端MPU的状态异常,从而触发系统主、备MPU的重新部署。
例如,当主MPU和备MPU之间的心跳报文收发正常时,认为对端MPU正常,保持自己的角色不变。在一段时间内,备MPU一直收不到主MPU发送的心跳报文时,就认为主MPU出现了故障,需要采取相应的动作(例如自己升为主用MPU);类似地,在一段时间内,当主MPU持续接收不到备MPU发送的心跳报文时,主MPU也需要采取相应的部署操作(例如该机框中还存在其它备份MPU时,重新选出一个备份MPU作为备MPU)。
现有技术主备MPU之间依赖路由器连接各个MPU的背板传递心跳报文,心跳报文需要依赖MPU中的处理器产生和处理,由于在路由器背板上还同时存在还有其他控制报文,所以如果在该通道上突然传递其它大量控制报文时,可能会导致该通道拥塞,也可能因此导致短暂丢失心跳报文,而使得主备两端的MPU接收不到心跳报文。此时由于背板通道拥塞,导致多个备份MPU收不到其它MPU的心跳报文,则备份MPU均会需要采取相应的动作(例如自己升为主用MPU),此时,路由器会同时存在多个主MPU,导致路由瞬间主MPU过多,转发单板将收到多份主MPU的控制命令,容易使得转发单板容易发生异常冲突。
因此,现有技术还有待发展。
发明内容
鉴于上述现有技术的不足之处,本发明的目的在于提供一种集群路由器主备MPU控制方法及其系统,旨在解决现有技术中,当背板通道阻塞时容易出现多个主MPU,导致转发单板出现异常冲突的问题。
为了达到上述目的,本发明采取了以下技术方案:
一种集群路由器主备MPU控制方法,其中,所述方法包括:A、机框启动,记录初始主MPU和备份顺序,B、接收两个或两个以上的MPU申请改变为主MPU的请求,C、批准所述两个或两个以上MPU为临时主MPU,D、向初始主MPU发送确认是否故障的请求报文,E、当初始主MPU发出工作正常的回复报文时,向其余备份MPU发出抑制报文,禁止备份MPU向转发单板发出控制报文。
所述的集群路由器主备MPU控制方法,其中,所述方法还包括:F、当初始主MPU发出出现故障的回复报文时,依据备份顺序,依次向备份MPU发送确认是否故障的请求报文,G、接收各备份MPU的回复报文,确定备份顺序中第一个非故障备份MPU,H、禁止所述第一个非故障备份MPU外的其他备份MPU向转发单板发送控制报文。
所述的集群路由器主备MPU控制方法,其中,在步骤H之后还包括,步骤H1、将所述第一个非故障备份MPU变为主MPU,H2、转发单板接收所述第一个非故障备份MPU的控制报文并完成相应的操作。
所述的集群路由器主备MPU控制方法,其中,所述步骤B具体包括:B1、当背板通道拥塞时,两个或两个以上的MPU检测接收不到其他MPU的心跳报文,B2、所述接收不到其他MPU心跳报文的MPU发出申请改变为主MPU的请求,B3、接收所述多个申请改变为主MPU的请求。
一种集群路由器主备MPU控制系统,其中,所述系统包括记录模块,用于在机框启动时,记录初始主MPU和备份顺序,主备切换控制器,所述主备切换控制器包括:接收模块,用于收两个或两个以上的MPU申请改变为主MPU的请求,批准模块,用于批准所述两个或两个以上MPU为临时主MPU,请求报文发送模块,用于向初始主MPU发送确认是否故障的请求报文,抑制报文发送模块,用于当初始主MPU发出工作正常的回复报文时,向其余备份MPU发出抑制报文,禁止备份MPU向转发单板发出控制报文。
所述的集群路由器主备MPU控制系统,其中,所述请求报文发送模块还用于,当初始主MPU发出出现故障的回复报文时,依据备份顺序,依次向备份MPU发送确认是否故障的请求报文,所述主备切换控制器还包括报文接收模块,用于接收各备份MPU的回复报文,确定备份顺序中第一个非故障备份MPU,所述抑制报文发送模块还用于,禁止所述第一个非故障备份MPU外的其他备份MPU向转发单板发送控制报文。
所述的集群路由器主备MPU控制系统,其中,所述主备切换控制器还用于,将所述第一个非故障备份MPU变为主MPU;所述控制系统还包括转发单板,所述转发单板用于接收所述第一个非故障备份MPU的控制报文并完成相应的操作。
所述的集群路由器主备MPU控制系统,其中,所述接收模块具体包括:心跳报文检测单元,用于当背板通道拥塞时,两个或两个以上的MPU检测接收不到其他MPU的心跳报文,改变请求发送单元,用于所述接收不到其他MPU心跳报文的MPU发出申请改变为主MPU的请求,接收单元,用于接收所述多个申请改变为主MPU的请求。
有益效果:本发明提供的一种集群路由器主备MPU控制方法及其系统,通过设置额外的判断机制,在背板阻塞时协调主备MPU的切换,使得路由器有其仅有一个主MPU进行工作,保证了集群路由器的稳定运行。
附图说明
图1为本发明的一种集群路由器主备MPU控制方法的具体实施例的方法流程图。
图2为本发明的一种集群路由器主备MPU控制系统的具体实施例的结构框图。
具体实施方式
本发明提供一种集群路由器主备MPU控制方法及其系统。为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
图1为本发明的一种集群路由器主备MPU控制方法的具体实施例。
如图1所示,所述方法包括:
S100、机框启动,记录初始主MPU和备份顺序。
S200、接收两个或两个以上的MPU申请改变为主MPU的请求。
S300、批准所述两个或两个以上MPU为临时主MPU。
能够保证路由器的正常运行,以避免无MPU工作的情况发生。
S400、向初始主MPU发送确认是否故障的请求报文。
初始主MPU在接收到所述请求报文后,会将自身是否故障的具体情况以回复报文的方式发送,若回复报文表示初始主MPU工作正常,则执行步骤S500。若初始主MPU回复报文表示故障,则执行步骤S600。
S500、向其余备份MPU发出抑制报文,禁止备份MPU向转发单板发出控制报文。
S600、寻找任一非故障的备份MPU升为主MPU。当然,可以使用任何合适的方法完成对非故障备份MPU的寻找。
具体的,所述步骤S600可以采用如下方法:首先,依据备份顺序,依次向备份MPU发送确认是否故障的请求报文。然后,接收各备份MPU的回复报文,确定备份顺序中第一个非故障备份MPU。最后,禁止所述第一个非故障备份MPU外的其他备份MPU向转发单板发送控制报文,从而确定非故障MPU并将其升为主MPU。上述方法简单易行,具有良好的鲁棒性。
更具体的,在确定非故障MPU后还包括:将所述第一个非故障备份MPU变为主MPU。然后,转发单板接收所述第一个非故障备份MPU的控制报文并完成相应的操作。
较佳的是,所述步骤S200具体包括:首先,当背板通道拥塞时,两个或两个以上的MPU检测接收不到其他MPU的心跳报文。然后,所述接收不到其他MPU心跳报文的MPU发出申请改变为主MPU的请求,最后,接收所述多个申请改变为主MPU的请求。
以下为采用本发明所述方法,实现保证机框有且仅有一个主MPU存在的具体实施例。
机框启动,记录下当前的MPU主备情况和备份板顺序。
当出现背板通道拥塞时,会导致多个MPU均收不到其他MPU的心跳报文,各个MPU向主备切换控制器发出请求,申请自己为主MPU。
为了保障路由器能继续运行,向各个MPU批准为临时主MPU,各MPU均向转发单板发送控制报文。此时控制报文的优先级依据主MPU,第一备MPU,第二备MPU顺序,逐一地向个转发单板发出。
同时,向故障前的主MPU发出请求报文,确定主MPU是否发生故障。若主MPU发出回复报文表示正常,则向其余各备份单板发出抑制报文,告知备份MPU不要再发控制报文。若主MPU真的发生故障,则按照记录,向第一备份MPU发出请求报文,确定主第一备份MPU是否发生故障,若第一备份MPU发出回复报文表示正常,则向其余各备份单板发出抑制报文,告知备份MPU不要再发控制报文。以此类推,直到找到新的主MPU为止。
本发明还提供了一种集群路由器主备MPU控制系统,如图2所示,所述系统包括记录模块100,用于在机框启动时,记录初始主MPU10和备份顺序(即图中所示第一备份MPU20,第二备份MPU30),主备切换控制器200,所述主备切换控制器包括:接收模块210,用于收两个或两个以上的MPU申请改变为主MPU的请求,批准模块220,用于批准所述两个或两个以上MPU为临时主MPU,请求报文发送模块230,用于向初始主MPU发送确认是否故障的请求报文,抑制报文发送模块240,用于当初始主MPU发出工作正常的回复报文时,向其余备份MPU发出抑制报文,禁止备份MPU向转发单板发出控制报文。如图所示,所述记录模块100也可以整合到主备切换控制器200中。当然,所述备份MPU可以依据实际情况设置为多个,所述各MPU之间通过背板通信通道40连接。
具体的,所述请求报文发送模块230还用于,当初始主MPU发出出现故障的回复报文时,依据备份顺序,依次向备份MPU发送确认是否故障的请求报文。
所述主备切换控制器200还包括报文接收模块,用于接收各备份MPU的回复报文,确定备份顺序中第一个非故障备份MPU。
所述抑制报文发送模块240还用于,禁止所述第一个非故障备份MPU外的其他备份MPU向转发单板发送控制报文。
所述的集群路由器主备MPU控制系统,其中,所述主备切换控制器还用于,将所述第一个非故障备份MPU变为主MPU;所述控制系统还包括转发单板,所述转发单板用于接收所述第一个非故障备份MPU的控制报文并完成相应的操作。
更具体的,所述接收模块220具体包括:心跳报文检测单元,用于当背板通道拥塞时,两个或两个以上的MPU检测接收不到其他MPU的心跳报文,改变请求发送单元,用于所述接收不到其他MPU心跳报文的MPU发出申请改变为主MPU的请求,接收单元,用于接收所述多个申请改变为主MPU的请求。
综上所述,本发明提供的一种集群路由器主备MPU控制方法及其系统,通过设置额外的判断机制,在背板阻塞时协调主备MPU的切换,使得路由器有其仅有一个主MPU进行工作,保证了集群路由器的稳定运行。
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及本发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

Claims (8)

1.一种集群路由器主备MPU控制方法,其特征在于,所述方法包括:A、机框启动,记录初始主MPU和备份顺序,B、接收两个或两个以上的MPU申请改变为主MPU的请求,C、批准所述两个或两个以上MPU为临时主MPU,D、向初始主MPU发送确认是否故障的请求报文,E、当初始主MPU发出工作正常的回复报文时,向其余备份MPU发出抑制报文,禁止备份MPU向转发单板发出控制报文。
2.根据权利要求1所述的集群路由器主备MPU控制方法,其特征在于,所述方法还包括:F、当初始主MPU发出出现故障的回复报文时,依据备份顺序,依次向备份MPU发送确认是否故障的请求报文,G、接收各备份MPU的回复报文,确定备份顺序中第一个非故障备份MPU,H、禁止所述第一个非故障备份MPU外的其他备份MPU向转发单板发送控制报文。
3.根据权利要求2所述的集群路由器主备MPU控制方法,其特征在于,在步骤H之后还包括,步骤H1、将所述第一个非故障备份MPU变为主MPU,H2、转发单板接收所述第一个非故障备份MPU的控制报文并完成相应的操作。
4.根据权利要求1所述的集群路由器主备MPU控制方法,其特征在于,所述步骤B具体包括:B1、当背板通道拥塞时,两个或两个以上的MPU接收不到其他MPU的心跳报文,B2、所述接收不到其他MPU心跳报文的MPU发出申请改变为主MPU的请求,B3、接收多个申请改变为主MPU的请求,所述背板通道用于连接各MPU。
5.一种集群路由器主备MPU控制系统,其特征在于,所述系统包括记录模块和主备切换控制器,所述记录模块,用于在机框启动时,记录初始主MPU和备份顺序,所述主备切换控制器包括:接收模块、批准模块、请求报文发送模块和抑制报文发送模块,所述接收模块,用于接收两个或两个以上的MPU申请改变为主MPU的请求;所述批准模块,用于批准所述两个或两个以上MPU为临时主MPU;所述请求报文发送模块,用于向初始主MPU发送确认是否故障的请求报文;所述抑制报文发送模块,用于当初始主MPU发出工作正常的回复报文时,向其余备份MPU发出抑制报文,禁止备份MPU向转发单板发出控制报文。
6.根据权利要求5所述的集群路由器主备MPU控制系统,其特征在于,所述请求报文发送模块还用于,当初始主MPU发出出现故障的回复报文时,依据备份顺序,依次向备份MPU发送确认是否故障的请求报文,
所述主备切换控制器还包括报文接收模块,用于接收各备份MPU的回复报文,确定备份顺序中第一个非故障备份MPU,
所述抑制报文发送模块还用于,禁止所述第一个非故障备份MPU外的其他备份MPU向转发单板发送控制报文。
7.根据权利要求6所述的集群路由器主备MPU控制系统,其特征在于,所述主备切换控制器还用于,将所述第一个非故障备份MPU变为主MPU;所述控制系统还包括转发单板,所述转发单板用于接收所述第一个非故障备份MPU的控制报文并完成相应的操作。
8.根据权利要求5所述的集群路由器主备MPU控制系统,其特征在于,所述接收模块具体包括:改变请求发送单元和接收单元,当背板通道拥塞时,两个或两个以上的MPU接收不到其他MPU的心跳报文;所述改变请求发送单元,用于所述接收不到其他MPU心跳报文的MPU发出申请改变为主MPU的请求;所述接收单元,用于接收多个申请改变为主MPU的请求,所述背板通道用于连接各MPU。
CN201510102342.9A 2015-03-09 2015-03-09 一种集群路由器主备mpu控制方法及其系统 Active CN104683153B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510102342.9A CN104683153B (zh) 2015-03-09 2015-03-09 一种集群路由器主备mpu控制方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510102342.9A CN104683153B (zh) 2015-03-09 2015-03-09 一种集群路由器主备mpu控制方法及其系统

Publications (2)

Publication Number Publication Date
CN104683153A CN104683153A (zh) 2015-06-03
CN104683153B true CN104683153B (zh) 2019-03-05

Family

ID=53317780

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510102342.9A Active CN104683153B (zh) 2015-03-09 2015-03-09 一种集群路由器主备mpu控制方法及其系统

Country Status (1)

Country Link
CN (1) CN104683153B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110391928B (zh) * 2018-04-20 2022-01-18 华为技术有限公司 一种使用电子开关执行主备切换的通信方法和设备
CN110356228A (zh) * 2019-06-20 2019-10-22 浙江众泰汽车制造有限公司 一种汽车仪表系统及其控制方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4991254B2 (ja) * 2006-11-17 2012-08-01 株式会社東芝 二重リング・ネットワークの通信制御方法及び二重リング・ネットワークの伝送局
CN101483540A (zh) * 2008-01-11 2009-07-15 上海博达数据通信有限公司 一种高端数据通信设备中的主备倒换方法
CN101232357B (zh) * 2008-02-27 2011-05-18 北京佳讯飞鸿电气股份有限公司 一种实现主备板卡倒换的方法及装置
CN203482216U (zh) * 2013-09-24 2014-03-12 浙江大华系统工程有限公司 一种网络设备
CN104394012B (zh) * 2014-11-12 2018-06-26 北京华为数字技术有限公司 集群路由器、mpu及其故障的确定方法、感知控制器

Also Published As

Publication number Publication date
CN104683153A (zh) 2015-06-03

Similar Documents

Publication Publication Date Title
US20220075698A1 (en) Method and Apparatus for Redundancy in Active-Active Cluster System
US5574863A (en) System for using mirrored memory as a robust communication path between dual disk storage controllers
CN105607590B (zh) 用于在过程控制系统中提供冗余性的方法和装置
US8732380B2 (en) System and method for using a multipath
US20060271815A1 (en) System and method for disaster recovery of data
US20100228960A1 (en) Virtual memory over baseboard management controller
US20120023278A1 (en) Expander to control multipaths in a storage network
JP5703201B2 (ja) 冗長制御装置およびネットワークシステム
CN104683153B (zh) 一种集群路由器主备mpu控制方法及其系统
EP2787699A1 (en) Data transmission method, device, and system
US20220129402A1 (en) Automatic switching system and method of front-end processor
US20100107000A1 (en) Active Link Verification For Failover Operations In A Storage Network
JP2010152643A (ja) データ転送装置、データ記憶装置及び方法
US10367887B2 (en) Data storage system and data storage method thereof
CN110413322A (zh) 一种服务器网口管理方法、系统以及基板管理控制器
WO2017181778A1 (zh) 一种双主控设备主控之间链路扩展方法及装置
CN107590032A (zh) 存储集群故障转移的方法及存储集群系统
JP2007304700A (ja) 2重化ノードシステムのアドレス管理システム及び方法
CN102081579A (zh) 双控制器存储设备的缓存镜像系统及方法
JP2005056347A (ja) サーバ機能引継方法およびサーバ機能引継プログラム
US7587628B2 (en) System, method and computer program product for copying data
JP2006262144A (ja) 制御装置、記憶装置、制御方法、およびプログラム
JP5606598B1 (ja) 通信システム及び通信方法
JP6901677B2 (ja) 管理プログラム、管理装置および管理方法
JP5870174B1 (ja) データ送信システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190102

Address after: 528000, 2 floor 209, block C, building 21, F2 complex, district B, Foshan, Guangdong, China (residence declaration)

Applicant after: Foshan City Light dispatch network Co., Ltd.

Address before: 528000 No. 23 people's thirty-two lane, southwest Street, Sanshui District, Foshan, Guangdong

Applicant before: Chen Jianqiang

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201201

Address after: 5F, 8 Xuzhou Road, Heping District, Tianjin

Patentee after: Tianjin Bohai IOT Technology Co., Ltd

Address before: 528000, 2 floor 209, block C, building 21, F2 complex, district B, Foshan, Guangdong, China (residence declaration)

Patentee before: FOSHAN QINGQIAN NETWORK Co.,Ltd.