CN103297279B - 一种多软件进程系统上软件控制的主备单盘倒换方法 - Google Patents
一种多软件进程系统上软件控制的主备单盘倒换方法 Download PDFInfo
- Publication number
- CN103297279B CN103297279B CN201310245789.2A CN201310245789A CN103297279B CN 103297279 B CN103297279 B CN 103297279B CN 201310245789 A CN201310245789 A CN 201310245789A CN 103297279 B CN103297279 B CN 103297279B
- Authority
- CN
- China
- Prior art keywords
- software
- dish
- software process
- finger daemon
- deck
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
本发明涉及一种多软件进程系统上软件控制的主备单盘倒换方法,在各设备单盘上分别创建软件守护进程,用于监控其单盘本地的各软件进程的状态;主备单盘的软件守护进程互相通信,使主用盘的软件守护进程能够获得备用盘的各软件进程的整体状态;主用盘的软件守护进程也与其单盘本地的硬件倒换逻辑通信,在出现软件进程状态异常处理无效,向硬件倒换逻辑发起由于软件异常所导致的倒换申请。本发明所述的主备单盘倒换方法,基于软件控制,软件倒换和硬件倒换结合,以守护进程监控多软件状态,实现多软件系统协同倒换,实现方法简单,成本较低,可实现软件异常导致的主备倒换场景,可以用于存在多软件进程的、需要支持主备倒换的单盘上。
Description
技术领域
本发明涉及通信设备内部的主备单盘倒换,具体说是一种多软件进程系统上软件控制的主备单盘倒换方法。
背景技术
在通信设备中,有些重要的核心单盘,例如控制盘,需要在设备上完成这些单盘的保护倒换。传统的方法是基于硬件实现复杂的单盘保护倒换过程。例如:申请号为200310111916.6、名称为《一种用于通信设备的主备倒换控制方法》的中国发明专利公开了以下技术方案:采用以太网口进行通信,将网口用于主备板之间的通信,用Online信号表示主备板的在位,用GOOD信号表示主备板是否正常工作,用ACTIVE信号指示主备板的主备状态,主备板之间通过网口备份数据。该专利提供的方法采用了硬件实现,实现方法复杂,成本较高,未涉及软件异常导致的主备倒换场景,也没有考虑通过软件与硬件协同实现设备单盘倒换的场景。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种多软件进程系统上软件控制的主备单盘倒换方法,主备单盘倒换基于软件控制,将软件倒换和硬件倒换结合起来,以守护进程监控多软件状态,实现多软件系统协同倒换,并且与硬件倒换逻辑结合,完成主备单盘倒换,实现方法简单,成本较低,可实现软件异常导致的主备倒换场景,不仅可以用于通信设备的控制盘倒换,还可以用于除控制盘外的、其它存在多软件进程的、需要支持主备倒换的单盘上。
为达到以上目的,本发明采取的技术方案是:
一种多软件进程系统上软件控制的主备单盘倒换方法,其特征在于:在需要主备单盘倒换的各个设备单盘上分别创建一个软件守护进程,所述软件守护进程与其单盘本地的各软件进程通信,监控其单盘本地的各软件进程的状态;
主备单盘的软件守护进程互相通信,使主用盘的软件守护进程能够获得备用盘的各软件进程的整体状态;
主用盘的软件守护进程也与其单盘本地的硬件倒换逻辑通信,在主用盘出现软件进程状态异常处理无效并判断备用盘软件进程状态正常后,向硬件倒换逻辑发起由于软件异常所导致的倒换申请。
在上述技术方案的基础上,主用盘的软件守护进程负责监控其单盘本地的各软件进程状态,一旦发现其单盘本地的软件进程状态异常,则主用盘的软件守护进程进行如下的倒换处理:
首先重启处于异常状态的软件进程,若重启能够使对应的软件进程恢复正常,则软件守护进程继续进行软件进程状态的监控;否则软件守护进程判断备用盘的软件进程状态是否正常,当对端软件进程正常时则向主用盘的硬件倒换逻辑发起倒换申请,执行主备单盘倒换。
在上述技术方案的基础上,所述需要主备单盘倒换的设备单盘为存在多软件进程的单盘。
在上述技术方案的基础上,所述存在多软件进程的单盘为存在多软件进程的控制盘。
在上述技术方案的基础上,主用盘实现倒换的工作流程包括以下步骤:
第1步:在主用盘创建并启动软件守护进程,软件守护进程简称为守护进程;
第2步:由主用盘的守护进程监控各主用盘的软件进程的状态,所述主用盘的守护进程通过不断ping主用盘的各个软件进程,从而获取主用盘的各个软件进程的状态;
第3步:主用盘的守护进程判断主用盘的各软件进程的状态是否正常,如果主用盘的所有软件进程的状态都正常,则继续重复执行第2步;否则,只要有任何一个软件进程状态不正常,守护进程就要执行第4步,尝试重启相应的软件进程;
第4步:主用盘的守护进程尝试重启处于异常状态的软件进程N次,N=1、2、3;
第5步:每次重启后,主用盘的守护进程均再次通过不断ping主用盘的各个软件进程,获取主用盘的软件进程的各个状态,并再次判断主用盘的各软件进程的状态是否恢复正常;
如果主用盘的各软件进程的状态正常,则继续执行第2步;否则判断是否已经达到N次重启的限制,若未达到,则继续执行第4步,否则执行第6步;
第6步:主用盘的守护进程判断对端软件状态是否正常,如果对端软件状态均正常,则继续执行第7步;否则执行告警上报给网管;
第7步:主用盘的守护进程向主用盘的硬件倒换逻辑发起软件倒换申请;
第8步:主用盘的硬件倒换逻辑判断对端硬件状态是否正常,如果对端硬件状态正常,就执行设备单盘倒换,否则就拒绝进行倒换。
在上述技术方案的基础上,备用盘实现倒换的工作流程包括以下步骤:
第1步:在备用盘创建并启动软件守护进程,软件守护进程简称为守护进程;
第2步:由备用盘的守护进程监控备用盘的各软件进程的状态,所述备用盘的守护进程通过不断ping备用盘的各个软件进程,从而获取备用盘的各个软件进程的状态;
第3步:备用盘的守护进程判断备用盘的各软件进程的状态是否正常,如果备用盘的所有软件进程的状态都正常,则继续执行第2步;否则执行第4步;
第4步:备用盘的守护进程尝试重启处于异常状态的软件进程N次,N=1、2、3;
第5步:每次重启后,备用盘的守护进程均再次通过不断ping备用盘的各个软件进程,获取备用盘的各个软件进程的状态,并再次判断备用盘的各软件进程的状态是否恢复正常,
如果备用盘的各软件进程的状态正常,则继续执行第2步;否则判断是否已经达到N次重启的限制,若未达到,则继续执行第4步,若N次重启后,还不正常,则通过主备之间的守护进程之间通信,告知主用盘的守护进程。
本发明所述的多软件进程系统上软件控制的主备单盘倒换方法,主备单盘倒换基于软件控制,将软件倒换和硬件倒换结合起来,以守护进程监控多软件状态,实现多软件系统协同倒换,并且与硬件倒换逻辑结合,完成主备单盘倒换,实现方法简单,成本较低,可实现软件异常导致的主备倒换场景,不仅可以用于通信设备的控制盘倒换,还可以用于除控制盘外的、其它存在多软件进程的、需要支持主备倒换的单盘上。
与现有技术相比,本发明的优点如下:
(1)多软件协同设备系统的倒换,即通过软件守护进程,实现多软件协同完成设备倒换。
(2)可以避免由于任一软件不稳定导致的设备单盘主备频繁切换。
附图说明
本发明有如下附图:
图1:系统结构框图,
图2:多软件进程系统上软件控制的主用盘工作流程图,
图3:多软件进程系统上软件控制的备用盘工作流程图。
具体实施方式
以下结合附图对本发明作进一步详细说明。
首先需要说明的是:通常,通信设备内部的控制盘上的软件进程比较多,比如控制盘上有NMU(网络管理单元)、适配层、APS(自动保护倒换)、ACU(ASONControlUnit,ASON控制单元)、SCU(SignalingControlUnit,信令控制单元)等多个软件进程,从而需要增加本发明所描述的软件控制的主备单盘倒换方法;另外,通信设备内部的时钟盘、交叉盘等,他们也需要主备单盘倒换,但是这种倒换完全是硬件控制的,且其单盘上不存在多软件进程,因而不在本发明范围内。
如图1所示,本发明所述的多软件进程系统上软件控制的主备单盘倒换方法,应用在图1所示的系统中,该基于软件控制的通信设备单盘倒换系统,包括:设备主用单盘和设备备用单盘,
设备主用单盘和设备备用单盘上均具有n个软件进程,n大于等于2,
在设备主用单盘和设备备用单盘上分别存在一个软件守护进程,
设备主用单盘和设备备用单盘上的软件守护进程之间可以交互数据,
设备主用单盘和设备备用单盘上的软件守护进程还分别和其单盘本地的硬件倒换逻辑交互数据。
即:在设备主用单盘上有软件守护进程、各个(n个)软件进程、硬件倒换逻辑。在设备备用单盘上也有软件守护进程、各个(n个)软件进程、硬件倒换逻辑。设备备用单盘上的软件进程相对于设备主用盘而言可以称为对端软件进程。
各设备单盘(指设备主用单盘或设备备用单盘)上仅仅有一个软件守护进程,软件守护进程与本设备单盘上(即单盘本地)的其它软件进程通信,同时软件守护进程也与本设备单盘上的硬件倒换逻辑通信。软件守护进程负责监控本设备单盘上的各软件进程状态、监控对端各软件进程状态,一旦本设备单盘上的软件进程状态异常,则守护进程进行倒换处理。需要说明的是:目前单盘的手工倒换,是通过控制命令,让硬件的主备状态倒换,而软件进程是跟随倒换的。本发明中提到的由软件守护进程触发的倒换,不处理其他倒换的情况,仅限于软件进程状态异常导致倒换处理的过程。
本发明所述的多软件进程系统上软件控制的主备单盘倒换方法,在需要主备单盘倒换的各个设备单盘上分别创建一个软件守护进程,所述软件守护进程与其单盘本地的各软件进程(指除软件守护进程之外的其他软件进程)通信,监控其单盘本地的各软件进程的状态;
主备单盘(亦称为主用盘和备用盘)的软件守护进程互相通信,使主用盘的软件守护进程能够获得备用盘的各软件进程的整体状态;同时,主用盘的软件守护进程也与其单盘本地的硬件倒换逻辑通信,在主用盘出现软件进程状态异常处理无效并判断备用盘软件进程状态正常后,向硬件倒换逻辑发起由于软件异常所导致的倒换申请,开始执行主备单盘倒换;
主用盘的软件守护进程负责监控其单盘本地的各软件进程状态,一旦发现其单盘本地的软件进程状态异常,则主用盘的软件守护进程进行如下的倒换处理:
首先重启处于异常状态的软件进程,若重启能够使对应的软件进程恢复正常,则软件守护进程继续进行软件进程状态的监控;否则软件守护进程判断备用盘的软件进程状态是否正常,当对端软件进程正常时则向主用盘的硬件倒换逻辑发起倒换申请,执行主备单盘倒换。
在上述技术方案的基础上,所述需要主备单盘倒换的设备单盘为存在多软件进程的单盘。所述存在多软件进程的单盘可为存在多软件进程的控制盘。
如图2所示,主用盘实现倒换的工作流程包括以下步骤:
第1步:在主用盘创建并启动软件守护进程(简称为守护进程);
第2步:由主用盘的守护进程监控各主用盘的软件进程的状态,所述主用盘的守护进程通过不断ping主用盘的各个软件进程,从而获取主用盘的各个软件进程的状态;
第3步:主用盘的守护进程判断主用盘的各软件进程的状态是否正常,如果主用盘的所有软件进程的状态都正常,则继续重复执行第2步;否则,只要有任何一个软件进程状态不正常,守护进程就要执行第4步,尝试重启相应的软件进程;
第4步:主用盘的守护进程尝试重启处于异常状态的软件进程N次,N=1、2、3,N值可以根据实际情况灵活选择;
第5步:每次重启后,主用盘的守护进程均再次通过不断ping主用盘的各个软件进程,获取主用盘的各个软件进程的状态,并再次判断主用盘的各软件进程的状态是否恢复正常;
如果主用盘的各软件进程的状态正常,则继续执行第2步;否则判断是否已经达到N次重启的限制,若未达到,则继续执行第4步,否则执行第6步;
第6步:主用盘的守护进程判断对端软件状态是否正常,如果对端软件状态均正常,则继续执行第7步;否则执行告警上报给网管;
因为当本地软件进程无法通过重启恢复,同时对端软件状态也不正常,就不能发起倒换,所以需要告警上报网管;
第7步:主用盘的守护进程向主用盘的硬件倒换逻辑发起软件倒换申请;
第8步:主用盘的硬件倒换逻辑判断对端硬件状态是否正常,如果对端硬件状态正常,就执行设备单盘倒换,否则就拒绝进行倒换。
本发明只描述在多软件进程系统上软件控制的主备单盘倒换方法,硬件倒换逻辑的具体实施不在本专利范围内,不再详述。
如图3所示,备用盘实现倒换的工作流程包括以下步骤:
第1步:在备用盘创建并启动软件守护进程(简称为守护进程);
第2步:由备用盘的守护进程监控备用盘的各软件进程的状态,所述备用盘的守护进程通过不断ping备用盘的各个软件进程,从而获取备用盘的各个软件进程的状态;
第3步:备用盘的守护进程判断备用盘的各软件进程的状态是否正常,如果备用盘的所有软件进程的状态都正常,则继续执行第2步;否则执行第4步;
第4步:备用盘的守护进程尝试重启处于异常状态的软件进程N次,N=1、2、3,N值可以根据实际情况灵活选择;
第5步:每次重启后,备用盘的守护进程均再次通过不断ping备用盘的各个软件进程,获取备用盘的各个软件进程的状态,并再次判断备用盘的各软件进程的状态是否恢复正常,
如果备用盘的各软件进程的状态正常,则继续执行第2步;否则判断是否已经达到N次重启的限制,若未达到,则继续执行第4步,若N次重启后,还不正常,则通过主备之间的守护进程之间通信,告知主用盘的守护进程,亦可同时上报告警到网管显示。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (3)
1.一种多软件进程系统上软件控制的主备单盘倒换方法,其特征在于:在需要主备单盘倒换的各个设备单盘上分别创建一个软件守护进程,所述软件守护进程与其单盘本地的各软件进程通信,监控其单盘本地的各软件进程的状态;
主备单盘的软件守护进程互相通信,使主用盘的软件守护进程能够获得备用盘的各软件进程的整体状态;
主用盘的软件守护进程也与其单盘本地的硬件倒换逻辑单元通信,在主用盘出现软件进程状态异常处理无效并判断备用盘软件进程状态正常后,向硬件倒换逻辑单元发起由于软件异常所导致的倒换申请;
主用盘实现倒换的工作流程包括以下步骤:
第1步:在主用盘创建并启动软件守护进程,软件守护进程简称为守护进程;
第2步:由主用盘的守护进程监控各主用盘的各软件进程的状态,所述主用盘的守护进程通过不断ping主用盘的各个软件进程,从而获取主用盘的各个软件进程的状态;
第3步:主用盘的守护进程判断主用盘的各软件进程的状态是否正常,如果主用盘的所有软件进程的状态都正常,则继续重复执行第2步;否则,只要有任何一个软件进程状态不正常,守护进程就要执行第4步,尝试重启相应的软件进程;
第4步:主用盘的守护进程尝试重启处于异常状态的软件进程N次,N等于1、2或3;
第5步:每次重启后,主用盘的守护进程均再次通过不断ping主用盘的各个软件进程,获取主用盘的各软件进程的状态,并再次判断主用盘的各软件进程的状态是否恢复正常;
如果主用盘的各软件进程的状态正常,则继续执行第2步;否则判断是否已经达到N次重启的限制,若未达到,则继续执行第4步,否则执行第6步;
第6步:主用盘的守护进程判断对端软件进程状态是否正常,如果对端软件进程状态均正常,则继续执行第7步;否则执行告警上报给网管;
第7步:主用盘的守护进程向主用盘的硬件倒换逻辑单元发起软件倒换申请;
第8步:主用盘的硬件倒换逻辑单元判断对端硬件状态是否正常,如果对端硬件状态正常,就执行设备单盘倒换,否则就拒绝进行倒换。
2.如权利要求1所述的多软件进程系统上软件控制的主备单盘倒换方法,其特征在于:所述存在多软件进程的单盘为存在多软件进程的控制盘。
3.如权利要求1所述的多软件进程系统上软件控制的主备单盘倒换方法,其特征在于,备用盘实现倒换的工作流程包括以下步骤:
第1步:在备用盘创建并启动软件守护进程,软件守护进程简称为守护进程;
第2步:由备用盘的守护进程监控备用盘的各软件进程的状态,所述备用盘的守护进程通过不断ping备用盘的各个软件进程,从而获取备用盘的各个软件进程的状态;
第3步:备用盘的守护进程判断备用盘的各软件进程的状态是否正常,如果备用盘的所有软件进程的状态都正常,则继续执行第2步;否则执行第4步;
第4步:备用盘的守护进程尝试重启处于异常状态的软件进程N次,N等于1、2或3;
第5步:每次重启后,备用盘的守护进程均再次通过不断ping备用盘的各个软件进程,获取备用盘的各个软件进程的状态,并再次判断备用盘的各软件进程的状态是否恢复正常,
如果备用盘的各软件进程的状态正常,则继续执行第2步;否则判断是否已经达到N次重启的限制,若未达到,则继续执行第4步,若N次重启后,还不正常,则通过主备单盘之间的守护进程通信,告知主用盘的守护进程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310245789.2A CN103297279B (zh) | 2013-06-20 | 2013-06-20 | 一种多软件进程系统上软件控制的主备单盘倒换方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310245789.2A CN103297279B (zh) | 2013-06-20 | 2013-06-20 | 一种多软件进程系统上软件控制的主备单盘倒换方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103297279A CN103297279A (zh) | 2013-09-11 |
CN103297279B true CN103297279B (zh) | 2016-03-23 |
Family
ID=49097627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310245789.2A Active CN103297279B (zh) | 2013-06-20 | 2013-06-20 | 一种多软件进程系统上软件控制的主备单盘倒换方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103297279B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105306289A (zh) * | 2014-06-27 | 2016-02-03 | 中兴通讯股份有限公司 | 一种提高多模块设备可靠性的方法、装置及客户终端设备 |
CN106254534B (zh) * | 2016-09-22 | 2019-04-09 | 南京中新赛克科技有限责任公司 | 基于混合架构的分布式集群监控代理及方法 |
CN106708643B (zh) * | 2016-11-14 | 2020-05-12 | 武汉斗鱼网络科技有限公司 | 异常信息处理方法及装置 |
CN108270634B (zh) * | 2016-12-30 | 2021-08-24 | 中移(苏州)软件技术有限公司 | 一种心跳探测的方法及系统 |
CN113742165A (zh) * | 2021-07-23 | 2021-12-03 | 文华学院 | 双主控设备及主备控制方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101106443A (zh) * | 2007-08-10 | 2008-01-16 | 中兴通讯股份有限公司 | 一种控制主备板倒换的系统和方法 |
CN102388569A (zh) * | 2011-09-15 | 2012-03-21 | 华为技术有限公司 | 主备管理软件的切换方法及系统 |
CN102724013A (zh) * | 2012-07-11 | 2012-10-10 | 烽火通信科技股份有限公司 | 一种光传输设备主控系统主备冗余保护的倒换方法 |
CN102739435A (zh) * | 2011-03-31 | 2012-10-17 | 微软公司 | 作为服务的故障检测与恢复 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005083569A1 (ja) * | 2004-02-26 | 2005-09-09 | Nec Corporation | ネットワーク間のプロセス移動方法およびそのネットワークシステム |
-
2013
- 2013-06-20 CN CN201310245789.2A patent/CN103297279B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101106443A (zh) * | 2007-08-10 | 2008-01-16 | 中兴通讯股份有限公司 | 一种控制主备板倒换的系统和方法 |
CN102739435A (zh) * | 2011-03-31 | 2012-10-17 | 微软公司 | 作为服务的故障检测与恢复 |
CN102388569A (zh) * | 2011-09-15 | 2012-03-21 | 华为技术有限公司 | 主备管理软件的切换方法及系统 |
CN102724013A (zh) * | 2012-07-11 | 2012-10-10 | 烽火通信科技股份有限公司 | 一种光传输设备主控系统主备冗余保护的倒换方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103297279A (zh) | 2013-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103297279B (zh) | 一种多软件进程系统上软件控制的主备单盘倒换方法 | |
EP2798782B1 (en) | Technique for handling a status change in an interconnect node | |
CN102394787B (zh) | 基于epa交换机的双链路冗余控制方法 | |
WO2016058307A1 (zh) | 资源的故障处理方法及装置 | |
CN103442035B (zh) | 一种空管自动化系统的双网热备冗余实现方法 | |
EP2458797A1 (en) | Method, device and system for updating ring network topology information | |
CN105915426B (zh) | 环形网络的故障恢复方法及装置 | |
CN105933253A (zh) | 一种sdn网络下交换机配置恢复方法 | |
CN102025562A (zh) | 一种路径检测方法及装置 | |
WO2007048319A1 (fr) | Systeme et procede de recuperation sur sinistre de dispositif de commande de service dans un reseau intelligent | |
EP2618523B1 (en) | Method, network device and system for ethernet ring protection switching | |
CN103490914A (zh) | 一种网络应用设备多机热备的切换系统及方法 | |
CN101141282B (zh) | 一种网管系统及其管理方法 | |
CN101436975A (zh) | 一种在环网中实现快速收敛的方法、装置及系统 | |
CN102904705B (zh) | 一种堆叠系统批量同步的方法及设备 | |
CN103441987A (zh) | 双机防火墙系统的管理方法和装置 | |
WO2010121459A1 (zh) | 一种自动交换光网络中实现保护与恢复的方法及系统 | |
CN102571598B (zh) | Vrrp组流量同步切换方法和路由设备 | |
EP2426855B1 (en) | Address refresh method and system | |
CN101854253B (zh) | 一种自动恢复监控和存储的方法及其监控系统 | |
CN103441878A (zh) | Vcf网络中pe设备的归属处理方法及设备 | |
CN101340377B (zh) | 一种用于二层网络数据传输的方法、装置及其系统 | |
JP5974911B2 (ja) | 通信システムおよびネットワーク中継装置 | |
CN102355371A (zh) | 一种拼接墙控制系统双机热冗余的实现方法 | |
CN103840965B (zh) | 一种增强rstp中故障快速收敛的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |