CN1306760C - 网络设备应用单元的管理方法 - Google Patents

网络设备应用单元的管理方法 Download PDF

Info

Publication number
CN1306760C
CN1306760C CNB03131113XA CN03131113A CN1306760C CN 1306760 C CN1306760 C CN 1306760C CN B03131113X A CNB03131113X A CN B03131113XA CN 03131113 A CN03131113 A CN 03131113A CN 1306760 C CN1306760 C CN 1306760C
Authority
CN
China
Prior art keywords
applying unit
network equipment
unit
message
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB03131113XA
Other languages
English (en)
Other versions
CN1549528A (zh
Inventor
王功远
李洪武
曹诗勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB03131113XA priority Critical patent/CN1306760C/zh
Publication of CN1549528A publication Critical patent/CN1549528A/zh
Application granted granted Critical
Publication of CN1306760C publication Critical patent/CN1306760C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种网络设备应用单元的管理方法。该方法包括:网络设备应用单元定时向操作维护管理单元发送用于管理应用单元的消息,操作维护管理单元在设定的时间内检测应用单元的消息,如果应用单元在设定的时间内发来消息,操纵维护管理单元可以检测该应用单元处于正常工作状态,否则,确认该应用单元处于非正常工作状态。操作维护单元根据应用单元的的工作状态,确定不同的维护管理策略。本发明可以更为有效地防止因为个别应用单元原因导致系统业务受影响,甚至崩溃。而且,本发明中应用单元主动向操作维护管理单元发送消息,减少了操作维护管理单元的负荷,且网络设备的管理开销较为合理。

Description

网络设备应用单元的管理方法
技术领域
本发明涉及网络通信技术领域,尤其涉及一种网络设备应用单元的管理方法。
背景技术
随着网络通信技术的发展,在网络通信系统中普遍应用的网络设备通常为由多个单元构成的分布式系统,并由操作维护管理单元作为系统的管理、维护及控制核心,对系统中的应用单元进行管理控制,即操作维护管理单元需要实时监控各个应用单元的运行状态,根据应用单元的状态作出不同的处理,以协调网络设备各应用单元的工作,并在发生故障时,能够及时通知相关模块做一些相应的补救处理措施,最大程度保证业务的可靠性、系统的稳定性、健壮性及容错性等。
目前,为了随时掌握、监控各应用单元的运行状态,通常的做法是由操作维护管理单元向各应用单元循环发送状态查询消息,各应用单元在接收到查询状态消息后,向操作维护管理单元反馈本应用单元的运行状态。这种传统的设计方式进行消息交互实现系统管理功能,大大增加了应用单元间通信流量量和系统负荷,且由于维护操作管理单元不间断轮询应用单元,大大增加了系统的开销。另外,各应用单元根据操作维护管理单元的查询请求被动的上报本单元的运行状态,增加了操作维护管理单元的负荷,而没有发挥应用单元的功能作用。
发明内容
本发明的目的是提供一种网络设备应用单元的管理方法,为对网络设备中各应用单元的管理提供了极大的方便,且管理开销合理。
本发明的目的是通过以下技术方案实现的:
一种网络设备应用单元的管理方法,其特征在于包括:
a、网络设备应用单元定时向操作维护管理单元发送用于管理应用单元的消息;
b、操作维护管理单元判断在设定的时间内是否收到应用单元发来的消息,如果有,则执行步骤c,否则,执行步骤d;
c、确认该应用单元处于正常工作状态;
d、确认该应用单元处于非正常工作状态。
步骤b所述的设定的时间值为步骤a所述的定时时间值的整数倍。
所述的设定的时间值和定时时间值为根据网络设备系统性能确定。
所述的步骤b包括:
b1、当操作维护管理单元接收所启动的定时器发来的定时器消息时,对设置的各应用单元的消息计数器进行计数处理,当操作维护管理单元接收应用单元发来的消息时,将该应用单元对应的消息计数器清零;
b2、判断应用单元的消息计数器统计的数值是否超过设定的数值,如果超过,则执行步骤d,否则,执行步骤c。
网络设备应用单元的管理方法还包括:启动操作维护管理单元时,初始化各应用单元的编号、消息计数器、应用单元状态,并启动向操作维护管理单元发送定时器消息的定时器。
所述的步骤d还包括:操作维护管理单元将确定该应用单元处于非正常工作状态的信息通知其它模块,以进行针对该应用单元的故障处理。
所述的操作维护管理单元和应用单元分别可以为:一个功能模块、一个子系统、一块单板或一台设备。
由上述技术方案可以看出,本发明对网络设备中各应用单元的管理方法为:由各个应用单元定时向操作维护管理单元发送消息,操作维护管理单元根据接收应用单元消息的情况及时作出相应的处理,从而可以更为有效地防止因为个别应用单元故障,导致整个系统业务受影响,甚至崩溃,从而提供了一种可以方便地对网络设备中各应用单元进行管理的技术方案。而且,本发明中应用单元主动向操作维护管理单元发送消息,减少了操作维护管理单元的负荷,且网络设备的管理开销更为合理。
附图说明
图1为网络设备应用单元的管理方法示意图;
图2为针对应用单元的消息记录结构图;
图3为本发明中操作维护管理单元的工作流程图;
图4为本发明中应用单元的工作流程图。
具体实施方式
本发明的核心为:网络设备的各个应用单元定时向操作维护管理单元发送消息,操作维护管理单元接收各应用单元发送的消息,定时进行会诊,如果在规定的时间内,操作维护管理单元未接收到应用单元的消息,则认为该应用单元出现故障,操作维护管理单元可以立即作出相应的处理,通知各个相关单元,最大限度保证整个网络设备系统正常运转,避免因为某个应用单元故障,导致系统业务受影响,甚至崩溃。
本发明的实施方式如图1所示:网络设备的多个APPU1(应用单元)、APPU2、……、APPUn定时向OAMU(操作维护管理单元)发送用于维护、管理及控制应用单元的消息,定时时间值T1毫秒的具体取值可以根据网络设备中OAMU的设置情况及网络设备的性能确定,其中,APPU和OAMU分别可以为网络设备系统的一个模块、一个子系统、一块单板或一台设备;OAMU接收APPU发来的消息后,首先对消息进行处理,然后确定出现异常的APPU,最后将出现异常的APPU信息上报给相应的模块进行处理,从而实现对网络设备各APPU的方便管理。
本发明中OAMU的具体工作流程如图3所示,包括以下步骤:
步骤31:启动网络设备的OAMU,并初始化针对各APPU的消息记录;
消息记录包括各APPU的单元编号、消息计数器、应用单元状态,其结构如图2所示;
APPU单元编号为从0开始到最大的APPU数的连续编号,例如有16个APPU,则单元编号为0~15;
消息计数器所统计的数值既不是APPU实际发送消息数,也不是OAMU收到的APPU消息数,而是OAMU定时检测各个APPU单元发送来的消息,如果在OAMU定时间隔时间内未收到某个APPU发送来的消息,则该APPU对应的消息计数器统计数值加1,假设OAMU定时间隔时间为1毫秒,在连续1秒内,OAMU未收到单元编号为1的APPU发来的消息,则对应单元编号为1的APPU的消息记录中的计数器的值为1000:
单元状态则是指APPU的工作状态,包括正常工作状态和非正常工作状态,比如,当OAMU在设定的时间内未收到APPU1发来的消息时,即当APPU1对应的消息计数器统计的数值超过设定的数值时,则可以认为APPU1发生故障,处于非正常工作状态,OAMU就可以通知相关单元采取规避措施,保证整个网络设备系统正常运转,避免因为某个应用单元故障,导致系统业务受影响,甚至崩溃的风险;
步骤32:OAMU启动处理消息记录的定时器,定时发送定时器消息,以便于计数器根据该消息进行统计数值的累加;
步骤33:OAMU开始接收定时器消息及APPU发来的消息,并根据接收到的消息对各APPU的计数器进行管理;
如果收到的是定时器消息,则对各APPU的消息计数器进行计数数据,即将消息计数器统计的数值加1;
如果收到的是APPU发来的消息,则将相应的APPU的消息计数器清零,说明APPU处于正常工作状态,其中APPU为定时向OAMU发送消息;
步骤34:判断APPU对应的消息计数器统计的数值是否超过设定的数值,如果超过,则执行步骤35,否则,执行步骤33;
所述的设定的数值的具体值是根据网络设备系统性能确定的;
所述的设定的数值实质是表示一个设定的时间,即OAMU判断在设定的时间内是否收到APPU发来的消息,如果收到APPU发来的消息,则执行步骤33,否则,执行步骤35,所述的设定的时间通常是APPU向OAMU发送消息间隔时间的整数倍;
步骤35:确定超过设定值的消息计数器对应的APPU处于非正常工作状态,执行步骤36:
即对应的APPU在“消息计数器统计的数值乘以计时器发送定时器消息的间隔时间”的时间段内未发送消息给OAMU,从而可以确定该APPU处于故障状态;
步骤36:OAMU通知其它模块采取相应的措施进行故障处理,最大程度保证系统的可靠性及系统的稳定性。
本发明中APPU的具体处理过程如图4所示,假设APPU每隔定时时间T1毫秒向OAMU发送消息,则本发明包括:步骤41,APPU启动,在APPU启动后的初始化阶段中,需要启动T1毫秒定时器向APPU发送定时器消息,参见步骤42,T1毫秒定时器启动后执行步骤43,APPU接收T1毫秒定时器每隔T1毫秒发送来的定时器消息,并且在APPU接收到定时器消息时向OAMU发送消息,参见步骤44,以便于OAMU根据该消息确定相应的APPU是否处于正常工作状态。
本发明中网络设备的各个APPU仅需要定时向OAMU发送消息即可辅助OAMU实现对APPU的管理,且OAMU不需要响应该消息。

Claims (6)

1、一种网络设备应用单元的管理方法,其特征在于包括:
a、网络设备应用单元定时向操作维护管理单元发送用于管理应用单元的消息;
b、操作维护管理单元接收自身启动的定时器发来的定时器消息,则对设置的各网络设备应用单元对应的消息计数器进行计数处理;操作维护管理单元接收网络设备应用单元发来的消息,则将该网络设备应用单元对应的消息计数器清零;判断网络设备应用单元对应的消息计数器的计数值是否超过设定值,若超过,则执行步骤d,否则,执行步骤c;
c、确认该应用单元处于正常工作状态;
d、确认该应用单元处于非正常工作状态。
2、根据权利要求1所述的网络设备应用单元的管理方法,其特征在于步骤b所述的设定的时间值为步骤a所述的定时时间值的整数倍。
3、根据权利要求1或2所述的网络设备应用单元的管理方法,其特征在于所述的设定的时间值和定时时间值为根据网络设备系统性能确定。
4、根据权利要求1所述的网络设备应用单元的管理方法,其特征在于该方法还包括:启动操作维护管理单元时,初始化各应用单元的编号、消息计数器、应用单元状态,并启动向操作维护管理单元发送定时器消息的定时器。
5、根据权利要求1所述的网络设备应用单元的管理方法,其特征在于所述的步骤d还包括:操作维护管理单元将确定该应用单元处于非正常工作状态的信息通知用于对该应用单元的故障进行处理的模块,以进行针对该应用单元的故障处理。
6、根据权利要求1所述的网络设备应用单元的管理方法,其特征在于所述的操作维护管理单元和应用单元分别可以为:一个功能模块、一个子系统、一块单板或一台设备。
CNB03131113XA 2003-05-12 2003-05-12 网络设备应用单元的管理方法 Expired - Fee Related CN1306760C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB03131113XA CN1306760C (zh) 2003-05-12 2003-05-12 网络设备应用单元的管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB03131113XA CN1306760C (zh) 2003-05-12 2003-05-12 网络设备应用单元的管理方法

Publications (2)

Publication Number Publication Date
CN1549528A CN1549528A (zh) 2004-11-24
CN1306760C true CN1306760C (zh) 2007-03-21

Family

ID=34322791

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB03131113XA Expired - Fee Related CN1306760C (zh) 2003-05-12 2003-05-12 网络设备应用单元的管理方法

Country Status (1)

Country Link
CN (1) CN1306760C (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101547157B (zh) * 2009-04-22 2012-07-04 成都市华为赛门铁克科技有限公司 一种过载检测的方法、装置及系统
CN102447595B (zh) * 2011-12-05 2014-07-23 上海顶竹通讯技术有限公司 多处理单元网源通路检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6529515B1 (en) * 1999-09-30 2003-03-04 Lucent Technologies, Inc. Method and apparatus for efficient network management using an active network mechanism
CN1501626A (zh) * 2002-11-18 2004-06-02 中国移动通信集团公司 一种用于监视网络管理系统工作状态的控制方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6529515B1 (en) * 1999-09-30 2003-03-04 Lucent Technologies, Inc. Method and apparatus for efficient network management using an active network mechanism
CN1501626A (zh) * 2002-11-18 2004-06-02 中国移动通信集团公司 一种用于监视网络管理系统工作状态的控制方法

Also Published As

Publication number Publication date
CN1549528A (zh) 2004-11-24

Similar Documents

Publication Publication Date Title
US6990593B2 (en) Method for diverting power reserves and shifting activities according to activity priorities in a server cluster in the event of a power interruption
EP1654645B1 (en) Fast application notification in a clustered computing system
CN1194316C (zh) 一种计算机网络远程网络监控方法
CN110830283B (zh) 故障检测方法、装置、设备和系统
US20100043004A1 (en) Method and system for computer system diagnostic scheduling using service level objectives
CN1577258A (zh) 存储器溢出检测及从容关闭
CN103354503A (zh) 一种可自动检测及替换故障节点的云存储系统及其方法
CN1725699A (zh) 通讯网络自动巡检的方法
CN1464396A (zh) 一种在服务器之间实现备份的方法
US7127484B2 (en) Server decision method and device thereof
CN102360324A (zh) 故障恢复方法和用于故障恢复的设备
CN1754153A (zh) 对在os运行时期间发生的系统错误的基于策略的响应
CN101047564A (zh) 网络通信设备平台及在其上实现高可靠性的方法
CN112217847A (zh) 微服务平台及其实现方法、电子设备及存储介质
CN1306760C (zh) 网络设备应用单元的管理方法
CN1308278A (zh) 集群服务器的ip容错方法
JP2000250833A (ja) 複数サーバ運用管理における稼働情報取得方法およびそのプログラムを記録した記録媒体
CN112612635B (zh) 一种应用程序多层级保护方法
CN113608836A (zh) 一种基于集群的虚拟机高可用方法及系统
CN111586110B (zh) 一种raft在出现点对点故障时的优化处理方法
CN112486713B (zh) 一种冻屏处理方法及电子设备
CN102831027B (zh) 一种基于代理的面向服务软件系统的容错方法
CN1588341A (zh) 电力自动化系统中关键应用模块的多备一的实现方法
CN102148707A (zh) 监控代理的故障处理方法和系统
CN1808991A (zh) 网络连线备援系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070321

Termination date: 20130512