CN102916793A - 一种网络通信设备高可靠性实现方法及系统 - Google Patents

一种网络通信设备高可靠性实现方法及系统 Download PDF

Info

Publication number
CN102916793A
CN102916793A CN2012104452155A CN201210445215A CN102916793A CN 102916793 A CN102916793 A CN 102916793A CN 2012104452155 A CN2012104452155 A CN 2012104452155A CN 201210445215 A CN201210445215 A CN 201210445215A CN 102916793 A CN102916793 A CN 102916793A
Authority
CN
China
Prior art keywords
application program
protection group
node
high reliability
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012104452155A
Other languages
English (en)
Other versions
CN102916793B (zh
Inventor
程富超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN201210445215.5A priority Critical patent/CN102916793B/zh
Publication of CN102916793A publication Critical patent/CN102916793A/zh
Application granted granted Critical
Publication of CN102916793B publication Critical patent/CN102916793B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stored Programmes (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请公开了一种高可靠性备份的方法,该方法包括:通过预先将相关的应用程序模块组织为不同的保护组,对各应用程序模块按保护组启动以及冗余备份。基于同样的发明构思,同时提出一种控制节点和负载节点,能够实现一个或多个相关应用程序模块冗余备份。

Description

一种网络通信设备高可靠性实现方法及系统
技术领域
本申请涉及通信技术领域,特别涉及一种网络通信设备的高可靠性(HighAvailabitity,简称HA)实现方法及系统。
背景技术
随着客户对网络通信设备服务质量要求的日益提高,中高端网络通信设备内部一般都要进行高可靠性保证的实现。现有网络通信设备高可靠性的实现方案中,冗余备份都是基于单个应用程序或者是单个节点(板卡)冗余备份。单个应用程序冗余备份是对单个应用程序模块进程进行操作,应用程序模块出错以后,上报给高可靠性管理模块,高可靠性管理模块将出错应用程序模块的应用程序进程终止,并且启动或激活备份应用程序模块的应程序进程实现单个应用程序模块切换。单个节点切换是,应用程序模块出错以后,报告给高可靠性管理模块,高可靠性管理模块将出错应用程序模块所在节点上的所有的应用程序进程停止,并且启动或者激活备份的应用程序进程。
从上面的描述可以看出,单个模块或者是单个节点切换,并不能满足一个或者多个相关应用程序模块的冗余备份。
发明内容
有鉴于此,本申请提供一种高可靠性备份的方法、控制节点和负载节点,能够实现一个或多个相关应用程序模块冗余备份。
为解决上述技术问题,本发明的技术方案是这样实现的:
一种网络通信设备高可靠性实现系统,包括控制节点和至少一个负载节点,所述控制节点包括:配置管理模块、高可靠性管理模块、高可靠性节点模块和应用程序模块;所述负载节点包括高可靠性节点模块和应用程序模块;
所述配置管理模块,用于解析配置文件,获取其所在控制节点以及各负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息,并同步到所述高可靠性管理模块;所述各应用程序模块所在保护组的信息包括保护组的类型信息,所述保护组的类型信息用于识别互为备份的保护组;
所述高可靠性管理模块,用于接收配置管理模块同步发送的其所在控制节点以及各负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息,并在接收到所述高可靠性节点模块发送的注册信息时,向所述高可靠性节点模块发送其所在节点对应的各应用程序模块的参数和各应用程序模块所在保护组的信息;接收到所述高可靠性节点模块通知的成功启动任一保护组时,根据预设规则确定出该保护组的高可靠性状态,并通知所述高可靠性节点模块;
所述高可靠性节点模块,用于向所述高可靠性管理模块发送注册信息,并根据从所述高可靠性管理模块接收的其所在节点对应的各应用程序模块的参数和各应用程序模块所在保护组的信息,按保护组在本地启动各应用程序模块,任一保护组启动成功时,通知高可靠性管理模块;接收到高可靠性管理模块通知的保护组的高可靠性状态时,根据该通知将对应的保护组中的所有应用程序模块设置对应的高可靠性状态;
所述应用程序模块,用于所述高可靠性节点模块对自身设置了高可靠性状态后,根据该设置的高可靠性状态运行应用程序。
一种网络通信设备高可靠性实现方法,应用于包括控制节点和至少一个负载节点网络通信设备高可靠性实现系统中,所述控制节点解析配置文件,获取本节点和各负载节点上的各应用程序的参数和各应用程序所在保护组的信息,所述各应用程序模块所在保护组的信息包括保护组的类型信息,所述保护组的类型信息用于识别互为备份的保护组;所述方法包括:
所述控制节点按保护组在本地启动各应用程序,任一保护组启动成功时,根据预设规则确定出该保护组的高可靠性状态,并为该保护组中的各应用程序设置对应的高可靠性状态,使各应用程序根据设置的状态运行程序;
当所述控制节点接收到任一所述负载节点发送的注册信息时,向该负载节点发送该负载节点上的各应用程序的参数和各应用程序所在保护组的信息;接收到该负载节点发送的任一保护组启动成功的消息时,根据预设规则确定该保护组的高可靠性状态并通知该负载节点;
任一所述负载节点向所述控制节点发送注册信息,接收到所述控制节点发送的本节点上的各应用程序的参数和各应用程序所在保护组的信息时,按保护组启动各应用程序;当任一保护组启动成功时,通知所述控制节点;接收到所述控制节点通知的该保护组的高可靠性状态时,设置该保护组中的所有应用程序为对应的高可靠性状态,并根据对应的高可靠性状态运行程序。
综上所述,本申请通过预先将相关的应用程序模块组织为不同的保护组,对各应用程序模块按保护组启动以及冗余备份,能够实现一个或多个相关应用程序模块冗余备份。互为备份的保护组可以存在于同一节点上,也可以存在于不同的节点上。
附图说明
图1为本发明具体实施例中网络通信设备高可靠性实现系统结构示意图;
图2为本发明具体实施例中网络通信设备高可靠性实现方法流程示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。
本发明实施例中提出一种网络通信设备高可靠性实现系统,包括控制节点和至少一个负载节点。该控制节点包括:配置管理模块、高可靠性管理模块、高可靠性节点模块和应用程序模块;该负载节点包括高可靠性节点模块和应用程序模块。
所述配置管理模块,用于解析配置文件,获取其所在控制节点以及各负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息,并同步到所述高可靠性管理模块;所述各应用程序模块所在保护组的信息包括保护组的类型信息,所述保护组的类型信息用于识别互为备份的保护组。
配置文件为预先配置的,对各节点上相关的应用程序模块进行组织,以配置各应用程序模块相关的参数和各应用程序模块所在的保护组的信息,保护组的信息包括保护组的类型信息,用于识别互为备份的保护组,即各应用程序模块的名称、启动命令,以及各应用程序模块所在的保护组的名称等。
所述高可靠性管理模块,用于接收配置管理模块同步发送的其所在控制节点以及各负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息,并在接收到所述高可靠性节点模块发送的注册信息时,向所述高可靠性节点模块发送其所在节点对应的各应用程序模块的参数和各应用程序模块所在保护组的信息;接收到所述高可靠性节点模块通知的成功启动任一保护组时,根据预设规则确定出该保护组的高可靠性状态,并通知所述高可靠性节点模块。
无论是控制节点上还是负载节点上的高可靠性节点模块都会向所述高可靠性节点模块发送注册信息,高可靠性管理模块向发送该信息的高可靠性节点发送该高可靠性节点模块所在的节点对应的各应用模块的参数和各应用模块所在保护组。
所述高可靠性节点模块,用于向所述高可靠性管理模块发送注册信息,并根据从所述高可靠性管理模块接收的其所在节点对应的各应用程序模块的参数和各应用程序模块所在保护组的信息,按保护组在本地启动各应用程序模块,任一保护组启动成功时,通知高可靠性管理模块;接收到高可靠性管理模块通知的保护组的高可靠性状态时,根据该通知将对应的保护组中的所有应用程序模块设置对应的高可靠性状态。
控制节点启动后,控制节点的高可靠性节点模块和负载节点的高可靠性模块会向高可靠性管理模块注册,注册成功后,高可靠性管理模块会将配置管理模块同步的本控制节点的各应用程序模块的参数和各应用程序模块所在保护组的信息发送给对应的高可靠性节点模块,各高可靠性节点模块根据其所在节点按保护组启动本地的各应用程序模块,即一个保护组一个保护组启动,当保护组中的所有应用程序模块都启动后才确定该保护组启动成功;否则,不成功。任一保护组启动成功后,本地高可靠性节点模块将该保护组名称通知高可靠性管理模块,高可靠性管理模块根据预设规则确定该保护组的高可靠性状态。其中,高可靠性状态为active状态或standby状态,所述active状态为工作状态,所述standby状态为备份状态。
上述预设规则可以为时间规则,即根据系统中组织的同类保护组信息中,先接收到哪个保护组启动成功,则先为哪个保护组分配active状态,其中同类保护组可以在同一节点上,也可以在不同节点上。
对于不同节点上的同类保护组信息还可采用IP地址或TIPC地址规则,如IP地址小的节点上的保护组设置为active状态。因此具体实现时可以根据实际需要预先配置裁决保护组的高可靠性状态的规则。
所述应用程序模块,用于所述高可靠性节点模块对自身设置了高可靠性状态后,根据该设置的高可靠性状态运行应用程序。
参见图1,图1为本发明具体实施例中网络通信设备高可靠性实现系统结构示意图。图1中以包括控制节点和一个负载节点为例,当该系统中包括多个负载节点时,各负载节点同控制节点的交互方式相同,这里不再一一举例。图1中控制节点110包括:配置管理模块111、高可靠性管理模块112、高可靠性节点模块113和应用程序模块114。负载节点120包括高可靠性节点模块121和应用程序模块122。
配置管理模块111,用于解析配置文件,获取其所在控制节点110以及负载节点120上的各应用程序模块114和应用程序122的参数和各应用程序模块所在保护组的信息,并同步到所述高可靠性管理模块112;应用程序模块114和应用程序模块122所在保护组的信息包括保护组的类型信息,所述保护组的类型信息用于识别互为备份的保护组。
高可靠性管理模块112,用于接收配置管理模块111同步发送的其所在控制节点以及各负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息,当接收到高可靠性节点模块113发送的注册信息时,向高可靠性节点模块113发送控制节点110对应的各应用程序模块114的参数和各应用程序模块所在保护组的信息;当接收到高可靠性节点模块121发送的注册信息时,向高可靠性节点模块121发送负载节点120对应的各应用程序模块122的参数和各应用程序模块所在保护组的信息。
高可靠性管理模块112接收到高可靠性节点模块113通知的成功启动任一保护组时,根据预设规则确定出该保护组的高可靠性状态,并通知高可靠性节点模块113;接收到高可靠性节点模块121通知的成功启动任一保护组时,根据预设规则确定出该保护组的高可靠性状态,并通知高可靠性节点模块121。
高可靠性节点模块113,用于向高可靠性管理模块112发送注册信息,并根据从高可靠性管理模块112接收的其所在节点对应的各应用程序模块114的参数和各应用程序模块114所在保护组的信息,按保护组在本地启动各应用程序模块,任一保护组启动成功时,通知高可靠性管理模块112;接收到高可靠性管理模块112通知的保护组的高可靠性状态时,根据该通知将对应的保护组中的所有应用程序模块114设置对应的高可靠性状态。
高可靠性节点模块121,用于向高可靠性管理模块112发送注册信息,并根据从高可靠性管理模块112接收的其所在节点对应的各应用程序模块122的参数和各应用程序模块122所在保护组的信息,按保护组在本地启动各应用程序模块,任一保护组启动成功时,通知高可靠性管理模块112;接收到高可靠性管理模块112通知的保护组的高可靠性状态时,根据该通知将对应的保护组中的所有应用程序模块122设置对应的高可靠性状态。
应用程序模块114,用于高可靠性节点模块113对自身设置了高可靠性状态后,根据该设置的高可靠性状态运行应用程序。应用程序模块122,用于高可靠性节点模块121对自身设置了高可靠性状态后,根据该设置的高可靠性状态运行应用程序。
在具体实现时,控制节点上的配置文件中可能只配置控制节点的信息,各负载节点的信息在各负载节点的本地保存;也可能控制节点和各负载节点的信息都保存在控制节点的配置文件中,因此,解析配置文件,获取各节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息,存在如下两种情况:
第一种,所述配置管理模块,用于解析本地配置文件,获取本控制节点和各负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息。
第二种,所述配置管理模块,用于解析本地配置文件,获取本控制节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息;接收到任一所述负载节点发送的配置文件并解析,获取该负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息。
当各负载节点在本地存储本节点的配置文件时,需要将该配置文件发送给控制节点,由控制节点的配置管理模块解析该配置文件。
下面详细描述各应用程序模块在运行时,如果出错,本发明具体实现时如何处理。
第一种情况为高可靠性节点模块感知到某一应用程序模块程序出错的处理过程:
所述配置管理模块,进一步用于解析配置文件,获取各应用程序模块对应的修复策略。
所述高可靠性节点模块,进一步接收到所述高可靠性管理模块发送的本节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息时,从所述配置管理模块上获取本地各应用程序模块对应的修复策略;当感知到本地任一应用程序模块程序出错时,则根据该应用程序模块对应的修复策略进行处理。
第一种情况中,无论控制节点或负载节点的高可靠性节点模块感知到本地任一应用程序模块程序出错时,则根据还应用程序模块对应的修复策略进行处理。该修复策略为高可靠性节点模块从配置管理模块获取的,配置管理模块通过解析配置文件获得。
第二种情况为靠可靠性节点模块接收到某一应用程序模块上报的运行出错的处理过程:
所述高可靠性节点模块,进一步用于接收到任一应用程序模块上报的错误信息和修复策略时,若所述修复策略是重启应用程序模块,则重启该应用程序模块;否则,通知所述高可靠性管理模块该应用程序模块运行出错;接收到所述高可靠性管理模块通知的切换该应用程序模块所在保护组中的所有应用程序模块的高可靠性状态时,将该应用程序模块所在保护组中的所有应用程序模块的高可靠性状态进行切换;接收到所述高可靠性管理模块通知的重启该应用程序模块所在的保护组中的所有应用程序模块时,重启该应用程序模块所在保护组中的所有应用程序模块。
所述高可靠性管理模块,用于接收到所述高可靠性节点模块发送的应用程序模块运行出错的通知时,若本地存在该应用程序模块所在保护组的备份保护组,则通知该备份保护组所在的节点进行保护组状态切换,并通知所述高可靠性节点模块切换该应用程序模块所在保护组中的所有应用程序模块的高可靠性状态;否则,通知高可靠性节点模块重启该应用程序模块所在的保护组中的所有应用程序模块。
所述应用程序模块,进一步用于感知到运行程序出错时,向所述高可靠性节点模块上报错误信息和修复策略。
第二种情况中,高可靠性节点模块接收到任一应用程序模块上报的错误信息,即该应用模块主动上报自身错误信息,并且同时上报修复策略。当上报的修复策略为重启该应用模块时,则高可靠性节点模块将该出错的应用程序模块重新启动;否则,高可靠性节点模块将该应用程序模块上报给高可靠性管理模块,由高可靠性管理模块查看是否有冗余备份的应用程序模块,如果有,通知该冗余备份所在的节点上的高可靠性节点模块进行保护状态切换,并通知出错端的高可靠性节点模块,将应用模块所在保护组中的各应用程序模块切换状态;如果没有冗余备份组时,通知该出错应用程序所在节点的该保护组中所有应用程序模块重启。
上述实施例的模块可以集成于一体,也可以分离部署;可以合并为一个模块,也可以进一步拆分成多个子模块。
本发明具体实施例中基于同样的发明构思,还提出一种网络通信设备高可靠性实现方法,应用于包括控制节点和至少一个负载节点网络通信设备高可靠性实现系统中,该控制节点解析配置文件,获取本节点和各负载节点上的各应用程序的参数和各应用程序所在保护组的信息,各应用程序模块所在保护组的信息包括保护组的类型信息,所述保护组的类型信息用于识别互为备份的保护组。
其中,控制节点解析配置文件,获取本节点和各负载节点上的各应用程序的参数和各应用程序所在保护组的信息,包括:
所述控制节点解析本地配置文件,获取本控制节点和各负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息;
或,
所述控制节点解析本地配置文件,获取本控制节点上的各应用程序的参数和各应用程序所在保护组的信息;接收到任一所述负载节点发送的配置文件并解析,获取该负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息。
参见图2,图2为本发明具体实施例中网络通信设备高可靠性实现方法流程示意图。具体步骤为:
步骤201,控制节点按保护组在本地启动各应用程序,任一保护组启动成功时,根据预设规则确定出该保护组的高可靠性状态,并为该保护组中的各应用程序设置对应的高可靠性状态,使各应用程序根据设置的状态运行程序。
步骤202,当所述控制节点接收到任一所述负载节点发送的注册信息时,向该负载节点发送该负载节点上的各应用程序的参数和各应用程序所在保护组的信息;接收到该负载节点发送的任一保护组启动成功的消息时,根据预设规则确定该保护组的高可靠性状态并通知该负载节点。
步骤203,任一所述负载节点向所述控制节点发送注册信息,接收到所述控制节点发送的本节点上的各应用程序的参数和各应用程序所在保护组的信息时,按保护组启动各应用程序;当任一保护组启动成功时,通知所述控制节点;接收到所述控制节点通知的该保护组的高可靠性状态时,设置该保护组中的所有应用程序为对应的高可靠性状态,并根据对应的高可靠性状态运行程序。
其中,所述高可靠性状态为工作active状态或备份standby状态;
其中,各应用程序模块在运行时,如果出错,本发明具体实现时如何处理,如下两种方式:
第一种,
所述控制节点解析配置文件,获得各应用程序对应的修复策略;当感知到本地任一应用程序程序运行出错时,则根据该应用程序对应的修复策略进行处理;
当所述负载节点接收到所述控制节点发送的各应用程序的参数和各应用程序所在保护组的信息时,向所述控制节点请求本地各应用程序对应的修复策略;
当所述控制节点接收到该负载节点请求其节点上应用程序对应的修复策略时,将该负载节点上的应用程序对应的修复策略发送给所述负载节点。
第二种,
当所述控制节点或所述负载节点获知本地任一应用程序运行出错,且该应用程序的修复策略为重启时,重启该应用程序;
当所述控制节点接收到该负载节点发送的应用程序出错时,确定该应用程序所在的保护组是否存在备份保护组,如果是,通知该备份保护组所在的节点对该备份保护组进行切换,并通知该负载节点修改该应用程序所在的保护组的高可靠性状态;否则,通知该负载节点重启该应用程序所在保护组中的所有应用程序。
综上所述,本发明具体实施例中通过预先将相关的应用程序模块组织为不同的保护组,对各应用程序模块按保护组启动以及冗余备份,能够实现一个或多个相关应用程序模块冗余备份。
本发明的具体应用既可以适应集中试设备,也可以适应与分布试设备。通过配置文件组织,使得应用程序组织更加灵活。通过高可靠性管理模块不直接管理应用程序进程,而应用程序管理由高可靠性节点模块管理,使得整个系统中可以存在多个不同的操作系统。多种的错误处理策略,使得错误处理机制更多样化。本发明具体实施例中的控制节点指主用主控卡,负载节点包括除主控卡外的运行应用程序的所有板卡,包括备用的主控卡。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种网络通信设备高可靠性实现系统,包括控制节点和至少一个负载节点,其特征在于,所述控制节点包括:配置管理模块、高可靠性管理模块、高可靠性节点模块和应用程序模块;所述负载节点包括高可靠性节点模块和应用程序模块; 
所述配置管理模块,用于解析配置文件,获取其所在控制节点以及各负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息,并同步到所述高可靠性管理模块;所述各应用程序模块所在保护组的信息包括保护组的类型信息,所述保护组的类型信息用于识别互为备份的保护组; 
所述高可靠性管理模块,用于接收配置管理模块同步发送的其所在控制节点以及各负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息,并在接收到所述高可靠性节点模块发送的注册信息时,向所述高可靠性节点模块发送其所在节点对应的各应用程序模块的参数和各应用程序模块所在保护组的信息;接收到所述高可靠性节点模块通知的成功启动任一保护组时,根据预设规则确定出该保护组的高可靠性状态,并通知所述高可靠性节点模块; 
所述高可靠性节点模块,用于向所述高可靠性管理模块发送注册信息,并根据从所述高可靠性管理模块接收的其所在节点对应的各应用程序模块的参数和各应用程序模块所在保护组的信息,按保护组在本地启动各应用程序模块,任一保护组启动成功时,通知高可靠性管理模块;接收到高可靠性管理模块通知的保护组的高可靠性状态时,根据该通知将对应的保护组中的所有应用程序模块设置对应的高可靠性状态; 
所述应用程序模块,用于所述高可靠性节点模块对自身设置了高可靠性状态后,根据该设置的高可靠性状态运行应用程序。 
2.根据权利要求1所述的系统,其特征在于, 
所述高可靠性状态为工作active状态或备份standby状态。 
3.根据权利要求1所述的系统,其特征在于, 
所述配置管理模块,用于解析本地配置文件,获取本控制节点和各负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息; 
或, 
所述配置管理模块,用于解析本地配置文件,获取本控制节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息;接收到任一所述负载节点发送的配置文件并解析,获取该负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息。 
4.根据权利要求1-3任意一项所述的系统,其特征在于, 
所述配置管理模块,进一步用于解析配置文件,获取各应用程序模块对应的修复策略; 
所述高可靠性节点模块,进一步接收到所述高可靠性管理模块发送的本节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息时,从所述配置管理模块上获取本地各应用程序模块对应的修复策略;当感知到本地任一应用程序模块程序出错时,则根据该应用程序模块对应的修复策略进行处理。 
5.根据权利要求4所述的系统,其特征在于, 
所述高可靠性节点模块,进一步用于接收到任一应用程序模块上报的错误信息和修复策略时,若所述修复策略是重启应用程序模块,则重启该应用程序模块;否则,通知所述高可靠性管理模块该应用程序模块运行出错;接收到所述高可靠性管理模块通知的切换该应用程序模块所在保护组中的所有应用程序模块的高可靠性状态时,将该应用程序模块所在保护组中的所有应用程序模块的高可靠性状态进行切换;接收到所述高可靠性管理模块通知的重启该应用程序模块所在的保护组中的所有应用程序模块时,重启该应用程序模块所在保护组中的所有应用程序模块; 
所述高可靠性管理模块,用于接收到所述高可靠性节点模块发送的应用程序模块运行出错的通知时,若本地存在该应用程序模块所在保护组的备份保护组,则通知该备份保护组所在的节点进行保护组状态切换,并通知所述高可靠性节点模块切换该应用程序模块所在保护组中的所有应用程序模块的高可靠性状态;否则,通知高可靠性节点模块重启该应用程序模块所在的保护组中的所有应用程序模块; 
所述应用程序模块,进一步用于感知到运行程序出错时,向所述高可靠性节点模块上报错误信息和修复策略。 
6.一种网络通信设备高可靠性实现方法,应用于包括控制节点和至少一个负载节点网络通信设备高可靠性实现系统中,其特征在于,所述控制节点解析配置文件,获取本节点和各负载节点上的各应用程序的参数和各应用程序所在保护组的信息,所述各应用程序模块所在保护组的信息包括保护组的类型信息,所述保护组的类型信息用于识别互为备份的保护组;所述方法包括: 
所述控制节点按保护组在本地启动各应用程序,任一保护组启动成功时,根据预设规则确定出该保护组的高可靠性状态,并为该保护组中的各应用程序设置对应的高可靠性状态,使各应用程序根据设置的状态运行程序; 
当所述控制节点接收到任一所述负载节点发送的注册信息时,向该负载节点发送该负载节点上的各应用程序的参数和各应用程序所在保护组的信息;接收到该负载节 点发送的任一保护组启动成功的消息时,根据预设规则确定该保护组的高可靠性状态并通知该负载节点; 
任一所述负载节点向所述控制节点发送注册信息,接收到所述控制节点发送的本节点上的各应用程序的参数和各应用程序所在保护组的信息时,按保护组启动各应用程序;当任一保护组启动成功时,通知所述控制节点;接收到所述控制节点通知的该保护组的高可靠性状态时,设置该保护组中的所有应用程序为对应的高可靠性状态,并根据对应的高可靠性状态运行程序。 
7.根据权利要求6所述的方法,其特征在于,所述高可靠性状态为工作active状态或备份standby状态。
8.根据权利要求6所述的方法,其特征在于,所述控制节点解析配置文件,获取本节点和各负载节点上的各应用程序的参数和各应用程序所在保护组的信息,包括: 
所述控制节点解析本地配置文件,获取本控制节点和各负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息; 
或, 
所述控制节点解析本地配置文件,获取本控制节点上的各应用程序的参数和各应用程序所在保护组的信息;接收到任一所述负载节点发送的配置文件并解析,获取该负载节点上的各应用程序模块的参数和各应用程序模块所在保护组的信息。 
9.根据权利要求6-8任意一项所述的方法,其特征在于,所述方法进一步包括: 
所述控制节点解析配置文件,获得各应用程序对应的修复策略;当感知到本地任一应用程序程序运行出错时,则根据该应用程序对应的修复策略进行处理; 
当所述负载节点接收到所述控制节点发送的各应用程序的参数和各应用程序所在保护组的信息时,向所述控制节点请求本地各应用程序对应的修复策略; 
当所述控制节点接收到该负载节点请求其节点上应用程序对应的修复策略时,将该负载节点上的应用程序对应的修复策略发送给所述负载节点。 
10.根据权利要求9所述的方法,其特征在于,所述方法进一步包括: 
当所述控制节点或所述负载节点获知本地任一应用程序运行出错,且该应用程序的修复策略为重启时,重启该应用程序; 
当所述控制节点接收到该负载节点发送的应用程序出错时,确定该应用程序所在的保护组是否存在备份保护组,如果是,通知该备份保护组所在的节点对该备份保护组进行切换,并通知该负载节点修改该应用程序所在的保护组的高可靠性状态;否则,通知该负载节点重启该应用程序所在保护组中的所有应用程序。 
CN201210445215.5A 2012-11-09 2012-11-09 一种网络通信设备高可靠性实现方法及系统 Active CN102916793B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210445215.5A CN102916793B (zh) 2012-11-09 2012-11-09 一种网络通信设备高可靠性实现方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210445215.5A CN102916793B (zh) 2012-11-09 2012-11-09 一种网络通信设备高可靠性实现方法及系统

Publications (2)

Publication Number Publication Date
CN102916793A true CN102916793A (zh) 2013-02-06
CN102916793B CN102916793B (zh) 2015-06-17

Family

ID=47615037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210445215.5A Active CN102916793B (zh) 2012-11-09 2012-11-09 一种网络通信设备高可靠性实现方法及系统

Country Status (1)

Country Link
CN (1) CN102916793B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106843952A (zh) * 2017-01-13 2017-06-13 百度在线网络技术(北京)有限公司 更新应用中功能模块的方法与装置
CN112187395A (zh) * 2020-11-02 2021-01-05 上海欣诺通信技术股份有限公司 一种分布式系统中的时间同步方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101068139A (zh) * 2007-06-28 2007-11-07 中兴通讯股份有限公司 媒体网关上联链路的主备保护方法
CN101771488A (zh) * 2009-01-05 2010-07-07 华为技术有限公司 提高多业务传送网可靠性的方法、系统及设备
CN101997713A (zh) * 2009-08-31 2011-03-30 中兴通讯股份有限公司 一种以太网路径保护的切换方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101068139A (zh) * 2007-06-28 2007-11-07 中兴通讯股份有限公司 媒体网关上联链路的主备保护方法
CN101771488A (zh) * 2009-01-05 2010-07-07 华为技术有限公司 提高多业务传送网可靠性的方法、系统及设备
CN101997713A (zh) * 2009-08-31 2011-03-30 中兴通讯股份有限公司 一种以太网路径保护的切换方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106843952A (zh) * 2017-01-13 2017-06-13 百度在线网络技术(北京)有限公司 更新应用中功能模块的方法与装置
CN106843952B (zh) * 2017-01-13 2023-02-28 百度在线网络技术(北京)有限公司 更新应用中功能模块的方法与装置
CN112187395A (zh) * 2020-11-02 2021-01-05 上海欣诺通信技术股份有限公司 一种分布式系统中的时间同步方法及装置
CN112187395B (zh) * 2020-11-02 2022-07-15 上海欣诺通信技术股份有限公司 一种分布式系统中的时间同步方法及装置

Also Published As

Publication number Publication date
CN102916793B (zh) 2015-06-17

Similar Documents

Publication Publication Date Title
CN102388570B (zh) 一种主备模式下的单板运行方法及系统
CN109474465A (zh) 一种基于服务器集群的可动态流转的高可用性的实现方法和系统
CN106911597B (zh) 一种跨板转发方法和装置
CN104604193A (zh) 具有虚拟设备环境功能的网络基础设施的自动管理
US20070270984A1 (en) Method and Device for Redundancy Control of Electrical Devices
CN103036716A (zh) 链路切换方法及系统
WO2012155630A1 (zh) 一种容灾的方法、装置及系统
US20170116094A1 (en) Fault handling methods in a home service system, and associated household appliances and servers
CN102904705B (zh) 一种堆叠系统批量同步的方法及设备
CN111654384A (zh) 一种主备切换方法、bras设备及存储介质
CN105577444A (zh) 一种无线控制器管理方法及无线控制器
US9311073B2 (en) Upgrading nodes using leader node appointment
CN104639615A (zh) 一种控制器集群中数据处理方法和装置
CN106941424B (zh) 一种基于ttdp协议的冗余切换方法及设备
CN101145972B (zh) 一种容灾网管系统及其网管客户端的登陆方法
CN109981353B (zh) 一种机框式网络通信设备中的邻站冗余保护方法及系统
CN102916793B (zh) 一种网络通信设备高可靠性实现方法及系统
CN101110609A (zh) 主、备用模块实现通信的方法和系统
CN102184183A (zh) 一种分布式数据库数据同步方法
CN106534758B (zh) 会议备份方法和装置
CN114978296B (zh) 设备切换方法、装置、地球站及可读存储介质
CN102983997A (zh) 主控服务迁移方法及装置
CN107087021B (zh) 主从服务器确定方法及装置
CN114342327B (zh) 在能冗余运行的通信网络中数据传输的方法和耦合通信设备
JP3910967B2 (ja) 2重化システム及び多重化制御方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant