CN101485139A - 一种基于网元的分布式主备管理的方法及系统 - Google Patents

一种基于网元的分布式主备管理的方法及系统 Download PDF

Info

Publication number
CN101485139A
CN101485139A CN200680055272.5A CN200680055272A CN101485139A CN 101485139 A CN101485139 A CN 101485139A CN 200680055272 A CN200680055272 A CN 200680055272A CN 101485139 A CN101485139 A CN 101485139A
Authority
CN
China
Prior art keywords
network element
server
main website
secondary station
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200680055272.5A
Other languages
English (en)
Other versions
CN101485139B (zh
Inventor
江霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Publication of CN101485139A publication Critical patent/CN101485139A/zh
Application granted granted Critical
Publication of CN101485139B publication Critical patent/CN101485139B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/042Network management architectures or arrangements comprising distributed management centres cooperatively managing the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2035Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L12/40169Flexible bus arrangements
    • H04L12/40176Flexible bus arrangements involving redundancy
    • H04L12/40202Flexible bus arrangements involving redundancy by using a plurality of master stations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/42Loop networks
    • H04L12/437Ring fault isolation or reconfiguration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1034Reaction to server failures by a load balancer

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种基于网元的分布式主备管理的方法及系统,是基于网元的分布式主备管理系统的一种动态网管保护方式,该方法中,连接所有网元并配置所有网元中的路由为双向互通,以及配置一个服务器作为网元的主站,另一服务器作为网元的副站,工作时,主站对网元进行管理,副站对网元进行监测,在网元与其主站通讯中断时,以网元的副站取代该网元的主站,继续管理网元,在通讯恢复时,依主站返回策略切换恢复为以网元配置的主站进行管理。本发明所述方法,通过合理分配两个网管作为主站管理的网元个数,做到了负载均衡;在通讯中断时,能够进行主备倒换,并且保持主副站数据同步,提高了系统网管管理的可靠性。

Description

一种基于网元的分布式主备管理的方法及系统 技术领域
本发明涉及光通讯领域网管系统中主备管理的方法,尤其涉及一种基于 网元的分布式主备管理的方法及系统。
背景技术
目前, 在通讯领域的网管管理系统中, 集中式网管运行时, 如果网管系 统异常, 将会导致网管不可用, 可靠性不高。 为了解决这个问题, 在通信行 业系统中存在主备网管的方案, 即两套网管同时工作, 一主一备或者一主多 备, 主网管采集历史数据, 对于网元进行管理, 这种主备网管方法通常是基 于网络系统管理的。
现有的主备网管方法, 通常有两种使用方式:
( 1 )一种方式是基于上层数据库镜像, 即副网管对于主网管的数据完 全镜像, 这样保证在主网管运行失效时所有的数据均会保留。 参考图 1 , 主 服务器作为主网管对网元进行管理,而作为副网管的副服务器对主服务器的 数据进行完全镜像, 在主服务器出现异常而运行失效时, 所有数据均可以从 副服务器中恢复。
( 2 ) 另一种方式是热监控方法, 由于对网元进行管理时, 存在主管理 者 (Manager ) , 为了增强网络管理的可靠性, 需要存在一个或多个副管理 者, 主、 副管理者数据进行同步, 在主管理者失效的情况下, 可以将副管理 者切换为主管理者管理网管系统。 参考图 2, 主服务器作为主管理者管理系 统网元, 而副服务器作为副管理者也能对所述网元也进行监测管理, 主、 副 服务器两者进行数据同步, 在主服务器出现故障或异常而运行失效时, 直接 切换副管理者作为网元的主管理者, 对网元进行管理。
但是, 如图 1和图 2所示的传统主副网管系统存在如下问题:
( 1 )主网管负荷过大。 系统运行时, 网管系统的所有网元数据都和主 网管进行交互, 造成主网管负荷过大, 存在安全隐患。 ( 2 )在系统中, 由于主副服务器仅采用一个接入网元进行接入, 且各 网元为单向连通, 所以在网元 ECC (嵌入控制通道 Embedded Control Channel ) 中断时, 会有部分网元监控失效。 例如, 在图 1或者图 2中, 当 网元 11和网元 12之间 ECC断开时, 主、 副网管都只能管理网元 11 , 对于 网元 11后面的网元均不能管理。
为此, 需要一种能够解决主网管负荷太大、 ECC 中断时会有部分网元 监控失效、 系统运行可靠性低等缺点的主备管理方法。 发明内容
本发明所要解决的技术问题在于,提供一种基于网元的分布式主备管理 的方法及系统, 使得主副网管负载分担、 提高网管管理的可靠性。
本发明提供一种基于网元的分布式主备管理的方法, 包括如下步驟:
( a )连接所有网元并将网元的路由配置为双向互通, 并配置好网元中 服务器 A和服务器 B的管理权限,其中一部分网元将服务器 A配置为主站, 将服务器 B配置为副站, 另一部分网元将服务器 B配置为主站, 将服务器 A配置为副站;
( b )在两个服务器中配置好主站的返回策略, 两个服务器彼此相接, 并分别连接到将自己配置为主站的一个接入网元, 工作后, 两个服务器作为 主站管理各自分配的部分网元, 作为副站监测另一部分网元;
( c )如有网元与其配置为主站的^^务器的通讯中断, 所述网元进行切 换, 以其配置为副站的另一服务器作为主站对所述网元进行管理;
( d ) 当所述网元与其配置为主站的服务器的通讯恢复后, 按照所述返 回策略恢复该服务器作为主站对这些网元的管理。 进一步地, 上 方法还可具有以下特点:
所述步骤(a ) 中连接所有网元并将网元的路由配置为双向互通的步驟 包括:
串连连接所有网元, 使得所述网元嵌入控制通道是互通的; 将每一网元的路由配置为双向互通。
所述步骤(a ) 中配置网元中两个服务器的管理权限的步骤为: 依据两个服务器负载均衡的原则, 将所有网元均衡地分为两个部分; 一部分网元将服务器 A配置为主站, 将服务器 B配置为副站; 另一部分网元 服务器 B配置为主站, 将服务器 A配置为副站。
所述步骤(b ) 中所述服务器作为主站管理将其配置为主站的网元时, 采集网元的历史数据,对于网元进行相应的配置查询; 所述服务器作为副站 管理将其配置为主站的网元时, 查询及监控网元。
所述步骤(b )中配置为主站和副站的服务器之间工作时进行数据同步, 通过进行数据库同步来保持主副站之间的数据同步, 其中, 主副站中的历史 数据都是全量的。
所述步驟( c ) 包括:
当网元检测到与其配置为主站的服务器通讯中断时,所述网元通知其配 置为副站的服务器作为主站管理该网元;
或被网元配置为副站的服务器检测到被网元配置为主站的服务器异常 时, 所述副站月良务器主动向所述网元请求主站权限, 所述网元 居当前主站 服务器的状态决定是否切换副站为主站管理所述网元。
步骤(b ) 中所述返回策略配置为主站返回方式或非返回方式, 如果是主站返回方式, 则所述步驟(d ) 中当所述网元与其配置为主站 的服务器的通讯恢复时,恢复其配置为主站的服务器作为主站来管理所述网 元,并切换当前主站为副站,同时恢复后的主站服务器同步中断期间的数据; 如果是主站非返回方式, 则所述步骤(d ) 中当所述网元与其配置为主 站的服务器的通讯恢复时,恢复其配置为主站的服务器作为副站来管理所述 网元, 并同步中断期间的数据,待当前主站的服务器断开时再以主站形式接 入所述网元。
所述步骤(b ) 中, 所述两个服务器, 即服务器 A和服务器^ 分别接 入到串接网元中的首端网元与末端网元。 本发明还提供一种基于网元的分布式主备管理系统,包括多个网元和用 于对这些网元进行管理的服务器 A和服务器 B, 其特点在于:
所有网元相互连接, 其路由配置为双向互通, 且在各网元中配置有服务 器 A和服务器 B的管理权限, 其中一部分网元将服务器 A配置为主站, 将 服务器 B配置为副站, 另一部分网元将服务器 B配置为主站, 将服务器 A 配置为副站;
所述网元在与其配置为主站的服务器的通讯中断时进行切换,以其配置 为副站的另一服务器作为主站; 在与其配置为主站的服务器的通讯恢复后, 再按照所述返回策略将其切换回来;
所述两个服务器彼此相接且配置有主站的返回策略,每个服务器分别连 接到将自己配置为主站的一个接入网元,工作时作为主站管理各自分配的部 分网元, 作为副站监测另一部分网元;
所述两个月良务器在发生通讯中断, 收到网元切换的通知时, 变换自己对 于所述网元的主副状态,服务器恢复与将其配置为主站的网元的通讯后,按 照所述返回策略恢复对这些网元的管理。 进一步地, 上述系统还可具有以下特点:
所述服务器, 作为主站管理将其配置为主站的网元时, 采集网元的历史 数据,对于所述网元进行相应的配置查询; 作为副站管理将其配置为副站的 网元时, 查询及监控所述网元。
所述两个月良务器, 在配置为网元的主站和副站正常工作时, 进行数据同 步, 通过进行数据库同步来保持主副站之间的数据同步, 其中, 主副站中的 历史数据都是全量的。 '
所述服务器作为主站的返回策略, 配置为主站返回方式或非返回方式, 如果是主站返回方式,所述网元在与其配置为主站的服务器的通讯恢复 时, 恢复其配置为主站的服务器作为主站来管理所述网元, 并切换当前主站 为副站, 同时恢复后的主站服务器同步中断期间的数据;
如果是主站非返回方式,则所述网元在与其配置为主站的服务器的通讯 恢复时, 恢复其配置为主站的服务器作为副站来管理所述网元, 并同步中断 期间的数据, 待当前主站的服务器断开时再以主站形式接入所述网元。
所述网元,在检测到与其配置为主站的服务器通讯中断时, 通知其配置 为副站的服务器作为主站管理该网元;或在网元配置为副站的服务器检测到 网元配置为主站的服务器异常时,所述副站服务器主动向所述网元请求主站 权限,所述.网元根据当前主站服务器的状态决定是否切换副站为主站管理所 述网元。
所述所有网元,彼此串接相连, 兵器通过首端网元与末端网元与所述两 个服务器, 即即服务器 A和服务器 分别相接。
所述两个服务器, 在作为主站管理分别管理所述网元时, 所管理的将其 配置为主站的网元数目均衡, 负载均衡的分别管理相应网元。
采用本发明所述的技术方案, 与现有技术相比, 对于网元需要配置双向 路由, 两个网管都和网元进行接入; 由于采取了基于网元的分布式主备管理 技术措施,实现了主副网管负载分担、提高了网管管理的可靠性。进一步地, 还可以取得负载均衡, 在局部 ECC断开仍然可实现全网管理等效果。 附图概述
图 1是一种常用现有的基于上层数据库镜像的主备管理技术原理图; 图 2是一种较常用现有的基于热监控的主备管理技术原理图;
图 3 是根据本发明实施例的一种基于网元的分布式主备管理方法的原 理图;
图 4是根据本发明技术方案的基于网元分布式主备管理方法中, 一个 服务器 1中断的实例;
图 5 是根据本发明技术方案的基于网元分布式主备管理方法中, 一个 网元 ECC中断的实例。 本发明的较佳实施方式
下面结合附图及较佳的具体实施方式,对本发明的技术方案的作进一步 的详细描述。
本实施例提出了一种基于密集波分复用系统网元的分布式主备管理的 方法, 但是也用于其它类型的光通讯网络中的网管系统。
该方法是基于网元的分布式主备管理系统, 是网管的一种动态保护方 式, 其中, 两个网管服务器之间都是互相平等的, 两个网管服务器与不同的 网关网元连接, 并且针对于每个不同的网元有相应的主副权限。 系统中的所 有的网元都是 ECC互通的, 而且配置了双向路由, 每一网元都可以独立配 置主备管理者(即主备网管服务器),这些管理者的功能和角色都是平等的, 即一个管理者对于一个网元是主站, 但对另一个网元就可能是副站。
正常情况下, 主备网管服务器都会管理所有网元, 合理分配两个网管服 务器作为主站管理的网元个数,做到负载均衡; 当主网管服务器处于正常工 作状态时, 网元对应的备网管服务器只处于监视状态不能进行配置。 当网络 处于异常状态, 或主网管服务器异常的情况下, 或者网元的 ECC 出现中断 时, 相应网元的副网管服务器取代该网元的主网管服务器, 具有主网管服务 器所有的管理功能, 以继续管理部分网絡或整个网络。
本实施例所述的一种基于网元的分布式主备管理方法, 参照图 3 , 可以 包括如下步骤:
第一步: 连接所有网元并将网元的路由配置为双向互通, 并配置好网元 中服务器 A和服务器 B的管理权限, 其中一部分网元将服务器 A配置为主 站, 将服务器 B配置为副站, 另一部分网元将服务器 B配置为主站, 将服 务器 A配置为副站。
首先, 所有网元可以串连的方式进行连接, 同时, 配置好网元的路由, 保证网元路由都是双向互通的, 当有一个方向不通时, 能够切换到另一个方 向的路由上。
才艮据实际的系统运行情况,需要规划好两个服务器作为主站管理的网元 数目, 例如将网元 11-ln规划为以服务器 1为主站, 将网元 21-2n规划为以 服务器 2为主站。 由于对于网元来说只有主网管采集历史数据, 而作为波分 网管系统中历史数据量是比较大的,所以尽量要做到正常运行时两个网管负 载均衡。
然后, 才 居规划配置好网元中相关管理者的相应权限, 配置网元 11-ln 以服务器 1为主站,以服务器 2为副站;配置网元 21-2n以服务器 2为主站, 以服务器 1为副站。
第二步:在两个服务器中配置好主站的返回策略,两个服务器彼此相接, 并分别连接到将自己配置为主站的一个接入网元, 工作后, 两个服务器作为 主站管理各自分配的部分网元, 作为副站监测另一部分网元。
首先, 需要在两个服务器上分别配置主站生效时的返回策略, 包括: 主站返回方式, 即主站恢复后立即成为相应的主站;
主站非返回方式, 指主站恢复后先成为副站, 等到主站申请时才成为主 站。
然后, 将服务器 1与服务器 2相连接, 将服务器 1通过网元 11接入, 作为网元 11-ln的主站,将服务器 2通过网元 2n接入,作为网元 21-2n的主 站, 如图 3所示, 当然也可以将两个服务器接入其它将其配置为主站的任一 网元。
在图 3所示的网管系统中, 正常运行时服务器 1为网元 11...网元 In的 主网管, 相应的服务器 2为这些网元的副网管; 服务器 2.同时为网元 21... 网元 2n的主网管, 服务器 1为它们的副网管。 这些网元 ECC (嵌入控制通 道 Embedded Control Channel )啫 |5是互通的。
正常运行时, 主站管理相应的网元, 采集网元的历史数据, 对于网元能 够进行相应的配置查询等操作; 而备网管只能查询及监控网元, 不能进行配 置操作, 不采集历史数据; 副网管通过和主网管之间进行数据库同步, 保证 主备网管之间的数据完全一致, 主副网管中的历史数据都是全量的。
在不同的通讯系统中 ,主站和副站的管理权限可能会依具体系统的不同 要求而具有不同的管理权限和管理职能, 但副站必须能够对网元进行监测。
第三步: 如有网元与其配置为主站的艮务器的通讯中断, 所述网元切换 为以其配置为副站的另一服务器作为主站对所述网元进行管理。
在正常运行时, 需要检测网元与其主站之间的通讯状态:
当网元检测和网管的心跳包不再有响应时,网元根据事先配置好的管理 者权限,选择其配置为副站的网管作为主站, 并发送通知相应的副站网管切 换为主站管理网元, 具有主站的所有权限;
或者当一个服务器检测到另一个服务器异常时,主动去 ... ...网元请求主 站权限, 网元根据当前管理的网管判断是否可以给予副站相应的主站权限。
第四步: 当所述网元与其配置为主站的服务器的通讯恢复后, 按照所述 返回策略恢复该服务器作为主站对这些网元的管理。
在网元与主站之间的通讯恢复时,才艮据预先配置好的返回策略对网元进 行管理, 其中主站的数据需要和另一个被替换为主站的副站进行同步。
如果配置的返回策略为主站返回方式, 则服务器和网元建链时, 网元探 测到主服务器正常,通知副服务器切换恢复重新作为副站; 同时主服务器同 步中断期间的数据; 也可以是副服务器探测到主服务器正常时, 进行主副站 的切换及数据同步。
如果配置的返回策略为主站非返回方式, 则主站恢复时, 主站首先被恢 复作为副站管理网元, 与当前作为主站的副服务器同步中断期间的数据, 等 到副服务器断开时再以主站形式接入, 以作为主站管理网元。
该步骤在技术实现与热监控主控方法是基本类似的。 应用实例 1: 服务器 1和网元中断连接失效的情况。
图 4显示了服务器 1和网元中断连接而失效时系统的示意图,依据本发 明所述主备管理方法的技术方案,对服务器 1和网元中断连接时的主备管理 主要包括如下步骤:
( 1 )连接网元 11…网元 In…网元 21…网元 2n, 并在所述网元上配置 好网元的双向路由, 配置好网元中服务器 1和服务器 2的权限, 配置好主站 的返回策略为主站返回式。
其中, 网元 11-ln被配置为以服务器 1为主站, 服务器 2为副站, 而网 元 21-2n被配置为以服务器 2为主站, 服务器 1为副站。
( 2 )将服务器 1和服务器 2接入到网元中, 正常运行时, 服务器 1作 为主站管理网元 11…网元 In, 服务器 2作为副站管理这些网元; 服务器 2 作为主站管理网元 21…网元 2n, 服务器 1作为副站管理这些网元; 服务器 1和服务器 2之间配置好数据同步, 保证两个服务器的数据都是完全一致的 而且都是全量的数据。
( 3 )参照图 4所示, 当服务器 1和网元 11之间通讯失效时, 此时网元 11…网元 In的通讯机制探测到和^ _务器 1之间断开时, 此时网元 11...网元 In通知作为其副站的服务器 2切换作为这些网元的主站, 此时, 服务器 2 作为主站管理网络上所有网元, 采集所有的历史数据,服务器 1管理不上任 何网元。
( 4 )当服务器 1和网元 11的通讯恢复后, 由于网元中配置的返回策略 为主站返回式, 所以服务器 1切换为网元 11…网元 In的主站, 服务器 2仍 然切换恢复为网元 11…网元 In的副站, 其中, 切换过程中, 服务器 1需要 与服务器 2进行数据同步, 恢复通讯中断期间的数据。
从该实例可以看到, 正常运行时系统负载均衡,服务器断开时系统仍然 能够正常管理, 所有的数据均不会丢失。 应用实例 2: 网元之间 ECC断开的情况。
图 5显示了网元 11到网元 12之间 ECC断开时系统的示意图, 依据本 发明所述主备管理方法的技术方案, 对网元之间 ECC断开连接时的主备管 理主要包括如下步骤:
( 1 )连接网元 11…网元 In…网元 21…网元 2n, 并在所述网元上配置 好网元的双向路由, 配置好网元中服务器 1和服务器 2的权限, 配置好主站 的返回策略为主站返回式。
其中, 网元 11-ln被配置为以服务器 1为主站, 服务器 2为副站, 而网 元 21-2n被配置为以服务器 2为主站, 服务器 1为副站。
( 2 )将服务器 1和服务器 2接入到网元中, 正常运行时, 服务器 1作 为主站管理网元 11…网元 ln, 服务器 2作为副站管理这些网元; 服务器 2 作为主站管理网元 21…网元 2n, 服务器 1作为副站管理这些网元; 服务器 1和服务器 2之间配置好数据同步, 保证两个服务器的数据都是完全一致的 而且都是全量的数据。
( 3 )参考图 5所示, 当网元 11和网元 12之间 ECC断开时, 此时网元 12…网元 2n的通讯机制探测到和服务器 1之间断开时, 此时网元 12…网元
In通知服务器 2切换作为这些网元的主站, 此时服务器 2作为主站管理网 元 1系列的部分网元和网元 2系列的所有网元, 采集所有的历史数据, 服务 器 1仅能作为主站管理网元 1系列的部分网元。
( 4 )当网元 11和网元 12之间 ECC通讯恢复后, 由于网元中配置的主 站返回策略为主站返回方式,所以服务器 1切换为网元 12…网元 In的主站, 服务器 2仍然为网元 11…网元 In的副站。
从该实例可以看到, 正常运行时系统负载均衡, ECC 断开时系统仍然 能够正常管理, 所有的数据均不会丟失。
本发明所述的基于网元的主备管理方法,保证主备网管各自管理一部分 网元,合理分配管理者作为主站管理的网元个数能够做到负载均衡; 同时因 为对于主、 备管理者, 其接入的网元不同, 当其中有 ECC中断时, 还能够 管理上所有网元, 能够提高系统的可靠性。
本说明书所附实施例是体现本发明构思的一些典型例子,并不排除使用 体现本发明设计方案的其他实施例。
比如, 在另一实施例中, 服务器的接入网关网元也可以不设置为串行连 接网元的第一个或最后一个, 例如, 在图 3中, 将服务器 2接入到网元 21 , 相比于连接至网元 2n, 其在网元 21与网元 22之间发生网元 ECC中断时, 将使得网元 22-2n不在与服务器 A和服务器 B中任一个相连接, 从而造成 网管服务器不能对这些网元进行管理, 因而, 此种接法的可靠性较差。
又如, 不一定非要负载均衡的将所有网元规划分配与两个服务器相连 接, 在划分网元时, 对两个服务器而言必须做到负载分担, 仅需依据系统实 际运行时的负载情况, 使得负载分担能够使系统能够进入最佳运行状态即 可。 工业实用性
本发明公开的一种基于网元的分布式主备管理的方法及系统,是基于网 元的分布式主备管理系统的一种动态网管保护方式, 其中, 两个网管服务器 之间都是互相平等的, 两个网管服务器与不同的网关网元连接, 并且针对于 每个不同的网元有相应的主副权限。 与现有技术相比,对于网元需要配置双 向路由, 两个网管服务器都和网元进行接入; 通过合理分配两个网管服务器 作为主站管理的网元个数,使得两个 务器共同分担负载; 当网络处于异常 状态, 或主网管异常的情况下,或者网元的 ECC 出现中断时, 相应网元的 副网管取代该网元的主网管, 继续管理部分网络或整个网络,提高了系统网 管管理的可靠性。

Claims (1)

  1. 权 利 要 求 书
    1、 一种基于网元的分布式主备管理的方法, 其特征在于, 包括如下步 骤:
    ( a )连接所有网元并将网元的路由配置为双向互通, 并配置好网元中 服务器 A和服务器 B的管理权限,其中一部分网元将服务器 A配置为主站, 将服务器 B配置为副站, 另一部分网元将服务器 B配置为主站, 将服务器 A配置为副站;
    ( b )在两个服务器中配置好主站的返回策略, 两个服务器彼此相接, 并分别连接到将自己配置为主站的一个接入网元, 工作后, 两个服务器作为 主站管理各自分配的部分网元, 作为副站监测另一部分网元;
    ( c )如有网元与其配置为主站的服务器的通讯中断, 所述网元进行切 换, 以其配置为副站的另一服务器作为主站对所述网元进行管理;
    ( d ) 当所述网元与其配置为主站的服务器的通讯恢复后, 按照所述返 回策略恢复该服务器作为主站对这些网元的管理。
    2、 如权利要求 1所述的方法, 其特征在于, 步骤(a ) 中连接所有网元 并将网元的路由配置为双向互通的步骤包括:
    串连连接所有网元, 使得所述网元嵌入控制通道是互通的;
    将每一网元的路由配置为双向互通。
    3、 如权利要求 1所述的方法, 其特征在于, 步骤(a ) 中配置网元中两 个服务器的管理权限的步驟为:
    依据两个服务器负载均衡的原则, 将所有网元均衡地分为两个部分; 一部分网元将服务器 A配置为主站, 将服务器 B配置为副站; 另一部分网元将服务器 B配置为主站, 将服务器 A配置为副站。
    4、 如权利要求 1所述的方法, 其特征在于, 所述步骤(b ) 中所述服务 器作为主站管理将其配置为主站的网元时, 采集网元的历史数据,对于网元 进行相应的配置查询; 所述服务器作为副站管理将其配置为主站的网元时, 查询及监控网元。
    5、 如权利要求 1所述的方法, 其特征在于, 所述步骤(b ) 中配置为主 站和副站的服务器之间工作时进行数据同步,通过进行数据库同步来保持主 副站之间的数据同步, 其中, 主副站中的历史数据都是全量的。
    6、 如权利要求 1所述的方法, 其特征在于, 所述步骤(c ) 包括: 当网元检测到与其配置为主站的服务器通讯中断时,所述网元通知其配 置为副站的服务器作为主站管理该网元;
    或被网元配置为副站的服务器检测到被网元配置为主站的服务器异常 时, 所述副站服务器主动向所述网元请求主站权限, 所述网元根据当前主站 服务器的状态决定是否切换副站为主站管理所述网元。
    7、 如权利要求 1所述的方法, 其特征在于, 步骤(b ) 中所述返回策略 配置为主站返回方式或非返回方式,
    如果是主站返回方式, 则所述步骤(d ) 中当所述网元与其配置为主站 的服务器的通讯恢复时,恢复其配置为主站的服务器作为主站来管理所述网 元,并切换当前主站为副站,同时恢复后的主站月良务器同步中断期间的数据; 如果是主站非返回方式, 则所述步骤(d ) 中当所述网元与其配置为主 站的服务器的通讯恢复时,恢复其配置为主站的服务器作为副站来管理所述 网元, 并同步中断期间的数据,待当前主站的服务器断开时再以主站形式接 入所述网元。
    8、 如权利要求 1或 2所述的方法, 其特征在于, 所述步骤(b ) 中, 所 述两个服务器, 即服务器 A和服务器 B,分别接入到串接网元中的首端网元 与末端网元。
    9、 一种基于网元的分布式主备管理系统, 包括多个网元和用于对这些 网元进行管理的服务器 A和服务器 B, 其特征在于:
    所有网元相互连接, 其路由配置为双向互通, 且在各网元中配置有服务 器 A和服务器 B的管理权限, 其中一部分网元将服务器 A配置为主站, 将 服务器 B配置为副站, 另一部分网元将服务器 B配置为主站, 将服务器 A 配置为副站;
    所述网元在与其配置为主站的服务器的通讯中断时进行切换,以其配置 为副站的另一服务器作为主站; 在与其配置为主站的 ϋ 务器的通讯恢复后, 再按照所述返回策略将其切换回来;
    所述两个服务器彼此相接且配置有主站的返回策略,每个服务器分别连 接到将自己配置为主站的一个接入网元,工作时作为主站管理各自分配的部 分网元, 作为副站监测另一部分网元;
    所述两个服务器在发生通讯中断, 收到网元切换的通知时, 变换自己对 于所述网元的主副状态,服务器恢复与将其配置为主站的网元的通讯后,按 照所述返回策略恢复对这些网元的管理。
    10、 如权利要求 9所述的系统, 其特征在于, 所述 务器作为主站管理 将其配置为主站的网元时, 采集网元的历史数据,对于所述网元进行相应的 配置查询; 作为副站管理将其配置为副站的网元时, 查询及监控所述网元。
    11、 如权利要求 9所述的系统, 其特征在于, 所述两个服务器在配置为 网元的主站和副站正常工作时,进行数据同步, 通过进行数据库同步来保持 主副站之间的数据同步, 其中, 主副站中的历史数据都是全量的。
    12、 如权利要求 9所述的系统, 其特征在于, 所述服务器作为主站的返 回策略配置为主站返回方式或非返回方式,
    如果是主站返回方式,所述网元在与其配置为主站的服务器的通讯恢复 时, 恢复其配置为主站的l 务器作为主站来管理所述网元, 并切换当前主站 为副站, 同时恢复后的主站服务器同步中断期间的数据;
    如果是主站非返回方式,则所述网元在与其配置为主站的服务器的通讯 恢复时, 恢复其配置为主站的服务器作为副站来管理所述网元, 并同步中断 期间的数据, 待当前主站的服务器断开时再以主站形式接入所述网元。
    13、 如权利要求 9所述的方法, 其特征在于, 所述网元在检测到与其配 置为主站的服务器通讯中断时,通知其配置为副站的服务器作为主站管理该 网元; 或在网元配置为副站的服务器检测到网元配置为主站的服务器异常 时, 所述副站服务器主动向所述网元请求主站权限, 所述网元根据当前主站 服务器的状态决定是否切换副站为主站管理所述网元。
    14、 如权利要求 9所述的系统, 其特征在于, 所述所有网元, 彼此串接 相连, 并且通过首端网元与末端网元与所述两个服务器, 即服务器 A和服 务器 B, 分别相接。
    15、 如权利要求 9所述的系统, 其特征在于, 所述两个服务器, 在作为 主站管理分别管理所述网元时, 所管理的将其配置为主站的网元数目均衡, 负载均衡的分别管理相应网元。
CN200680055272.5A 2006-07-28 2006-07-28 一种基于网元的分布式主备管理的方法及系统 Active CN101485139B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2006/001882 WO2008014639A1 (en) 2006-07-28 2006-07-28 A distributed master and standby managing method and system based on the network element

Publications (2)

Publication Number Publication Date
CN101485139A true CN101485139A (zh) 2009-07-15
CN101485139B CN101485139B (zh) 2011-09-14

Family

ID=38996848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680055272.5A Active CN101485139B (zh) 2006-07-28 2006-07-28 一种基于网元的分布式主备管理的方法及系统

Country Status (7)

Country Link
EP (1) EP2053780B1 (zh)
CN (1) CN101485139B (zh)
BR (1) BRPI0621898A2 (zh)
ES (1) ES2526809T3 (zh)
HK (1) HK1128564A1 (zh)
PT (1) PT2053780E (zh)
WO (1) WO2008014639A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101616440B (zh) * 2009-07-31 2012-05-23 华为技术有限公司 多级双机系统及其倒换方法
CN103118055A (zh) * 2012-10-10 2013-05-22 中兴通讯股份有限公司 一种多媒体接入的方法和设备
CN110266522A (zh) * 2019-05-30 2019-09-20 深圳市中航比特通讯技术有限公司 一种无缝切换管理装置的军用通信设备管理方法
CN112714461A (zh) * 2021-01-29 2021-04-27 四川安迪科技实业有限公司 一种dama卫星网络中心站保护倒换方法
CN113259185A (zh) * 2021-07-07 2021-08-13 中兴通讯股份有限公司 网管代理以及网元管理平台
CN113766002A (zh) * 2021-07-21 2021-12-07 深圳拓邦股份有限公司 一种局域组网的换电柜数据传输方法及系统

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102480369A (zh) * 2010-11-23 2012-05-30 中兴通讯股份有限公司 一种网络管理系统及性能采集的方法
CN102752325A (zh) * 2011-04-18 2012-10-24 贾金原 基于对等网的大规模虚拟场景的高效下载方法
CN102724234A (zh) * 2011-09-29 2012-10-10 新奥特(北京)视频技术有限公司 一种内外网环境文稿系统与制作系统交互的方法和系统
CN102724061B (zh) * 2012-04-16 2016-02-17 成都广达新网科技股份有限公司 一种网络接口管理方法
CN102857371B (zh) * 2012-08-21 2016-04-20 曙光信息产业(北京)有限公司 一种面向集群系统的动态配置管理方法
CN103200018A (zh) * 2013-04-11 2013-07-10 天脉聚源(北京)传媒科技有限公司 一种信息交互的系统和方法
CN103974022A (zh) * 2014-05-23 2014-08-06 无锡矽太恒科电子有限公司 一种基于sip的楼宇可视对讲的方法及其系统
CN108647113B (zh) * 2018-03-30 2022-02-18 创新先进技术有限公司 一种灾难恢复方法及服务器
US11785077B2 (en) 2021-04-29 2023-10-10 Zoom Video Communications, Inc. Active-active standby for real-time telephony traffic
US11575741B2 (en) 2021-04-29 2023-02-07 Zoom Video Communications, Inc. System and method for active-active standby in phone system management
CN113253643A (zh) * 2021-05-12 2021-08-13 南瑞集团有限公司 一种基于d5000主备调系统的主从模式控制方法及管理系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01175338A (ja) * 1987-12-28 1989-07-11 Fuji Electric Co Ltd 伝送系の二重化方法
JPH03232397A (ja) * 1990-02-08 1991-10-16 Toshiba Corp バックアップ切替方式
US5696895A (en) * 1995-05-19 1997-12-09 Compaq Computer Corporation Fault tolerant multiple network servers
US5694615A (en) 1995-06-26 1997-12-02 Hewlett Packard Company Storage system having storage units interconnected to form multiple loops to provide simultaneous access from multiple hosts
US6687222B1 (en) * 1999-07-02 2004-02-03 Cisco Technology, Inc. Backup service managers for providing reliable network services in a distributed environment
CA2388712A1 (en) * 2000-06-30 2002-01-10 Internap Network Services Corporation Distributed network management system and method
US20040034807A1 (en) * 2002-08-14 2004-02-19 Gnp Computers, Inc. Roving servers in a clustered telecommunication distributed computer system
US20050080891A1 (en) 2003-08-28 2005-04-14 Cauthron David M. Maintenance unit architecture for a scalable internet engine
US7178052B2 (en) 2003-09-18 2007-02-13 Cisco Technology, Inc. High availability virtual switch
US7275175B2 (en) * 2004-07-22 2007-09-25 International Business Machines Corporation Method and apparatus for high-speed network adapter failover
JP4459018B2 (ja) * 2004-10-28 2010-04-28 富士通株式会社 ノード装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101616440B (zh) * 2009-07-31 2012-05-23 华为技术有限公司 多级双机系统及其倒换方法
CN103118055A (zh) * 2012-10-10 2013-05-22 中兴通讯股份有限公司 一种多媒体接入的方法和设备
CN110266522A (zh) * 2019-05-30 2019-09-20 深圳市中航比特通讯技术有限公司 一种无缝切换管理装置的军用通信设备管理方法
CN112714461A (zh) * 2021-01-29 2021-04-27 四川安迪科技实业有限公司 一种dama卫星网络中心站保护倒换方法
CN113259185A (zh) * 2021-07-07 2021-08-13 中兴通讯股份有限公司 网管代理以及网元管理平台
CN113766002A (zh) * 2021-07-21 2021-12-07 深圳拓邦股份有限公司 一种局域组网的换电柜数据传输方法及系统

Also Published As

Publication number Publication date
EP2053780A1 (en) 2009-04-29
WO2008014639A1 (en) 2008-02-07
EP2053780A4 (en) 2011-04-13
EP2053780B1 (en) 2014-10-08
BRPI0621898A2 (pt) 2012-10-16
HK1128564A1 (en) 2009-10-30
ES2526809T3 (es) 2015-01-15
PT2053780E (pt) 2015-01-05
CN101485139B (zh) 2011-09-14

Similar Documents

Publication Publication Date Title
CN101485139A (zh) 一种基于网元的分布式主备管理的方法及系统
EP1491000B1 (en) Network management system
CN100534024C (zh) 基于工业以太网的故障处理方法、系统及一种交换设备
JP4461175B2 (ja) 伝送装置、および伝送装置とレイヤ2スイッチ間の冗長方法
JP2002504776A (ja) リング/メッシュ・オプティカルネットワーク
CN100499507C (zh) 一种容灾系统、方法和网络设备
JP2002510163A (ja) 自己回復光ネットワーク
CN101860492A (zh) 快速切换的方法、装置和系统
CN112003716A (zh) 一种数据中心双活实现方法
CN100493017C (zh) 一种主备设备自动切换的方法
CN103095569B (zh) 一种高冗余低成本的热容灾广域网架构及其实现方法
CN110838962B (zh) 船用网络系统及船舶系统
JP2002247038A (ja) ネットワークにおけるリング形成方法及び障害回復方法並びにリング形成時のノードアドレス付与方法
CN102045245A (zh) 用户接入备份时下行流量切换保护方法及备份转发系统
CN100391190C (zh) 经由冗余网络控制的多重网络故障容错管理的方法和装置
EP1721400B1 (en) Systems and methods for multi-layer protection switching within a sub-networking connection
CN101145972A (zh) 一种容灾网管系统及其网管客户端的登陆方法
CN102255741B (zh) 用户业务信息备份方法和装置
CN106850264B (zh) 一种网络设备
WO2014030732A1 (ja) 通信システム、通信装置、プロテクション切り替え方法および切り替えプログラム
CN101262400A (zh) 一种桥模式弹性分组环冗余保护的方法和系统
JP3445900B2 (ja) インタネットワーク装置及びネットワークシステム
JP2692657B2 (ja) 通信システム
JPH0758965B2 (ja) ネツトワ−クシステム
CN110572289A (zh) 一种基于第三方通道的主备切换系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1128564

Country of ref document: HK