CN103414778B - 一种集群网管设备逐级保活的方法 - Google Patents

一种集群网管设备逐级保活的方法 Download PDF

Info

Publication number
CN103414778B
CN103414778B CN201310357688.4A CN201310357688A CN103414778B CN 103414778 B CN103414778 B CN 103414778B CN 201310357688 A CN201310357688 A CN 201310357688A CN 103414778 B CN103414778 B CN 103414778B
Authority
CN
China
Prior art keywords
equipment
alive
keep
cluster
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310357688.4A
Other languages
English (en)
Other versions
CN103414778A (zh
Inventor
徐菲云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Guangda Hengji Communication Technology Co ltd
Original Assignee
Chengdu Guangda New Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Guangda New Network Technology Co Ltd filed Critical Chengdu Guangda New Network Technology Co Ltd
Priority to CN201310357688.4A priority Critical patent/CN103414778B/zh
Publication of CN103414778A publication Critical patent/CN103414778A/zh
Application granted granted Critical
Publication of CN103414778B publication Critical patent/CN103414778B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种集群网管设备逐级保活的方法,该方法包括以下步骤:(1)获取设备间的拓扑关系:(2)集群设备通过保活机制来检测设备是否在线,每一台设备都由其直接上游设备与其进行保活,保活机制通过设备间周期性互发保活报文来实现。当一台设备的直接上游设备在一个保活周期内没有收到该设备的保活报文,则表示保活失败,该设备的直接上游设备通知集群代理设备该设备离线,集群代理设备收到该设备的离线通知后将自己维护的该设备及其下游设备(如果有的话)的集群状态置为离线,本发明从负荷分担的角度考虑,采用逐级保活的方法:每一个集群成员都由与其直连的上游设备和其保活,因此可以达到减轻集群代理设备的负担的突出优点。

Description

一种集群网管设备逐级保活的方法
技术领域
本发明涉及数据通信领域,尤其是涉及一种集群网管设备逐级保活的方法。
背景技术
广电接入网基本的组网模型如图1所示,通常情况下,一台OLT(光线路终端OpticalLineTerminal为EPON网络的一个设备单元)设备可下联上千台设备,并且这些设备分布在各个角落,而针对这些设备的统一管理(如给设备分配IP地址,自动对设备进行配置)是一个必须考虑的问题。
针对这些管理类的问题,业界通常通过集群网管来解决问题。集群是由一组二层网络设备构成的一个统一的管理域,它可以提供对集群每个成员的管理和访问能力。我们这里谈到的管理域是OLT及下联的二层设备;集群这个管理域中,分别有集群成员和集群代理两种角色。
集群代理:在集群中,提供对整个集群的管理接口作用的设备,称为集群代理,网管系统对集群中的成员进行配置、管理、监控,都必须通过集群代理来进行。集群代理下联的设备需要通过一系列和集群代理设备的报文交互才能加入集群成为集群成员。在广电接入网中,集群代理的角色通常由OLT承担。
集群成员:就是指被集群代理管理的设备,包括EOC局端、EOC终端、ONU、Switch、网管光机等。
要对设备进行统一管理,首先必须要把设备间的拓扑关系发现出来,并且如果设备发现出来之后被移走或断电,也能够被检测出来。这通常通过保活机制来实现,保活就是两台设备之间通过周期性的互发报文来检测对方是否在线,如果在一定时间内没有收到对方的报文,就认为对方离线。如果保活都由集群代理设备来负责(一般做法),由于集群代理设备可能下联上千台设备,这会给集群代理设备造成很大的负担。
发明内容
本发明的目的在于:为解决集群设备离线检测的问题,集群系统需采用保活机制。如果保活都由集群代理设备来负责,由于集群代理设备可能下联上千台设备,这会给集群代理设备造成很大的负担。因此从负荷分担的角度考虑,采用逐级保活的方法:每一个集群成员都由与其直连的上游设备和其保活,以减轻集群代理设备的负担。
本发明的发明目的通过以下技术方案来实现:
一种集群网管设备逐级保活的方法,其特征在于,该方法包括以下步骤:
(1)获取设备间的拓扑关系:
1)集群代理设备周期性的发送设备发现广播报文;
2)刚接入网络中的新设备接收到设备发现广播报文后,向集群代理设备发送一个设备发现响应报文作为回应;
3)集群代理设备接收设备发现响应报文,并判断新设备的直接上游设备是否是集群代理设备本身,如果是,则在设备加入集群后由集群代理设备作为直接上游设备和新设备进行保活,如果否,则在设备加入集群后由直接上游设备和新设备进行保活;
(2)当一台下线设备的直接上游设备在一个保活周期内没有收到该下线设备的保活报文,则表示保活失败,该下线设备的直接上游设备通知集群代理设备该下线设备已离线,集群代理设备收到的该下线设备的直接上游设备的通知后将自己维护的该下线设备的集群状态置为离线,如果该下线设备有下游设备,集群代理设备还把该下线设备的所有下游设备的集群状态置为离线。
优选的,步骤(1)中,如果新设备与集群代理设备之间有一台中间设备,则新设备发送的设备响应报文经过该中间设备时,该中间设备就在设备响应报文中加入自己的MAC地址作为路径信息,集群代理设备收到设备发现响应报文后,取出路径信息中的MAC地址作为新设备的直接上游设备的MAC地址。
优选的,如果新设备和集群代理设备之间有多台中间设备,则设备响应报文后经过的中间设备要把自己的路径信息加在前面经过的中间设备所加路径信息的后面,集群代理设备收到设备发现响应报文后,取出第一条路径信息中的MAC地址作为新设备的直接上游设备的MAC地址。
优选的,如果设备发现响应报文中没有路径信息,则认为该新设备的直接上游设备为集群代理设备本身。
优选的,步骤(1)中,集群代理设备向新设备的直接上游设备发送请求报文,请求直接上游设备与新设备进行保活,直接上游设备收到请求报文后,如果同意与新设备进行保活,则发送同意保活报文给集群代理设备,且保活开始,直接上游设备首先发送保活报文给新设备,新设备收到该保活报文,回应一个保活报文给直接上游设备,互发保活报文的过程周期性的进行;如果不同意与新设备进行保活,则发送拒绝保活报文给集群代理设备。
优选的,步骤(2)中,集群代理设备需要对下线设备的直接上游设备发出的通知发送回应报文,如果下线设备的直接上游设备没有收到集群代理设备的回应报文,则该下线设备的直接上游设备需要一直发送通知,直到收到集群代理设备的回应报为止。
与现有技术相比,本发明具有以下优点:
1、由集群代理设备周期性的发送设备发现广播报文,有新设备接入时,集群代理设备可立刻知道有新设备接入,同时还能迅速自动获取新设备的位置,从而快速建立设备及设备间的拓扑关系;
2、从负荷分担的角度考虑,采用逐级保活的方法:每一个集群成员都由与其直连的上游设备和其保活,当有成员离线时,其直连的上游设备能迅速通知集群代理设备,从而可以减轻集群代理设备的负担。
附图说明
图1为接入网基本的组网模型;
图2为发现请求/响应流程图示;
图3为保活请求流程图示;
图4为保活过程图示;
图5为保活失败通知流程图示。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例
本发明为解决集群设备离线检测的问题,集群系统需采用保活机制。如果保活都由集群代理设备来负责,由于集群代理设备可能下联上千台设备,这会给集群代理设备造成很大的负担。因此从负荷分担的角度考虑,采用逐级保活的方法:每一个集群成员都由与其直连的上游设备和其保活,以减轻集群代理设备的负担。其具体包括以下步骤:
步骤一:获取设备间的拓扑关系:
1)集群代理设备周期性的发送设备发现广播报文,所有还没有加入集群的设备必须响应该报文;
2)刚接入网络中的新设备接收到设备发现广播报文后,向集群代理设备发送一个设备发现响应报文作为回应;
当一台新设备被接入到网络中,如果新设备收到集群代理设备发送的设备发现广播报文,需要向集群代理设备发送一个设备发现响应报文作为回应,如果这台新设备和集群代理设备之间还有其它设备,响应报文每经过一台设备,经过的那台设备就需要在报文中加入自己的MAC地址作为路径信息。如果新设备和集群代理设备之间不止一台设备,则报文后经过的设备要把自己的路径信息加在前面经过的设备所加路径信息的后面。
3)集群代理设备接收设备发现响应报文,并判断新设备的直接上游设备是否是集群代理设备本身,如果是,则新设备加入集群由集群代理设备作为直接上游设备和新设备进行保活,如果否,则新设备加入集群由直接上游设备和新设备进行保活;
集群代理设备收到设备发现响应报文后,取出第一条路径信息中的MAC地址作为该报文发送设备的直接上游设备的MAC地址。如果报文中没有路径信息,则认为该设备的直接上游设备为集群代理设备本身。
如果一台下游设备(假设为设备甲)的直接上游设备为集群代理设备,则由集群代理设备和其保活;否则集群代理设备发送请求报文到设备甲的直接上游设备(假设为设备乙),发送请求报文的目的是请求设备乙与设备甲保活,设备乙收到这个请求报文后,如果同意与设备甲保活,则发送同意保活报文,如果不同意与设备甲保活,发送拒绝保活报文。设备乙同意保活则保活开始,设备乙首先发送保活报文给设备甲,设备甲收到该报文,需要回应一个保活报文给设备乙。
步骤二:当一台设备的直接上游设备在一个保活周期内还没有收到该设备的保活报文,则表示保活失败,该设备的直接上游设备通知集群代理设备该设备已离线,集群代理设备收到的该设备的直接上游设备的通知后将自己维护的该设备的集群状态置为离线,如果该设备有下游设备,集群代理设备还需要把该设备的所有下游设备的集群状态置为离线。
保活双方需要保活定时器,如果定时器超时还没有收到对方的保活报文,则保活失败。假设设备甲将自己的集群状态置为离线,设备乙(设备甲的直接上游设备)需要通知集群代理设备设备甲离线。集群代理设备收到设备乙的通知后将自己维护的设备甲的集群状态置为离线,如果设备甲也有下游设备,集群代理设备还需要把设备甲的所有下游设备的集群状态置为离线。
上游设备发送的通知集群代理设备某台设备离线的报文有可能得不到集群代理设备的响应(比如发送的通知报文在集群代理设备上因为拥塞而丢弃),发生这种情况的时候,发送离线通知报文的设备需要一直发送,直到收到集群代理设备的响应为止。
设备接入网络后,逐级保活将全程自动完成,不需要任何手动操作。以下通过一台EOC局端设备加入网络的例子来说明逐级保活的具体实施流程。
1)如图2所示,将一台EOC局端设备接入网络,当它收到来自OLT的设备发现广播报文的时候,向OLT发送设备发现响应报文,该响应报文经过ONU时,ONU添加自己的路径信息转发给OLT。OLT收到设备发现响应报文,解析该报文,根据其中的路径信息获取EOC局端设备的直接上游设备(ONU)。
2)如图3所示,待加入过程完成后,OLT向ONU发送请求报文请求ONU与EOC局端设备保活,ONU同意保活请求,发送同意保活报文给OLT。
3)如图4所示,ONU与EOC局端设备通过周期性的互发保活报文进行保活。
4)如图5所示,由于ONU与EOC局端设备之间链路中断,导致设备间保活失败,ONU通知OLTEOC局端设备离线。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,应当指出的是,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种集群网管设备逐级保活的方法,其特征在于,该方法包括以下步骤:
(1)获取设备间的拓扑关系:
1)集群代理设备周期性的发送设备发现广播报文;
2)刚接入网络中的新设备接收到设备发现广播报文后,向集群代理设备发送一个设备发现响应报文作为回应;
3)集群代理设备接收设备发现响应报文,并判断新设备的直接上游设备是否是集群代理设备本身,如果是,则在设备加入集群后由集群代理设备作为直接上游设备和新设备进行保活,如果否,则在设备加入集群后由直接上游设备和新设备进行保活;
如果新设备与集群代理设备之间有一台中间设备,则新设备发送的设备发现响应报文经过该中间设备时,该中间设备就在设备发现响应报文中加入自己的MAC地址作为路径信息,集群代理设备收到设备发现响应报文后,取出路径信息中的MAC地址作为新设备的直接上游设备的MAC地址;
(2)当一台下线设备的直接上游设备在一个保活周期内没有收到该下线设备的保活报文,则表示保活失败,该下线设备的直接上游设备通知集群代理设备该下线设备已离线,集群代理设备收到的该下线设备的直接上游设备的通知后将自己维护的该下线设备的集群状态置为离线,如果该下线设备有下游设备,集群代理设备还把该下线设备的所有下游设备的集群状态置为离线。
2.根据权利要求1所述的一种集群网管设备逐级保活的方法,其特征在于,如果新设备和集群代理设备之间有多台中间设备,则设备发现响应报文后经过的中间设备要把自己的路径信息加在前面经过的中间设备所加路径信息的后面,集群代理设备收到设备发现响应报文后,取出第一条路径信息中的MAC地址作为新设备的直接上游设备的MAC地址。
3.根据权利要求2所述的一种集群网管设备逐级保活的方法,其特征在于,如果设备发现响应报文中没有路径信息,则认为该新设备的直接上游设备为集群代理设备本身。
4.根据权利要求1所述的一种集群网管设备逐级保活的方法,其特征在于,步骤(1)中,集群代理设备向新设备的直接上游设备发送请求报文,请求直接上游设备与新设备进行保活,直接上游设备收到请求报文后,如果同意与新设备进行保活,则发送同意保活报文给集群代理设备,且保活开始,直接上游设备首先发送保活报文给新设备,新设备收到该保活报文,回应一个保活报文给直接上游设备,互发保活报文的过程周期性的进行;如果不同意与新设备进行保活,则发送拒绝保活报文给集群代理设备。
5.根据权利要求1所述的一种集群网管设备逐级保活的方法,其特征在于,步骤(2)中,集群代理设备需要对下线设备的直接上游设备发出的通知发送回应报文,如果下线设备的直接上游设备没有收到集群代理设备的回应报文,则该下线设备的直接上游设备需要一直发送通知,直到收到集群代理设备的回应报文为止。
CN201310357688.4A 2013-08-16 2013-08-16 一种集群网管设备逐级保活的方法 Expired - Fee Related CN103414778B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310357688.4A CN103414778B (zh) 2013-08-16 2013-08-16 一种集群网管设备逐级保活的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310357688.4A CN103414778B (zh) 2013-08-16 2013-08-16 一种集群网管设备逐级保活的方法

Publications (2)

Publication Number Publication Date
CN103414778A CN103414778A (zh) 2013-11-27
CN103414778B true CN103414778B (zh) 2016-05-25

Family

ID=49607763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310357688.4A Expired - Fee Related CN103414778B (zh) 2013-08-16 2013-08-16 一种集群网管设备逐级保活的方法

Country Status (1)

Country Link
CN (1) CN103414778B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873299B (zh) * 2014-03-17 2017-11-14 新华三技术有限公司 一种设备状态轮询的方法及其装置
CN104333468A (zh) * 2014-11-13 2015-02-04 太仓市同维电子有限公司 在EPON中基于WebNMS拓扑发现与管理的方法
WO2016106520A1 (zh) * 2014-12-29 2016-07-07 华为技术有限公司 一种在光网络中传输信息的方法、终端及系统
CN108881450A (zh) * 2018-06-27 2018-11-23 郑州云海信息技术有限公司 一种在存储集群中进行设备发现的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101098279A (zh) * 2006-06-30 2008-01-02 李涛 分布式动态拓扑系统、构建方法以及应用在其中的终端设备
US7577725B1 (en) * 2000-02-25 2009-08-18 Cisco Technology, Inc. IP address allocation in a network environment
CN101674669A (zh) * 2009-10-12 2010-03-17 中兴通讯股份有限公司 用于保活处理的方法、服务节点设备和接入节点设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7577725B1 (en) * 2000-02-25 2009-08-18 Cisco Technology, Inc. IP address allocation in a network environment
CN101098279A (zh) * 2006-06-30 2008-01-02 李涛 分布式动态拓扑系统、构建方法以及应用在其中的终端设备
CN101674669A (zh) * 2009-10-12 2010-03-17 中兴通讯股份有限公司 用于保活处理的方法、服务节点设备和接入节点设备

Also Published As

Publication number Publication date
CN103414778A (zh) 2013-11-27

Similar Documents

Publication Publication Date Title
CN102088413B (zh) 一种网络流量分流方法、网络节点及系统
CN100469036C (zh) 一种工业以太网快速冗余的实现方法
US9894166B2 (en) Registration method and system for common service entity
CN103414778B (zh) 一种集群网管设备逐级保活的方法
CN104094577A (zh) 用于间接地评定活动实体的状态的方法和装置
CN101729426B (zh) 一种虚拟路由冗余协议主备用设备快速切换的方法及系统
CN110311800A (zh) 通信设备、节点的连接方法、存储介质、电子装置
CN104144124B (zh) 数据转发方法、装置及系统
CN103095749A (zh) 用于实现跨网段设备发现的方法和系统
CN107295428A (zh) 一种光网络单元的注册方法、装置及光线路终端
CN101378333B (zh) 实现连续性检查消息报文收发的系统、装置及方法
CN103856760A (zh) 一种视频监控设备间纵向虚拟化装置
CN101895472A (zh) 流业务负载分担方法和处理方法以及相应的设备和系统
WO2015131548A1 (zh) 保护bfd的方法和设备
CN103227725A (zh) 一种防火墙双机备份的方法及装置
WO2013189381A3 (zh) 无源光网络链路检测方法及装置
US8611231B2 (en) Connectivity fault management for ethernet tree (E-Tree) type services
CN104317679A (zh) 一种scada系统基于线程冗余的通信容错方法
CN103997436A (zh) 一种电梯物联网中的链路保持方法和网关
CN106453539A (zh) 一种处理节点注册通知的方法和系统
CN103517155A (zh) 一种基于监控业务的流量动态控制的方法及装置
CN104602180A (zh) 创建订阅资源系统及创建订阅资源的方法
JP2018504812A (ja) 受動光ネットワークにおける端末装置を管理するための方法、装置、およびシステム
CN104079396A (zh) 网络冗余结构
CN109245911B (zh) 一种bras热备的实现方法、设备及计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: High tech Zone Shiyang street Chengdu city Sichuan Province, Qingyun 610041 village five group No. fifty-five Shiyang Industrial Park No. two building four floor

Applicant after: CHENGDU GUANGDA ELECTRONIC CO.,LTD.

Address before: High tech Zone Shiyang street Chengdu city Sichuan Province, Qingyun 610041 village five group No. fifty-five Shiyang Industrial Park No. two building four floor

Applicant before: Chengdu Guangda Electronic & Telecom Technology Development Co.,Ltd.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: CHENGDU GUANGDA ELECTRONIC + TELECOM TECHNOLOGY DEVELOPMENT CO., LTD. TO: CHENGDU GUANGDA ELECTRONIC CORPORATION CO., LTD.

CB02 Change of applicant information

Address after: High tech Zone Shiyang street Chengdu city Sichuan Province, Qingyun 610041 village five group No. fifty-five Shiyang Industrial Park No. two building four floor

Applicant after: CHENGDU GUANGDA NEW NETWORK TECHNOLOGY Co.,Ltd.

Address before: High tech Zone Shiyang street Chengdu city Sichuan Province, Qingyun 610041 village five group No. fifty-five Shiyang Industrial Park No. two building four floor

Applicant before: CHENGDU GUANGDA ELECTRONIC CO.,LTD.

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200728

Address after: Floor 2, No.16, Gaopeng Avenue, high tech Zone, Chengdu, Sichuan 610000

Patentee after: Chengdu Guangda Hengji Communication Technology Co.,Ltd.

Address before: 610041 building four, building two, Shiyang Industrial Park, five village, Shiyang village, fifty-five village, Chengdu hi tech Zone, Sichuan, Qingyun

Patentee before: CHENGDU GUANGDA NEW NETWORK TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160525

Termination date: 20210816

CF01 Termination of patent right due to non-payment of annual fee