CN102340407B - 保护倒换方法及系统 - Google Patents

保护倒换方法及系统 Download PDF

Info

Publication number
CN102340407B
CN102340407B CN201010232516.0A CN201010232516A CN102340407B CN 102340407 B CN102340407 B CN 102340407B CN 201010232516 A CN201010232516 A CN 201010232516A CN 102340407 B CN102340407 B CN 102340407B
Authority
CN
China
Prior art keywords
node device
microwave node
standby
active
pretection switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010232516.0A
Other languages
English (en)
Other versions
CN102340407A (zh
Inventor
任文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201010232516.0A priority Critical patent/CN102340407B/zh
Priority to PCT/CN2010/079022 priority patent/WO2012009914A1/zh
Publication of CN102340407A publication Critical patent/CN102340407A/zh
Application granted granted Critical
Publication of CN102340407B publication Critical patent/CN102340407B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/74Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for increasing reliability, e.g. using redundant or spare channels or apparatus

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明公开了一种保护倒换方法及系统,构成保护对的主备微波节点设备中设置有各自的代理中心,保护对中设置有一个管理中心,该方法包括:主备微波节点设备代理中心根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现一个或多个故障;在主备微波节点设备之间通信正常的情况下,主备微波节点设备代理中心通过保护倒换通信通道进行主备微波节点设备的保护倒换;在主备微波节点设备之间通信异常的情况下,主备微波节点设备代理中心通知管理中心,管理中心通过保护倒换通信通道对主备微波节点设备进行强制保护倒换。借助于本发明的技术方案,使保护倒换更加可靠安全,并缩短了保护倒换的时间,提高了设备的性能。

Description

保护倒换方法及系统
技术领域
本发明涉及通讯领域,特别是涉及一种保护倒换方法及系统。
背景技术
目前,微波通信技术问世已半个多世纪,该技术是在微波频段通过地面视距进行信息传播的一种无线通信手段。微波通信在通信领域起着举足轻重的作用,是一种快速的通信手段。无论是在移动接入网络,还是在移动城域网络和核心网络中,随处都可以看到微波设备的身影,尤其在应急通信中,微波更是一个不可替代的手段。数字微波通信、光纤、以及卫星一起被称为现代通信传输的三大支柱。
作为单个的微波设备必须能够稳定可靠的工作才能支撑起稳定可靠的微波网络,但是,硬件软件都存在自身的缺陷,因此不可避免的会出现故障,在相关技术中,为了提高单个微波设备的可靠性,一般都会选择1+1保护方案:即,一个微波节点设备为主用子单元,而另一个微波节点设备为备用子单元,主备子单元构成某传输方向的保护对。当主用子单元出现故障时,立即倒换到备用子单元上,从而保证该传输方向的业务的正常运行。
目前,一般常见的保护倒换方式有热备份,热备份+空间分集、频率分集,热备份+空间分集。它们的目的是均是为了保证传输业务能够高可靠的传输,目前市场上的微波设备一般都会支持以上保护倒换方式。由于保护倒换是一个动态过程,如果在保护倒换过程中出现任何问题,都会造成保护倒换失败,保护倒换的结果就很难得到控制。
实际应用中,实现保护倒换的方法不同,保护倒换的效果有可能也不同,但目前的相关技术中,保护倒换严重依赖于主用与备用之间的触发通道,如果该通道失效,即主备设备间的通讯出现异常,将无法完成保护倒换,如果触发通道失效则该倒换方法完全失效。例如,出现当前不检测故障而不进行倒换导致业务瘫痪、或通讯链路出现故障而不进行倒换导致业务瘫痪、发生误检测而导致保护倒换等问题。
发明内容
本发明提供一种保护倒换方法及系统,以解决现有技术中主备设备通讯异常时,倒换不可实现的问题。
本发明提供一种保护倒换方法,构成保护对的主备微波节点设备中设置有各自的代理中心,保护对中设置有一个管理中心,该方法包括:
主备微波节点设备代理中心根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现一个或多个故障;
在主备微波节点设备之间通信正常的情况下,主备微波节点设备代理中心通过保护倒换通信通道进行主备微波节点设备的保护倒换;
在主备微波节点设备之间通信异常的情况下,主备微波节点设备代理中心通知管理中心,管理中心通过保护倒换通信通道对主备微波节点设备进行强制保护倒换。
本发明还提供了一种保护倒换系统,包括:
主用微波节点设备代理中心,用于根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现一个或多个故障,并在主备微波节点设备之间通信正常的情况下,通过保护倒换通信通道进行主备微波节点设备的保护倒换;
备用微波节点设备代理中心,用于根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现一个或多个故障,并在主备微波节点设备之间通信正常的情况下,通过保护倒换通信通道进行主备微波节点设备的保护倒换;
管理中心,用于在主备微波节点设备之间通信异常的情况下,通过保护倒换通信通道对主备微波节点设备进行强制保护倒换。
本发明有益效果如下:
本发明实施例通过多点检测控制策略、对各故障触发的保护倒换相对独立而又统一的实现方式,解决了现有技术中存在的主备设备通讯异常时,倒换不可实现的问题。同时,通过主备设备之间的高速通讯通道可以解决倒换时间较长造成业务中断时间长、通过多点检测控制策略可以解决当前不可检测故障而不进行倒换导致业务瘫痪、通讯链路出现故障而不进行倒换导致业务瘫痪、以及发生误检测而导致保护倒换的问题,使保护倒换动作完全处于可控状态下,使保护倒换更加可靠安全,减少出现错误倒换和不倒换的情况;并缩短了保护倒换的时间,提高了设备的性能。
附图说明
图1是本发明实施例的管理中心-代理中心架构及数据流向的示意图;
图2是本发明实施例的保护倒换方法的流程图;
图3是本发明实施例的故障信息触发保护倒换的处理流程图;
图4是本发明实施例的主备Agent通信中断触发保护倒换的处理流程图;
图5是本发明实施例的掉电消息触发保护倒换的处理流程图;
图6是本发明实施例的由远端告警触发保护倒换的处理流程图;
图7是本发明实施例的保护倒换系统的结构示意图。
具体实施方式
为了解决现有技术中存在的倒换时间较长造成业务中断时间长、当前不可检测故障而不进行倒换导致业务瘫痪、通讯链路出现故障而不进行倒换导致业务瘫痪、以及发生误检测而导致保护倒换的问题,本发明提供了一种保护倒换方法及系统。
在对本发明实施例进行说明之前,首先对本发明实施例的网络架构进行详细的说明,图1是本发明实施例的管理中心-代理中心架构及数据流向的示意图,如图1所示,管理中心(Manager)-代理中心(Agent)架构包括三个模块:管理中心(Manager)、主用代理中心,即主用微波节点设备代理中心(MasterAgent)、备用代理中心,即备用微波节点设备代理中心(Slave Agent);六类消息:Manager-Agent心跳消息,包括:心跳消息101和心跳消息103;Manager-Agent控制消息,包括:控制消息102和控制消息104;Agent-Agent心跳消息,包括:心跳消息105;Agent-Agent控制消息,包括:控制消息106;远端告警(RDI)消息,包括:远端告警107和远端告警108。
其中,Manager-Agent心跳消息包括的内容为:Agent能够检测到的故障信息,即,当前故障状态;Agent当前工作状态,包括:主用状态和备用状态。Manager-Agent控制消息包括的内容:Manager发给Agent的强制倒换消息;Agent发送到Manager的完成强制倒换结束消息;Agent发送到Manager的请求监控保护倒换消息;Agent发送到Manager的取消监控保护倒换消息。Agent-Agent心跳消息包括:Agent能够检测到的故障信息,即,当前故障状态;Agent当前工作状态,包括:主用状态和备用状态。Agent-Agent控制消息包括:Master Agent发送到Slave Agent的请求保护倒换消息;原Slave Agent发送到原Master Agent的保护倒换结束消息。远端告警消息:为可扩展的消息,它可以指示任何对端故障而导致本端故障的消息,是对端将故障信息插到微波帧中反馈到本端。
Manager是一个控制管理中心,它的主要作用是管理Master Agent和SlaveAgent上报的心跳消息101和心跳消息103,这两条心跳消息的信息内容主要包括Master Agent和Slave Agent的状态信息和故障信息,它的上报分为两种:触发上报状态信息和故障信息以及周期上报或间隔相同时间上报状态信息和故障信息。其中,触发上报是指:发生变化时就会主动上报,主要目的是在快速通道出现故障时,使管理中心能规划出正确的传输路径;周期上报或间隔相同时间上报主要是指管理中心向页面反馈Master Agent和Slave Agent的工作状态,以及在快速通道出现问题时,管理中心会根据心跳消息进行监控。Manager在接收到Master Agent和Slave Agent上报的心跳消息101和心跳消息103后,会向用户界面返回当前两个代理中心(Agent)的状态,当超时未收到心跳消息101或心跳消息103,就将相应设备的工作状态显示为未工作、将故障状态设置为严重故障并上报告警;当Manager收到Master Agent或Slave Agent的请求监控保护倒换消息后,开始规划该传输单元的最优传输路径并向MasterAgent和Slave Agent发送强制倒换消息,然后一直监控该传输单元的MasterAgent和Slave Agent的故障状态,尽可能保证该传输单元能够正常传输业务,直到收到取消监控保护倒换消息。
Agent是一个代理中心,它的主用作用是处理Agent的检测模块检测到的故障信息,通过Agent的通讯模块与另一Agent进行通讯,控制Agent的执行模块完成保护倒换动作,其中的Master Agent可以将本端的远端故障指示(Remote Defect Indication,简称为RDI)消息插入到微波帧,RDI消息为对端向本端返回的故障信息。
需要说明的是,本发明实施例的Manager与现有技术中保护倒换控制器有着本质的区别,首先现有技术中保护倒换控制器是保护倒换的核心,而本发明实施例的Manager控制保护倒换的功能已经被削弱,也就是说,如果主备Agent能够正常通信,则此Manager不会参与保护倒换流程,仅是监控主备Agent的心跳消息。只有在收到主备Agent通信异常时才获取保护倒换控制权,进行统一的保护倒换规划和控制。此外,本发明实施例的Agent也不再是完成简单的代理功能,在主备Agent间通信正常时,处于主用态的Agent能够参与保护倒换流程。
在对本发明实施例的Manager-Agent架构及数据流向进行了详细说明之后,以下结合附图以及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。
方法实施例
根据本发明的实施例,提供了一种保护倒换方法,该方法基于上述的Manager-Agent架构:构成保护对的主备微波节点设备中设置有各自的Agent,每个保护对中设置有一个Manager。图2是本发明实施例的保护倒换方法的流程图,如图2所示,根据本发明实施例的保护倒换方法包括如下处理:
步骤201,主备Agent根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现一个或多个故障;其中,多点故障检测策略包括以下至少之一:对主备Agent的心跳消息进行检测、对掉电消息进行检测、对主备Agent自身设备故障信息进行检测、对远端告警进行检测。需要说明的是,远端告警检测主要用于通过对端的告警信息来指示本端出现了无法检测到故障,是可以扩展的告警。
具体地,主备Agent包括用于检测设备故障的故障检测模块,用于主备Agent的通信和Manager与Agent间通信的通信模块,用于完成保护倒换动作并写入远端告警信息的执行模块。
需要说明的是,在主备Agent根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现多个故障的情况下,需要确定多个故障的优先级,其中,优先级由高到低为:掉电故障、主备微波节点设备代理中心通信异常故障、主备微波节点设备故障、远端告警故障。最后,需要根据故障的优先级进行相应的保护倒换操作。
步骤202,在主备微波节点设备之间通信正常的情况下,主备Agent通过保护倒换通信通道进行主备微波节点设备的保护倒换;其中,保护倒换通信通道包括:主备Agent之间的高速通信通道、主备Agent与Manager之间的可靠通信通道、以及远端告警通信通道。具体地,主备Agent间通信通道要做成高速通道,保证保护倒换快速完成,缩短保护倒换时间;主备Agent与Manager间通信通道要做成可靠通道,保证保护倒换高可靠性;远端告警通信通道是在微波帧中插入本端状态信息。需要说明的是,在高速通信通道无故障时,保护倒换信息是通过高速通信通道传送的;高速通信通道有故障时,代理中心向管理中心发送的监控信息,管理中心向代理中心发送的强制倒换信息就会利用可靠通信通道,另外心跳消息也是通过可靠通信通道传输的;远端告警通信通道用于传输对端向本端返回的故障信息。
步骤203,在主备微波节点设备之间通信异常的情况下,主备Agent通知Manager,Manager通过保护倒换通信通道对主备微波节点设备进行强制保护倒换。
从上述处理可以看出,Manager的中心位置已经被削弱,主要是为了缩短保护倒换时间,但保留的管理功能是为了完成当主备Agent间通信异常无法完成保护倒换时来控制完成保护倒换,提高保护倒换可靠性。
下面,将针对主备微波节点设备出现不同的故障,对进行保护倒换或进行强制保护倒换的处理过程进行详细说明。
情况一,主备Agent检测到自身设备出现故障。
首先,Agent的检测模块检测到本设备出现了故障后,通知Agent本设备出现故障,在故障设备为备用微波节点设备的情况下,备用微波节点设备代理中心(Slave Agent)向主用微波节点设备代理中心(Master Agent)发送故障消息,Master Agent根据故障状态消息修改备用微波节点设备的故障状态信息;需要说明的是,修改故障状态信息是为了在保护倒换时进行查询,以判断是否进行保护倒换。在故障设备为主用微波节点设备的情况下,Master Agent检测备用微波节点设备的故障状态信息,如果备用微波节点设备已存在故障,则上报告警,如果备用微波节点设备正常,则通过主备Agent之间的高速通信通道向Slave Agent发送保护倒换消息,进行主备微波节点设备的保护倒换,并将自身的工作状态信息修改为备用状态;Slave Agent在接收到保护倒换消息后,进行主备微波节点设备的保护倒换,将自身的工作状态信息修改为主用状态,并向原Master Agent发送保护倒换完成消息;在原Master Agent未接收到保护倒换完成消息的情况下,原Master Agent通过可靠通信通道通知Manager进行强制保护倒换。优选地,如果原Master Agent在规定的时间内没有收到保护倒换完成消息,该Agent会重试三次,如果此时还未收到Slave Agent的保护倒换完成消息,则会通知Manager来接管保护倒换控制权,由Manager来完成保护倒换的规划和决策。
图3是本发明实施例的故障信息触发保护倒换的处理流程图,如图3所示,包括如下处理:
步骤301,Agent的检测模块检测到本传输单元出现故障;
步骤302,Agent的检测模块将故障信息上报给Agent;
步骤303,Agent判断自身的工作状态是否为主用状态,如果判断为否,则执行步骤304,否则,执行步骤305;
步骤304,若为备用状态则将故障消息通知给MasterAgent,结束操作;
步骤305,若为主用状态则判断备用单元是否存在故障,如果判断为是,则执行步骤306,否则,执行步骤307;
步骤306,若备用单元有故障则向上级上报该传输单元故障告警,结束操作;
步骤307,若备用单元没有故障则向Slave Agent发请求保护倒换消息,完成本身的保护倒换动作,将工作状态改为备用态;
步骤308,Slave Agent接收请求保护倒换消息;
步骤309,Slave Agent通过执行模块完成保护倒换动作,将工作状态改为主用状态;
步骤310,现Master Agent向原MasterAgent返回保护倒换结束消息;
步骤311,原Master Agent收到保护倒换结束消息,保护倒换过程结束。
情况二,主备Agent通过心跳消息检测到主备Agent发生通信异常。
当主备Agent检测到无法收到对方Agent心跳消息或无法解析出正确的消息,则认为主备Agent间的通信异常,此时仅主备Agent无法完成保护倒换动作。处于主用态的Master Agent会通知Manager来接管保护倒换控制权,由Manager通过可靠通信通道来完成保护倒换的规划和决策,Master Agent向Manager发送接管保护倒换控制权消息;Manager接收接管保护倒换控制权消息,并根据主备微波节点设备的故障状态信息和工作状态信息判断主备微波节点设备是否满足传输业务条件;在确定满足传输业务条件的情况下,Manager向主备Agent发送强制保护倒换消息,进行主备微波节点设备的保护倒换;在确定不满足传输业务情况下,Manager根据故障状态信息,规划传输路径,根据传输路径对主备Agent进行强制保护倒换,接收主备Agent返回的强制倒换完成消息,并进入监控状态;在主备Agent的通信恢复正常的情况下,Manager取消保护倒换控制权,保证保护倒换的快速性。
图4是本发明实施例的主备Agent通信中断触发保护倒换的处理流程图,如图4所示,包括如下处理:
步骤401,通信模块检测到主备Agent之间通信异常;
步骤402,由Master Agent向Manager发送请求监控保护倒换消息;
步骤403,Manager收到监控保护倒换消息后,根据主备Agent的工作状态和故障状态进行判断规划;
步骤404,Manager判断该传输单元是否满足正常传输业务的需求,如果判断为否,则执行步骤405,否则,执行步骤408;
步骤405,规划出能满足传输业务的路径并向主备Agent发送强制保护倒换消息;
步骤406,主备Agent收到强制保护倒换消息后由执行模块完成保护倒换动作;
步骤407,主备Agent向Manager返回强制保护倒换完成消息;
步骤408,Manager收到强制保护倒换完成消息后进入监控状态,尽可能保障业务正常传输,如果主备Agent间通信恢复正常,则由Master Agent向Manager发送取消监控保护倒换消息,后面的保护倒换仍由主备Agent完成。
情况三,主备Agent通过检测掉电消息确认对端掉电。
Agent收到对方掉电消息,如果Master Agent通过检测掉电消息确认备用微波节点设备掉电,Master Agent不执行操作;如果SlaveAgent通过检测掉电消息确认主用微波节点设备掉电,则Slave Agent通过高速通信通道进行保护倒换,并将自身的工作状态信息设置为主用状态。
图5是本发明实施例的掉电消息触发保护倒换的处理流程图,如图5所示,包括如下处理:
步骤501,某Agent检测到对方Agent掉电,或者收到对方掉电消息;
步骤502,该Agent判断自身的工作状态是否为主用状态,如果判断为是,则结束操作,否则,执行步骤503;
步骤503,通过该Agent的执行模块完成保护倒换动作并将工作状态置为主用状态。
情况四,主备Agent检测到远端告警。
处于主用态的Master Agent通过远端告警通信通道检测到远端告警,Master Agent根据远端告警检测自身设备是否出现故障,如果判断为是,即检测出自身设备出现可检测的故障,则Master Agent通过高速通信通道进行主备微波节点设备保护倒换,即进入由故障信息触发的保护倒换流程;如果判断为否,Master Agent则检测备用微波节点设备的故障状态信息;如果确定备用微波节点设备存在故障,Master Agent不执行操作,如果确定备用微波节点设备不存在故障,Master Agent通过高速通信通道进行保护倒换;在进行保护倒换后,原Slave Agent通过远端告警通信通道检测是否还有远端告警,如果判断为是,则上报原Master Agent出现不可检测故障告警信息。如果远端告警信息还继续保持说明是对端设备出现了故障,需上报对端设备出现不可检测故障的告警信息。
图6是本发明实施例的由远端告警触发保护倒换的处理流程图,如图6所示,包括如下处理:
步骤601,Master Agent检测到有远端告警信息;
步骤602,Master Agent首先检测自身是否存在故障,如果判断为是,则执行步骤603,否则,执行步骤604;
步骤603,若Master Agent存在故障则进入由故障信息触发保护倒换流程;
步骤604,若不存在故障则检测备用单元是否存在故障信息,如果判断为是,则执行步骤605,否则,执行步骤606;
步骤605,若备用单元存在故障则上报主用单元出现不可检测故障的告警信息;
步骤606,若备用单元不存在故障则Master Agent向Slave Agent发送请求保护倒换消息;
步骤607,Slave Agent收到请求保护倒换消息后完成保护倒换动作并返回保护倒换完成消息;
步骤608,检测现在是否还存在远端告警,如果判断为是,这执行步骤609,否则,执行步骤605;
步骤609,在本端发送端或者对端接收端存在不可检测的故障时,上报本端发送端或者对端接收端出现不可检测故障的告警信息。
以上处理流程是分解的相对独立的故障处理流程,是根据不同的触发条件而选择的保护倒换流程,而在处理过程中必须统一处理,否则会出现重复保护倒换或者不倒换的情况,为了避免以上情况的发生,需要在处理流程中将以上各类故障进行分析,根据故障的关联关系将各类故障进行归类排队划分优先级,根据不同的触发条件选择不同的处理流程。例如:如果出现了掉电故障肯定会出现主备Agent通信异常故障和远端告警故障,如果处理完掉电消息再处理主备Agent通信异常故障和远端告警故障肯定会出现来回进行保护倒换的情况,因此掉电故障优先级大于主备Agent通信异常故障和远端告警故障,所以此时只需处理掉电故障不用处理主备Agent通信异常故障和远端告警故障。在本发明实施例中各故障的优先级由高到低为:掉电故障、主备Agent通信异常故障、主备设备故障、远端告警故障。
从上述处理可以看出,本发明实施例的保护倒换策略实现流程采用多点保护倒换策略,将保护倒换的风险分散,在满足高可靠保护倒换情况下,尽可能提高保护倒换的快速性,缩短保护倒换时间,由于是分布式保护倒换流程,对每条信息的处理流程是有差异的,但又能够进行统一管理。
此外,本发明实施例可以做成独立的模块,便于移植到需要1+1保护的其他产品,降低开发成本缩短开发时间;远端告警信息还有助于发现定位设备故障,为以后的开发维护积累经验。
装置实施例
根据本发明的实施例,提供了一种保护倒换系统,图7是本发明实施例的保护倒换系统的结构示意图,如图7所示,根据本发明实施例的保护倒换系统包括:主用微波节点设备代理中心(Master Agent)70、备用微波节点设备代理中心(Slave Agent)72、以及管理中心(Manager)74。以下对本发明实施例的各个模块进行详细的说明。
具体地,Master Agent 70,用于根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现一个或多个故障,并在主备微波节点设备之间通信正常的情况下,通过保护倒换通信通道进行所述主备微波节点设备的保护倒换;其中,多点故障检测策略包括以下至少之一:对主备Agent的心跳消息进行检测、对掉电消息进行检测、对主备Agent自身设备故障信息进行检测、对远端告警进行检测。需要说明的是,远端告警检测主要用于通过对端的告警信息来指示本端出现了无法检测到故障,是可以扩展的告警。
保护倒换通信通道包括:主备Agent之间的高速通信通道、主备Agent与Manager之间的可靠通信通道、以及远端告警通信通道。具体地,主备Agent间通信通道要做成高速通道,保证保护倒换快速完成,缩短保护倒换时间;主备Agent与Manager间通信通道要做成可靠通道,保证保护倒换高可靠性;远端告警通信通道是在微波帧中插入本端状态信息。需要说明的是,在高速通信通道无故障时,保护倒换信息是通过高速通信通道传送的;高速通信通道有故障时,代理中心向管理中心发送的监控信息,管理中心向代理中心发送的强制倒换信息就会利用可靠通信通道,另外心跳消息也是通过可靠通信通道传输的;远端告警通信通道用于传输对端向本端返回的故障信息。
Slave Agent 72,用于根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现一个或多个故障,并在主备微波节点设备之间通信正常的情况下,通过保护倒换通信通道进行所述主备微波节点设备的保护倒换;
具体地,主备Agent包括用于检测设备故障的故障检测模块,用于主备Agent的通信和Manager与Agent间通信的通信模块,用于完成保护倒换动作并写入远端告警信息的执行模块。
需要说明的是,在主备Agent根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现多个故障的情况下,需要确定多个故障的优先级,其中,优先级由高到低为:掉电故障、主备微波节点设备代理中心通信异常故障、主备微波节点设备故障、远端告警故障。最后,需要根据故障的优先级进行相应的保护倒换操作。
Manager 74,用于在所述主备微波节点设备之间通信异常的情况下,通过所述保护倒换通信通道对所述主备微波节点设备进行强制保护倒换。
从上述处理可以看出,Manager的中心位置已经被削弱,主要是为了缩短保护倒换时间,但保留的管理功能是为了完成当主备Agent间通信异常无法完成保护倒换时来控制完成保护倒换,提高保护倒换可靠性。
下面,将针对主备微波节点设备出现不同的故障,对进行保护倒换或进行强制保护倒换的处理过程进行详细说明。
情况一,主备Agent检测到自身设备出现故障。
首先,Agent的检测模块检测到本设备出现了故障后,通知Agent本设备出现故障,在故障设备为备用微波节点设备的情况下,备用微波节点设备代理中心(Slave Agent)向主用微波节点设备代理中心(Master Agent)发送故障状态消息,Master Agent根据故障状态消息修改备用微波节点设备的故障状态信息;需要说明的是,修改故障状态信息是为了在保护倒换时进行查询,以判断是否进行保护倒换。在故障设备为主用微波节点设备的情况下,Master Agent检测备用微波节点设备的故障状态信息,如果备用微波节点设备已存在故障,则上报告警,如果备用微波节点设备正常,则通过主备Agent之间的高速通信通道向Slave Agent发送保护倒换消息,进行主备微波节点设备的保护倒换,并将自身的工作状态信息修改为备用状态;Slave Agent在接收到保护倒换消息后,进行主备微波节点设备的保护倒换,将自身的工作状态信息修改为主用状态,并向原Master Agent发送保护倒换完成消息;在原Master Agent未接收到保护倒换完成消息的情况下,原Master Agent通过可靠通信通道通知Manager进行强制保护倒换。优选地,如果原Master Agent在规定的时间内没有收到保护倒换完成消息,该Agent会重试三次,如果此时还未收到Slave Agent的保护倒换完成消息,则会通知Manager来接管保护倒换控制权,由Manager来完成保护倒换的规划和决策。
情况二,主备Agent通过心跳消息检测到主备Agent发生通信异常。
当主备Agent检测到无法收到对方Agent心跳消息或无法解析出正确的消息,则认为主备Agent间的通信异常,此时仅主备Agent无法完成保护倒换动作。处于主用态的Master Agent会通知Manager来接管保护倒换控制权,由Manager通过可靠通信通道来完成保护倒换的规划和决策,Master Agent向Manager发送接管保护倒换控制权消息;Manager接收接管保护倒换控制权消息,并根据主备微波节点设备的故障状态信息和工作状态信息判断主备微波节点设备是否满足传输业务条件;在确定满足传输业务条件的情况下,Manager向主备Agent发送强制保护倒换消息,进行主备微波节点设备的保护倒换;在确定不满足传输业务情况下,Manager根据故障状态信息,规划传输路径,根据传输路径对主备Agent进行强制保护倒换,接收主备Agent返回的强制倒换完成消息,并进入监控状态;在主备Agent的通信恢复正常的情况下,Manager取消保护倒换控制权,保证保护倒换的快速性。
情况三,主备Agent通过检测掉电消息确认对端掉电。
Agent收到对方掉电消息,如果Master Agent通过检测掉电消息确认备用微波节点设备掉电,Master Agent不执行操作;如果Slave Agent通过检测掉电消息确认主用微波节点设备掉电,则Slave Agentt通过高速通信通道进行保护倒换,并将自身的工作状态信息设置为主用状态。
情况四,主备Agent检测到远端告警。
处于主用态的Master Agent通过远端告警通信通道检测到远端告警,Master Agent根据远端告警检测自身设备是否出现故障,如果判断为是,即检测出自身设备出现可检测的故障,则Master Agent通过高速通信通道进行主备微波节点设备保护倒换,即进入由故障信息触发的保护倒换流程;如果判断为否,Master Agent则检测备用微波节点设备的故障状态信息;如果确定备用微波节点设备存在故障,Master Agent不执行操作,如果确定备用微波节点设备不存在故障,Master Agent通过高速通信通道进行保护倒换;在进行保护倒换后,原Slave Agent通过远端告警通信通道检测是否还有远端告警,如果判断为是,则上报原Master Agent出现不可检测故障告警信息。如果远端告警信息还继续保持说明是对端设备出现了故障,需上报对端设备出现不可检测故障的告警信息。
以上处理流程是分解的相对独立的故障处理流程,是根据不同的触发条件而选择的保护倒换流程,而在处理过程中必须统一处理,否则会出现重复保护倒换或者不倒换的情况,为了避免以上情况的发生,需要在处理流程中将以上各类故障进行分析,根据故障的关联关系将各类故障进行归类排队划分优先级,根据不同的触发条件选择不同的处理流程。例如:如果出现了掉电故障肯定会出现主备Agent通信异常故障和远端告警故障,如果处理完掉电消息再处理主备Agent通信异常故障和远端告警故障肯定会出现来回进行保护倒换的情况,因此掉电故障优先级大于主备Agent通信异常故障和远端告警故障,所以此时只需处理掉电故障不用处理主备Agent通信异常故障和远端告警故障。在本发明实施例中各故障的优先级由高到低为:掉电故障、主备Agent通信异常故障、主备设备故障、远端告警故障。
综上所述,本发明实施例通过分布式检测控制策略、对各故障触发的保护倒换相对独立而又统一的实现方式,解决了现有技术中存在的倒换时间较长造成业务长时间的中断、当前不检测故障而不进行倒换导致业务瘫痪、通讯链路出现故障而不进行倒换导致业务瘫痪、以及发生误检测而导致保护倒换的问题,使保护倒换动作完全处于可控状态下,使保护倒换更加可靠安全,减少出现错误倒换和不倒换的情况;并缩短了保护倒换的时间,提高了设备的性能。
此外,本发明实施例可以做成独立的模块,便于移植到需要1+1保护的其他产品,降低开发成本缩短开发时间;远端告警信息还有助于发现定位设备故障,为以后的开发维护积累经验。
尽管为示例目的,已经公开了本发明的优选实施例,本领域的技术人员将意识到各种改进、增加和取代也是可能的,因此,本发明的范围应当不限于上述实施例。

Claims (13)

1.一种保护倒换方法,其特征在于,构成保护对的主备微波节点设备中设置有各自的代理中心,所述保护对中设置有一个管理中心,所述方法包括:
主备微波节点设备代理中心根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现一个或多个故障;
在主备微波节点设备之间通信正常的情况下,所述主备微波节点设备代理中心通过保护倒换通信通道进行所述主备微波节点设备的保护倒换;所述保护倒换通信通道包括:所述主备微波节点设备代理中心之间的高速通信通道;
在所述主备微波节点设备之间通信异常的情况下,所述主备微波节点设备代理中心通知所述管理中心,所述管理中心通过所述保护倒换通信通道对所述主备微波节点设备进行强制保护倒换;
其中,在所述主备微波节点设备代理中心检测到自身设备出现故障的情况下,所述主备微波节点设备代理中心通过所述高速通信通道进行主备微波节点设备保护倒换,其中,所述主备微波节点设备代理中心通过所述高速通信通道进行主备微波节点设备保护倒换包括:
在故障设备为备用微波节点设备的情况下,备用微波节点设备代理中心向主用微波节点设备代理中心发送故障消息,所述主用微波节点设备代理中心根据所述故障消息修改所述备用微波节点设备的故障状态信息;
在故障设备为主用微波节点设备的情况下,所述主用微波节点设备代理中心检测所述备用微波节点设备的故障状态信息,如果所述备用微波节点设备已存在故障,则上报告警,如果所述备用微波节点设备正常,则向所述备用微波节点设备代理中心发送保护倒换消息,进行所述主备微波节点设备的保护倒换,并将自身的工作状态信息修改为备用状态;
所述备用微波节点设备代理中心在接收到所述保护倒换消息后,进行所述主备微波节点设备的保护倒换,将自身的工作状态信息修改为主用状态,并向原主用微波节点设备代理中心发送保护倒换完成消息;
在所述原主用微波节点设备代理中心未接收到所述保护倒换完成消息的情况下,所述原主用微波节点设备代理中心通知所述管理中心进行强制保护倒换。
2.如权利要求1所述的方法,其特征在于,所述多点故障检测策略包括以下至少之一:对所述主备微波节点设备代理中心的心跳消息进行检测、对掉电消息进行检测、对所述主备微波节点设备代理中心自身设备故障信息进行检测、对远端告警进行检测。
3.如权利要求2所述的方法,其特征在于,所述保护倒换通信通道还包括:所述主备微波节点设备代理中心与所述管理中心之间的可靠通信通道、以及远端告警通信通道。
4.如权利要求1所述的方法,其特征在于,在主备微波节点设备代理中心根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现多个故障的情况下,所述方法还包括:
确定所述多个故障的优先级,其中,所述优先级由高到低为:掉电故障、主备微波节点设备代理中心通信异常故障、主备微波节点设备故障、远端告警故障。
5.如权利要求3至4任一项所述的方法,其特征在于,在所述主备微波节点设备代理中心通过心跳消息检测到主备微波节点设备代理中心发生通信异常的情况下,所述主备微波节点设备代理中心通知所述管理中心,所述管理中心通过所述可靠通信通道对所述主备微波节点设备进行强制保护倒换。
6.如权利要求5所述的方法,其特征在于,所述管理中心通过所述可靠通信通道对所述主备微波节点设备进行强制保护倒换包括:
主用微波节点设备代理中心向所述管理中心发送接管保护倒换控制权消息;
所述管理中心接收所述接管保护倒换控制权消息,并根据所述主备微波节点设备的故障状态信息和工作状态信息判断所述主备微波节点设备是否满足传输业务条件;
在确定满足所述传输业务条件的情况下,所述管理中心向所述主备微波节点设备代理中心发送强制保护倒换消息,进行所述主备微波节点设备的保护倒换;
在确定不满足所述传输业务条件的情况下,所述管理中心根据所述故障状态信息,规划传输路径,根据所述传输路径对所述主备微波节点设备代理中心进行强制保护倒换,接收所述主备微波节点设备代理中心返回的强制倒换完成消息,并进入监控状态;
在所述主备微波节点设备代理中心的通信恢复正常的情况下,所述管理中心取消保护倒换控制权。
7.如权利要求3至4任一项所述的方法,其特征在于,在所述主备微波节点设备代理中心通过检测掉电消息确认对端掉电的情况下,所述主备微波节点设备代理中心通过所述高速通信通道进行主备微波节点设备保护倒换。
8.如权利要求7所述的方法,其特征在于,在所述主备微波节点设备代理中心通过检测掉电消息确认对端掉电的情况下,所述主备微波节点设备代理中心通过所述高速通信通道进行主备微波节点设备保护倒换包括:
如果主用微波节点设备代理中心通过检测掉电消息确认备用微波节点设备掉电,所述主用微波节点设备代理中心不执行操作;
如果备用微波节点设备代理中心通过检测掉电消息确认主用微波节点设备掉电,则所述备用微波节点设备代理中心进行保护倒换,并将自身的工作状态信息设置为主用状态。
9.如权利要求3至4任一项所述的方法,其特征在于,在所述主备微波节点设备代理中心通过所述远端告警通信通道检测到远端告警的情况下,所述主备微波节点设备代理中心通过所述高速通信通道进行主备微波节点设备保护倒换。
10.如权利要求9所述的方法,其特征在于,在所述主备微波节点设备代理中心通过所述远端告警通信通道检测到远端告警的情况下,所述主备微波节点设备代理中心通过所述高速通信通道进行主备微波节点设备保护倒换包括:
所述主用微波节点设备代理中心根据所述远端告警检测自身设备是否出现故障,如果判断为是,则主用微波节点设备代理中心进行主备微波节点设备保护倒换;如果判断为否,所述主用微波节点设备代理中心则检测所述备用微波节点设备的故障状态信息;
如果确定所述备用微波节点设备存在故障,所述主用微波节点设备代理中心不执行操作,如果确定所述备用微波节点设备不存在故障,所述主用微波节点设备代理中心进行保护倒换。
11.如权利要求10所述的方法,其特征在于,在进行保护倒换后,原备用微波节点设备代理中心检测是否还有所述远端告警,如果判断为是,则上报原主用微波节点设备出现不可检测故障告警信息。
12.一种保护倒换系统,其特征在于,包括:
主用微波节点设备代理中心,用于根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现一个或多个故障,并在主备微波节点设备之间通信正常的情况下,通过保护倒换通信通道进行所述主备微波节点设备的保护倒换;所述保护倒换通信通道包括:所述主备微波节点设备代理中心之间的高速通信通道;在检测到自身设备出现故障的情况下,通过所述高速通信通道进行主备微波节点设备保护倒换;根据备用微波节点设备代理中心发送的故障消息修改所述备用微波节点设备的故障状态信息;在故障设备为主用微波节点设备的情况下,检测所述备用微波节点设备的故障状态信息,如果所述备用微波节点设备已存在故障,则上报告警,如果所述备用微波节点设备正常,则向所述备用微波节点设备代理中心发送保护倒换消息,进行所述主备微波节点设备的保护倒换,并将自身的工作状态信息修改为备用状态;在原主用微波节点设备代理中心未接收到所述备用微波节点设备代理中心发送的保护倒换完成消息的情况下,通知管理中心进行强制保护倒换。
备用微波节点设备代理中心,用于根据预先设置的多点故障检测策略确定主用微波节点设备或备用微波节点设备出现一个或多个故障,并在主备微波节点设备之间通信正常的情况下,通过保护倒换通信通道进行所述主备微波节点设备的保护倒换;在检测到自身设备出现故障的情况下,通过所述高速通信通道进行主备微波节点设备保护倒换;在故障设备为备用微波节点设备的情况下,向主用微波节点设备代理中心发送故障消息;在接收到所述保护倒换消息后,进行所述主备微波节点设备的保护倒换,将自身的工作状态信息修改为主用状态,并向原主用微波节点设备代理中心发送保护倒换完成消息;
管理中心,用于在所述主备微波节点设备之间通信异常的情况下,通过所述保护倒换通信通道对所述主备微波节点设备进行强制保护倒换。
13.如权利要求12所述的系统,其特征在于,
所述多点故障检测策略包括以下至少之一:对所述主备微波节点设备代理中心的心跳消息进行检测、对掉电消息进行检测、对所述主备微波节点设备代理中心自身设备故障信息进行检测、对远端告警进行检测;
所述保护倒换通信通道还包括:所述主备微波节点设备代理中心与所述管理中心之间的可靠通信通道、以及远端告警通信通道。
CN201010232516.0A 2010-07-21 2010-07-21 保护倒换方法及系统 Active CN102340407B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201010232516.0A CN102340407B (zh) 2010-07-21 2010-07-21 保护倒换方法及系统
PCT/CN2010/079022 WO2012009914A1 (zh) 2010-07-21 2010-11-23 保护倒换方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010232516.0A CN102340407B (zh) 2010-07-21 2010-07-21 保护倒换方法及系统

Publications (2)

Publication Number Publication Date
CN102340407A CN102340407A (zh) 2012-02-01
CN102340407B true CN102340407B (zh) 2015-07-22

Family

ID=45496465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010232516.0A Active CN102340407B (zh) 2010-07-21 2010-07-21 保护倒换方法及系统

Country Status (2)

Country Link
CN (1) CN102340407B (zh)
WO (1) WO2012009914A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103905114B (zh) * 2012-12-25 2017-02-22 中国移动通信集团广西有限公司 光缆线路故障点定位方法、装置和系统
CN107688547B (zh) * 2017-08-23 2020-06-16 苏州浪潮智能科技有限公司 一种控制器主备切换的方法及系统
CN109815049B (zh) 2017-11-21 2021-03-26 北京金山云网络技术有限公司 节点宕机恢复方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1321004A (zh) * 2000-04-25 2001-11-07 华为技术有限公司 交换机的主备倒换方法及其实现装置
CN1463081A (zh) * 2002-05-30 2003-12-24 华为技术有限公司 通信设备中实现主备设备快速倒换的方法
WO2004004158A1 (en) * 2002-06-28 2004-01-08 Harris Corporation System and method for supporting automatic protection switching between multiple node pairs using common agent architecture
CN1889373A (zh) * 2005-06-30 2007-01-03 华为技术有限公司 一种配线连接设备实现主备倒换的方法
CN101237315A (zh) * 2008-02-28 2008-08-06 浪潮电子信息产业股份有限公司 一种用于双控高可用系统的同步检测和故障隔离方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1321004A (zh) * 2000-04-25 2001-11-07 华为技术有限公司 交换机的主备倒换方法及其实现装置
CN1463081A (zh) * 2002-05-30 2003-12-24 华为技术有限公司 通信设备中实现主备设备快速倒换的方法
WO2004004158A1 (en) * 2002-06-28 2004-01-08 Harris Corporation System and method for supporting automatic protection switching between multiple node pairs using common agent architecture
CN1889373A (zh) * 2005-06-30 2007-01-03 华为技术有限公司 一种配线连接设备实现主备倒换的方法
CN101237315A (zh) * 2008-02-28 2008-08-06 浪潮电子信息产业股份有限公司 一种用于双控高可用系统的同步检测和故障隔离方法

Also Published As

Publication number Publication date
WO2012009914A1 (zh) 2012-01-26
CN102340407A (zh) 2012-02-01

Similar Documents

Publication Publication Date Title
CN102394787B (zh) 基于epa交换机的双链路冗余控制方法
CN1874201B (zh) 在接收设备共享配置下的光网络保护触发方法及装置
US20090199040A1 (en) Method and device for implementing link pass through in point-to-multipoint network
CN101540638B (zh) 一种epon系统中tdm业务通道的板间保护倒换方法
US8244123B2 (en) System and method for optical transmission
CN102571457B (zh) 一种触发旁路设备切换的方法、旁路设备切换方法及装置
CN105915426B (zh) 环形网络的故障恢复方法及装置
CN101267392B (zh) 一种上行链路状态切换时通知下游设备的实现方法
CN105634848B (zh) 一种虚拟路由器监控方法及装置
CN114337796B (zh) 一种数字光纤直放站冗余备份方法及其系统
CN102340407B (zh) 保护倒换方法及系统
CN104317679A (zh) 一种scada系统基于线程冗余的通信容错方法
CN109104325B (zh) 基于CANopen协议的列车网络数据传输方法、系统及其装置
CN109062184A (zh) 双机应急救援设备、故障切换方法和救援系统
CN101938365B (zh) 以太网中的故障处理方法和装置
CN102932183A (zh) 双上行链路故障处理方法及设备
CN107026780A (zh) 一种基于物联网的配电光纤环网故障点定位方法及系统
CN101854263B (zh) 网络拓扑的分析处理方法、系统和管理服务器
CN102891767A (zh) 一种链路保护方法、网元及系统
CN101659271A (zh) 一种车站ats与联锁子系统的连接方法
CN103067205A (zh) 同一主机管理下共用同一地址的rt与备份rt切换方法
CN109039768A (zh) 一种lte-m通信网络中cbtc信号告警方法
CN111475386B (zh) 一种故障预警方法及相关装置
CN101659270A (zh) 一种车站ats与车站ato的连接方法
CN101860888A (zh) 一种通过无线链路传输数据的方法、系统及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant