CN106656532A - 网元切换方法及装置 - Google Patents

网元切换方法及装置 Download PDF

Info

Publication number
CN106656532A
CN106656532A CN201510715636.9A CN201510715636A CN106656532A CN 106656532 A CN106656532 A CN 106656532A CN 201510715636 A CN201510715636 A CN 201510715636A CN 106656532 A CN106656532 A CN 106656532A
Authority
CN
China
Prior art keywords
network element
production
disaster tolerance
website
production network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510715636.9A
Other languages
English (en)
Inventor
叶广杰
杨恩锋
余光虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510715636.9A priority Critical patent/CN106656532A/zh
Publication of CN106656532A publication Critical patent/CN106656532A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种网元切换方法以及装置,属于通信领域。该方法包括:当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换;当确定网元切换成功时,控制该生产网元的路由设备和该容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至该容灾网元。本发明通过上述技术方案,在该网元切换过程中,达到无需人为干预,站点间切换第三方无感知的效果。生产网元恢复正常时,容灾站点通过控制生产网元的路由设备和容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至生产网元,达到无需人为干预,站点间切换第三方无感知的效果。

Description

网元切换方法及装置
技术领域
本发明涉及通信领域,特别涉及一种网元切换方法及装置。
背景技术
随着通信技术的发展,通信系统的架构越来越庞杂,涉及到的通信设备越来越多,因此,为了避免通信系统的正常运行由于一些不可避免的因素而中断服务,现有的通信系统提供了容灾机制。容灾机制是运营商保护核心数据,为用户提供连续服务的关键和前提。容灾机制是指建立两套或多套功能相同的系统,互相之间进行健康状态监视和功能切换,当一处系统因意外停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。
在通信系统中,某些业务系统(例如融合计费系统或客户关系管理系统)和第三方营业系统存在对接的场景。当生产站点发生故障而切换到容灾站点时,业务系统可以部署硬件负载均衡器进行均衡,这种硬件负载均衡器可为生产站点和容灾站点对外提供虚拟IP(Internet Protocol,互联网协议),使第三方营业系统对于业务系统内对生产站点和容灾站点之间的切换无感知。
然而,由于硬件负载均衡器成本过高,大多数业务系统会部署软件负载均衡器进行均衡。软件负载均衡器采用开放式最短路径优先协议作为动态路由选择,人为修改第三方链路指向,并对外提供虚拟IP,从而实现对外切换无感知。而这种软件负载均衡器使用的开源软件存在安全问题,但是,由于需要关闭OSPF(Open Shortest Path First,开放式最短路径优先)协议来屏蔽虚拟IP,所以对于第三方营业系统而言需要人为干预,无法实现自动切换。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种网元切换方法及装置。该技术方案如下:
一方面,本发明实施例提供了一种网元切换方法,该方法包括:
当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换;
当确定网元切换成功时,控制该生产网元的路由设备和该容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至该容灾网元。
在第一方面的第一种可能实现方式中,当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换之后,该方法还包括:
控制该生产网元将自身状态修改为非正常状态,使得该生产网元不再工作。
在第一方面的第二种可能实现方式中,当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换包括:
当业务网元是整站点切换,则将该生产网元所在的生产站点切换至容灾站点。
在第一方面的第三种可能实现方式中,当业务网元是整站点切换,则将该生产网元所在的生产站点切换至容灾站点之后,该方法还包括:
从所述容灾网元中选取一个节点作为主节点,所述容灾网元中的其他节点作为从节点,所述主节点用于对所述从节点进行管理和控制。
在第一方面的第四种可能实现方式中,当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换之前,该方法还包括:
当生产网元为集群场景时,如果检测到生产网元集群内已发生异常的网元数大于预设阈值,则执行该控制生产网元向容灾网元进行切换的步骤。
在第一方面的第五种可能实现方式中,当生产网元为集群场景时,如果检测到生产网元集群内所有网元均发生异常或已发生异常的网元数大于预设阈值,则执行该控制生产网元向容灾网元进行切换的步骤之后,该方法还包括:
对指定生产网元进行配置,使得该指定生产网元获知该容灾网元,该指定生成网元为与该生产网元具有业务关系的网元。
在第一方面的第六种可能实现方式中,当确定网元切换成功时,分别向该生产网元的路由设备和该容灾网元的路由设备发送路由策略修改指令之后,该方法还包括:
当该生产网元恢复正常时,控制该生产网元的路由设备和该容灾网元的路由设备恢复修改前的路由策略。
在第一方面的第七种可能实现方式中,当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换之后,该方法还包括:
当该生产网元恢复正常时,控制该生产网元将自身状态修改为正常状态,使得该生产网元开始工作。
另一方面,本发明实施例提供了一种网元切换装置,该装置包括:
网元切换模块,用于当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换;
路由策略修改模块,用于当确定网元切换成功时,控制该生产网元的路由设备和该容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至该容灾网元。
在第二方面的第一种可能实现方式中,该网元切换模块用于控制该生产网元将自身状态修改为非正常状态,使得该生产网元不再工作。
在第二方面的第二种可能实现方式中,该装置还包括:
整站点切换模块,用于当业务网元是整站点切换,则将该生产网元所在的生产站点切换至容灾站点。
在第二方面的第三种可能实现方式中,所述网元切换模块用于从所述容灾网元中选取一个节点作为主节点,所述容灾网元中的其他节点作为从节点,所述主节点用于对所述从节点进行管理和控制。
在第二方面的第四种可能实现方式中,该网元切换模块用于当生产网元为集群场景时,如果检测到生产网元集群内已发生异常的网元数大于预设阈值,则执行该控制生产网元向容灾网元进行切换的步骤。
在第二方面的第五种可能实现方式中,该网元切换模块用于对指定生产网元进行配置,使得该指定生产网元获知该容灾网元,该指定生成网元为与该生产网元具有业务关系的网元。
在第二方面的第六种可能实现方式中,该路由策略修改模块用于当该生产网元恢复正常时,控制该生产网元的路由设备和该容灾网元的路由设备恢复修改前的路由策略。
在第二方面的第七种可能实现方式中,该网元切换模块用于当该生产网元恢复正常时,控制该生产网元将自身状态修改为正常状态,使得该生产网元开始工作。
本发明实施例提供的技术方案带来的有益效果是:
容灾站点通过控制生产网元向容灾网元进行切换成功后,控制该生产网元的路由设备和容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至该容灾网元,达到无需人为干预,站点间切换第三方无感知的效果。
生产网元恢复正常时,容灾站点通过控制生产网元的路由设备和容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至生产网元,达到无需人为干预,站点间切换第三方无感知的效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的系统架构示意图;
图2是本发明实施例提供的一种网元切换方法流程图;
图3是本发明实施例提供的一种网元切换装置框图;
图4是本发明实施例提供的一种网元切换方法的流程图;
图5是本发明实施例提供的一种网元切换方法的流程图;
图6是根据本发明实施例提供的一种用于网元切换的装置600的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是本发明实施例提供的系统架构示意图。下面对图1中的各个设备以及基本功能进行简要介绍:
UOA(Uniform Operation&Maintenance Agent,统一网管代理),该UOA可以安装于任一系统上,以适应不同的环境应用。
生产站点:生产网元所在的站点,称为生产站点。
生产网元:正常情况下,能处理来自第三方业务请求的网元。例如,对于CBS(Convergent Billing System,融合计费系统)来说,BMP(Business ManagementPoint,业务管理点)网元和CBP(Convergent Billing Point,融合计费点)网元。
容灾站点:容灾网元所在的站点,称为容灾站点。
容灾网元:发生异常时,能够替代生产网元处理来自第三方业务请求的网元。
GDR(Geographical Disaster Recovery,地理容灾系统)部署在生产网元和容灾网元上,并且容灾网元的GDR监测生产网元的GDR。例如,对于部署了GDR的CBS系统来说,容灾站点的BMP网元监测生产站点的BMP网元,容灾站点的CBP网元监测生产站点的CBP网元。本发明实施例中,所涉及到的生产网元和容灾网元均部署了GDR。
交换机/防火墙,对于生产站点和容灾站点来说,可以分别具有各自的交换机/防火墙,本发明实施例中,仅将交换机/防火墙统称为路由设备。
第三方系统:又称为第三方营业系统,连接生产站点路由设备和容灾站点路由设备,根据路由选择协议获取最优路径后,刷新自身路由表信息,将业务请求发送至相应站点。
网元切换:在不同站点中,有能够处理相同业务的网元,这些网元之间的切换,称为网元切换。
整站点切换:对于生产站点和容灾站点来说,站点内均包括多个具有业务处理功能的网元,当生产站点中任一个网元发生异常时,并不仅仅对该网元进行切换,而是将整个生产站点切换至容灾站点,以避免由于异常而造成的业务影响,这种切换方式可以称为整站点切换。
需要说明的是,下述网元切换方法还可以适用于CRM(CustomerRelationship Management,客户关系管理系统)以及其他涉及切网元切换的系统,本发明实施例对此不作限定。
图2是本发明实施例提供的一种网元切换方法流程图。如图2所示,包括以下步骤:
201、当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换。
202、当确定网元切换成功时,控制该生产网元的路由设备和该容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至该容灾网元。
本发明实施例提供的方法,容灾站点通过控制生产网元向容灾网元进行切换成功后,控制该生产网元的路由设备和容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至该容灾网元,达到无需人为干预,站点间切换第三方无感知的效果。生产网元恢复正常时,容灾站点通过控制生产网元的路由设备和容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至生产网元,达到无需人为干预,站点间切换第三方无感知的效果。
第一种可能实现方式中,当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换之后,该方法还包括:
控制该生产网元将自身状态修改为非正常状态,使得该生产网元不再工作。
第二种可能实现方式中,当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换包括:
当业务网元是整站点切换,则将该生产网元所在的生产站点切换至容灾站点。
第三种可能实现方式中,控制生产网元向容灾网元进行切换包括:从所述容灾网元中选取一个节点作为主节点,所述容灾网元中的其他节点作为从节点,所述主节点用于对所述从节点进行管理和控制。
第四种可能实现方式中,当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换之前,该方法还包括:
当生产网元为集群场景时,如果检测到生产网元集群内已发生异常的网元数大于预设阈值,则执行该控制生产网元向容灾网元进行切换的步骤。
第五种可能实现方式中,当生产网元为集群场景时,如果检测到生产网元集群内所有网元均发生异常或已发生异常的网元数大于预设阈值,则执行该控制生产网元向容灾网元进行切换的步骤之后,该方法还包括:
对指定生产网元进行配置,使得该指定生产网元获知该容灾网元,该指定生成网元为与该生产网元具有业务关系的网元。
第六种可能实现方式中,当确定网元切换成功时,分别向该生产网元的路由设备和该容灾网元的路由设备发送路由策略修改指令之后,该方法还包括:
当该生产网元恢复正常时,控制该生产网元的路由设备和该容灾网元的路由设备恢复修改前的路由策略。
第七种可能实现方式中,当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换之后,该方法还包括:
当该生产网元恢复正常时,控制该生产网元将自身状态修改为正常状态,使得该生产网元开始工作。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
图3是本发明实施例提供的一种网元切换装置框图。本发明实施例提供了一种网元切换装置,该装置包括:网元切换模块301和路由策略修改模块302。
网元切换模块301,用于当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换;
路由策略修改模块302,用于当确定网元切换成功时,控制该生产网元的路由设备和该容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至该容灾网元。
本发明实施例提供的技术方案,容灾站点通过控制生产网元向容灾网元进行切换成功后,控制该生产网元的路由设备和容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至该容灾网元,达到无需人为干预,站点间切换第三方无感知的效果。
生产网元恢复正常时,容灾站点通过控制生产网元的路由设备和容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至生产网元,达到无需人为干预,站点间切换第三方无感知的效果。
在本发明提供的一个实施例中,该网元切换模块301用于控制该生产网元将自身状态修改为非正常状态,使得该生产网元不再工作。
在本发明提供的一个实施例中,该装置还包括:整站点切换模块,用于当业务网元是整站点切换,则将该生产网元所在的生产站点切换至容灾站点。
在本发明提供的一个实施例中,所述网元切换模块用于从所述容灾网元中选取一个节点作为主节点,所述容灾网元中的其他节点作为从节点,所述主节点用于对所述从节点进行管理和控制。
在本发明提供的一个实施例中,该网元切换模块301用于当生产网元为集群场景时,如果检测到生产网元集群内已发生异常的网元数大于预设阈值,则执行该控制生产网元向容灾网元进行切换的步骤。
在本发明提供的一个实施例中,该网元切换模块301用于对指定生产网元进行配置,使得该指定生产网元获知该容灾网元,该指定生成网元为与该生产网元具有业务关系的网元。
在本发明提供的一个实施例中,该路由策略修改模块302用于当该生产网元恢复正常时,控制该生产网元的路由设备和该容灾网元的路由设备恢复修改前的路由策略。
在本发明提供的一个实施例中,该网元切换模块301用于当该生产网元恢复正常时,控制该生产网元将自身状态修改为正常状态,使得该生产网元开始工作。
上述所有可选技术方案,均可以按照任意结合形成本发明的可选实施例,本发明实施例对此不再一一赘述。
图4是本发明实施例提供的一种网元切换方法的流程图。参见图4,该方法包括:
401、容灾站点对生产站点进行生产状态监测。
在本发明实施例中,仅以由容灾站点对生产站点进行监测为例进行说明,在容灾站点的优先级高于生产站点的场景下,可以采用容灾站点进行生产状态的监测,而在一些未对优先级进行限定或是其他生产场景下,还可以由生产站点或系统中其他管理站点对生产站点进行监测,本发明实施例对此不作限定。
402、容灾站点监测到生产站点内的生产网元发生异常,向UOA发送告警信息。
本发明实施例中,该生产网元发生异常是指生产网元发生故障或者处于掉线状态等,本发明实施例对具体发生故障以及掉线的原因不作限定。
对于生产网元为集群场景来说,该生产网元可以包括多个节点,每个节点均可以用于处理来自第三方的业务请求。而对于该生产网元来说,由于生产网元中具有多个节点,因此,即使生产网元中有一部分节点处于异常,如果剩余节点仍然能够负载生产网元的所有业务请求,则可以认为当前生产网元处于正常状态,而如果剩余节点不能够负载生产网元的所有业务请求,则可以认为当前生产网元处于异常状态。为了进行上述区分,可以为该生产网元设置权重值,也即是,如果检测到生产网元集群内已发生异常的节点数的权重值大于预设权重值,如,该预设权重值可以设置为100,则确定当前生产网元发生异常,反之,则确定当前生产网元未发生异常,继续对其进行监测。本发明实例仅以生产网元为集群场景、且生产网元集群内已发生异常的节点数的权重值大于预设权重值为例进行说明。
进一步地,容灾站点向UOA发送的告警信息中,可以包含发生异常的生产网元信息,以便UOA能够获知当前发生异常的是哪些生产网元。
在本发明提供的另一实施例中,对于整站点切换场景来说,生产站点内有一个或多个生产网元处理来自第三方的业务请求,当这些生产网元中的一个或多个网元发生异常时,容灾站点向UOA发送告警信息,以触发对该生产站点进行整站点切换。
403、UOA接收到告警信息,向网管发送告警信息。
在步骤402和403中,对部署了GDR的CBS系统来说,当容灾站点的BMP网元监测到生产站点的BMP网元异常时,容灾站点BMP网元上部署的GDR生成告警信息,通过UOA上报给I2000网关。
404、当网管接收到告警信息时,对告警信息进行处理,当需要进行容灾切换时,向容灾站点发送网元切换指令。
在步骤403和404中,网管可以是系统维护人员也可以是网络管理系统,该告警信息可以包括当前发生异常的生产网元信息,以使得网管根据该生产网元信息,决策是否进行容灾切换,当需要进行容灾切换时,向容灾站点发送网元切换指令,使得容灾站点根据该生产网元信息,确定启动站点内相应容灾网元,该相应容灾网元与发生异常的生产网元属于同类型网元,或者,该相应容灾网元的负载能力大于或等于发生异常的生产网元。例如,对于CBS来说,生产站点的BMP网元可以对应于容灾站点的BMP网元,生产站点的CBP网元可以对应于容灾站点的CBP网元。
在本发明提供的另一实施例中,对于整站点切换场景来说,网管向容灾站点发送整站点切换指令,容灾站点从从所述容灾网元中选取一个节点作为主节点,所述容灾网元中的其他节点作为从节点,所述主节点不仅用于对所述从节点进行管理和控制,而且还可用于与生产站点的主节点进行通信,使得容灾站点的主节点对生产站点内的其他节点进行管理和控制。
405、当容灾站点接收到该切换指令时,向容灾站点发送启动指令。
其中,启动指令的目的是启动业务处理功能,使得容灾站点后续可以接收新的业务请求,并根据该业务请求进行业务处理。
一般地,在容灾站点未上线的情况下,其具体功能可以在于对生产站点进行监测,由于容灾网元状态不正常,则会拒绝接受来自第三方系统的业务请求,故该业务请求不会触发到容灾站点中用于处理该业务的容灾网元。
需要说明的是,在网元切换的场景下,该启动指令可以携带待启动的容灾网元信息,如需要启动几个网元或是需要启动网元种类等。
406、当容灾站点接收到该启动指令时,启动容灾网元,向容灾站点发送启动成功响应。
在步骤405和406中,启动指令所启动的对象是容灾站点内与发生异常的生产网元相应的容灾网元,则当容灾站点接收到启动指令时,可以对相应容灾网元进行启动,在容灾网元启动后,向容灾站点发送启动成功响应。
在本发明提供的另一实施例中,对于整站点切换场景来说,启动指令所启动的对象是容灾站点,在容灾站点启动后,可以返回启动成功响应。
407、当容灾站点接收到该启动成功响应时,向生产站点发送状态修改指令。
为了保证后续新的业务请求能够到达容灾站点内相应的容灾网元,需要对生产站点内的生产网元状态以及与发生异常的生产网元具有业务关系的指定生产网元进行配置修改。
408、当生产站点接收到该状态修改指令时,将生产网元的状态进行修改,并对指定生产网元进行配置,使得生产网元不再工作,指定生产网元获知容灾网元,生产站点向容灾站点发送状态修改成功响应。
其中,可以由该生产站点内的指定生产网元执行上述状态修改指令,具体地,该指定生产网元将生产网元状态修改为非正常状态,将容灾网元状态修改为正常状态。
例如,在CBS中,假设生产站点的BMP网元发生异常,生产站点的BMP网元切换到容灾站点的BMP网元时,需要通知生产站点的CBP网元进行配置修改,以连接到容灾站点的BMP网元,此配置信息保存在生产站点的CBP网元的配置文件中。
其中,对指定生产网元CBP网元的具体配置文件如下:
在上述举例的配置文件中,将生产站点的BMP网元的IP地址对应的状态修改为abnormal,即"bmp101"ip="172.16.170.104"对应的记录,而将容灾站点的BMP网元的状态改为normal,即status="normal"。
在步骤407和408中,在本发明提供的另一实施例中,对于整站点切换场景来说,容灾站点向容灾站点发送状态修改指令。容灾站点内的各网元执行该修改指令,该修改指令是将生产站点中生产网元状态改为非正常,容灾站点中容灾网元状态改为正常,进一步地,还可以将生产站点的IP地址改为容灾站点的IP地址。此时,容灾站点向容灾站点返回状态修改成功指令。
上述步骤404~408为当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换的过程,在该过程中,可以由容灾站点控制切换,当然,如果具有站点控制功能的是其他管理站点,还可以由其他管理站点控制该切换过程。
409、当容灾站点接收到该修改成功响应后,分别向生产网元路由设备和容灾网元路由设备发送路由策略修改指令。
其中,路由策略是指在正常的路由协议上,路由设备通过改变其内部参数或者设置其内部控制方式来改变路由产生、发布、选择的结果。
410、当生产站点路由设备接收到该修改路由策略指令时,生产站点路由设备撤销生产站点的生产网元路由。
411、当容灾站点路由设备接收到该修改路由策略指令时,容灾站点路由设备发布容灾网元路由。
在步骤410和411中,仅以生产站点路由设备和容灾站点路由设备通过更改路由发布的方式来修改路由策略为例进行说明。更改路由发布是指,正常情况下,仅对外发布生产站点的路由策略,不对外发布容灾站点的路由策略,第三方通过路由选择协议仅选择到生产站点的路由策略,并更新自身系统的路由表,当生产网元发生异常时,生产站点向容灾站点进行切换,容灾站点通过分别发送切换指令到生产站点路由设备和容灾站点路由设备,使生产站点撤销路由策略,容灾站点发布路由策略,第三方通过路由选择协议,仅选择到容灾站点的路由策略,获取最优路径刷新自身路由表信息,将业务请求发送至容灾网元。例如,生产站点路由设备IP地址为127.0.0.3,容灾站点路由设备IP地址为127.0.0.4,正常情况下,第三方路由表信息如表1:
表1
生产站点向容灾站点切换时,生产站点路由设备修改路由策略的命令如下:undo import-route direct,容灾站点路由设备修改路由策略的命令如下:import-route direct。
第三方根据路由选择协议获取最优路径后,刷新自身路由表信息,结果如表2:
表2
对比表1和表2,下一跳内的IP地址由生产站点的IP127.0.0.3刷新为容灾站点的IP127.0.0.4,第三方根据刷新的路由信息将新的业务请求发送至容灾站点。
在步骤409~411中,路由设备修改路由策略的方式除了更改路由发布方式外,还可以通过控制路由开销方式对路由策略进行修改。路由开销方式是指通过更改路由开销值,使第三方根据路由选择协议对通过一个网络的不同路由进行开销值的判断,开销值越小,优先级越高,从而选择出最佳路由策略。一般情况下,由网络管理员指定路由开销值。例如,为了实现生产站点向容灾站点的切换,生产站点路由设备增加生产站点的路由开销,容灾站点路由设备减少容灾站点的路由开销,使第三方通过路由选择协议,仅选择到容灾站点的路由策略,获取最优路径刷新自身路由表信息,将业务请求发送至容灾站点。
412、生产站点路由设备向容灾站点发送路由策略修改成功响应。
413、容灾站点路由设备向容灾站点发送路由策略修改成功响应。
414、当容灾站点接收到生产站点路由设备和容灾站点路由设备发来的路由策略修改成功响应时,向网管发送切换成功响应。
上述图4所示实施例是将发生异常的生产网元切换至容灾网元的具体过程,而对于实际场景来说,需要对发生异常的生产网元进行修复,进而需要在生产网元恢复正常后,将容灾网元切换回至生产网元,该具体过程可以如图5所示。
图5是本发明实施例提供的一种网元切换方法的流程图。参见图5,该方法包括:
501、网管将生产站点的发生异常的生产网元恢复正常后,向容灾站点发送网元切换指令。
步骤501中,网管可以是系统维护人员,由系统维护人员人为干预,以便对生产站点发生异常的生产网元进行恢复。
对于生产网元为集群场景来说,该生产网元可以包括多个节点,每个节点均可以用于处理来自第三方的业务请求。而对于该生产网元来说,由于生产网元中具有多个节点,因此,即使生产网元中有一部分节点恢复正常,如果已恢复的节点网元仍然不能够负载生产网元的所有的业务请求,则可以认为当前生产网元处于异常状态,而如果恢复正常的网元能够负载生产网元的所有的业务请求,则可以认为当前生产网元处于正常状态。
在本发明提供的另一实施例中,对于整站点切换场景来说,生产站点内有一个或多个生产网元处理来自第三方的业务请求,当这些生产网元中的一个或多个网元恢复正常时,容灾站点进行整站点切换。
502、当容灾站点接收到切换指令时,向生产站点发送启动指令。
其中,启动指令的目的是启动业务处理功能,使生产站点能够对后续接收到的业务请求进行处理。
503、当生产站点接收到该启动指令时,向容灾站点发送启动成功响应。
其中,启动指令启动的对象是恢复正常的生产网元。
在本发明提供的另一实施例中,对于整站点切换场景来说,启动指令所启动的对象是生产站点。
504、当容灾站点接收到该成功响应时,向容灾站点发送停止指令。
其中,停止指令的目的是停止业务处理功能。
在本发明实施例中,该停止指令所停止的对象是容灾网元。使得容灾站点后续拒绝接收新的业务请求。在本发明提供的另一实施例中,对于整站点切换场景来说,该停止指令的目的仍然是停止容灾站点的业务处理能力,使得容灾站点后续拒绝接收新的业务请求。
505、当容灾站点内接收到该停止指令时,向容灾站点发送停止成功响应。
506、当容灾站点接收到该停止成功响应后,向生产站点发送状态修改指令。
其中,为了保证后续业务请求能够到达恢复正常的生产网元,需要对容灾站点内的容灾网元状态以及与发生异常的生产网元具有业务关系的指定生产网元进行重新配置。
其中,生产站点内指定生产网元执行该修改指令,该指定生产网元是与发生异常的生产网元具有业务关系的网元。例如,对于CBS来说,当前生产站点内的一个生产网元为BMP网元,则与其有业务关系的指定生产网元可以为CBP网元。
507、当指定生产网元接收到该状态修改指令时,将生产网元的状态进行修改,并对指定生产网元进行配置,使得恢复正常的生产网元开始工作,指定生产网元获知恢复正常的生产网元。
其中,指定生产网元将生产网元状态修改为正常状态,将容灾网元状态修改为非正常状态。例如,在CBS中,BMP网元由容灾网元切换到生产网元时,需要通知生产站点的CBP网元进行配置修改,以连接到生产站点的BMP网元,此配置信息保存在生产站点的CBP网元的配置文件中。
其中,对指定生产网元CBP网元的具体配置文件如下:
在上述举例的配置文件中,将容灾站点的BMP网元的IP地址,即"drbmp102"ip="172.16.172.104"状态改为非正常,而将生产站点的BMP网元bmp101"ip="172.16.170.104"的状态改为normal,即status="normal"。
508、生产站点向容灾站点发送修改成功响应。
在步骤506~508中,在本发明提供的另一实施例中,对于整站点切换场景来说,容灾站点向容灾站点发送状态修改指令。容灾站点内的各网元执行该修改指令,该修改指令是将容灾站点中容灾网元状态改为异常,生产站点中生产网元状态改为正常,并且,将容灾站点的IP地址改为生产站点的IP地址。此时,容灾站点向容灾站点返回状态修改成功指令。
509、当容灾站点接收到该修改成功响应后,分别向生产网元路由设备和容灾网元路由设备发送路由策略修改指令。
510、当生产站点路由设备接收到该修改路由策略指令时,生产站点路由设备发布恢复正常的生产网元路由。
511、当容灾站点路由设备接收到该修改路由策略指令时,容灾站点路由设备撤销容灾网元路由。
在步骤509~511中,仅以生产站点路由设备和容灾站点路由设备通过更改路由发布的方式来修改路由策略为例进行说明。更改路由发布是指,生产网元发生异常的情况下,仅对外发布容灾站点的路由策略,不对外发布生产站点的路由策略,第三方通过路由选择协议仅选择到容灾站点的路由策略,并更新自身系统的路由表,当发生异常的生产网元恢复正常时,容灾站点向生产站点进行回切操作时,该回切操作可以为容灾站点向生产站点进行切换操作,容灾站点通过分别发送切换指令到生产站点路由设备和容灾站点路由设备,使生产站点发布路由策略,容灾站点撤销路由策略,第三方通过路由选择协议,仅选择到生产站点的路由策略,获取最优路径刷新自身路由表信息,将业务请求发送至生产网元。例如,生产站点路由设备IP地址为127.0.0.3,容灾站点路由设备IP地址为127.0.0.4,容灾情况下,第三方路由表3:
表3
容灾站点向生产站点切换时,生产站点路由设备修改路由策略的命令如下:import-route direct,容灾站点路由设备修改路由策略的命令如下:undoimport-route direct。
第三方根据路由选择协议获取最优路径后,刷新自身路由表信息,结果如表4:
表4
对比表3和表4,下一跳内的IP地址由容灾站点的IP:127.0.0.4刷新为生产站点的IP:127.0.0.3,第三方根据刷新的路由信息将新的业务请求发送至生产站点。
在步骤509~511中,路由设备修改路由策略的方式除了更改路由发布方式外,还可以通过控制路由开销方式对路由策略进行修改。当容灾站点切换到生产站点时,生产站点路由设备减小生产站点的路由开销,容灾站点路由设备增大容灾站点的路由开销,使第三方通过路由选择协议,仅选择到生产站点的路由策略,获取最优路径刷新自身路由表信息,将业务请求发送至生产网元。
512、生产站点路由设备和容灾站点路由设备使第三方通过路由选择协议,获取最优路径刷新自身路由表信息,将业务请求发送至生产网元。
513、生产站点路由设备向容灾站点发送路由策略修改成功响应,容灾站点路由设备向容灾站点发送路由策略修改成功响应。
514、当容灾站点接收到生产站点路由设备和容灾站点路由设备发来的路由策略修改成功响应时,向网管发送切换成功响应。
图6是根据本发明实施例提供的一种用于网元切换的装置600的框图。例如,装置600可以被提供为一服务器。参照图6,装置600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行上述路由设备连接方法。
装置600还可以包括一个电源组件626被配置为执行装置600的电源管理,一个有线或无线网络接口650被配置为将装置600连接到网络,和一个输入输出(I/O)接口658。装置600可以操作基于存储在存储器632的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上该仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种网元切换方法,其特征在于,所述方法包括:
当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换;
当确定网元切换成功时,控制所述生产网元的路由设备和所述容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至所述容灾网元。
2.根据权利要求1所述的方法,其特征在于,所述当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换之后,所述方法还包括:
控制所述生产网元将自身状态修改为非正常状态,使得所述生产网元不再工作。
3.根据权利要求1所述的方法,其特征在于,所述当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换包括:
当业务网元是整站点切换,则将所述生产网元所在的生产站点切换至容灾站点。
4.根据权利要求1所述的方法,其特征在于,控制生产网元向容灾网元进行切换包括:
从所述容灾网元中选取一个节点作为主节点,所述容灾网元中的其他节点作为从节点,所述主节点用于对所述从节点进行管理和控制。
5.根据权利要求1所述的方法,其特征在于,所述当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换之前,所述方法还包括:
当生产网元为集群场景时,如果检测到生产网元集群内已发生异常的网元数大于预设阈值,则执行所述控制生产网元向容灾网元进行切换的步骤。
6.根据权利要求5所述的方法,其特征在于,所述当生产网元为集群场景时,如果检测到生产网元集群内所有网元均发生异常或已发生异常的网元数大于预设阈值,则执行所述控制生产网元向容灾网元进行切换的步骤之后,所述方法还包括:
对指定生产网元进行配置,使得所述指定生产网元获知所述容灾网元,所述指定生成网元为与所述生产网元具有业务关系的网元。
7.根据权利要求1所述的方法,其特征在于,所述当确定网元切换成功时,分别向所述生产网元的路由设备和所述容灾网元的路由设备发送路由策略修改指令之后,所述方法还包括:
当所述生产网元恢复正常时,控制所述生产网元的路由设备和所述容灾网元的路由设备恢复修改前的路由策略。
8.根据权利要求1所述的方法,其特征在于,所述当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换之后,所述方法还包括:
当所述生产网元恢复正常时,控制所述生产网元将自身状态修改为正常状态,使得所述生产网元开始工作。
9.一种网元切换装置,其特征在于,所述装置包括:
网元切换模块,用于当检测到生产网元发生异常时,控制生产网元向容灾网元进行切换;
路由策略修改模块,用于当确定网元切换成功时,控制所述生产网元的路由设备和所述容灾网元的路由设备对路由策略进行修改,使得第三方将业务请求发送至所述容灾网元。
10.根据权利要求9所述的装置,其特征在于,所述网元切换模块用于控制所述生产网元将自身状态修改为非正常状态,使得所述生产网元不再工作。
11.根据权利要求9所述的装置,其特征在于,所述装置还包括:
整站点切换模块,用于当业务网元是整站点切换,则将所述生产网元所在的生产站点切换至容灾站点。
12.根据权利要求11所述的装置,其特征在于,所述网元切换模块用于从所述容灾网元中选取一个节点作为主节点,所述容灾网元中的其他节点作为从节点,所述主节点用于对所述从节点进行管理和控制。
13.根据权利要求9所述的装置,其特征在于,所述网元切换模块还用于当生产网元为集群场景时,如果检测到生产网元集群内已发生异常的网元数大于预设阈值,则执行所述控制生产网元向容灾网元进行切换的步骤。
14.根据权利要求13所述的装置,其特征在于,所述网元切换模块还用于对指定生产网元进行配置,使得所述指定生产网元获知所述容灾网元,所述指定生成网元为与所述生产网元具有业务关系的网元。
15.根据权利要求9所述的装置,其特征在于,所述路由策略修改模块还用于当所述生产网元恢复正常时,控制所述生产网元的路由设备和所述容灾网元的路由设备恢复修改前的路由策略。
16.根据权利要求9所述的装置,其特征在于,所述网元切换模块还用于当所述生产网元恢复正常时,控制所述生产网元将自身状态修改为正常状态,使得所述生产网元开始工作。
CN201510715636.9A 2015-10-28 2015-10-28 网元切换方法及装置 Pending CN106656532A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510715636.9A CN106656532A (zh) 2015-10-28 2015-10-28 网元切换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510715636.9A CN106656532A (zh) 2015-10-28 2015-10-28 网元切换方法及装置

Publications (1)

Publication Number Publication Date
CN106656532A true CN106656532A (zh) 2017-05-10

Family

ID=58831075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510715636.9A Pending CN106656532A (zh) 2015-10-28 2015-10-28 网元切换方法及装置

Country Status (1)

Country Link
CN (1) CN106656532A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107147555A (zh) * 2017-06-30 2017-09-08 联想(北京)有限公司 一种vxlan网络的切换方法及设备、存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101237342A (zh) * 2007-01-31 2008-08-06 中兴通讯股份有限公司 实现sip服务器间容灾的系统及其方法
CN101632273A (zh) * 2006-12-20 2010-01-20 杰恩邦德公司 用于媒体网关处的源识别ip路由的方法、系统和计算机程序产品
CN102263657A (zh) * 2011-06-07 2011-11-30 华为软件技术有限公司 数据业务容灾切换方法、装置和系统
CN102710457A (zh) * 2012-05-07 2012-10-03 浙江宇视科技有限公司 一种跨网段的n+1备份方法及装置
CN102868602A (zh) * 2012-10-12 2013-01-09 南京邮电大学 一种容迟网络中基于社会关联度的改进路由方法
CN102932255A (zh) * 2012-09-06 2013-02-13 华为技术有限公司 隧道路径选择的方法及装置
US20140078887A1 (en) * 2011-05-31 2014-03-20 Huawei Technologies Co., Ltd Method, Device, and System for Realizing Disaster Tolerance Backup
CN104717083A (zh) * 2013-12-13 2015-06-17 中国移动通信集团上海有限公司 一种a-sbc设备的容灾切换系统、方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101632273A (zh) * 2006-12-20 2010-01-20 杰恩邦德公司 用于媒体网关处的源识别ip路由的方法、系统和计算机程序产品
CN101237342A (zh) * 2007-01-31 2008-08-06 中兴通讯股份有限公司 实现sip服务器间容灾的系统及其方法
US20140078887A1 (en) * 2011-05-31 2014-03-20 Huawei Technologies Co., Ltd Method, Device, and System for Realizing Disaster Tolerance Backup
CN102263657A (zh) * 2011-06-07 2011-11-30 华为软件技术有限公司 数据业务容灾切换方法、装置和系统
CN102710457A (zh) * 2012-05-07 2012-10-03 浙江宇视科技有限公司 一种跨网段的n+1备份方法及装置
CN102932255A (zh) * 2012-09-06 2013-02-13 华为技术有限公司 隧道路径选择的方法及装置
CN102868602A (zh) * 2012-10-12 2013-01-09 南京邮电大学 一种容迟网络中基于社会关联度的改进路由方法
CN104717083A (zh) * 2013-12-13 2015-06-17 中国移动通信集团上海有限公司 一种a-sbc设备的容灾切换系统、方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107147555A (zh) * 2017-06-30 2017-09-08 联想(北京)有限公司 一种vxlan网络的切换方法及设备、存储介质
CN107147555B (zh) * 2017-06-30 2020-06-23 联想(北京)有限公司 一种vxlan网络的切换方法及设备、存储介质

Similar Documents

Publication Publication Date Title
US11323307B2 (en) Method and system of a dynamic high-availability mode based on current wide area network connectivity
CN108270669B (zh) Sdn网络的业务恢复装置、主控制器、系统及方法
US10601657B2 (en) Instance node management method and management device
EP3261290B1 (en) Software defined data center and method for deploying service cluster therein
CN103596652B (zh) 一种网络控制方法及装置
WO2017000260A1 (zh) 一种切换vnf的方法和装置
WO2016058307A1 (zh) 资源的故障处理方法及装置
CN109982447B (zh) 一种无线网络组网方法、系统及无线ap
CN106936613B (zh) 一种Openflow交换机快速主备切换的方法和系统
CN105915400A (zh) 一种数据流切换方法及系统
CN104935672A (zh) 负载均衡服务高可用实现方法和设备
CN104038376A (zh) 一种管理真实服务器的方法、装置及lvs集群系统
WO2012174893A1 (zh) 一种iptv系统中基于双中心容灾的切换方法及装置
CN102710520B (zh) 一种备份lns的方法及装置
CA2998428C (en) Modular control device of an industrial automation system, and method for configuring the modular control device
WO2020030000A1 (zh) 容灾切换方法、相关设备及计算机存储介质
CN103200033B (zh) Cdn与网络融合系统及其主、备用调度单元的选举方法
CN102487332B (zh) 故障处理方法、装置和系统
CN104125079B (zh) 一种确定双机热备份配置信息的方法及装置
CN106411574A (zh) 一种管理控制方法和装置
EP3280102B1 (en) Optical path allocation method and apparatus
CN106656532A (zh) 网元切换方法及装置
CN105591804B (zh) 一种配置改变处理方法及装置
WO2017096621A1 (zh) 通信设备、通信处理方法、通信处理装置及通信系统
WO2011103815A1 (zh) 在无线网络中管理自愈功能的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200201

Address after: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Applicant after: HUAWEI TECHNOLOGIES Co.,Ltd.

Address before: 210012 HUAWEI Nanjing base, 101 software Avenue, Yuhuatai District, Jiangsu, Nanjing

Applicant before: Huawei Technologies Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20170510

RJ01 Rejection of invention patent application after publication