CN101577719A - 一种双机热备方法、装置和系统 - Google Patents

一种双机热备方法、装置和系统 Download PDF

Info

Publication number
CN101577719A
CN101577719A CNA2009101080214A CN200910108021A CN101577719A CN 101577719 A CN101577719 A CN 101577719A CN A2009101080214 A CNA2009101080214 A CN A2009101080214A CN 200910108021 A CN200910108021 A CN 200910108021A CN 101577719 A CN101577719 A CN 101577719A
Authority
CN
China
Prior art keywords
network node
user
network
access interface
route
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2009101080214A
Other languages
English (en)
Other versions
CN101577719B (zh
Inventor
谢莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN200910108021.4A priority Critical patent/CN101577719B/zh
Publication of CN101577719A publication Critical patent/CN101577719A/zh
Priority to PCT/CN2010/073413 priority patent/WO2010142210A1/zh
Priority to ES10785723.7T priority patent/ES2581208T3/es
Priority to MX2011012651A priority patent/MX2011012651A/es
Priority to BRPI1014929-5A priority patent/BRPI1014929B1/pt
Priority to JP2012514335A priority patent/JP6056089B2/ja
Priority to EP10785723.7A priority patent/EP2424186B1/en
Priority to CA2762924A priority patent/CA2762924C/en
Priority to US13/295,548 priority patent/US9106566B2/en
Priority to IN4773KON2011 priority patent/IN2011KN04773A/en
Application granted granted Critical
Publication of CN101577719B publication Critical patent/CN101577719B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/58Association of routers
    • H04L45/586Association of routers of virtual routers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2048Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage

Abstract

本发明涉及网络通信领域,尤其涉及一种双机热备方法、装置和系统。该方法包括,在接入端口配置与第一网络节点间的冗余协议,协商本地的各接入端口与所述第一网络节点的各接入端口的主备关系;发布用户的网段路由,所述用户的网段与所述第一网络节点发布的路由所属的用户的网段相同;建立或指定与所述第一网络节点间的保护通道;与所述第一网络节点同步用户信息;当所述第一网络节点故障时,根据所述冗余协议进行业务倒换,根据所述用户信息将下行流量发送到用户。采用本实施例提供的技术方案,在业务倒换和回切过程中,不需要发布或者撤回用户的网段路由,解决了双机热备在故障场景下下行流量倒换和回切慢的问题。

Description

一种双机热备方法、装置和系统
技术领域
本发明涉及网络通信领域,尤其涉及一种双机热备方法、装置和系统。
背景技术
目前的网际协议(Internet Protocol,IP)网络正向着多业务的方向发展,需要支持下一代网络(Next Generation Network,NGN)、第三代移动通信(3rd-generation,3G)、网络协议电视(InternetProtocol Television,IPTV)、数据等多种业务。IP网络在整个网络中,扮演着承载网的角色。相对于传统数据业务,多业务网络对承载网的可靠性方面有着非常苛刻的要求,业务高可靠性(servicereliability)已经日益成为数据通信设备的核心竞争力之一。
在IP或多协议标签交换(Multi-Protocol Label Switch,MPLS)核心网的路由器或三层交换机上,业务高可靠性可以通过路由协议、完美重启(Graceful Restart,GR)、快速重路由(Fast Reroute,FRR),流量工程(Traffic Engineering,TE)保护组等技术实现;在2层网的以太网交换机(Lanswitch)上,可以通过生成树协议(Spanning TreeProtocol,STP)、快速生成树协议(ra pid spaning tree protocol,RSTP)或多生成树协议(Multiple Spanning Tree Protocol,MSTP)等二层冗余协议实现。
对于处于汇聚层或者边缘层的业务节点,则需要支持设备间双机热备(inter-chassis/inter-节点Redundancy)。现有的双机热备方法包括,在两个节点的接入端口(access port)配置冗余协议,用于协商接入端口的主备,并在对端端口故障的情况下,触发业务保护倒换(Protection Switching);在主用设备(The Primary Node)恢复后,触发业务回切(Revertive Switching)。两个节点相互通过某种协议同步用户信息(session-info或者user-info),确保在节点整机故障或者链路出现故障时,备份节点有足够的信息快速恢复业务。
双机备份方案除了要实现冗余协议与用户信息同步,还需要在各种故障场景(包括链路故障、端口故障、线卡故障、节点整机故障、业务回切)中解决转发从核心网络到用户的流量,即下行流量的问题。
现有的方案通过路由的发布或撤回解决下行流量的转发问题。
例如,一个网段只能应用在一个接入端口下,当该接入端口升主用时,则升主用的接入端口所在的节点发布该网段路由;当该接入端口由主用切换为备用时,则撤回该网段路由。
该方案中,业务故障倒换或者回切后,需要等待路由收敛后,下行流量才能恢复正常。而路由收敛时间主要由路由协议的路由计算间隔决定。如果路由计算间隔配置太短,会增加路由器的中央处理器(CentralProcess Unit,CPU)负荷;如果路由计算间隔配置太长,则路由收敛时间也会相应变长,不利于业务的快速恢复。并且对于业务节点来说,IP地址网段一般是全局分配,或者是按业务分配。如果限定一个IP网段只能在一个接入端口下,那将造成用户地址的浪费,同时业务部署会较为困难。
另一种解决方法是,节点发布在线用户的主机路由:当用户在接入端口上在线,则该接入端口所在节点发布该用户的主机路由,当用户所在接入端口转为备份状态时,则撤回用户的主机路由。这种方式支持网段在节点全局应用。但该技术同样存在路由收敛的问题:用户业务故障倒换或者回切后,需要等待路由收敛后,用户业务才能恢复正常。并且因为要发布每个用户的主机路由,对热备节点本身、网络中的其他路由器的路由容量和性能的要求都比较高;在业务发生故障倒换或者回切时,节点需要发布或者撤回每个用户的主机路由,对热备节点本身和网络中其他路由器和三层交换机的CPU造成比较大的冲击。
发明内容
本发明实施例的目的是提供一种双机热备方法、装置和系统,用以解决双机热备在故障场景下下行流量倒换和回切慢的问题。
本发明实施例的目的是通过以下技术方案实现的:
一种双机热备方法,包括:
在接入端口配置与第一网络节点间的冗余协议,协商本地的各接入端口与所述第一网络节点的各接入端口的主备关系;
发布用户的网段路由,所述用户的网段与所述第一网络节点发布的路由所属的用户的网段相同;
建立或指定与所述第一网络节点间的保护通道;
与所述第一网络节点同步用户信息;
当所述第一网络节点故障时,根据所述冗余协议进行业务倒换,根据所述用户信息将下行流量发送到用户。
一种网络节点,包括至少一个接入端口、同步模块、发布模块、建立模块和发送模块;其中,
所述接入端口,用于配置与第一网络节点间的冗余协议,协商与所述第一网络节点的接入端口的主备关系;
所述同步模块,用于与所述第一网络节点同步用户信息;
所述发布模块,用于发布用户的网段路由,所述用户的网段与所述第一网络节点发布的路由所属的用户的网段相同;
所述建立模块,用于建立或指定与所述第一网络节点间的保护通道;
所述发送模块,用于根据用户信息和所述冗余协议,将下行流量发送到用户。
一种双机热备系统,包括,第一网络节点和第二网络节点;其中,
所述第一网络节点,用于在接入端口配置与所述第二网络节点间的冗余协议,协商所述第一网络节点的各接入端口与所述第二网络节点的各接入端口的主备关系,发布用户的网段路由。
所述第二网络节点,用于在接入端口配置与所述第一网络节点间的冗余协议,协商所述第二网络节点的各接入端口与所述第一网络节点的各接入端口的主备关系,发布用户的网段路由,所述用户的网段与所述第一网络节点发布的路由所属的用户的网段相同,建立或指定与所述第一网络节点的保护通道,与所述第一网络节点同步用户信息,当所述第一网络节点故障时,根据所述冗余协议进行业务倒换,根据所述用户信息将下行流量发送到用户。
采用本实施例提供的技术方案,因为在双机热备的网络节点间建立或指定了保护通道,并且两个网络节点发布相同用户的网段路由,在下行流量倒换和回切过程中,不需要发布或者撤回用户的网段路由,在多数情况下也不需要网络重新计算路由,因此下行流量倒换和业务回切的性能大幅度提高,大大缩短业务中断时间,解决了双机热备在故障场景下下行流量倒换和回切慢的问题。
附图说明
图1为本发明一个实施例中双机热备方法流程图;
图2为本发明一个实施例中网络节点框图;
图3为本发明一个实施例中双机热备系统框图;
图4为本发明一个实施例中双机热备系统故障场景示意图。
具体实施方式
以下结合图1至图3说明本发明实施例:
图1为本发明一个实施例中双机热备方法流程图。该方法包括:
102、在接入端口配置与第一网络节点间的冗余协议,协商本地的各接入端口与第一网络节点的各接入端口的主备关系。
具体可以是,在第二网络节点的接入端口配置与第一网络节点间的冗余协议,协商第二网络节点的各个接入端口与第一网络节点的各个接入端口的主备关系,例如根据协商确定第二网络节点的接入端口B为第一网络节点的一个接入端口A的备用接入端口,根据协商确定第一网络节点的一个接入端口C为第二网络节点的另一个接入端口D的备用接入端口,一个接入端口不能同时为主用接入端口和备用接入端口。冗余协议在第一网络节点的接入端口故障的情况下,触发业务倒换,在第一网络节点的接入端口故障恢复后,触发业务回切。
104、发布用户的网段路由,所述用户的网段与所述第一网络节点发布的路由所属的用户的网段相同。
同一网段的不同用户可以在第一网络节点的主用接入端口或第二网络节点的主用接入端口上线。
106、建立或指定与第一网络节点间的保护通道。
在第二网络节点与第一网络节点之间通过IP或MPLS核心网建立或指定保护通道,或者在第二网络节点与第一网络节点之间通过直接相连的链路建立保护通道。所述保护通道可以是流量工程(TrafficEngineering,TE)隧道、通用路由封装(Generic RoutingEncapsulation,GRE)隧道、标签分配协议(Label DistributionProtocol,LDP)标签交换路径(Label Switched Path,LSP)隧道或IPSEC(IP Security)隧道,也可以是直连的以太网链路、异步传输模式(Asynchronous Trans fer Mode,ATM)链路或点对点协议(Point-to-Point Protocol,PPP)链路。当所述保护通道为第二网络节点与第一网络节点间已经存在的隧道,例如,LDP LSP隧道时,只需指定该已经存在的隧道为所述保护通道。所述保护通道应保证双向传输能力,因此,如果是类似TE的单向隧道,则需要建立或指定第二网络节点到第一网络节点和第一网络节点到第二网络节点的2条隧道,如果是双向隧道,则只需要建立或指定一条。
对于发送给用户的报文,只要能到达第二网络节点或第一网络节点中的一个,就能直接到达用户,或者是通过保护通道经过另一网络节点到达用户。例如,用户在第一网络节点的一个主用接入端口上线,当发送给该用户的报文到达第二网络节点时,该报文通过保护通道到达第一网络节点,并从用户上线的主用接入端口到达用户。因此,本实施例中的路由的部署比较简单,不需要在业务故障倒换或者业务回切时发布或者撤回路由,而是在两个网络节点都发布用户的网段路由。如果需要优化路由,则可以通过配置路由策略进行干预,使该网段路由优先指向优先级较高的网络节点,例如,如果第一网络节点的全部或大部分接入端口是主用接入端口,运营商希望该网段路由优先指向第一网络节点以提高路由效率,则可以配置路由策略使第一网络节点的优先级较高。
为了避免报文在两个节点之间环回,有两种方案解决:(1)对于从保护通道收到的,并且目的地址属于用户的网段的报文,做水平分割,不允许环回的报文再发往保护通道;或者(2)对于目的地址属于用户的网段的报文,如果报文TTL超过设定值,则把TTL改为设定值,否则按通常的方法,对TTL减1,所述设定值根据保护通道的具体性质设置,通常是一个较小的值,例如2或3。
本领域普通技术人员可以理解,建立或指定与第一网络节点的保护通道相对独立,可以根据具体情况在102、104之前或之后执行。
108、与第一网络节点同步用户信息。
第二网络节点与第一网络节点同步用户信息,以使第二网络节点在第一网络节点故障或者链路出现故障时,有足够的信息将下行流量发送到用户,能够快速恢复业务。
110、当第一网络节点故障时,根据冗余协议进行业务倒换,根据所述用户信息将下行流量发送到用户。
第一网络节点的故障可能有不同的原因。
在本发明实施例的一个应用场景中,第一网络节点的用户的接入链路或接入端口发生故障。此时用户业务切换到第二网络节点上根据冗余协议根据协商确定的所述发生故障的接入端口的备用接入端口,该备用接入端口升为主用。因为第一网络节点和第二网络节点都发布了该用户的网段路由,所以下行流量可能直接到达第二网络节点也可能先到达第一网络节点。如果下行流量先到达第一网络节点,则第一网络节点把下行流量通过保护通道发送到第二网络节点,第二网络节点根据用户信息把下行流量通过协议根据协商确定的该接入端口发送到用户;如果下行流量直接到达第二网络节点,则由第二网络节点根据用户信息通过协议根据协商确定的该接入端口直接发送到用户,无论那种情况下行流量都可以到达用户,所以路由不需要变化。当第一网络节点的接入链路或接入端口的故障恢复后业务回切,路由同样也不需要变化。
因为在上述应用场景中业务倒换和回切过程中,不需要发布或者撤回用户的网段路由,也不需要网络重新计算路由,因此业务倒换和业务回切的性能大幅度提高,大大缩短了业务中断时间。
在本发明实施例的另一个应用场景中,第一网络节点为多线卡的设备,通过多个线卡的端口连接到核心网,第一网络节点的用户接入端口所在的线卡故障。因为此时第一网络节点的其他线卡工作正常,第一网络节点和核心网还是连通的,到第二网络节点的保护通道也正常,因此和第一网络节点的用户接入链路或端口发生故障的场景相似,在业务倒换和回切过程中,不需要发布或者撤回用户的网段路由,也不需要网络重新计算路由,因此业务倒换和业务回切的性能大幅度提高,大大缩短了业务中断时间。
在本发明实施例的又一个应用场景中,第一网络节点整机发生故障。此时第一网络节点到第二网络节点的保护通道也不能正常工作。因此需要在路由收敛后,用户的网段路由才会自动指向第二网络节点,此时,发送给用户的报文,经核心网直接发送到第二网络节点。在该场景中,因为第二网络节点已经发布了用户的网段路由,业务倒换中不需要再次发布路由,因此业务倒换性能也会有一定程度提高。并且,只要第一网络节点恢复,保护通道就会复正常,下行流量只要第一网络节点或第二网络节点中的任意一个,最终都可以到达用户。因此在业务回切过程中,第一网络节点不需要发布路由,第二网络节点也不需要撤回路由,业务回切性能大幅度提高,大大缩短业务中断时间。
图2为本发明一个实施例中网络节点框图。该网络节点包括,至少一个接入端口202、同步模块204、发布模块206、建立模块208、发送模块210;其中,
接入端口202,用于配置与第一网络节点间的冗余协议。
接入端口202配置与第一网络节点间的冗余协议,所述冗余协议用于协商与第一网络节点的接入端口的主备,例如根据协商确定接入端口202为第一网络节点的一个接入端口的备用接入端口,或者根据协商确定第一网络节点的一个接入端口为接入端口202的备用接入端口。冗余协议在第一网络节点的接入端口故障的情况下,触发业务倒换,在第一网络节点的接入端口故障恢复后,触发业务回切。
同步模块204,用于与所述第一网络节点同步用户信息。
同步模块204与第一网络节点同步用户信息,以使第二网络节点在第一网络节点故障或者链路出现故障时,有足够的信息快速恢复业务。
发布模块206,用于发布用户的网段路由,所述用户的网段与所述第一网络节点发布的路由所属的用户的网段相同。
建立模块208,用于建立或指定与所述第一网络节点间的保护通道。
建立模块208在第二网络节点与第一网络节点之间通过IP或MPLS核心网建立或指定保护通道,或者在第二网络节点与第一网络节点之间通过直接相连的链路建立保护通道。所述保护通道可以是流量工程TE隧道、通用路由封装GRE隧道、标签分配协议LDP标签交换路径LSP隧道或IPSEC隧道,也可以是直连的以太网链路、ATM链路或PPP链路。当所述保护通道为第二网络节点与第一网络节点间已经存在的隧道,例如,LDP LSP隧道时,只需指定该已经存在的隧道为所述保护通道。所述保护通道应保证双向传输能力,因此,如果是类似TE的单向隧道,则需要建立或指定第二网络节点到第一网络节点和第一网络节点到第二网络节点的2条隧道,如果是双向隧道,则只需要建立或指定一条。
对于发送给用户的报文,只要能到达第二网络节点或第一网络节点中的一个,就能直接到达用户,或者是通过保护通道经过另一网络节点到达用户。例如,用户在第一网络节点的一个主用接入端口上线,当发送给用户的报文到达第二网络节点时,该报文通过保护通道到达第一网络节点,并从用户上线的接入端口到达用户。因此,路由的部署比较简单,不需要在业务故障倒换或者业务回切时发布或者撤回路由,可以在两个网络节点都发布用户IP网段路由。如果需要优化路由,则可以通过配置路由策略进行干预,使该IP网段路由优先指向优先级较高的网络节点,例如,如果第一网络节点的全部或大部分接入端口是主用接入端口,运营商希望该网段路由优先指向第一网络节点以提高路由效率,则可以配置路由策略使第一网络节点的优先级较高。
为了避免报文在两个节点之间环回,有两种方案解决:(1)对于从保护通道收到的,并且目的地址属于用户的网段的报文,做水平分割,不允许环回的报文再发往保护通道;或者(2)对于目的地址属于用户的网段的报文,如果报文TTL超过设定值,则把TTL改为设定值,否则按通常的方法,对TTL减1,所述设定值根据保护通道的具体性质设置,通常是一个较小的值,例如2或3。
发送模块210,用于根据用户信息和所述冗余协议,根据用户信息将下行流量发送到用户。
发送模块210在所述第一网络节点无故障时,根据用户信息,将下行流量发送到用户。
当所述第一网络节点故障时,发送模块210根据所述冗余协议进行业务倒换,根据用户信息,将下行流量发送到用户。
第一网络节点的故障可能有不同的原因。
在本发明实施例的一个应用场景中,第一网络节点的用户的接入链路或接入端口发生故障。此时用户业务切换到冗余协议根据协商确定的所述发生故障的接入端口的备用接入端口,该备用接入端口升为主用。因为第一网络节点和第二网络节点都发布了该用户的网段路由,所以下行流量可能直接到达第二网络节点也可能先到达第一网络节点。举例来说,冗余协议根据协商确定接入端口202为第一网络节点的一个接入端口的备用接入端口,当第一网络节点的该接入端口故障时,接入端口202升为主用。如果下行流量先到达第一网络节点,则第一网络节点把下行流量通过保护通道发送到第二网络节点,第二网络节点的发送模块210根据用户信息把下行流量通过接入端口202发送到用户;如果下行流量直接到达第二网络节点,则由发送模块210根据用户信息通过接入端口202直接发送到用户,无论那种情况下行流量都可以到达用户,所以路由不需要变化。当第一网络节点的接入链路或接入端口的故障恢复后业务回切,路由同样也不需要变化。
因为在上述应用场景中业务倒换和回切过程中,不需要发布或者撤回用户的网段路由,也不需要网络重新计算路由,因此业务倒换和业务回切的性能大幅度提高,大大缩短了业务中断时间。
在本发明实施例的另一个应用场景中,第一网络节点为多线卡的设备,通过多个线卡的端口连接到核心网,第一网络节点的用户接入端口所在的线卡故障。因为此时第一网络节点的其他线卡工作正常,第一网络节点和核心网还是连通的,到第二网络节点的保护通道也正常,因此和第一网络节点的用户接入链路或端口发生故障的场景相似,在业务倒换和回切过程中,不需要发布或者撤回用户的网段路由,也不需要网络重新计算路由,因此业务倒换和业务回切的性能大幅度提高,大大缩短业务中断时间。
在本发明实施例的又一个应用场景中,第一网络节点整机发生故障。此时第一网络节点到第二网络节点的保护通道也不能正常工作。因此需要在路由收敛后,用户的网段路由才会自动指向第二网络节点,发送给用户的报文,经核心网直接发送到第二网络节点。在该场景中,因为第二网络节点已经发布了用户网段的路由,业务倒换中不需要再次发布路由,因此业务倒换性能也会有一定程度提高。并且,只要第一网络节点恢复,保护通道就会恢复正常,下行流量只要到达第一网络节点或第二网络节点中的任意一个,最终都可以到达用户。因此在业务回切过程中,第一网络节点不需要发布路由,第二网络节点也不需要撤回路由,业务回切性能大幅度提高,大大缩短业务中断时间。
图3为本发明一个实施例中双机热备系统框图。该系统包括,第一网络节点和第二网络节点;其中,
第一网络节点302,用于在接入端口配置与所述第二网络节点304间的冗余协议,协商第一网络节点302的各接入端口与所述第二网络节点304的各接入端口的主备关系,发布用户的网段路由。
第二网络节点304,用于在接入端口配置与所述第一网络节点302间的冗余协议,协商所述第二网络节点304的各接入端口与所述第一网络节点302的各接入端口的主备关系,发布用户的网段路由,所述用户的网段与所述第一网络节点302发布的路由所属的用户的网段相同,建立或指定与所述第一网络节点302的保护通道,与所述第一网络节点302同步用户信息,当所述第一网络节点故障时,根据所述冗余协议进行业务倒换,根据用户信息将下行流量发送到用户。
参见图4,图4为本发明一个实施例中双机热备系统故障场景示意图。该双机热备系统中,同一网段的不同用户可以在第一网络节点302的接入端口上线,也可以在第二网络节点304的接入端口上线,例如,用户1在第一网络节点302的接入端口A上线,冗余协议根据协商确定第二网络节点304的接入端口B是接入端口A的备用接入端口,用户2在第二网络节点304的接入端口D上线,冗余协议根据协商确定第一网络节点302的接入端口C是接入端口D的备用接入端口。在该具体的故障场景中,第一网络节点302的用户1的接入链路或接入端口发生故障。此时用户1的业务切换到第二网络节点304上根据冗余协议根据协商确定的所述发生故障的接入端口的备用接入端口B,接入端口B升为主用,用户2不需要切换。因为第一网络节点302和第二网络节点304都发布了该用户的网段路由,所以下行流量可能直接到达第二网络节点304也可能先到达第一网络节点302。如果下行流量先到达第一网络节点302,则第一网络节点302根据用户信息把下行流量通过保护通道发送到第二网络节点304,第二网络节点304根据用户信息把下行流量通过相应的接入端口发送到用户;如果下行流量直接到达第二网络节点304,则第二网络节点304根据用户信息通过相应的接入端口发送到用户,无论那种情况下行流量都可以到达用户,所以路由不需要变化。当第一网络节点的接入链路或接入端口的故障恢复后业务回切,路由同样也不需要变化。
因为在图4所示故障场景中业务倒换和回切过程中,不需要发布或者撤回用户的网段路由,也不需要网络重新计算路由,因此业务倒换和业务回切的性能大幅度提高,大大缩短了业务中断时间。
采用本实施例提供的技术方案,因为在双机热备的网络节点间建立或指定了保护通道,并且两个网络节点发布相同用户的网段路由,在下行流量倒换和回切过程中,不需要发布或者撤回用户的网段路由,在多数情况下也不需要网络重新计算路由,因此下行流量倒换和业务回切的性能大幅度提高,大大缩短业务中断时间,解决了双机热备在故障场景下下行流量倒换和回切慢的问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质可以是ROM/RAM,磁盘或光盘等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (7)

1、一种双机热备方法,其特征在于,包括:
在接入端口配置与第一网络节点间的冗余协议,协商本地的各接入端口与所述第一网络节点的各接入端口的主备关系;
发布用户的网段路由,所述用户的网段与所述第一网络节点发布的路由所属的用户的网段相同;
建立或指定与所述第一网络节点间的保护通道;
与所述第一网络节点同步用户信息;
当所述第一网络节点故障时,根据所述冗余协议进行业务倒换,根据所述用户信息将下行流量发送到用户。
2、根据权利要求1所述的方法,其特征在于,所述保护通道,包括:
流量工程TE隧道、通用路由封装GRE隧道、标签分配协议LDP标签交换路径LSP隧道、IPSEC隧道、直连的以太网链路、异步传输模式ATM链路或点对点协议PPP链路。
3、根据权利要求1所述的方法,其特征在于,还包括:
对于从所述保护通道收到的,并且目的地址属于所述用户的网段的报文,做水平分割;或
对于目的地址属于所述用户的网段的报文,如果报文生存时间TTL超过设定值,则将TTL修改为所述设定值,否则对TTL减1。
4、根据权利要求1所述的方法,其特征在于,还包括:
当所述第一网络节点故障恢复时,根据所述冗余协议进行业务回切。
5、一种网络节点,其特征在于,包括至少一个接入端口、同步模块、发布模块、建立模块和发送模块;其中,
所述接入端口,用于配置与第一网络节点间的冗余协议,协商与所述第一网络节点的接入端口的主备关系;
所述同步模块,用于与所述第一网络节点同步用户信息;
所述发布模块,用于发布用户的网段路由,所述用户的网段与所述第一网络节点发布的路由所属的用户的网段相同;
所述建立模块,用于建立或指定与所述第一网络节点间的保护通道;
所述发送模块,用于根据用户信息和所述冗余协议,将下行流量发送到用户。
6、一种双机热备系统,其特征在于,包括,第一网络节点和第二网络节点;其中,
所述第一网络节点,用于在接入端口配置与所述第二网络节点间的冗余协议,协商所述第一网络节点的各接入端口与所述第二网络节点的各接入端口的主备关系,发布用户的网段路由。
所述第二网络节点,用于在接入端口配置与所述第一网络节点间的冗余协议,协商所述第二网络节点的各接入端口与所述第一网络节点的各接入端口的主备关系,发布用户的网段路由,所述用户的网段与所述第一网络节点发布的路由所属的用户的网段相同,建立或指定与所述第一网络节点的保护通道,与所述第一网络节点同步用户信息,当所述第一网络节点故障时,根据所述冗余协议进行业务倒换,根据所述用户信息将下行流量发送到用户。
7、根据权利要求6所述的系统,其特征在于,
所述第二网络节点,还用于当所述第一节点故障恢复时,根据所述冗余协议进行业务回切。
CN200910108021.4A 2009-06-09 2009-06-09 一种双机热备方法、装置和系统 Active CN101577719B (zh)

Priority Applications (10)

Application Number Priority Date Filing Date Title
CN200910108021.4A CN101577719B (zh) 2009-06-09 2009-06-09 一种双机热备方法、装置和系统
ES10785723.7T ES2581208T3 (es) 2009-06-09 2010-06-01 Método, dispositivo y sistema de reposición inmediata de ordenador dual
PCT/CN2010/073413 WO2010142210A1 (zh) 2009-06-09 2010-06-01 一种双机热备方法、装置和系统
MX2011012651A MX2011012651A (es) 2009-06-09 2010-06-01 Metodo, aparato y sistema para respaldo caliente de agrupamiento de dos nodos.
BRPI1014929-5A BRPI1014929B1 (pt) 2009-06-09 2010-06-01 "método e sistema para realizar backup dinâmico com agrupamento de dois nós de rede"
JP2012514335A JP6056089B2 (ja) 2009-06-09 2010-06-01 二台のコンピュータによるホットスタンバイの方法、機器およびシステム
EP10785723.7A EP2424186B1 (en) 2009-06-09 2010-06-01 Dual-computer hot-standby method, device and system
CA2762924A CA2762924C (en) 2009-06-09 2010-06-01 Method, apparatus and system for two-node cluster hot backup
US13/295,548 US9106566B2 (en) 2009-06-09 2011-11-14 Method, apparatus and system for two-node cluster hot backup
IN4773KON2011 IN2011KN04773A (zh) 2009-06-09 2011-11-18

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910108021.4A CN101577719B (zh) 2009-06-09 2009-06-09 一种双机热备方法、装置和系统

Publications (2)

Publication Number Publication Date
CN101577719A true CN101577719A (zh) 2009-11-11
CN101577719B CN101577719B (zh) 2016-03-02

Family

ID=41272506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910108021.4A Active CN101577719B (zh) 2009-06-09 2009-06-09 一种双机热备方法、装置和系统

Country Status (10)

Country Link
US (1) US9106566B2 (zh)
EP (1) EP2424186B1 (zh)
JP (1) JP6056089B2 (zh)
CN (1) CN101577719B (zh)
BR (1) BRPI1014929B1 (zh)
CA (1) CA2762924C (zh)
ES (1) ES2581208T3 (zh)
IN (1) IN2011KN04773A (zh)
MX (1) MX2011012651A (zh)
WO (1) WO2010142210A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010142210A1 (zh) * 2009-06-09 2010-12-16 华为技术有限公司 一种双机热备方法、装置和系统
WO2010145357A1 (zh) * 2009-10-21 2010-12-23 中兴通讯股份有限公司 用户信息备份方法及装置
CN103152266A (zh) * 2011-12-07 2013-06-12 华为技术有限公司 一种网络设备间的同步方法、网络设备及系统
CN106712997A (zh) * 2015-11-16 2017-05-24 华为技术有限公司 表项恢复的方法、设备及系统
CN107018010A (zh) * 2017-03-07 2017-08-04 杭州承联通信技术有限公司 一种pdt集群核心网系统及其容灾切换方法
CN109739697A (zh) * 2018-12-13 2019-05-10 北京计算机技术及应用研究所 一种基于高速数据交换的强实时性双机同步容错系统
CN116915777A (zh) * 2023-09-13 2023-10-20 杭州立方控股股份有限公司 一种坐席人员协同的智能停车管理系统及方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9374315B2 (en) * 2014-04-11 2016-06-21 Nice-Systems Ltd. Spare resource election in a computing system
CN105959172B (zh) * 2016-07-19 2019-01-18 浪潮(北京)电子信息产业有限公司 一种集群系统的冗余网络管理方法及平台
US11775395B2 (en) 2020-01-27 2023-10-03 International Business Machines Corporation Withdrawing a point-in-time snapshot copy operation within a data consistency application

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6631136B1 (en) * 1998-08-26 2003-10-07 Hypercom Corporation Methods and apparatus for data communication using a hybrid transport switching protocol
JP3689007B2 (ja) * 2001-02-06 2005-08-31 三菱電機株式会社 ネットワークシステムおよびネットワーク接続装置
CN100373799C (zh) 2003-07-01 2008-03-05 中兴通讯股份有限公司 一种宽带接入服务器热备份的方法
US8009556B2 (en) 2003-10-17 2011-08-30 Ip Infusion, Inc. System and method for providing redundant routing capabilities for a network node
JP2005130049A (ja) * 2003-10-21 2005-05-19 Fujitsu Ltd ノード
CN100454853C (zh) * 2006-10-25 2009-01-21 华为技术有限公司 检测业务通道的方法及提供检测业务通道方法的系统
JP4796184B2 (ja) * 2007-03-28 2011-10-19 富士通株式会社 エッジノード冗長システム
CN101447858B (zh) * 2008-01-17 2012-01-11 中兴通讯股份有限公司 双机热备份系统中实现虚拟路由冗余协议同步倒换的方法
CN101316239B (zh) * 2008-07-23 2011-06-22 中兴通讯股份有限公司 一种在虚拟专用局域网业务网络中控制访问及转发的方法
CN101577719B (zh) * 2009-06-09 2016-03-02 华为技术有限公司 一种双机热备方法、装置和系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9106566B2 (en) 2009-06-09 2015-08-11 Huawei Technologies Co., Ltd. Method, apparatus and system for two-node cluster hot backup
WO2010142210A1 (zh) * 2009-06-09 2010-12-16 华为技术有限公司 一种双机热备方法、装置和系统
WO2010145357A1 (zh) * 2009-10-21 2010-12-23 中兴通讯股份有限公司 用户信息备份方法及装置
CN103152266B (zh) * 2011-12-07 2016-08-03 华为技术有限公司 一种网络设备间的同步方法、网络设备及系统
WO2013083013A1 (zh) * 2011-12-07 2013-06-13 华为技术有限公司 一种网络设备间的同步方法、网络设备及系统
US9350612B2 (en) 2011-12-07 2016-05-24 Huawei Technologies Co., Ltd. Method, network device, and system for synchronization between network devices
CN103152266A (zh) * 2011-12-07 2013-06-12 华为技术有限公司 一种网络设备间的同步方法、网络设备及系统
CN106712997A (zh) * 2015-11-16 2017-05-24 华为技术有限公司 表项恢复的方法、设备及系统
CN106712997B (zh) * 2015-11-16 2020-04-14 华为技术有限公司 表项恢复的方法、设备及系统
CN107018010A (zh) * 2017-03-07 2017-08-04 杭州承联通信技术有限公司 一种pdt集群核心网系统及其容灾切换方法
CN109739697A (zh) * 2018-12-13 2019-05-10 北京计算机技术及应用研究所 一种基于高速数据交换的强实时性双机同步容错系统
CN109739697B (zh) * 2018-12-13 2022-10-14 北京计算机技术及应用研究所 一种基于高速数据交换的强实时性双机同步容错系统
CN116915777A (zh) * 2023-09-13 2023-10-20 杭州立方控股股份有限公司 一种坐席人员协同的智能停车管理系统及方法
CN116915777B (zh) * 2023-09-13 2023-12-05 杭州立方控股股份有限公司 一种坐席人员协同的智能停车管理系统及方法

Also Published As

Publication number Publication date
BRPI1014929A2 (pt) 2016-04-19
BRPI1014929B1 (pt) 2018-07-03
CN101577719B (zh) 2016-03-02
CA2762924A1 (en) 2010-12-16
JP2012529805A (ja) 2012-11-22
CA2762924C (en) 2015-03-17
US20120057453A1 (en) 2012-03-08
IN2011KN04773A (zh) 2015-07-10
EP2424186A4 (en) 2012-07-25
US9106566B2 (en) 2015-08-11
ES2581208T3 (es) 2016-09-02
MX2011012651A (es) 2012-01-12
WO2010142210A1 (zh) 2010-12-16
EP2424186B1 (en) 2016-04-06
JP6056089B2 (ja) 2017-01-11
EP2424186A1 (en) 2012-02-29

Similar Documents

Publication Publication Date Title
CN101577719B (zh) 一种双机热备方法、装置和系统
CN101710877B (zh) 基于伪线的业务流量处理方法、设备和系统
CN1866806B (zh) 共享格状网恢复的实现方法
CN102025646B (zh) 链路倒换方法及其装置
CN100558111C (zh) 城域以太网提供多业务组网下的可靠性处理方法及系统
US8300523B2 (en) Multi-chasis ethernet link aggregation
CN101753453B (zh) 一种分组传送网环网的组网方法
CN102148677B (zh) 一种更新地址解析协议表项的方法及核心交换机
CN101877677B (zh) 一种多协议标签交换业务隧道切换的方法及系统
CN101364927A (zh) 实现虚拟专用网vpn故障恢复的方法、设备及系统
WO2008119294A1 (fr) Procédé et matériel de restauration du commerce en réseau
WO2011157130A2 (zh) 路径建立方法和装置
JP2008141754A (ja) ローカルエリアネットワーク(lan)接続の保護を提供する方法、マルチサービスプラットフォーム及びシステム
WO2016119265A1 (zh) 一种网络业务建立方法、协作控制中心及网络系统
CN102143065B (zh) 一种故障保护方法及设备
CN101646105B (zh) 业务恢复的方法、系统和设备
CN101155070B (zh) 一种智能光网络中的业务管理方法
CN101958809B (zh) 基于包交换的ason网络中实现共享式恢复的方法
EP2028824B1 (en) The process method for traffic engineering link information
US8554073B2 (en) Method and apparatus for migrating sub-network connection protection (SNCP) service
CN102215098B (zh) 对客户端设备的业务数据进行传输的方法、装置和系统
CN100387025C (zh) Mpls环网中实现流量公平传送的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant