CN110875824B - 一种故障多层链路恢复方法和控制器 - Google Patents

一种故障多层链路恢复方法和控制器 Download PDF

Info

Publication number
CN110875824B
CN110875824B CN201811001018.8A CN201811001018A CN110875824B CN 110875824 B CN110875824 B CN 110875824B CN 201811001018 A CN201811001018 A CN 201811001018A CN 110875824 B CN110875824 B CN 110875824B
Authority
CN
China
Prior art keywords
link
network device
layer
controller
port
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811001018.8A
Other languages
English (en)
Other versions
CN110875824A (zh
Inventor
车佳
胡志林
刘长宝
孙昌盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201811001018.8A priority Critical patent/CN110875824B/zh
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201911202722.4A priority patent/CN111130850B/zh
Priority to BR112020010520-1A priority patent/BR112020010520A2/pt
Priority to EP19854857.0A priority patent/EP3694152B1/en
Priority to KR1020207015083A priority patent/KR102534739B1/ko
Priority to JP2020526119A priority patent/JP7027542B2/ja
Priority to PCT/CN2019/102682 priority patent/WO2020043075A1/zh
Publication of CN110875824A publication Critical patent/CN110875824A/zh
Priority to US17/012,687 priority patent/US11552881B2/en
Priority to JP2022021842A priority patent/JP7405494B2/ja
Application granted granted Critical
Publication of CN110875824B publication Critical patent/CN110875824B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/044Network management architectures or arrangements comprising hierarchical management structures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/03Arrangements for fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/40Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • H04L45/245Link aggregation, e.g. trunking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/64Routing or path finding of packets in data switching networks using an overlay routing layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/41Flow control; Congestion control by acting on aggregated flows or links
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/555Error detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/557Error correction, e.g. fault recovery or fault tolerance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/60Software-defined switches
    • H04L49/602Multilayer or multiprotocol switching, e.g. IP switching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • H04Q2011/0079Operation or maintenance aspects
    • H04Q2011/0081Fault tolerance; Redundancy; Recovery; Reconfigurability
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Abstract

本申请公开了一种故障恢复方法。在该方法中,控制器首先确定经过第一网络设备上的第一端口的第一多层链路发生故障,其中,所述第一多层链路为所述第一网络设备和第二网络设备之间的链路聚合组中的链路。之后,所述控制器释放所述第一多层链路的光层资源,并将所述第一多层链路从所述链路聚合组中删除。进一步地,所述控制器基于所述第一网络设备上的第一空闲端口和目标网络设备上的第二空闲端口建立用于恢复第一多层链路的第二多层链路,并将所述第二多层链路添加至所述第一网络设备和所述目标网络设备之间的目标链路聚合组。通过这种方法,可以在包括多层的网络中对聚合组中的故障链路进行恢复。

Description

一种故障多层链路恢复方法和控制器
技术领域
本申请涉及通信领域,尤其涉及一种故障多层链路恢复方法和控制器。
背景技术
链路聚合是一种将一组物理接口捆绑在一起成为一个逻辑接口的方法,这种方法可以增加带宽和可靠性。将多条物理链路捆绑在一起形成的逻辑链路被称为链路聚合组(Link Aggregation Group,LAG)或者主干(Trunk)。如果这些被捆绑的链路都是以太网链路,那么该聚合组被称为以太网链路聚合组,可以被简写为Eth-Trunk,该聚合组的接口被称为Eth-Trunk接口,Eth-Trunk的中的多个接口被称之为多个成员接口。Eth-Trunk接口可以作为普通的以太网接口来使用,它与普通以太网接口的差别只在于:转发的时候Eth-Trunk需要从众多成员接口中选择一个或多个接口来进行转发。所以,除了一些必须在物理接口下配置的特性,可以像配置普通以太网接口那样配置Eth-Trunk逻辑接口。当一个Eth-Trunk中的一条物理链路发生故障时,需要对该发生故障的物理链路进行恢复,否则网络的性能会下降或者网络中的数据传输会失败。
发明内容
本申请实施例的一个目的为提供对一种故障链路恢复方法和控制器。
本申请的一方面提供了一种故障恢复方法,该方法包括:控制器确定经过第一网络设备上的第一端口的第一多层链路发生故障,其中,所述第一多层链路为所述第一网络设备和第二网络设备之间的链路聚合组中的链路;所述控制器释放所述第一多层链路的光层资源;所述控制器将所述第一多层链路从所述链路聚合组中删除;所述控制器基于所述第一网络设备上的第一空闲端口和目标网络设备上的第二空闲端口建立用于恢复第一多层链路的第二多层链路;所述控制器将所述第二多层链路添加至所述第一网络设备和所述目标网络设备之间的目标链路聚合组。
在一种可能的设计中,所述目标网络设备为所述第二网络设备。
在一种可能的设计中,所述确定经过第一网络设备上的第一端口的第一多层链路发生故障包括:确定所述第一网络设备上的第一端口发生故障;根据所述第一端口的故障确定所述第一多层链路发生故障。
在一种可能的设计中,所述目标网络设备为第三网络设备。
在一种可能的设计中,所述确定经过第一网络设备上的第一端口的第一多层链路发生故障包括:确定所述第二网络设备发生节点故障;确定所述第一多层链路经过所述第一端口与所述第二网络设备;确定所述第一多层链路发生故障。
在一种可能的设计中,所述第一空闲端口是所述第一端口。
在一种可能的设计中,所述第一空闲端口不是所述第一端口。
在一种可能的设计中,所述第一多层链路和所述第二多层链路是经过不同类型的网络的链路。
本申请的另一方面提供了一种控制器,该控制器包括存储器和处理器。所述存储器用于保存计算机可读指令。所述处理器与所述存储器通信,用于读取所述计算机可读指令,从而:确定经过第一网络设备上的第一端口的第一多层链路发生故障,其中,所述第一链路为所述第一网络设备和第二网络设备之间的链路聚合组中的链路;释放所述第一多层链路的光层资源;将所述第一多层链路从所述链路聚合组中删除;基于所述第一网络设备上的第一空闲端口和目标网络设备上的第二空闲端口建立用于恢复第一多层链路的第二多层链路;将所述第二多层链路添加至所述第一网络设备和所述目标网络设备之间的目标链路聚合组。
在一种可能的设计中,所述目标网络设备为所述第二网络设备。
在一种可能的设计中,所述处理器用于读取所述计算机可读指令,从而:确定所述第一网络设备上的第一端口发生故障;根据所述第一端口的故障确定所述第一多层链路发生故障。
在一种可能的设计中,所述目标网络设备为第三网络设备。
在一种可能的设计中,所述处理器用于读取所述计算机可读指令,从而:确定所述第二网络设备发生节点故障;确定所述第一多层链路经过所述第一端口与所述第二网络设备;确定所述第一多层链路发生故障。
在一种可能的设计中,所述第一空闲端口是所述第一端口。
在一种可能的设计中,所述第一空闲端口不是所述第一端口。
在一种可能的设计中,所述第一多层链路和所述第二多层链路是经过不同类型的网络的链路。
在本申请中,控制器在确定链路聚合组中发生故障的多层链路后,不仅将发生故障的多层链路从链路聚合组中删除,还要释放该多层链路的光网络资源,然后再根据空闲端口建立一个用于恢复所述故障链路新的多层链路,从而对光网络和IP网络的资源进行协同管理,实现了对故障多层链路的高效恢复。
附图说明
图1所示为本发明实施例的网络的示意图;
图2所示为本发明实施例的故障恢复方法的流程图;
图3所示为本发明实施例的网络的示意图;
图4所示为本发明实施例的故障恢复方法的流程图;
图5所示为本发明实施例的网络的示意图;
图6所示为本发明实施例的故障恢复方法的流程图;
图7所示为本发明实施例的控制器的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明展开详细说明。但需要注意,下面的这些实施例,仅为帮助理解技术方案所举的例子,并不用于限定本发明。
图1所示为本发明实施例的网络的示意图。如图1所示,网络100包括控制器120,IP网络140和光网络160。
控制器120包括多层管理模块122,IP域管理模块124和光域管理模块126。所述三个模块具有多种实现方式。在有些实施例中,多层管理模块122,IP域管理模块124和光域管理模块126可以是三个独立的设备或软件产品。在这种情况下,控制器120可以被理解为包括多个独立设备或软件产品的系统。当控制器120是指一个包括多个独立设备的系统时,多层管理模块122,IP域管理模块124和光域管理模块126实际上分别是多层管理设备122,IP域管理设备124和光域管理设备126。这三个管理设备都是控制器。此外,多层管理模块122,IP域管理模块124和光域管理模块126也可以在一个独立设备或软件产品上实现。控制器120可以是一个软件定义网络(software defined network,SDN)控制器产品。
IP网络140包括多个网络设备,例如路由器141-144。这些路由器之间直接或者间接相连,并且根据控制器120发送的配置命令信息,配置自身的转发行为,对接收到的数据进行路由。光网络160包括多个光网络单元(Optical Network Element,ONE),例如ONE161-164。在图1所示的网络中,ONE161-164分别和路由器141-144一一对应。当一个路由器,例如路由器141,需要向另一个路由器,例如路由器142,发送数据时,为了提高传送速度,发送数据的路由器可以先将数据发送到一个与其对应的ONE,例如ONE161,然后由该ONE通过光网络将所述数据发送至目标路由器,例如路由器142,对应的ONE,例如ONE162,然后再由与目标路由器对应的ONE将接收到的数据发送给目标路由器。由于该数据经过的链路跨越了路由器141和142所在的IP网络140和ONE161和ONE162所在的光网络160,并且IP网络140可以被称为IP层网络,光网络160可以被称为光层网络,所以该链路可以被称为多层链路。在这里,连接IP网络140和光网络160的链路,例如连接路由器141和ONE161的链路,是层间链路(cross link),也被称为跳纤(patch cord)。
IP域管理模124块用于向IP网络140中的路由器发送控制信息,还可以接收IP网络140上报的IP网络状态信息。光域管理模块126用于向光网络160中的ONE发送控制信息,还可以接收光网络160上报的光网络状态信息。
图2所示为本发明实施例的故障恢复方法的流程图。图2所示的故障恢复是基于图3所示的网络进行的,其中图3所示的网络结构和图1所示的网络的网络结构相同。在图3所示的网络中,控制器120根据自身保存的IP网络140的网络状态信息可以确定路由器141上有端口P1、P2和P3,路由器142上有端口P4、P5和P6,端口P1和P4通过一条多层链路相连,端口P2和P5通过一条多层链路相连,端口P3和P6处于空闲状态,这两个多层链路均处于一个链路聚合组中。所述网络状态信息可以被存储于控制器的多层管理模块中。此外,IP域管理模块124可以保存所述网络状态信息中关于IP网络140的部分,光域管理模块126可以保存所述网络状态信息中关于光网络160的部分。
图2所示的故障恢复方法包括以下内容。
205、控制器120确定路由器141的端口P2发生故障。
路由器141在检测到端口P2发生故障后,向控制器120发送报告信息,报告端口P2发生故障。控制器120基于所述报告信息,确定路由器141的端口P2发生故障。举例来说,IP域管理模块124接收所述报告信息,并将所述报告信息发送给多层管理模块122,多层管理模块122基于所述报告信息确定端口P2发生故障。
210、控制器120释放网络160中承载连接端口P2和P5的多层链路的光层资源。
举例来说,控制器120向光网络160发送释放通知,通知光网络160释放光网络160中承载连接端口P2和P5的多层链路的光层资源。在控制器120内部,多层管理模块122驱动光域管理模块126释放光网络160中承载连接端口P2和P5的多层链路的光层资源;相应地,光域管理模块126向光网络160发送释放通知,使光网络160释放承载连接端口P2和P5的多层链路的光层资源。光网络160在收到释放通知后,将用于传输连接端口P2和P5的多层链路的光资源释放。所述释放通知可以包括发送给ONE161和ONE162的两条信息,所述两条信息分别通知ONE161和ONE162将用于传输连接端口P2和P5的多层链路的光资源释放。控制器120可以更新其保存的光网络160的光网络状态信息,更新后的光网络160的光网络状态信息表明所述用于传输连接端口P2和P5的多层链路的光资源处于空闲状态。所述更新后的光网络状态信息可以保存在多层管理模块122中,也可以保存在光域管理模块126,也可以保存在多层管理模块122和光域管理模块126中。
215、控制器120将连接节点P2和P5的多层链路从链路聚合组170中删除。
举例来说,控制器120可以向IP网络140路由器发送删除通知,用于通知IP网络140将连接端口P2和P5的多层链路从其所在的链路聚合组170中删除。所述删除通知可以包括分别发送给路由器141和142的两条信息,这两条信息分别用于通知路由器141和142将连接端口P2和P5的多层链路从其所在的链路聚合组170中删除。所述删除通知可以由多层管理模块122驱动IP域管理模块124发送,也可以由IP域管理模块124独自发送。
220、控制器120基于路由器141和142上的空闲端口,建立连接路由器141和142的多层链路。
控制器120可以根据控制器120中保存的IP网络140的状态信息,确定路由器141上还存在可用端口P3,并确定使用该空闲端口P3与路由器142建立新的多层链路。具体的,可以使用端口P3和P5新的多层链路,可以使用端口P3和路由器142上的另一个空闲端口P6建立新的IP链路P3-P6。为了建立连接路由器141和142的多层链路,可以对IP网络140和光网络160都进行配置,因此IP域管理模块124和光域管理模块126可以基于多层管理模块的控制向IP网络140和光网络160发送控制信息,从而建立所述连接路由器141和142的多层链路。
225、控制器120将新建的多层链路添加至所述链路聚合组170,从而恢复所述链路聚合组170中发生了故障的链路。举例来说,IP域管理模块124可以在多层管理模块122的控制下向路由器141和142发送控制信息,使路由器141和142将在220新建的多层链路添加至所述链路聚合组170。
图4所示为本发明实施例的故障恢复方法的流程图。图4所示的故障恢复是基于图5所示的网络进行的,其中图5所示的网络的网络结构与图1所示的网络的网络结构相同。在图5所示的网络中,控制器120根据其中保存的网络状态信息可以确定路由器141上有端口P1、P2和P3,路由器142上有端口P4、P5和P6,路由器144上有P7和P8。控制器120配置了连接端口P2和P5的工作链路,并且还配置了连接端口P3和P8的保护链路。所述工作链路和保护链路都是多层链路。所述保护链路用于保护所述工作链路。例如,当所述工作链路故障时,路由器141将工作链路上的流量切换至保护链路。所述网络状态信息可以被存储于控制器的多层管理模块122中。此外,IP域管理模块124可以保存所述网络状态信息中关于IP网络140的部分,光域管理模块126可以保存所述网络状态信息中关于光网络160的部分。
图4所示的故障保护方法包括以下内容。
405、控制器120确定路由器142或者光网络单元162发生节点故障。举例来说,控制器120可以通过IP域管理模块124感知到路由器142的节点故障,可以通过光域管理模块126感知到光设备162的节点故障。路由器142和光网络单元162都是用于传输数据的网络设备。光网络单元162是与路由器142对应的光网络单元,因为光网络单元162用于在光网络上发送和接收路由器142和另一个或多个路由器之间相互通信的数据。
410、控制器120根据路由器142或者光设备162的故障,确定连接端口P2和P5的多层链路故障。当路由器142发生节点故障时,控制器120中的多层管理模块122可以根据IP域管理模块124上报的用于通知路由器142发生节点故障的故障信息确定路由器142发生故障。由于多层管理模块122已经知道端口P5在路由设备142上并且有一条多层链路连接了端口P2和P5,多层管理模块122可以确定这条连接端口P2和P5的多层链路发生故障。当光网络单元162发生节点故障时,控制器120中的多层管理模块122可以根据光域管理模块126上报的用于通知光网络单元162发生节点故障的故障信息确定光网络单元162发生故障。由于多层管理模块122已经知道光网络单元是用于为路由器142发送和接收数据,端口P5在路由器142上,并且有一条多层链路连接了端口P2和P5,多层管理模块122可以确定这条连接端口P2和P5的多层链路发生故障。
415、控制器120释放光网络160中承载连接节点P2和P5的多层链路的光层资源。举例来说,控制器120向光传送网络160发送释放通知,使光网络160释放光网络160中承载连接节点P2和P5的多层链路的光层资源。在具体实现上,所述释放通知可以通知光网络160释放光网络160中承载通过路由器142的每条多层链路的光层资源,也可以通知光网络160释放光网络160中仅用于承载连接端口P2和P5的多层链路的光层资源。在发送释放通知方面,可以由多层管理模块122驱动光域管理模块146发送所述释放通知,也可以由光域管理模块146独自决定发送所述释放通知。当所述节点故障是指路由器142发生故障,所述释放通知可以是指发给光网络单元161或162的一条信息,也可以包括发送给包括光网络单元161和162在内的多个光网络单元的多条信息。当所述节点故障是指光网络单元162发生故障,所述释放通知可以是指发给光网络单元161的一条信息,也可以包括发送给包括光网络单元161在内的多个光网络单元的多条信息。由于光网络单元162发生故障,控制器120可以不向光网络单元162用于通知其释放承载连接节点P2和P5的多层链路的光层资源的信息。但是由于光网络单元162可能仍有一定的处理能力,控制器120也可以向光网络单元162发送通知其释放承载连接节点P2和P5的多层链路的光层资源的信息。
420、控制器120将连接端口P2和P5的多层链路从路由器141和142间的链路聚合组170中删除。举例来说,控制器120向IP网络140发送删除通知,使IP网络140将连接端口P2和P5的多层链路从路由器141和142间的链路聚合组170中删除。此外,控制器120也可以将连接端口P2和P5的多层链路从控制器120中保存的所述链路聚合组的配置信息中删除,以便使控制器中保存正确的网络状态信息。当路由器141和142间的链路聚合组为以太网聚合组Eth-Trunk时,需要将连接端口P2和P5的多层链路从所述Eth-Trunk中删除。在发送删除通知方面,可以由多层管理模块122驱动IP域管理模块144发送所述删除通知,也可以由IP域管理模块144独自决定发送所述删除通知。当所述节点故障是指路由器142发生故障,所述删除通知可以是指发给路由器141的一条信息,也可以包括发送给包括路由器141在内的多个路由器的多条信息。由于路由器142发生故障,控制器120可以不向路由器142发送用于通知其删除连接端口P2和P5的多层链路的信息。但是由于路由器142可以还具有一定的处理能力,控制器120也可以向路由器142发送用于通知其删除连接端口P2和P5的多层链路的信息。
425、控制器120基于路由器141和路由器144上的空闲端口建立连接路由器141和路由器144的多层链路。路由器144可以是所述保护链路上的端口P8所在的路由器,也可以不是端口P8所在的路由器。连接路由器141和路由器144的多层链路可以连接路由器141上的一个空闲端口,例如端口P1或者一个不同于端口P1的空闲端口,和路由器144上的一个空闲端口,例如端口P7。控制器120可以向路由器141和144以及光网络单元161和164发送配置信息,从而建立所述路由器141和路由器144的多层链路
430、控制器120将所述连接端口P1和P4的多层链路添加至所述保护链路所在的链路聚合组180,从而可以通过连接端口P2和P7的多层链路替代连接端口P2和P5的链路,实现了对了连接端口P2和P5的链路这个发生故障的链路的恢复。在经过端口P2和P5的多层链路故障后,该链路上的流量可能会被切换至经过端口P3和P8的保护链路上。如果所述流量已经被切换指所述保护链路,控制器120可以将所述流量切换至经过在425建立的多层链路,也可以不切换。
图6所示为本发明实施例的故障恢复方法的流程图。该故障恢复方法包括以下内容。
605、控制器确定经过第一网络设备上的第一端口的第一多层链路发生故障,其中,所述第一链路为所述第一网络设备和第二网络设备之间的链路聚合组中的链路。
控制器可以通过检测所述第一多层链路两端的网络设备是否发生故障来确定所述第一多层链路是否发生故障。当控制器确定所述第一端口发生故障时,可以确定所述第一多层链路发生故障。例如,当图3中的端口P2故障时,可以确定连接端口P2和端口P5的链路发生了故障。此外,当控制器确定第二网络设备发生节点故障时,也可以确定所述第一多层链路发生故障。
控制器还可以通过所述两端的网络设备对应的光网络单元的故障来确定第一多层链路发生故障。例如,当光网络单元162发生节点故障时,可以确定与光网络单元162对应的网络设备142发生节点故障,从而进一步确定网络节点142和网络节点141之间的全部多层链路都发生了故障。如果所述第一端口是网络节点141上与网络节点142相连的端口,则可以确定经过第一端口的第一多层链路发生故障。
610、所述控制器释放所述第一多层链路的光层资源。
由于第一多层链路经过IP网络和光网络,因此控制器需要释放第一多层链路的光层资源,避免所述光层资源被浪费。所述第一多层链路的光层资源可以是指用于与第一多层链路的两个IP层网络设备分别对应的两个光网络单元间的光资源。例如,在图5中,如果连接P2和P5的多层链路发生故障,则控制器120要释放连接P2和P5的这条多层链路的光层资源,即释放光网络单元161和162上用于传输连接节点P2和P5的这条多层链路上的数据的光资源。控制器不仅可以向所述两个光传输节点发送释放所述光资源的信息,还可以释放控制器本地记录的用于传输连接节点P2和P5的这条多层链路上的数据的光资源。
615、所述控制器将所述第一多层链路从所述链路聚合组中删除。
由于第一多层链路已经故障,因此需要将其从所述链路聚合组中删除,防止发生数据丢失。控制器可以向被第一多层链路连接的两个网络设备发送删除通知,使所述两个网络设备从自身保存的关于所述链路聚合组的配置信息中将所述第一多层链路删除。控制器还可以在自身保存的关于所述链路聚合组的配置信息中将所述第一多层链路删除。
620、所述控制器基于所述第一网络设备上的第一空闲端口和目标网络设备上的第二空闲端口建立用于恢复第一多层链路的第二多层链路。
所述第一空闲端口可以是所述第一网络设备上的所述第一端口,但是也可以是所述第一网络设备上的另一个空闲端口。
所述目标网络设备的选取需要根据故障类型。当所述第二网络设备发生节点故障时,所述目标网络设备不可以是所述第二网络设备,而需要是一个不同于所述第一网络设备和第二网络设备的第三网络设备,其中第三网络设备是所述第二网络设备的备份设备。当所述第二网络设备未发生节点故障,所述第一链路的故障是由端口故障引起的,则所述目标网络设备既可以是所述第二网络设备,也可以是所述第三网络设备。
625、所述控制器将所述第二多层链路添加至所述第一网络设备和所述目标网络设备之间的目标链路聚合组。
这样,发生故障的所述第一多层链路就被所述第二多层链路恢复了。因为第一多层链路故障而导致的带宽损失可以因为将第二多层链路添加至目标链路聚合组而得到补偿。
图7所示为本发明实施例中的控制器700的结构框图。如图7所示,控制器700包括处理器710,与所述处理器710通信的存储器720,以及收发器730。当图1、3和5中的多层管理模块122,IP域管理模块124和光域管理模块126是一个设备内部的三个模块,而不是三个分立的设备时,控制器700可以是当图1、3和5中控制器120。当图1、3和5中的多层管理模块122,IP域管理模块124和光域管理模块126是三个独立的设备时,控制器120实际上是一个控制系统。在这种情况下,控制器700可以是多层管理模块122,实际上也就是多层管理设备122。
处理器710可以是中央处理器(central processing unit,CPU),网络处理器(network processor,NP)或者CPU和NP的组合。处理器还可以是专用集成电路(application-specific integrated circuit,ASIC),可编程逻辑器件(programmablelogic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complexprogrammable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gatearray,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。处理器710可以是指一个处理器,也可以包括多个处理器。存储器720可以是指一个存储器,也可以包括多个存储器。存储器720可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器也可以包括非易失性存储器(non-volatilememory),例如只读存储器(read-only memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);存储器还可以包括上述种类的存储器的组合。存储器720中存储有计算机可读指令,所述计算机可读指令包括多个软件模块。处理器710执行各个软件模块后可以按照各个软件模块的指示进行相应的操作。处理器710执行存储器720中的计算机可读指令后,可以按照所述计算机可读指令的指示,执行作为独立设备的控制器120或者多层管理模块122所执行的全部操作。此外,当图1、3和5中的多层管理模块122,IP域管理模块124和光域管理模块126是一个设备内部的三个模块时,多层管理模块122可以被理解为基于处理器710,存储器720以及存储器720中存储的多层管理软件模块实现。类似地,IP域管理模块124可以被理解为基于处理器710,存储器720以及存储器720中存储的IP域管理软件模块实现;光域管理模块126可以被理解为基于处理器710,存储器720以及存储器720中存储的光域管理软件模块实现。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (16)

1.一种故障恢复方法,其特征在于,包括:
控制器确定经过第一网络设备上的第一端口的第一多层链路发生故障,其中,所述第一多层链路为所述第一网络设备和第二网络设备之间的链路聚合组中的链路;
所述控制器释放所述第一多层链路的光层资源;
所述控制器将所述第一多层链路从所述链路聚合组中删除;
所述控制器基于所述第一网络设备上的第一空闲端口和目标网络设备上的第二空闲端口建立用于恢复第一多层链路的第二多层链路;
所述控制器将所述第二多层链路添加至所述第一网络设备和所述目标网络设备之间的目标链路聚合组。
2.根据权利要求1所述的方法,其特征在于,所述目标网络设备为所述第二网络设备。
3.根据权利要求1或2所述的方法,其特征在于,所述确定经过第一网络设备上的第一端口的第一多层链路发生故障包括:
确定所述第一网络设备上的第一端口发生故障;
根据所述第一端口的故障确定所述第一多层链路发生故障。
4.根据权利要求1所述的方法,其特征在于,所述目标网络设备为第三网络设备。
5.根据权利要求1或4所述的方法,其特征在于,所述确定经过第一网络设备上的第一端口的第一多层链路发生故障包括:
确定所述第二网络设备发生节点故障;
确定所述第一多层链路经过所述第一端口与所述第二网络设备;
确定所述第一多层链路发生故障。
6.根据权利要求1、2或4任一项所述的方法,其特征在于,所述第一空闲端口是所述第一端口。
7.根据权利要求1、2或4任一项所述的方法,其特征在于,所述第一空闲端口不是所述第一端口。
8.根据权利要求1、2或4任一项所述的方法,其特征在于,所述第一多层链路和所述第二多层链路是经过不同类型的网络的链路。
9.一种控制器,其特征在于,包括:
存储器,用于保存计算机可读指令;
与所述存储器通信的处理器,用于读取所述计算机可读指令,从而:
确定经过第一网络设备上的第一端口的第一多层链路发生故障,其中,所述第一多层链路为所述第一网络设备和第二网络设备之间的链路聚合组中的链路;
释放所述第一多层链路的光层资源;
将所述第一多层链路从所述链路聚合组中删除;
基于所述第一网络设备上的第一空闲端口和目标网络设备上的第二空闲端口建立用于恢复第一多层链路的第二多层链路;
将所述第二多层链路添加至所述第一网络设备和所述目标网络设备之间的目标链路聚合组。
10.根据权利要求9所述的控制器,其特征在于,所述目标网络设备为所述第二网络设备。
11.根据权利要求9或10所述的控制器,其特征在于,所述处理器用于读取所述计算机可读指令,从而:
确定所述第一网络设备上的第一端口发生故障;
根据所述第一端口的故障确定所述第一多层链路发生故障。
12.根据权利要求9所述的控制器,其特征在于,所述目标网络设备为第三网络设备。
13.根据权利要求9或12所述的控制器,其特征在于,所述处理器用于读取所述计算机可读指令,从而:
确定所述第二网络设备发生节点故障;
确定所述第一多层链路经过所述第一端口与所述第二网络设备;
确定所述第一多层链路发生故障。
14.根据权利要求9、10或12任一项所述的控制器,其特征在于,所述第一空闲端口是所述第一端口。
15.根据权利要求9、10或12任一项所述的控制器,其特征在于,所述第一空闲端口不是所述第一端口。
16.根据权利要求9、10或12任一项所述的控制器,其特征在于,所述第一多层链路和所述第二多层链路是经过不同类型的网络的链路。
CN201811001018.8A 2018-08-30 2018-08-30 一种故障多层链路恢复方法和控制器 Active CN110875824B (zh)

Priority Applications (9)

Application Number Priority Date Filing Date Title
CN201911202722.4A CN111130850B (zh) 2018-08-30 2018-08-30 一种故障多层链路恢复方法和控制器
CN201811001018.8A CN110875824B (zh) 2018-08-30 2018-08-30 一种故障多层链路恢复方法和控制器
EP19854857.0A EP3694152B1 (en) 2018-08-30 2019-08-27 Method for recovering faulty multi-layer link and controller
KR1020207015083A KR102534739B1 (ko) 2018-08-30 2019-08-27 고장 다층 링크 회복 방법 및 제어기
BR112020010520-1A BR112020010520A2 (pt) 2018-08-30 2019-08-27 Método e controlador de restauração de link multicamada defeituoso
JP2020526119A JP7027542B2 (ja) 2018-08-30 2019-08-27 障害がある多層リンク復旧方法およびコントローラ
PCT/CN2019/102682 WO2020043075A1 (zh) 2018-08-30 2019-08-27 一种故障多层链路恢复方法和控制器
US17/012,687 US11552881B2 (en) 2018-08-30 2020-09-04 Faulty multi-layer link restoration method and controller
JP2022021842A JP7405494B2 (ja) 2018-08-30 2022-02-16 障害がある多層リンク復旧方法およびコントローラ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811001018.8A CN110875824B (zh) 2018-08-30 2018-08-30 一种故障多层链路恢复方法和控制器

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201911202722.4A Division CN111130850B (zh) 2018-08-30 2018-08-30 一种故障多层链路恢复方法和控制器

Publications (2)

Publication Number Publication Date
CN110875824A CN110875824A (zh) 2020-03-10
CN110875824B true CN110875824B (zh) 2023-10-13

Family

ID=69644065

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201911202722.4A Active CN111130850B (zh) 2018-08-30 2018-08-30 一种故障多层链路恢复方法和控制器
CN201811001018.8A Active CN110875824B (zh) 2018-08-30 2018-08-30 一种故障多层链路恢复方法和控制器

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201911202722.4A Active CN111130850B (zh) 2018-08-30 2018-08-30 一种故障多层链路恢复方法和控制器

Country Status (7)

Country Link
US (1) US11552881B2 (zh)
EP (1) EP3694152B1 (zh)
JP (2) JP7027542B2 (zh)
KR (1) KR102534739B1 (zh)
CN (2) CN111130850B (zh)
BR (1) BR112020010520A2 (zh)
WO (1) WO2020043075A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111786899A (zh) * 2020-07-15 2020-10-16 深圳市有方科技股份有限公司 一种物联网通信方法及相关设备
US11546078B1 (en) * 2021-03-30 2023-01-03 Amazon Technologies, Inc. Optimizing routes across an optical network based on traffic stream bandwidth utilization

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102208999A (zh) * 2011-06-17 2011-10-05 中兴通讯股份有限公司 以太环网链路聚合组的保护方法和装置
CN103916281A (zh) * 2014-04-29 2014-07-09 上海斐讯数据通信技术有限公司 一种动态lacp聚合链路故障恢复方法
CN106330780A (zh) * 2015-06-24 2017-01-11 联想企业解决方案(新加坡)有限公司 用于构成聚合链路的交换机、设备和方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6687758B2 (en) * 2001-03-07 2004-02-03 Alacritech, Inc. Port aggregation for network connections that are offloaded to network interface devices
US20040107382A1 (en) * 2002-07-23 2004-06-03 Att Corp. Method for network layer restoration using spare interfaces connected to a reconfigurable transport network
JP4835422B2 (ja) * 2006-12-21 2011-12-14 株式会社日立製作所 ネットワーク装置及び通信システム
JP2009111477A (ja) * 2007-10-26 2009-05-21 Nippon Telegr & Teleph Corp <Ntt> ノード装置および通信路制御方法
CN101471868A (zh) * 2007-12-27 2009-07-01 华为技术有限公司 路径选择方法及网络系统、路径计算模块
CN101626317A (zh) * 2008-07-07 2010-01-13 华为技术有限公司 一种链路故障恢复的方法、系统和装置
CN101715149B (zh) * 2009-07-21 2013-01-23 北京邮电大学 一种多层多域分布式光网络并行跨域故障恢复方法和装置
KR101417195B1 (ko) * 2010-10-18 2014-07-09 한국전자통신연구원 다계층 네트워크에서의 계층간 경로 설정 방법 및 시스템
WO2012074305A2 (ko) * 2010-12-02 2012-06-07 엘지전자 주식회사 반송파 집성 시스템에서 채널 상태 정보 전송 방법 및 장치
CN102136940B (zh) * 2010-12-31 2013-10-09 华为技术有限公司 一种网络恢复方法和装置
US8861334B2 (en) * 2011-06-14 2014-10-14 Avaya Inc. Method and apparatus for lossless link recovery between two devices interconnected via multi link trunk/link aggregation group (MLT/LAG)
US8938163B2 (en) * 2011-10-05 2015-01-20 Fujitsu Limited Method and system for hybrid multi-layer mesh restoration in a communication network
EP2843880B1 (en) * 2012-04-27 2018-07-25 Allied Telesis Holdings K.K. Switch, transmission method, program, and recording medium
US9264302B2 (en) * 2013-06-17 2016-02-16 Telefonaktiebolaget L M Ericsson (Publ) Methods and systems with enhanced robustness for multi-chassis link aggregation group
US9258238B2 (en) * 2013-08-30 2016-02-09 Juniper Networks, Inc. Dynamic end-to-end network path setup across multiple network layers
CN103973491B (zh) * 2014-05-09 2017-11-14 北京智谷睿拓技术服务有限公司 故障处理方法及光层控制网元、ip层控制网元
CN104243015B (zh) * 2014-10-11 2018-04-27 北京邮电大学 一种光网络用户网络接口故障恢复方法
US10015053B2 (en) * 2015-05-21 2018-07-03 Huawei Technologies Co., Ltd. Transport software defined networking (SDN)—logical link aggregation (LAG) member signaling
US10158448B2 (en) * 2016-01-08 2018-12-18 Ciena Corporation Multilayer resource management and arbitration in transport networks
US10587500B2 (en) * 2016-04-07 2020-03-10 Infinera Corporation Intelligent optical restoration in integrated multi-layer networks
CN108337043B (zh) * 2017-12-26 2020-09-25 广东电网有限责任公司电力调度控制中心 多层sdn光网络中具有区域故障容忍的故障恢复方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102208999A (zh) * 2011-06-17 2011-10-05 中兴通讯股份有限公司 以太环网链路聚合组的保护方法和装置
CN103916281A (zh) * 2014-04-29 2014-07-09 上海斐讯数据通信技术有限公司 一种动态lacp聚合链路故障恢复方法
CN106330780A (zh) * 2015-06-24 2017-01-11 联想企业解决方案(新加坡)有限公司 用于构成聚合链路的交换机、设备和方法

Also Published As

Publication number Publication date
CN111130850A (zh) 2020-05-08
JP2021506145A (ja) 2021-02-18
KR20200078585A (ko) 2020-07-01
KR102534739B1 (ko) 2023-05-22
JP7027542B2 (ja) 2022-03-01
JP7405494B2 (ja) 2023-12-26
US20200403907A1 (en) 2020-12-24
EP3694152B1 (en) 2023-04-26
CN111130850B (zh) 2022-09-16
BR112020010520A2 (pt) 2021-03-09
WO2020043075A1 (zh) 2020-03-05
JP2022084587A (ja) 2022-06-07
EP3694152A1 (en) 2020-08-12
EP3694152A4 (en) 2021-03-03
CN110875824A (zh) 2020-03-10
US11552881B2 (en) 2023-01-10

Similar Documents

Publication Publication Date Title
CN105827419B (zh) 一种转发设备故障处理的方法、设备和控制器
EP3097659B1 (en) G.8032 ethernet multiple fault recovery mechanisms
JP7405494B2 (ja) 障害がある多層リンク復旧方法およびコントローラ
WO2015167479A1 (en) Efficient routing in software defined networks
US9467332B2 (en) Node failure detection for distributed linear protection
CN105103475A (zh) 一种链路切换方法、设备和系统
US20140219080A1 (en) Method and apparatus for interworking protection switching
JP5949412B2 (ja) 通信ネットワークにおける複合型マルチレイヤメッシュ回復方法およびシステム
WO2017113929A1 (zh) 一种软件定义网络中控制转发设备集群的方法及控制器
US20160204976A1 (en) Identifying the absence and presence of a ring protection link owner node in an ethernet network
WO2016153506A1 (en) Fast failover recovery in software defined networks
CN106664229A (zh) 针对回弹双层网络的双故障的保护
KR20150002474A (ko) 통신 네트워크에서 장애 복구 방법
CN105207871B (zh) 双切环网保护方法及装置
CN102611610A (zh) 一种多条相同路径隧道集中管理的方法和系统
US8615006B2 (en) Systems and methods for reconfiguration of a circuit switched ring to a packet switched ring
US20150263884A1 (en) Fabric switchover for systems with control plane and fabric plane on same board
JP5168499B2 (ja) 通信ネットワークシステム及びパスの高信頼化方法
EP2693706A1 (en) Method and device for implementing multi-protection overlapped protection groups
CN109039681A (zh) 基于sdn的路径优化方法、存储装置和网络设备
KR102126222B1 (ko) 연동 보호 절체 방법 및 장치
US9647893B2 (en) Method for identifying logical loops in ethernet networks
US6418117B1 (en) Out of band messaging in a DRA network
CN117499205B (zh) 一种存储系统端口绑定容灾的方法、装置、设备及介质
CN115701031A (zh) 一种业务处理方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant