CN101088257B - 交换以太网局域网(lan)的运营商级弹性解决方案 - Google Patents

交换以太网局域网(lan)的运营商级弹性解决方案 Download PDF

Info

Publication number
CN101088257B
CN101088257B CN2004800444967A CN200480044496A CN101088257B CN 101088257 B CN101088257 B CN 101088257B CN 2004800444967 A CN2004800444967 A CN 2004800444967A CN 200480044496 A CN200480044496 A CN 200480044496A CN 101088257 B CN101088257 B CN 101088257B
Authority
CN
China
Prior art keywords
rlsp
switching matrix
link
meet
meets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004800444967A
Other languages
English (en)
Other versions
CN101088257A (zh
Inventor
I·弗罗罗思
J·卡尔森
U·H·拉森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN101088257A publication Critical patent/CN101088257A/zh
Application granted granted Critical
Publication of CN101088257B publication Critical patent/CN101088257B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/552Prevention, detection or correction of errors by ensuring the integrity of packets received through redundant connections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/25Routing or path finding in a switch fabric
    • H04L49/253Routing or path finding in a switch fabric using establishment or release of connections between ports
    • H04L49/254Centralised controller, i.e. arbitration or scheduling

Abstract

本文描述了一种具有弹性交换控制系统(RSCS)的运营商级以太网交换机,该弹性交换控制系统管理使用冗余链路来连接到一个或多个应用刀片(例如,交换机、终端站)的冗余交换矩阵。由于快速链路监控协议(RLSP)用于检测在冗余交换矩阵与应用刀片之间任一冗余链路中的故障,因此,以太网交换机具有运营商级特征。此外,RLSP分发策略用于协调和控制冗余交换矩阵与应用刀片之间的隔离措施。在本文中还描述了一种在网络中提供弹性以太网连接的方法。

Description

交换以太网局域网(LAN)的运营商级弹性解决方案
技术领域
本发明一般涉及以太网背板领域,并且具体地,涉及在与机架式应用刀片(例如,交换机和终端站)连接时具有运营商级弹性和冗余特征的以太网交换机。
背景技术
在局域网(LAN)领域中,以太网通常被视为最具成本效益的连网技术。在过去的十年内,以太网也日益被用作诸如广域网和公共接入网络等其它连网应用选择的技术。为支持这些其它类型的应用,以太网标准框架已通过几种方式更新和扩展以便为每种类型的使用实现适当的属性和特征。
例如,以太网近来被引入称为背板的局部连网域以形成装有计算和交换装置的设备架(也称为子机架)的连接基础架构。鉴于市场对以统一方式使用此连接基础架构的需求,以太网标准论坛IEEE 802.3已开始着手此领域的标准工作,成立了称为“背板以太网”工作组。此工作的结果预期对包括电信部门的几个连网业务段有用。
可注意到的是,此工作组在处理明确定义的范围,该范围集中于背板的物理和电气方面。排除在该范围之外的是也需要解决以便实施此局部连接的几个其它方面。这些方面包括允许实现“运营商级”层次的高可用性的冗余和弹性机制。还可注意到,当前以太网标准框架与构建在节点之间具有冗余路径的网络相关联,但当前标准化机制的故障修复性能未能实现“运营商级”层次的高可用性。
本发明涉及以太网背板领域,并具特别集中于一种在此类环境中提供运营商级弹性(冗余、自恢复)以太网连接的方法。相对于现有技术和相关现有技术,有几个不同类型的弹性解决方案,其中一些将在下文描述。
符合标准的解决方案
即使以太网标准框架要求无环路活动拓扑,利用符合标准的以太网LAN装置的传统弹性解决方案也可在网络拓扑方面以相当高的自由度构建。由于用于拓扑发现和自动配置的标准化机制的原因,这种自由是可能的。
通过使用并行链路和重复交换机来提供一定量的稳健性,可构建在链路和设备层上具有冗余的这些解决方案。并行链路可使用IEEE标准802.3链路聚合,一条或多条链路手动配置为备份链路。在物理拓扑包括重复交换机和冗余交叉链路,IEEE标准802.1D/Q生成树协议自动将相关链路置于备用模式以确保活动逻辑拓扑无环路。
在理论上,基于上面引用的标准化机制的系统可支持确定性故障修复行为,但这是不够的。由于在所有这些机制中,故障修复性能的时标充其量不过约为数秒。此时标的长度如此的原因在于链路故障检测和随后的活动拓扑重新发现中涉及的协议和计时器。因此,此故障修复性能的时标比一般为50ms到100ms的运营商级性能所需的低2到3个数量级。
基于已修改标准的解决方案
有两个美国专利申请09/961471(2001年9月24日提交)和10/125654(2002年4月18日提交)描述了使用具有基于标准但已修改的行为(即,与标准有偏差)的以太网交换机在LAN中提供弹性连接的不同方法和布置。这些专利申请的内容通过引用结合于本文中。
这两个专利申请描述了使一对以太网交换机在连接到LAN的其它装置(交换机和终端站)看来是一个弹性以太网交换机的解决方案。此解决方案的实现是先通过让这对以太网交换机实施使这两个不同的以太网交换机看来是一个弹性交换机的专有机制。并且此后让每个装置(交换机和终端站)依据IEEE标准802.3使用“链路聚合”。这些方法和布置一般在通用LAN应用中使用。
即使在当前可用的以太网交换产品中使用的这些解决方案和其它解决方案与基于标准的解决方案相比大大地改进了故障修复特征,但这些改进通常是不足够的:由于这些解决方案(基于已修改标准的解决方案)将其故障修复主要或完全基于在物理层中的故障检测,因此,故障修复时间较大程度上取决于PHY。这产生了比运营商级性能所需的大约低一个数量级的故障修复性能。
特定使用的专有解决方案
在以太网连网的情况中,还存在在例如交换机和路由器等机架式节点中提供冗余的多种专有解决方案。这些解决方案经常基于与位于重复交换矩阵与重复接口板之间的背板相关联的专有协议。在背板上使用的这些协议和机制绝对在内部并且连接到机架式节点的外部接口的装置(例如,交换机和终端站)无法看到。这样,这些解决方案一般设计和优化用于特定的背板体系结构,并对内部网络拓扑和大小有严格的约束。
相邻使用领域的其它解决方案
另一种不完全相关的解决方案由于其目的有点类似,因而值得一提。此解决方案基于闭环配置(以太网交换环),在LAN或MAN中的所有交换机为拓扑控制而实施特殊的协议时,例如可在LAN或MAN中构建该配置。在IETF RCF 3619“以太网自动保护交换”(EAPS)中已公开的此解决方案的一个实施中,环中的至少一条链路保持在热备用模式,直至在环中某处检测到节点或链路故障。然而,在此类型的解决方案中,业务中断时间通常高度依赖于L1(PHY)故障检测时间。并且如上所述,较大程度上取决于PHY的故障修复时间产生了比运营商级性能所需的大约低一个数量级的故障修复性能。
发明内容
本发明的一个目的是提供在与机架式应用刀片(例如,交换机和终端站)连接时具有运营商级弹性和冗余特征的以太网交换机。在优选实施例中,以太网交换机具有弹性交换控制系统(RSCS),该系统管理使用冗余链路来连接到一个或多个应用刀片(例如,交换机、终端站)的冗余交换矩阵。由于快速链路监控协议(RLSP)用于检测在冗余交换矩阵与应用刀片之间任一冗余链路中的故障,因此,以太网交换机具有运营商级特征。此外,RLSP分发策略用于协调和控制冗余交换矩阵与应用刀片之间的隔离措施。本发明的另一目的是提供一种在网络中实现弹性以太网连接的方法。如下所述的本发明满足了这些目的和其它目的。
附图说明
结合附图,参照下面的详细说明,可更彻底地理解本发明,其中:
图1是包括以太网交换机和多个应用刀片的网络框图,根据本发明,所有这些具有运营商级特征;
图2是示出可在图1所示的以太网交换机和应用刀片中实施的两种状态的状态机图形;以及
图3是指示在图1所示的网络中提供弹性以太网连接的优选方法步骤的流程图。
具体实施方式
参照图1,它示出了包括连接到多个应用刀片104a、104b、...、104n的综合以太网交换机102的弹性网络100的框图。如图所示,以太网交换机102具有包括左交换矩阵106a和右交换矩阵106b的冗余(重复)交换矩阵106。以太网交换机102还包括使用交换机内部管理接口110连接到左交换矩阵106a和右交换矩阵106b的弹性交换控制系统(RSCS)108。应理解的是,左交换矩阵106a和右交换矩阵106b可彼此不互连或者可通过可用于像转发有效负荷等多种用途的链路彼此互连。在图1中未示出这些链路。
在优选实施例中,应用刀片104a、104b、...、104n是位于设备架(也称为子机架)中的交换机或终端站。每个应用刀片104a、104b、...、104n分别使用两个“链路组”112a和113a、112b和113b、...、112n和113n连接到以太网交换机102。这些链路组各自可由一条或多条单独的以太网链路组成,限制是连接到同一应用刀片104a(例如)的链路组对112a和113a(例如)就链路类型和链路数量而言是对称的。因此,每个应用刀片104a、104b、...、104n使用偶数数量的单独的以太网链路连接到以太网交换机102,根据IEEE标准802.3第43条款将这些链路配置为链路聚合链路。
通过引用将此标准的内容结合于本文中。如图所示,应用刀片104a、104b、...、104n分别使用链路组112a、112b、...、112n连接到左交换矩阵106a。此外,应用刀片104a、104b、...、104n分别使用链路组113a、113b、...、113n连接到右交换矩阵106b。这样,所有应用刀片104a、104b、...、104n以对称方式连接到交换矩阵106a和106b,并因此在整个交换LAN 100上实现网络冗余。
如上所述,每个应用刀片104a、104b、...、104n受链路聚合标准的约束,并且因此每个刀片可将帧分发到对应链路聚合组(LAG)114a、114b、...、114n内的链路组对112a/113a、112b/113b、...、112n/113n的一条或多条工作链路。链路聚合标准未规定特定的分发策略,但如果检测到LAG 114a(例如)内的链路组112a和113a(例如)内的任一链路有故障(即,PHY提供的状态指示link_status=DOWN(失效)),则将要发送到中断链路的帧分发到LAG 114a内的链路组112a和113a的一条或多条剩余链路上。因此,如果交换矩阵106a(例如)出现故障,检测到故障的已连接应用刀片104a、104b、...、104n“自动”修改其帧分发策略以只使用连接到剩余交换矩阵106b(例如)113a、113b、...、113n(例如)的链路。然而,如上面详细所述,使用基于PHY提供的状态指示的分发策略不合需要,这是由于它太慢以致无法实现运营商级性能。本发明解决了此问题。
交换矩阵106a和106b可实施为可单独卸除,而不扰乱另一矩阵的完整性。因此,结合在应用刀片104a、104b、...、104n上的上述链路聚合特征,即使交换矩阵之一106a或106b有故障、断电或甚至手动卸除,交换LAN 100也能够保持连接。这保证了在发生故障时的稳健处理,并且还保证了诸如设备维修、硬件和软件升级等计划活动。
另外,就带宽和可用端口数量而言,交换矩阵106a和106b可以是可扩展的。此外,对于所有外部以太网端口,交换矩阵106a和106b应完全逐端口对称。然而,在LAN网络100的此配置中允许和预见到的唯一稳定的状态不对称是交换矩阵106a或106b由于故障或管理干扰而被完全隔离的情况。
根据IEEE标准802.3和IEEE标准802.1D/Q,RSCS 108通过管理每个单独的交换矩阵106a和106b以确保这两个交换矩阵106a和106b作为单个以太网桥接器操作,从而控制交换矩阵106。通过引用将这些标准的内容结合于本文中。为此,RSCS 108可使用物理上集中或分散的处理元件或其混合体。RSCS 108还可使用诸如多PRO、1+1、1+N等弹性方案。
如下面详细描述的,本发明实现以太网网络100的此配置以满足运营商级要求。满足运营商级性能的要求之一是需要避免最终用户会话的业务扰动,而无论在故障修复时活动的最终用户会话的类型和数量如何。除以太网LAN系统最初定位的纯数据传送应用外,这些最终用户会话还可涉及话音和流式媒体等,这暗示着所需的故障修复时标为大约数十毫秒(ms)。对于声称符合运营商级一致性的系统,典型的故障修复时标值为50ms,并且常见的最大值为100ms。如背景技术部分中所述,此时标对所有基于已知现有标准的解决方案而言太困难了。
下述内容是本发明解决的要求清单,这些要求使得运营商级弹性以太网网络100得以实现:
●LAN段112a、112b、...、112n和113a、113b、...、113n的故障和隔离状态的快速检测。
●在故障和受控隔离情况下的快速故障修复。
●确定性故障修复行为(给定的原因-一个结果)。
●管理各个交换矩阵106a和106b协调的隔离。
RLSP
此清单中需要解决以实现运营商级性能的第一个要求可通过使用快速链路监控协议(RLSP)而得到满足。在112a、112b、...、112n和113a、113b、...、113n的各条链路上,即在LAG 114a、114b、...、114n中包括的各条链路上使用RLSP。RLSP的基本操作原理为通过一条或多条链路112a互连的两个装置104a和106a(例如)需要交换协议特定的协议数据单元(PDU)以验证那些链路112a或远程装置104a和106a的状态。随后将此相同的原理应用到方案中涉及的所有链路,即,也应用到将装置104a(例如)与装置106b互连的链路113a。
为交换这些PDU,要求符合RLSP的装置104a、104b、...、104n、106a和106b通过在接收每个单独的RLSP PDU的同一单独的链路上发射匹配的RLSP响应PDU而响应所有已接收的RLSP PDU。此响应过程无需注意与接收RLSP PDU的间隔,而是只需尽可能快地通过RLSP响应PDU作出响应。然而,RLSP PDU的接收和RLSP响应PDU的接收是驱动如图2所示的RLSP状态机200的事件,并且将在下文进一步描述。
这样,为监控链路组112a内的链路(例如),这两个已连接装置104a和106a(例如)中的至少一个装置106a(例如)必须生成RLSPPDU。正在主动生成RLSP PDU的符合RLSP的装置可称为“主动RLSP装置”,而确实只对RLSP PDU作出响应的符合RLSP的装置称为“被动RLSP装置”。如果装置106a(例如)是主动的,并且装置104a是被动的,则被动RLSP装置104a除实施必需的响应逻辑外,还需要实施逻辑以监控已接收RLSP PDU的间隔,以便检测112a的各条链路或远程装置106a的状态中的协议状态更改。此外,主动RLSP装置106a需要发送RLSP PDU并等待从被动RLSP装置104a接收RLSP响应PDU以检测112a的各条链路或远程装置104a状态中的协议状态更改。这种情况下,其中,这两个装置104a和106a(例如)中只有一个装置106a(例如)在主动生成RLSP PDU,主动装置106a是唯一能够监控112a的各条链路的两个方向的装置。被动装置104a只可通过监控RLSP PDU接收的间隔而监控112a的各条链路的其接收方向。
或者,可能的是,通过具有两个均监控112a(例如)的链路的两个方向的主动RLSP装置104a和106a(例如)而监控112a的链路。这种情况下,如果未在112a的链路的一个方向或两个方向上返回响应PDU,则链路有故障。各个主动装置104a和106a可使用不同的间隔监控112a的链路。
在优选实施例中,RLSP PDU和RLSP响应PDU均实施为第2层以太网协议数据单元。此外,RLSP PDU和RLSP响应PDU均使用目的地址字段中的专用多播MAC地址作为标识符。此布置支持一种简单、像标准的工具,该工具可由RLSP装置的MAC实体用于从112a、112b、...、112n和113a、113b、...、113n的链路上的其它流中识别和过滤出RLSP PDU和RLSP响应PDU。例如,NIC/MAC装置、交换机芯片等大多数能够经管理接口将这些多播帧与其它帧流分隔,并将它们直接分发到处理单元。处理单元可以为在硬件或软件中运行RLSP及其相关联监控的中央处理单元(CPU)或任何其它装置。
正如可看到的,RLSP及其相关联PDU监控由本发明用于确定在符合RLSP的装置104a、104b、...、104n、106a和106b之间的一条或多条链路112a、112b、...、112n和113a、113b、...、113n的当前状态。为有助于RLSP PDU和RLSP响应PDU的此监控,可使用如图2中所示定义的两种状态的状态机200。在优选实施例中,各个符合RLSP的装置104a、104b、...、104n、106a和106b为与其连接的112a、112b、...、112n和113a、113b、...、113n的各条单独的链路实施一个状态机200。在操作中,在正好在112a(例如)的链路上主动生成RLSP PDU的装置106a(例如)中实施的状态机200的实例由从远程装置104a(例如)接收RLSP响应PDU驱动。此外,在被动装置104a(例如)中实施的状态机200的实例由在112a(例如)的链路上从主动装置106a(例如)接收发送的RLSP PDU驱动。
图2所示的状态机200还设计有内置迟滞以在出现偶尔帧故障、与设备有关的时钟偏差或可跨112a、112b、...、112n和113a、113b、...、113n的受监控链路注意到的其它潜在短期扰动的情况下满足改进的状态稳健性。状态机200中所示的常数N和M是可调整数。例如,这些常数的合理默认设置可能为N=M=3。
为实现RLSP监控的稳健的确定性行为,建议只要将RLSP PDU和RLSP响应PDU注射到链路上便以“足够高”的优先级处理RLSPPDU和RLSP响应PDU。对于大多数实施,RLSP PDU和RLSP响应PDU可被授予最高优先级,以便它们可实际上忽略所有排队或缓冲或与非有利的调度有关的处理。正如后面将说明的,基于消耗不超过GE链路(1Gbit/s以太网链路)的大约0.01%带宽的RLSP而实现运营商级弹性是可能的。
正如还将在下面部分中详细说明的,应通过某一全面LAN管理(OLM)功能116监视RLSP状态机200。要加速此时间严格的监视,所有RLSP装置104a、104b、...、104n、106a和106b可实施为自发地向OLM功能116报告任一状态更改,OLM功能在图1中示为位于RSCS 108中。
RLSP分发策略
正如链路聚合标准所述,包括一组单独的链路的LAG 114a(例如)的聚合器(例如,符合RLSP的装置)可根据称为分发策略的一组规则将帧分发到那些链路上。只要不在每个单独的流内导致帧重新排序,此分发策略可自由选择。另外,链路聚合标准规定,如果包括在多链路LAG 114a(例如)中的112a(例如)的链路出现故障,则原来要发送到112a的故障链路的流需要通过该LAG 114a的112a(如果适用)和113a的剩余链路重新分发。如上所述,确定链路状态的传统机制是标准PHY状态指示link_staus。然而,对于一些PHY,此指示绝对是太慢(数秒)。因此,为实现具有运营商级性能的确定性故障修复机制,本发明利用来自状态机200的RLSP状态来控制分发策略。
本发明的RLSP分发策略分别对包括在LAG 114a、114b、...、114n中的112a、112b、...、112n和113a、113b、...、113n的每条链路的RLSP状态起作用。例如,RLSP分发策略可具有负载均衡功能,该功能对状态机200中的RLSP状态起作用以在LAG 114a、114b、...、114n中处于可用状态的链路之间适当地分发帧。另一方面,具有此负载均衡功能的RLSP分发策略可防止将除MAC协议/控制帧子集(例如,链路聚合控制协议(LACP)和RLSP相关PDU)外的帧分发到LAG114a、114b、...、114n中处于隔离状态的链路。
RLSP分发策略还可适用于处理RLSP状态更改而无另外的延迟。此外,RLSP状态机200支持的迟滞机制可用于提供保护,防止状态之间的伪过渡,否则这会导致不稳定的行为。应注意的是,上述标准链路聚合策略的限制会仍适用于RLSP分发策略。
隔离控制-全面LAN管理
如上所述,通过使用RLSP的概念,可能的是,在如图1所示构建的以太网网络100中实现运营商级弹性特征。还应理解的是,通过利用一些特定的配置设置,可能的是,以太网交换机102控制和管理单点故障情况,并为冗余交换矩阵106a和106b的无扰动隔离提供全面支持。此功能是能够实现各种维修和升级操作所必需的。
此外,通过只配置交换矩阵106a和106b主动生成RLSP PDU,交换矩阵106a和106b可部分控制应用刀片104a、104b、...、104n中的RLSP状态机200。例如,如果交换矩阵106a避免在112a的某一链路上生成RLSP PDU,则在链路末端连接到应用刀片104a的RLSP状态机200随后会更改为隔离状态。因此,应用刀片104a会禁止将任何有效负荷业务分发到112a的该链路,直至交换矩阵106a在该链路上重新开始RLSP PDU生成,并且应用刀片104a中对应的RLSP状态机200切换回可用状态。
遵循相同的逻辑,要是112a(例如)的链路中的实际故障禁止RLSPPDU到达应用刀片104a(例如),或者如果在交换矩阵106a(例如)的生成逻辑出现故障,则应用刀片104a中的相关RLSP状态机200会检测到故障并阻止将帧分发“到空白中”。这样,存在一种机制,在该机制中,各个应用刀片104a(例如)可自行确定将其帧向哪个交换矩阵106a或106b传送。交换矩阵106a(例如)和/或112a、112b、...、112n(例如)的所有链路的故障以相同的方式检测,好像交换矩阵106a(例如)有意或无意停止生成RLSP PDU。
另外,如果交换矩阵106a(例如)同时在112a、112b、...、112n的所有其链路上停止发送RLSP PDU,则所有已连接应用刀片104a、104b、...、104n恢复为只在113a、113b、...、113n的链路上朝向其它可用交换矩阵106b分发帧。类似于RLSP状态机200,以太网交换机102在这种情况下可建模为具有一个可用交换矩阵106b和一个隔离交换矩阵106a。
为控制这些分发的隔离机制,全面LAN管理(OLM)功能116可用于协调交换矩阵106a和106b上的操作。具体而言,OLM功能116可基于像操作员交互(例如,作为硬件替换准备而命令的隔离)或在LAN 100中检测到故障等事件,触发交换矩阵106a和106b的隔离和/或去隔离。OLM功能116在图1中示为实施为RSCS 108的一部分,但在其它替代解决方案中也是可行的。
如上所述,交换矩阵106a和106b可持续监控LAN 100的所有内部段,故障检测时间与RLSP的匹配。因此,在任一RLSP状态机200中的任一过渡及向OLM功能116报告的任一交换机内部故障可用于分析交换LAN 100的状态。由于OLM功能116需要了解LAN系统100的整体拓扑,因此,此任务的复杂性可较大或较小,这较大程度上取决于以太网交换机102的内部结构。
现在,如果OLM功能116注意到在LAN 100中某处的故障,则启动快速进程以分析故障的可能原因。OLM功能116甚至可断定交换矩阵106a或106b之一需要隔离。如果情况如此,则OLM功能116随后通过RLSP命令组成该交换矩阵106a(例如)的装置自行隔离,并且如已经所述的,交换矩阵106a很快变为隔离。
由于不同的原因,即使在隔离的情况中,可能也不希望在符合RLSP的装置104a、104b、...、104n、106a和106b中完全关闭RLSP,这是因为缺少RLSP PDU交互会失去某一基本的监控能力。为确保在装置104a、104b、...、104n、106a和106b中不完全关闭RLSP,需要实施一种稍微改进的、仍可支持上述所有特性的解决方案。一个解决方案是让隔离交换矩阵106a(例如)将RLSP PDU生成的强度降低至少90%。这种情况下,应用刀片104a、104b、...、104n仍要响应PDU,但其分别与112a、112b、...、112n(例如)的其链路相关联的状态机200牢固地“锁定”在隔离状态。随后,隔离交换矩阵106a可针对应用的“低”间隔验证RLSP响应PDU,因此,即使RLSP状态更改检测更慢,112a、112b、...、112n的链路状态也仍可被监视。
弹性性能
符合RLSP的装置104a、104b、...、104n、106a和106b中近似的RLSP故障检测时间可表示为:
TPDU≤*M tRLSP≤TPDU*(M+1),
其中,tRLSP是故障检测时间,TPDU是RLSP PDU生成期,并且如图2所示,M是状态机变量M。
假设这样一种情况,故障最初由应用刀片104a、104b、...、104n的子集检测,则OLM功能116从检测到故障的应用刀片104a、104b、...、104n接收状态更改指示并启动故障分析进程。在tProcms的处理时间后,OLM功能116已分析情况并命令交换矩阵之一106a(例如)被隔离,这触发了剩余的应用刀片104a、104b、...、104n故障修复到非隔离交换矩阵106b(例如)。执行此完整方案的时间可表示为:
TTotal≤2TPDU*(M+1)+tProc
例如,假设预算是要求在从引入故障的时刻开始的100ms内隔离,10ms的RLSP期和M=3使OLM功能116进行隔离故障分析和管理的时间为20ms。
应注意的是,在同一LAN系统100中支持对隔离和故障修复性能有不同要求的应用刀片104a、104b、...、104n或应用刀片组也是可行的。这种有差别的性能可通过让交换矩阵106a和106b以匹配每个单独的应用刀片或应用刀片组104a、104b、...、104n的速率生成RLSP PDU而实现。
如上面简要提及的,RLSP PDU和RLSP响应PDU具有与PDU的生成强度和大小成比例的带宽消耗。例如,假设每个PDU大小为128字节,并具有10ms的时期。对于每个主动生成RLSP装置106a(例如),此配置会导致带宽消耗为[(帧间间隙+前置码+PDU长度)*(每字节8比特)*(每秒PDU数量)]=[(12+8+128)*8*100)]=每秒118400比特。此外,此带宽消耗大约为每秒10Mbit以太网链路的1.2%、FE链路的0.12%、GE的0.012%及10GE链路的0.0012%。
从上述内容中,本领域的技术人员可易于理解,本发明包括一种在像图1所示的网络100中提供弹性以太网连接的方法300。图3中示出了方法300的基本步骤。从步骤302开始,RLSP用于检测应用刀片104a、104b、...、104n与交换矩阵106a和106b之间112a、112b、...、112n和113a、113b、...、113n的任一冗余链路中的故障。随后,在步骤304中,RLSP分发策略用于协调和控制应用刀片104a、104b、...、104n与交换矩阵106a和106b之间的隔离措施。有关可如何实现这方面的所有内容的细节已经描述。
下述内容是本发明的一些特性、优点和用途:
·本发明的一个优点是它支持以可配置且与PHY无关的方式实现符合运营商级要求的快速故障修复时间。这是因为RLSP可配置为对几乎任一时标起作用,因此,可不依赖使用的第1层(PHY)技术操作它。
·通过使用RLSP及其状态机200,本发明可容易地在像交换机和终端站等多种应用刀片中实施。
·本发明的另一优点源于以下情况:它与符合当前标准的系统(虽然这些系统无法提供运营商级性能)向后兼容,并且它将本发明介绍的特殊机制的将来标准化考虑在内。
·虽然本发明已描述为在通过高速背板互连的局部连网中使用,但本发明中并无禁止其也在其它连网上下文中使用的内容。
·应理解的是,在本发明中使用的冗余实体可以为彼此的确切镜像,这具有以下优点:
ο提供简单的确定性故障修复行为,这是因为配对中的冗余实体隐含知道彼此的基本配置。
ο便于配置、备份和维护,这是因为在容错中央存储单元和/或分布式存储单元中可存在一个主配置文件。
ο在维护操作期间提供直接的隔离方案。
·本发明的以太网交换机102可使用每个应用刀片不止一个LAG,并且每个LAG可包括2、4、6、8或更多条链路。此外,在本发明中,每条链路通过RLSP单独监控,并且所有多链路LAG服从RLSP分发策略。
·应理解的是,与上述弹性网络100相关联的许多组件和细节在本领域中已为人熟知。因此,为简明起见,上面提供的说明省略了对理解本发明不是必需的那些熟知组件和细节。
虽然附图中显示且在上面的详细说明中描述了本发明的一个实施例,但应理解,本发明并不限于公开的实施例,而是在不脱离随附权利要求书陈述和限定的本发明精神的情况下,能够进行多种重新布置、修改和替代。

Claims (18)

1.一种交换机,包括:
弹性交换控制系统;
第一符合快速链路监控协议RLSP的交换矩阵;
第二符合快速链路监控协议RLSP的交换矩阵;
所述第一符合RLSP的交换矩阵经由符合RLSP的链路连接到符合RLSP的应用刀片并且所述第二符合RLSP的交换矩阵经由符合RLSP的链路连接到所述符合RLSP的应用刀片;
所述第一符合RLSP的交换矩阵与连接到该第一符合RLSP的交换矩阵的相应的符合RLSP的应用刀片交换RLSP协议数据单元PDU和RLSP响应PDU,以验证连接所述第一符合RLSP的交换矩阵与所述相应的符合RLSP的应用刀片的相应链路的状态;以及
所述第二符合RLSP的交换矩阵与连接到该第二符合RLSP的交换矩阵的相应的符合RLSP的应用刀片交换RLSP协议数据单元PDU和RLSP响应PDU,以验证连接所述第二符合RLSP的交换矩阵与所述相应的符合RLSP的应用刀片的相应链路的状态。
2.如权利要求1所述的交换机,其中,所述RLSP PDU和所述RLSP响应PDU分别是第二层以太网PDU和第二层以太网响应PDU。
3.如权利要求1所述的交换机,其中,所述弹性交换控制系统控制在所述第一符合RLSP的交换矩阵和所述第二符合RLSP的交换矩阵中的RLSP PDU生成和/或RLSP响应PDU传输。
4.如权利要求1所述的交换机,其中,所述弹性交换控制系统使用全面管理功能来协调在所述第一符合RLSP的交换矩阵和所述第二符合RLSP的交换矩阵的操作。
5.如权利要求1所述的交换机,其中,所述弹性交换控制系统确保所述第一符合RLSP的交换矩阵和所述第二符合RLSP的交换矩阵作为单个桥接器操作。
6.如权利要求1所述的交换机,其中,所述符合RLSP的链路以逻辑聚合方式捆绑在一起。
7.如权利要求1所述的交换机,其中,当所述符合RLSP的链路处于可用状态时,在这些链路之间适当地分发帧,而当所述符合RLSP的链路中的任一个处于隔离状态时,除MAC协议/控制帧子集外的帧被禁止分发到所述处于隔离状态的链路。
8.一种弹性网络,包括:
多个符合快速链路监控协议RLSP的应用刀片;以及
交换机,包括:
弹性交换控制系统;
第一符合RLSP的交换矩阵;
第二符合RLSP的交换矩阵;
所述第一符合RLSP的交换矩阵经由符合RLSP的链路连接到符合RLSP的应用刀片并且所述第二符合RLSP的交换矩阵经由符合RLSP的链路连接到所述符合RLSP的应用刀片;
所述第一符合RLSP的交换矩阵与连接到该第一符合RLSP的交换矩阵的相应的符合RLSP的应用刀片中的每一个为连接所述第一符合RLSP的交换矩阵和所述相应的符合RLSP的应用刀片的相应的符合RLSP的链路实施一个状态机;
所述第二符合RLSP的交换矩阵与连接到该第二符合RLSP的交换矩阵的相应的符合RLSP的应用刀片中的每一个为连接所述第二符合RLSP的交换矩阵和所述相应的符合RLSP的应用刀片的相应的符合RLSP的链路实施一个状态机;
所述第一符合RLSP的交换矩阵和连接到该第一符合RLSP的交换矩阵的相应的符合RLSP的应用刀片交换RLSP协议数据单元PDU和RLSP响应PDU,以验证用于连接所述第一符合RLSP的交换矩阵和所述相应的符合RLSP的应用刀片的相应的符合RLSP的链路的状态;以及
所述第二符合RLSP的交换矩阵和连接到该第二符合RLSP的交换矩阵的相应的符合RLSP的应用刀片交换RLSP协议数据单元PDU和RLSP响应PDU,以验证用于连接所述第二符合RLSP的交换矩阵和所述相应的符合RLSP的应用刀片的相应的符合RLSP的链路的状态。
9.如权利要求8所述的弹性网络,其中,所述RLSP PDU和所述RLSP响应PDU分别是第二层以太网PDU和第二层以太网响应PDU。
10.如权利要求8所述的弹性网络,其中,所述弹性交换控制系统控制在所述第一符合RLSP的交换矩阵和所述第二符合RLSP的交换矩阵中的RLSP PDU生成和/或RLSP响应PDU传输,由此部分控制在所述符合RLSP的应用刀片中的状态机。
11.如权利要求8所述的弹性网络,其中,所述弹性交换控制系统使用全面管理功能来协调在所述第一符合RLSP的交换矩阵和所述第二符合RLSP的交换矩阵的操作。
12.如权利要求8所述的弹性网络,其中,所述弹性交换控制系统确保所述第一符合RLSP的交换矩阵和所述第二符合RLSP的交换矩阵作为单个桥接器操作。
13.如权利要求8所述的弹性网络,其中,所述符合RLSP的链路以逻辑聚合方式捆绑在一起。
14.如权利要求8所述的弹性网络,其中,所述符合RLSP的应用刀片为交换机或终端站。
15.如权利要求8所述的弹性网络,其中,当所述符合RLSP的链路处于可用状态时,在这些链路之间适当地分发帧,而当所述符合RLSP的链路中的任一个处于隔离状态时,除MAC协议/控制帧子集外的帧被禁止分发到所述处于隔离状态的链路。
16.一种在网络中提供弹性连接的方法,所述网络包括:
多个符合快速链路监控协议RLSP的应用刀片;以及
交换机,包括:
弹性交换控制系统;
第一符合RLSP的交换矩阵;
第二符合RLSP的交换矩阵;
所述第一交换矩阵和所述第二交换矩阵经由冗余的符合RLSP的链路连接到所述应用刀片中的每一个;
所述第一交换矩阵与连接到该第一交换矩阵的相应的应用刀片中的每一个为连接所述第一交换矩阵和所述相应的应用刀片的相应的链路实施一个状态机;以及
所述第二交换矩阵与连接到该第二矩阵的相应的应用刀片中的每一个为连接所述第二交换矩阵和所述相应的应用刀片的相应的链路实施一个状态机,所述方法包括以下步骤:
在所述第一交换矩阵和连接到该第一交换矩阵的每个应用刀片之间交换快速链路监控协议RLSP协议数据单元PDU和RLSP响应PDU,以验证用于连接所述第一交换矩阵和每个应用刀片的每个冗余链路的状态;以及
在所述第二交换矩阵和连接到该第二交换矩阵的每个应用刀片之间交换快速链路监控协议RLSP协议数据单元PDU和RLSP响应PDU,以验证用于连接所述第二交换矩阵和每个应用刀片的每个冗余链路的状态。
17.如权利要求16所述的方法,还包括以下步骤:
当所述链路处于可用状态时,在这些链路之间适当地分发帧,而当所述链路中的任一个处于隔离状态时,防止将除MAC协议/控制帧子集外的帧分发到所述处于隔离状态的链路。
18.如权利要求16所述的方法,还包括以下步骤:
控制在所述第一交换矩阵和所述第二交换矩阵中的RLSP PDU生成和/或RLSP响应PDU传输以部分控制在所述应用刀片中的状态机。
CN2004800444967A 2004-09-30 2004-09-30 交换以太网局域网(lan)的运营商级弹性解决方案 Expired - Fee Related CN101088257B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/IB2004/003192 WO2006035262A1 (en) 2004-09-30 2004-09-30 Carrier class resilience solution for switched ethernet local area networks (lans)

Publications (2)

Publication Number Publication Date
CN101088257A CN101088257A (zh) 2007-12-12
CN101088257B true CN101088257B (zh) 2012-09-05

Family

ID=34958805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800444967A Expired - Fee Related CN101088257B (zh) 2004-09-30 2004-09-30 交换以太网局域网(lan)的运营商级弹性解决方案

Country Status (5)

Country Link
US (1) US7782760B2 (zh)
EP (1) EP1803259B1 (zh)
CN (1) CN101088257B (zh)
HK (1) HK1115695A1 (zh)
WO (1) WO2006035262A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008104108A (ja) * 2006-10-20 2008-05-01 Fujitsu Ltd 中継装置および障害監視方法
EP1993253A1 (en) * 2007-05-14 2008-11-19 Nokia Siemens Networks Oy Method and device for transmitting information via a link aggregation and system comprising such device
US7916669B2 (en) * 2008-12-31 2011-03-29 Alcatel Lucent Method and system for STP-aware subscriber management
US8098572B2 (en) * 2009-02-03 2012-01-17 Google Inc. Interface monitoring for link aggregation
US8401026B2 (en) * 2009-05-18 2013-03-19 Cisco Technology, Inc. Achieving about an equal number of active links across chassis in a virtual port-channel environment
US8184648B2 (en) * 2009-06-18 2012-05-22 Rockstar Bidco, LP Method and apparatus for implementing control of multiple physically dual homed devices
CN101640622B (zh) * 2009-09-07 2012-05-23 中兴通讯股份有限公司 一种以太环网保护方法及传输节点
US8787155B2 (en) 2011-06-01 2014-07-22 International Business Machines Corporation Sideband error signaling
US8560736B2 (en) 2011-06-01 2013-10-15 International Business Machines Corporation Facilitating processing of out-of-order data transfers
US8880956B2 (en) 2011-06-01 2014-11-04 International Business Machines Corporation Facilitating processing in a communications environment using stop signaling
US8495265B2 (en) 2011-06-01 2013-07-23 International Business Machines Corporation Avoiding non-posted request deadlocks in devices by holding the sending of requests
US8903966B2 (en) 2011-06-01 2014-12-02 International Business Machines Corporation Re-programming programmable hardware devices without system downtime
US8762546B2 (en) 2011-12-13 2014-06-24 Motorola Mobility Llc Method and apparatus for adaptive network heartbeat message for TCP channel
CN104796276B (zh) * 2014-01-21 2018-11-23 中国移动通信集团河南有限公司 一种链路切换方法和系统
CN105827426B (zh) * 2015-01-08 2019-03-15 中国移动通信集团河南有限公司 一种链路故障处理方法、装置及系统
CN107222380A (zh) * 2017-06-08 2017-09-29 中国电子信息产业集团有限公司第六研究所 支持链路冗余的双线EtherCAT协议转换方法及装置
US11706083B1 (en) * 2022-02-10 2023-07-18 Opnet Technologies Co., Ltd. Telco-grad server/ethernet network switch

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5909427A (en) * 1995-07-19 1999-06-01 Fujitsu Network Communications, Inc. Redundant switch system and method of operation
EP1320219A2 (en) * 2001-12-17 2003-06-18 Alcatel Canada Inc. System and method for transmission of operations, administration and maintenance packets between ATM and switching networks upon failures
US6614756B1 (en) * 1999-08-20 2003-09-02 3Com Corporation Method of detecting and recovering from signaling congestion in an asynchronous transfer mode network
CN1470117A (zh) * 2000-10-16 2004-01-21 ����ɭ�绰�ɷ����޹�˾ 交换平面的同步变换

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6292463B1 (en) * 1998-07-06 2001-09-18 Alcatel Canada Inc. Method and apparatus for recovering from a signalling failure in a switched connection data transmission network
US7085237B1 (en) * 2000-03-31 2006-08-01 Alcatel Method and apparatus for routing alarms in a signaling server
US7173934B2 (en) 2001-09-10 2007-02-06 Nortel Networks Limited System, device, and method for improving communication network reliability using trunk splitting
US6910149B2 (en) 2001-09-24 2005-06-21 Intel Corporation Multi-device link aggregation
CA2357913A1 (en) * 2001-09-27 2003-03-27 Alcatel Canada Inc. System for providing fabric activity switch control in a communications system
US7406038B1 (en) * 2002-04-05 2008-07-29 Ciphermax, Incorporated System and method for expansion of computer network switching system without disruption thereof
US7835265B2 (en) * 2002-10-31 2010-11-16 Conexant Systems, Inc. High availability Ethernet backplane architecture
US7260066B2 (en) * 2002-10-31 2007-08-21 Conexant Systems, Inc. Apparatus for link failure detection on high availability Ethernet backplane
US7818615B2 (en) * 2004-09-16 2010-10-19 Invensys Systems, Inc. Runtime failure management of redundantly deployed hosts of a supervisory process control data acquisition facility
US7796501B2 (en) * 2007-12-12 2010-09-14 Ciena Corporation System and methods for redundant switch fabric and switch controller

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5909427A (en) * 1995-07-19 1999-06-01 Fujitsu Network Communications, Inc. Redundant switch system and method of operation
US6614756B1 (en) * 1999-08-20 2003-09-02 3Com Corporation Method of detecting and recovering from signaling congestion in an asynchronous transfer mode network
CN1470117A (zh) * 2000-10-16 2004-01-21 ����ɭ�绰�ɷ����޹�˾ 交换平面的同步变换
EP1320219A2 (en) * 2001-12-17 2003-06-18 Alcatel Canada Inc. System and method for transmission of operations, administration and maintenance packets between ATM and switching networks upon failures

Also Published As

Publication number Publication date
CN101088257A (zh) 2007-12-12
EP1803259A1 (en) 2007-07-04
US20080304477A1 (en) 2008-12-11
US7782760B2 (en) 2010-08-24
EP1803259B1 (en) 2017-09-13
HK1115695A1 (en) 2008-12-05
WO2006035262A1 (en) 2006-04-06

Similar Documents

Publication Publication Date Title
CN101088257B (zh) 交换以太网局域网(lan)的运营商级弹性解决方案
EP1677468B1 (en) Retention of a stack address during primary master failover
EP2074789B1 (en) Technique for automatically configuring a communication network element
JP4257509B2 (ja) ネットワークシステム、ノード装置、冗長構築方法、および冗長構築プログラム
EP1675356B1 (en) Notification of failures in a trunk network
WO2007041909A1 (fr) Méthode et système de gestion reposant sur une interface intelligente de gestion de plate-forme
EP2503737A2 (en) Systems and methods for scaling performance of ethernet ring protection protocol
WO2007092132A2 (en) System and method for detecting and recovering from virtual switch link failures
CN105721546A (zh) 一种基于工业物联通讯的多数据集成服务平台
WO2012066625A1 (ja) 通信システムの制御方法、通信システム、通信装置
US20120328289A1 (en) Devices, Systems and Methods for Run-Time Reassignment of a PHY to MAC Devices Interconnect
CN102724030A (zh) 一种高可靠性的堆叠系统
US7420922B2 (en) Ring network with variable rate
US20090274068A1 (en) Network Having Redundancy Properties, Ethernet Switch for Such a Network and Method for Configuring Such a Network
US20110208844A1 (en) Cluster system, method and device for expanding cluster system
CN106533771A (zh) 一种网络设备以及控制信息传输方法
CN1512675A (zh) 通讯通道主备倒换方法
EP1298866B1 (en) Method and apparatus for optimization of redundant link usage
CN1996880A (zh) 自适应管理网络设备的方法和网络设备
US11646909B2 (en) Method for data transmission in a redundantly operable communications network and coupling communication device
Cisco Managing the Catalyst 3920
Cisco Cisco ONS 15303 Commands
EP4002779A1 (en) Method and apparatus for sharing information in redundant network, and computer storage medium
Cisco Cisco ONS 15303 Commands
CN101094238A (zh) 多机框集群系统与机框

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1115695

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1115695

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120905

Termination date: 20190930