CN105897459A - 多级交换机结构故障检测和处理 - Google Patents

多级交换机结构故障检测和处理 Download PDF

Info

Publication number
CN105897459A
CN105897459A CN201610087847.7A CN201610087847A CN105897459A CN 105897459 A CN105897459 A CN 105897459A CN 201610087847 A CN201610087847 A CN 201610087847A CN 105897459 A CN105897459 A CN 105897459A
Authority
CN
China
Prior art keywords
structural
endpoint
switch
fault
structural plan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610087847.7A
Other languages
English (en)
Other versions
CN105897459B (zh
Inventor
A·亚达夫
M·戈拉施
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Juniper Networks Inc
Peribit Networks Inc
Original Assignee
Peribit Networks Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peribit Networks Inc filed Critical Peribit Networks Inc
Publication of CN105897459A publication Critical patent/CN105897459A/zh
Application granted granted Critical
Publication of CN105897459B publication Critical patent/CN105897459B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • H04L49/101Packet switching elements characterised by the switching fabric construction using crossbar or matrix
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules
    • H04L49/1515Non-blocking multistage, e.g. Clos
    • H04L49/1523Parallel switch fabric planes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/555Error detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/557Error correction, e.g. fault recovery or fault tolerance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/04Selecting arrangements for multiplex systems for time-division multiplexing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/40Constructional details, e.g. power supply, mechanical construction or backplane

Abstract

本公开的实施例涉及多级交换机结构故障检测和处理。在一些示例中,交换系统包括多个结构端点和多级交换机结构,多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多个级。多个结构端点中的结构端点被配置为在多个结构平面中的第一结构平面内向多个级中的第一级的交换机发送去往结构端点的自查验消息。结构端点被配置为响应于确定结构端点在预定时间之后尚未接收到自查验消息,发送针对第一结构平面的连接性故障的指示。

Description

多级交换机结构故障检测和处理
技术领域
本公开内容涉及计算机网络,并且更特别地涉及在计算机网络内对传送分组。
背景技术
计算机网络是能够交换数据并且共享资源的互连的计算设备的结合。在基于分组的网络(例如以太网)中,计算设备通过将数据划分成被称为分组的可变长度块来传送数据,可变长度块跨网络单个地从源设备被路由至目的地设备。目的地设备从分组中提取数据并将数据汇集成其原始形式。
被称为路由器的特定设备维护表示网络的拓扑的路由信息。路由器交换路由信息从而维持通过网络的可用路由的准确表示。“路由”通常能够被定义为在网络上的两个位置之间的路径。在接收到传入数据分组之后,路由器检查分组内的信息(常常被称为“键”)以根据路由信息选择要向其转发分组的适当的下一跳。
在因特网内存在各种路由器。例如,网络服务提供商(NSP)维护“边缘路由器”以向客户提供因特网访问和其他服务。NSP可以提供的服务的示例包括IP语音电话(VoIP)、异步传输模式(ATM)访问或帧中继通信、因特网协议(IP)数据服务以及多媒体服务(例如视频流传输)。NSP的边缘路由器常常将网络流量传送到高速“核心路由器”,其通常可以被视为形成因特网的骨干。这些核心路由器常常包括比边缘路由器多得多的处理资源,并且被设计为处理大容量的网络流量。
在一些示例中,核心路由器或另外的路由器或交换设备可以采用分布式多级交换机结构体系,其中网络分组遍历位于路由器的分布式转发部件中的交换结构的多个级,以从交换结构的入口点行进到交换结构的出口点。作为一个示例,交换结构可以被实施为单个多级Clos交换结构,其跨交换结构的各级进行中继通信。典型的多级Clos交换结构具有互连以形成多个级的多个交换机。在典型的布置中,交换结构包括入口(或“第一”)级、一个或多个中间级以及出口(或“末”)级,其中每级具有一个或多个交换机(例如,纵横式交换机-常常更简单地被称为“纵横机(crossbar)”)。此外,交换结构可以被实施为使得交换机被布置为多个平行结构平面,每个平行结构平面提供通过多级从入口端口到出口端口的独立转发,其中的一个或多个可以被当作空闲的结构平面。换言之,多个平行结构平面中的每个平行结构平面可以被视为多级Clos交换结构的独立部分,其中每个平面提供交换冗余。
许多核心路由器是“多机箱式”路由器,其中多个路由器节点被物理耦合并被配置为操作成单个路由节点。多机箱式路由器的一个示例包括多线路卡机箱(LCC),其中每个LCC包括用于发送和接收分组的一个或多个接口卡(IFC),LCC耦合到提供对LCC的自上而下管理的中央交换控制机箱(SCC)。为了使网络上的路由器对等,多机箱式路由器表现为单个路由节点。因为多机箱式路由器组合了多个路由设备的资源,所以多机箱式路由器具有比独立式路由器更高的带宽能力。例如,使用多机箱式路由器能够通过将路由功能合并到更少的路由器上来简化并改进服务提供商网络上的路由。
发明内容
总体上,描述了一种用于对采用多级交换机结构(fabric)的设备或网络中的故障的可扩展的检测和通知的技术。该技术可以特别适用于具有将全部由分布式控制平面管理的数百结构端点进行连接的多个结构平面的大规模且复杂的交换设备或网络内,但是该技术还保持可适用于小规模设备和网络中。在一些示例中,结构端点可以通过将自查验数据单元发布到交换结构来验证与交换结构的相应的每平面的结构连接性,交换结构通过中间级将结构消息交换回到发布的结构端点。结构端点没有接收到指示针对结构端点的相对于结构平面的连接性故障的发布的自查验数据单元。响应于检测到连接性故障,结构端点利用交换结构在数据路径中将结构端点与交换结构之间的连接性故障的指示广播到其他结构端点。不是将连接性故障的指示单播到其他结构端点中的每个结构端点,而是已经检测到连接性故障的结构端点可以代替地依靠针对工作的结构平面中的一个结构平面的第一级,以将指示中继到末级交换机和连接到其的其他结构端点。接收到指示的结构端点响应地避免使用发生故障的结构平面将数据发送到具有连接性故障的结构端点。
在一些示例中,实施针对多级交换机结构中的每级的纵横式交换机的结构端点以及结构芯片可以检测将级纵横机彼此耦合并耦合到结构端点的结构链路的结构链路和可到达性故障。响应于检测到针对结构平面的链路故障,结构平面的结构端点和结构芯片可以在数据路径中将链路故障的指示中继到实施针对具有链路故障的结构链路的对应第一级纵横式交换机的对应结构芯片。结构芯片将该指示广播到实施针对具有链路故障的结构平面的末级的纵横式交换机的结构芯片中的全部结构芯片。末级结构芯片可以转而通知结构端点,结构端点响应地避免结构平面中具有链路故障的至少一部分。
以上描述的可扩展的检测和故障通知技术可以具有一个或多个优点。例如,通过结构端点在数据路径中(而非通过控制路径)执行分布式故障检测和发信号通知可以得到更快的故障检测。此外,将处理针对故障通知的工作负荷的数据路径分布在实施结构级的结构芯片之中,这可以以使得能够减少流量黑洞直到结构控制器能够对交换结构进行重新路由的方式将故障通知传播扩展到结构端点。通过结构芯片到结构端点的分布式故障通知可以额外地使得能够使用交换结构内的、与结构平面的数目和结构端点的数目无关的多个故障通知消息进行故障通知,其可以支持更大的规模,并且减少结构端点上的在生成的和接收到的故障通知的数目两个方面上的工作负荷。
在一些示例中,一种验证与多级交换机结构的结构连接性的方法,多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多个级,该方法包括:由多个结构端点中的结构端点将自查验(self-ping)消息发送到多个结构平面中的第一结构平面的第一级交换机,自查验消息去往发送自查验消息的端点。该方法还包括由结构端点响应于确定结构端点在预定时间之后尚未接收到自查验消息而发送针对第一结构平面的连接性故障的指示。
在一些示例中,一种发信号通知针对多级交换机结构的结构故障的方法,多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多个级,该方法包括:由多个结构平面中的第一结构平面的第一级交换机接收针对多个结构平面中的第二结构平面的结构故障的指示,第一结构平面不同于第二结构平面。该方法还包括由第一级交换机将包括结构故障的指示的第一故障通知数据单元发送到第一结构平面的第一末级交换机。该方法还包括由第一级交换机将包括结构故障的指示的第二故障通知数据单元发送到第一结构平面的第二末级交换机。
在一些示例中,一种交换系统包括多个结构端点和多级交换机结构,多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多个级。多个结构端点中的结构端点被配置为在多个结构平面中的第一结构平面内将去往结构端点的自查验消息发送到多个级中的第一级的交换机。结构端点被配置为响应于确定结构端点在预定时间之后尚未接收到自查验消息而发送针对第一结构平面的连接性故障的指示。
在一些示例中,一种交换系统包括多个结构端点和多级交换机结构,多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多个级。多个结构平面中的第一结构平面的第一级交换机被配置为接收针对多个结构平面中的第二结构平面的结构故障的指示,第一结构平面不同于第二结构平面。第一级交换机被配置为将包括结构故障的指示的第一故障通知数据单元发送到第一结构平面的第一末级交换机。第一级交换机被配置为将包括结构故障的指示的第二故障通知数据单元发送到第一结构平面的第二末级交换机。
在一些示例中,一种计算机可读存储介质,包括用于使得多级交换机结构的至少一个可编程处理器执行以下步骤的指令,其中多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多个级:由多个结构端点中的结构端点将自查验消息发送到多个结构平面中的第一结构平面的第一级交换机,自查验消息去往发送自查验消息的端点;并且由结构端点响应于确定结构端点在预定时间之后尚未接收到自查验消息而发送针对第一结构平面的连接性故障的指示。
在一些示例中,一种计算机可读存储介质包括用于使得多级交换机结构的至少一个可编程处理器执行以下操作的指令,多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多个级:由多个结构平面中的第一结构平面的第一级交换机接收针对多个结构平面中的第二结构平面的结构故障的指示,第一结构平面不同于第二结构平面;由第一级交换机将包括结构故障的指示的第一故障通知数据单元发送到第一结构平面的第一末级交换机;并且由第一级交换机将包括结构故障的指示的第二故障通知数据单元发送到第一结构平面的第二末级交换机。
在附图和下面的描述中阐述一个或多个示例的细节。其他特征、目的和优点将从说明书和附图以及权利要求书变得显而易见。
附图说明
图1是图示了在其中服务提供商网络包括根据本公开内容中描述的技术配置的多机箱式路由器的示例网络环境的方框图。
图2是图示了根据本文中描述的技术的交换系统的示例的方框图。
图3是图示了根据本公开内容的一个方面的多机箱式路由器的方框图。
图4是图示了根据本文中描述的技术操作的三级交换网络的逻辑表示的方框图。
图5是图示了根据本文中描述的技术的在其中结构端点验证连接性的示例交换系统的方框图。
图6A至6C是描绘了根据本公开内容中描述的技术的结构故障检测和通过结构平面的对结构故障的指示的分布的方框图。
图7是图示了根据本公开内容中描述的技术的结构故障检测和通过结构平面的对结构故障的指示的分布的方框图。
图8是描绘了根据本公开内容中描述的技术的被配置为实施级交换机并执行故障检测和故障指示的分布的专用集成电路(ASIC)的方框图。
图9是图示了根据本公开内容的技术的示例数据单元式的方框图。
图10是图示了本文中描述的技术的示例可以被实施在其中的具有数据中心510的示例网络508的方框图。
图11是图示了根据本公开内容中描述的技术的针对结构端点的、用于检测关于结构平面的故障的操作的示例模式的流程图。
图12是图示了根据本公开内容中描述的技术的针对第一级交换机的、用于想结构端点通知针对结构平面的故障的操作的示例模式的流程图。
在整个附图和文本中,类似的参考标记表示类似的元件。
具体实施方式
图1是图示了在其中服务提供商网络包括根据本公开内容中描述的技术配置的多机箱式路由器的示例网络环境的方框图。为了举例的目的,参考图1的简化的网络环境2来描述本发明的原理,其中,多机箱式路由器4与边缘路由器5A和5B(“边缘路由器5”)进行通信以向客户网络8A至8C(“客户网络8”)提供对服务提供商网络6的访问。多机箱式路由器4可以与边缘路由器5交换路由信息以便维护网络环境2的拓扑的准确表示。多机箱式路由器4可以包括操作为服务提供商网络6内的单个节点的多个合作路由部件。另外,尽管参考多机箱式路由器4进行描述,但是本文中公开的技术也可适用于单个机箱式路由器,并且页可适用于在其中采用交换数据单元的多级交换机结构的其他背景。
尽管未图示,但是服务提供商网络6可以耦合到由其他提供商管理的一个或多个网络,并且可以因此形成大规模公共网络基础设施(例如,因特网)的一部分。因此,客户网络8可以被视为因特网的边缘网络。服务提供商网络6可以向客户网络8内的计算设备提供对因特网的访问,并且可以允许客户网络8内的计算设备彼此通信。在另外的示例中,服务提供商网络6可以提供因特网的核心内的网络服务。在任一情况下,服务提供商网络6可以包括除了多机箱式路由器4和边缘路由器5之外的各种网络设备(未示出),诸如附加的路由器、交换机、服务器或其他设备。
在图示的示例中,边缘路由器5A经由访问链路9A耦合到客户网络8A,并且边缘路由器5B分别经由访问链路9B和9C耦合到客户网络8B和8C。客户网络8可以是针对企业的地理上分开的站点的网络。客户网络8可以包括一个或多个计算设备(未示出),例如个人计算机、膝上型计算机、手持式计算机、工作站、服务器、交换机、打印机、客户数据中心或其他设备。图1中图示的网络环境2的配置仅仅是一个示例。服务提供商网络6可以耦合到任何数目的客户网络8。然而,为了便于描述,在图1中仅仅图示了客户网络8A至8C。除了服务提供商网络之外的许多不同类型的网络可以采用多机箱式路由器4的实例,包括客户/企业网络、传输网络、聚合或访问网络等。
多机箱式路由器4包括被物理耦合并被配置为操作为单个路由器的多个机箱(图1中未示出)。对于网络环境2的边缘路由器5,多机箱式路由器4表现为单个路由设备。例如,尽管多机箱式路由器4包括多个机箱,但是从对等路由器5的角度,多机箱式路由器4具有单个网络地址并且维持针对维持与边缘路由器5中的每个的对等路由会话的每个路由协议的单个对等路由会话。
如下面进一步详细描述的,多机箱式路由器4的多个路由节点使用将路由器内的结构端点互连的内部多级交换机结构12在多机箱式路由器4的数据平面上将分组(即网络流量)转发到路由器的网络接口卡(例如,端口接口卡)。在图1的示例中,多级交换机结构12将数据单元从网络接口卡的入口端口交换到网络接口卡的出口端口,以执行在多机箱式路由器4的路由节点之中和之内的高速分组转发。多级交换机结构12可以表示第3级Clos网络、第5级Clos网络或针对任何值n的第n级Clos网络。总体上,在入口端口处接收到的分组被划分成一个或多个固定长度单元以用于交换。然而,在一些实例中,分组可以被划分成可变长度单元以用于交换或作为相应的数据单元完整地被交换。“数据单元”或“单元”是指通过多级交换机结构12传递的最小数据块。单元包括头部分和数据部分。“单元数据”是指包含在单元的数据部分内的数据。下面参考图9来描述针对示例单元格式的附加细节。如在本说明书中所使用的,除非明确指示,“单元”可以是指由多级交换机结构交换的任何数据单元。
根据本公开内容的技术,多机箱式路由器4采用影响多级交换机结构12的故障的可扩展检测和故障通知。在一些示例中,路由器4内的结构端点可以通过将自查验数据单元(例如,由结构端点发送并被寻址到发送的结构端点的单元)发布到多机箱式路由器4的多级交换机结构12来验证与交换结构12的相应的结构连接性,其中多级交换机结构12通过中间级将自查验数据单元交换回到发布的结构端点。自查验数据单元和用于检测故障和故障通知的其他数据单元可以表示针对多机箱式路由器4的示例操作、管理和维护(OAM)设施。如果结构端点不能够验证连接性,则结构端点利用多级交换机结构来向其他结构端点通知该故障。在一些示例中,结构端点或多机箱式结构12本身可以检测将多级交换机结构12的各级彼此耦合并耦合到结构端点的结构链路的结构链路故障。响应于检测到针对结构平面的链路故障,结构端点和多级交换机结构12可以在多级交换机结构12的数据路径中对链路故障的指示进行中继和广播,以使得结构端点中的每个接收到指示。响应于接收到故障的通知,结构端点可以至少暂时避免使用多级交换机结构12中具有连接性故障或链路故障的至少一部分。
以上描述的可扩展的检测和故障通知技术可以具有一个或多个优点。例如,通过结构端点在数据路径中而非通过针对多级交换机结构12的控制路径执行故障检测可以得到更容易的故障检测。此外,将处理针对故障通知的工作负荷的数据路径分布在多级交换机结构12之内可以以使得能够减少流量黑洞直到结构控制器能够对多级交换机结构12进行重新路由的方式,来将故障通知传播扩展到结构端点。通过多级交换机结构12到结构端点的分布式故障通知可以额外地使得能够使用多级交换机结构12内的、与结构平面的数目和结构端点的数目无关的多个故障通知消息进行故障通知,其可以支持更大的规模并且减少结构端点上的在生成的和接收到的故障通知的数目两个方面上的工作负荷。尽管参考多机箱式路由器4的交换结构12进行描述,但是技术可以被应用到在其中独立式设备(例如交换机)相互连接以提供高速交换结构的网络中。
图2是图示了根据本文中描述的技术的交换系统的示例的方框图。交换系统16的多级交换机结构18(“结构18”)可以表示图1的多机箱式路由器4的多级交换机结构12、图4的多级结构250、以及图10的数据中心结构514的示例实例。交换系统16中单独地耦合到多级交换机结构18的结构平面22A至22K的结构端点20A、20B(统称为“结构端点20”)操作为由结构18交换的数据单元(例如,单元)的源和/或目的地。在图示的示例中,结构端点20A从源分组26进入、起源、或以其他方式以经由多级交换机结构18交换到从分组26外出、耗尽或以其他方式沉没的结构端点20B。
尽管结构端点20中的每个结构端点通常操作为针对单元的源和目的地两者,但是在各种实例中结构端点20中的任何结构端点可以为针对单元的源或者目的地。在一些示例中,结构端点20可以均表示分组转发引擎或其他转发单元,使得结构端点20共同地实施针对分组交换设备(例如,多机箱式路由器4)的分布式转发平面。在一些示例中,结构端点20可以表示针对经由结构18交换针对分布式应用的分组的服务器或其他主机(例如,虚拟机)的结构接口。结构端点20可以包括相应的交换结构接口或“交换接口”(SI-未示出),以提供对经由结构18交换的单元的排队以及其他操作。
在该示例中,多级交换机结构18包括多个操作上无关的并行的交换结构平面22A至22K(被图示为“结构平面22A至22K”,并且在本文中被统称为“结构平面22”)。结构平面22的数目可以是任何数,这取决于结构平面22的相应容量和所需要的结构带宽。结构平面22可以例如包括4个、5个或18个平面。在一些示例中,结构平面22K操作为剩余的结构平面22的备份或空闲结构平面。结构平面22中的每个包括用于实施独立的Clos或其他多个级交换网络(例如,Benes网络)的类似的部件,以向结构端点20提供独立交换带宽,在后文中描述的部件和功能主要是相对于结构平面22A的。结构平面22是操作上无关的,这是因为结构平面22中的一个结构平面的故障不影响剩余的操作结构平面的交换能力。结构平面22中的每个结构平面可以提供非阻塞的连接性。在Pradeep S.Sindhu于1999年11月24提交的题目为“Switching Device”的美国专利第7,102,999号中找到关于具有多个交换平面的多级交换机结构的示例的附加细节,通过引用将其整体并入。
结构平面22中的每个结构平面包括耦合到结构端点20A的输入端口和耦合到结构端点20B的输出端口。尽管为了简化仅仅图示了一个入口结构端点20A和一个出口结构端点20B,但是每个结构平面22通常包括耦合到相应的结构端点的多个输入端口和输出端口。当结构端点20A获得分组时,结构端点20A执行查找操作以确定结构端点20B(在该示例中)是针对分组的目的地。获得分组可以例如是指从网络或主机接收到分组或者发起分组。结构端点20A任选地将分组划分成单元并将分组/单元跨多个级结构18转发到结构端点20B。结构端点20A选择不同的结构平面22以交换单元,从而将带宽负载跨结构平面22分布。
结构端点20A、20B可以采用请求/授权协议来跨结构18发送数据单元。在这样的情况下,源结构端点20A将请求跨结构18发送到目的结构端点20B。结构端点20A跨结构平面22中的不同结构平面以循环的或其他均衡化的顺序发送每个这样的请求以公平地分布传输负荷。响应于接收到请求,结构端点20B将授权跨结构端点20B在其上接收到对应的请求的相同的结构平面22发送到结构端点20A。响应于接收到授权,结构端点20A将数据单元跨结构端点20A在其上发布对应的请求的相同的结构平面22发送到结构端点20B。
如以上所指出的,每个结构平面22中可以包括用于执行类似的多级交换功能的类似的部件。作为示例,结构平面22A包括由结构芯片到芯片链路(CCL-未示出)耦合的多个结构芯片24以实施针对结构平面22A的多级交换机结构。结构芯片24A可以被分布在交换系统16的各种交换设备、机箱等之中。每个结构芯片24A可以包括专用集成电路(ASIC)并且可以被称为“结构ASIC”。
根据本文中描述的技术,结构端点20A包括用于生成并接收自查验单元以验证结构端点20A相对于结构平面22的每平面连接性。结构芯片24A包括故障处理模块30A,其可以包括被分布在各种结构芯片24A之中的逻辑。故障检测模块28A在确定关于结构平面22A的连接性故障之后,例如将连接性故障的指示发送到结构平面22A。该指示可以为由故障检测28A专门生成的单元。另外,结构端点20A可以至少暂时地修改它的操作以避免将单元发送到结构平面22A上的其他结构端点20。
在经由到结构平面22A的输入端口接收到连接性故障的指示时,故障处理模块30A将指示分布在结构芯片24A之中,结构芯片24A经由结构平面24A的输出端口将连接性故障的指示发送到其他结构端点20。通过这种方式,结构平面22A的故障检测模块28A和故障处理模块30A可以在数据路径中并且以分布式方式合作地标识并分布结构端点20A相对于结构平面22A的连接性故障的指示。响应于接收到连接性故障的指示,其他结构端点20可以避免使用结构平面22A将单元发送到结构端点20A。
故障检测模块28A可以通过确定在预计时间内未接收到发送的自查验单元来确定连接性故障。在一些实例中,故障检测模块28A可以仅仅在接收由故障检测模块28A先前发送的自查验单元的许多连续的这样的故障之后声明连接性故障。故障检测模块28A可以根据定义的周期生成自查验单元并将其发送到结构平面22A。故障检测模块28A可以在每平面的基础上生成并发送自查验单元,即,故障检测模块28A可以执行以上关于结构平面22中的每个结构平面描述的操作以便验证与所有结构平面22的连接性。
在一些示例中,故障检测模块28A或故障处理模块30A可以接收并处理将结构端点20A耦合到结构芯片24A中的一个或者将结构芯片24A中的两个进行耦合的发生故障的芯片到芯片链路的指示。响应于接收到针对结构平面22A的链路故障,例如结构端点20A和/或故障处理模块24A可以在数据路径中对到结构芯片24A的链路故障的指示进行中继和广播,以使得结构端点20中的每个接收到链路故障的指示。响应于接收到链路故障的通知,包括结构端点20A和想要将单元发送到结构端点20A的结构端点的结构端点20可以至少暂时地避免使用结构平面22A中具有链路故障的至少一部分。
图3是图示了根据本公开内容的一个方面的多机箱式路由器的方框图。本文中描述的用于故障检测和分布式故障通知的技术可以被实施在图3的多机箱路由器150中。在图3的示例中,多机箱式路由器150包括线路卡机箱(LCC)152A的详细视图,其表示多机箱式路由器150中的一个机箱。多机箱式路由器150在网络上的网络设备之间路由数据。多机箱式路由器150可以例如进一步详细地表示图1的多机箱式路由器4的示例。再次地,尽管出于说明的目的关于具有分布式线路卡机箱(每个分布式线路卡机箱耦合到一个或多个交换卡机箱)的多机箱式路由器进行描述,但是本公开内容的技术可适用于在大量结构端点之中交换数据单元的任何单个或多机箱式网络设备或网络交换结构。
如图3中所示出的,多机箱式路由器150包括操作为网络内的单个节点的多个合作路由部件。在该示例中,多机箱式路由器150包括四个基本上相同的LCC 152B–152D(“LCC 152”)和交换卡机箱(SCC)154(或者更简单地,“交换机箱154”)。在其他实施例中,多机箱式路由器可以包括更多或更少的LCC。SCC 154可以操作为用于连接LCC 152的中央路由节点。
每个LCC 152中可以被包含在物理上分开的机箱内并且可以包括具有结构管理模块(仅仅示出了LCC 152A的结构管理模块158A)、交换结构(仅仅示出了LCC 152A的交换结构157)、转发部件集合(仅仅示出了LCC 152A的转发部件集合156A1)以及网络接口的集合(未示出)的CPU(仅仅示出了LCC 152A的CPU 155A)。SCC 154包括经由链路(未示出)连接到LCC 152的每个CPU 155中的集中式路由引擎(未示出)。
其他路由节点,即LCC 152B至152D通常类似于LCC 152A。在该示例中,LCC 152A包括CPU 155A和四个线路卡(LC)160A1至160A4(“LC 160A”)。LCC 152A内的每个LC 160A包括转发部件。每个LC 160A还包括提供用于从外部网络接收分组并且用于将分组发送到外部网络的物理接口的接口卡(IFC)159A的集合(仅仅示出了IFC 159A1)。LC 160A每个也包括根据来自路由引擎155A的指令来执行LC 160A内的控制功能的LC控制器161A(仅仅示出了LC控制器161A1)。
SCC 154的路由引擎(未示出)维护描述网络的拓扑的路由信息,并且根据路由信息导出转发信息库(FIB)。SCC 154的路由引擎将FIB拷贝到LCC 152的每个路由引擎,例如拷贝到LCC 152A的路由引擎155A。路由引擎155A之后将FIB拷贝到LC 160A中的转发部件集156A。(转发部件156中的任何)入口转发部件使用FIB来将从网络(未示出)到达的数据指引到恰当的(也是转发部件156中的任何)出口转发部件。出口转发部件将数据中继到网络。转发部件156中的每个中的FIB可以在不降低多机箱式路由器150的分组转发性能的情况下被更新,这是因为FIB更新与数据分组分开地被分布。备选地,SCC 154的路由引擎可以导出单独的FIB,其被拷贝到相应的转发部件156。
在一些示例中,管理员168(“ADMIN 168”)经由命令行接口(CLI)172与SCC 154的管理守护进程170进行交互,以使用管理守护进程170执行各种管理任务。管理守护进程170可以将用于对结构平面157进行配置的配置信息提供到结构控制器174。结构控制器174对构成结构平面157的各个结构芯片进行配置,如下面进一步详细描述的。例如,结构控制器174可以修改每个结构芯片的散布(spray)配置。
针对LCC 152中的LC 160的转发部件集合中的每个,即转发部件集合156A1至156A4、156B1至156B4、…、156D1至156D4(统称为“转发部件集合156”)包括共同地实施针对路由器150的数据或转发平面的部分的一个或多个转发部件。转发部件表示提供对网络流量的高速转发的基于硬件的分组处理器。转发部件可以表示分组转发集成电路(IC),例如一个或多个可编程ASIC或基于ASIC的分组处理器,当分组例如经由结构平面157遍历路由器150的内部体系时,分组转发集成电路通过在通过相应的内部分组转发路径的每个分组上执行一系列操作来处理网络分组。转发部件可以根据由路由引擎155中的一个路由引擎提供的转发信息库来处理分组。在一些示例中,转发部件可以被称为分组转发引擎。
转发部件集合156中的每个转发部件可以连接到一个或多个网络接口。例如,转发部件可以发送和接收针对两个网络接口(例如来自图3的IFC 159A1和IFC 159A2)的信息分组。具有十六个转发部件的其中每个转发部件具有两个网络接口的LCC 152将具有总共三十二个网络接口。
转发部件156中的每个连接到每个结构平面157中。结构平面157的每个活跃的结构平面负责提供多机箱式路由器150的所需要的内部交换带宽的一部分。通过将数据划分成单元并在逐个单元的基础上通过活跃的交换平面发送数据,转发部件156可以对在活跃的结构平面157上的流量进行负载平衡。
转发部件集合156A1的转发部件可以经由LC 160A1上的IFC159A1中的一个接收传入分组。转发部件根据由路由引擎155A提供的FIB来确定分组是否要被交换到不是转发部件集合156A1中的一个转发部件集合并且因此被定位在不同的LC 160上的一个转发部件。如果这样的话,转发部件将分组划分成数据单元并将数据单元发送到结构平面157A,以交换到不同的LC 160和转发部件156中的一个转发部件。接收针对分组的数据单元的转发部件156对分组进行重组并经由针对转发部件的IFC 159中的对应一个输出分组。
在多机箱式路由器150中,每个结构平面157A–157K(统称为“结构平面157”)提供操作上无关的多级交换机结构。结构平面157可以表示图2的结构平面22的示例实施方式。例如可以由被插入在SCC 154内以及LCC 152中的每个内的专用交换卡(未示出交换卡)实施结构平面157A。例如,来自SCC 154的交换卡可以包括用于实施针对结构平面157A的多级交换机结构的中间级的逻辑(在图3中被示出为单个中间第2级164A并且备选地被称为针对第3级Clos网络的“F2”或者被称为“中间级”),并且来自LCC 152A(以及其他LCC 152)的交换卡可以包括用于实施分别针对结构平面157A的第一级和末级(备选地,针对第3级Clos网络的“F1”和“F3”)第1级162A和第3级166A的逻辑。因此,在一些示例中,来自每个LCC 152中的一个交换卡和来自SCC 154的一个SCC交换卡形成结构平面157。在一些示例中,第1级162A和第3级166A中的任一或两者可以被定位在152A或者SCC 154上。
SCC 154和LCC 152的交换卡可以包括交换接口板(SIB)或其他交换卡,其他交换卡例如包括一个或多个结构芯片和提供在SCC154与LCC 152之间的连接性的光学或其他高速接口的集合。在该实施例中,针对结构平面157A的LCC部分的每个交换卡连接到针对结构平面157A的SCC部分的单个交换卡。单独的链路将每个SCC交换卡连接到每个多机箱式交换卡。例如,链路(未示出)可以包括针对结构平面157中的每个的单独的光纤阵列线缆。如果多机箱式路由器150例如具有五个结构平面157,则总共二十个线缆可以用于将实施各种结构平面157的交换卡互连。
第1级162A可以例如被称为第一级、首级、入口级、F1或第1级。因为结构平面157A是第3级交换结构,第3级166A可以例如被称为第三级、三级、末级/最后一级、尾级、出口级、F3或第3级。对于n级结构,其中n为除了3之外的数,则命名法将对应地不同,例如针对末级的“F5”。其他结构平面157可以由类似的单独的交换卡来实施以提供操作无关性。第1级162A、第2级164A和第3级166A中的每个可以由诸如图2的结构芯片24的一个或多个结构芯片来实施。第1级162A交换机和对应的第3级166A交换机可以被定位在相同的设备或部件上并且由使得能够在两个交换机之间进行直接通信的配对链路186耦合。
如以上所指出的,结构平面157中的每个形成三级交换结构。例如,三级交换结构可以为在每级中包括多个纵横式交换机的Clos网络。在一些实施例中,LCC 152中的每个包括三级中的每级的部分。在其他实施例中,针对LCC 152的结构平面157的交换卡可以执行第一级和第三级,而SCC 154的结构平面157中的交换卡执行三级网络中的第二级。如在LCC 154A的结构平面157A上所示出的,要从LC 160A1被中继的数据单元首先被发送到第1级162A,以传输到SCC 154的结构平面157A的第2级164A。第1级162A、第2级164A和第3级166A中的每个可以包括一个或多个纵横式交换机或其他交换机。针对其他结构平面157的级可以类似于结构平面157A的级。
第1级162A经由相互连接的链路将数据单元交换到第2级164A,其被定位在SCC 154的结构平面部分157A的内部。第2级164A不仅从LCC 152上的第1级162A交换机接收数据单元,而且从被定位在LCC 152B–152D上的类似的第1级交换机接收数据单元。换言之,每个LCC 152具有针对每个结构平面157的至少一个第1级交换机。类似地,每个LCC 152具有针对每个结构平面157的至少一个第3级交换机。第2级164A将数据单元交换到被定位在LCC 152中的任何上的第3级166A交换机。
一个或多个第3级交换机166A包括连接到LCC 152A上的转发部件156A中的每个的独立输出端(未示出)。由第3级166A交换机接收到的单元被指引到与如数据单元的目的地所需要的IFC 159A的集合相对应的转发部件156。
实施结构平面157的级的转发部件156和结构芯片执行本文中描述的用于故障检测和分布式故障通知的技术。转发部件156中的每个可以表示结构端点20的实例的示例,结构平面157可以表示结构平面22的示例实例,并且结构平面157的级(例如,结构平面157A的第1级162A、第2级164A和第3级166A)可以表示示例图2中的示例结构芯片24A。
作为示范性图示,转发部件156A1包括可以表示图2的故障检测模块28的示例实例的故障检测模块190。也就是说,故障检测模块190可以执行本文中描述的由结构端点执行以检测并处理结构平面157内的或关于将转发部件156A1连接到结构平面157的链路的故障的技术中的任何。类似地,第1级162A、第2级164A和第3级166A中的每个包括故障处理模块。第1级162A包括故障处理模块182A,第2级164A包括故障处理模块180A,并且第3级166A包括故障处理模块184A。故障处理模块180A、182A、184A可以均表示图2的故障处理模块30的示例实例。也就是说,故障处理模块180A、182A、184A可以执行本文中描述的由级(或级交换机)执行以检测针对结构平面157的故障指示并将其分布到各种转发部件156的技术中的任何。在一些示例中,故障处理模块180A、182A、184A确定并处理将转发部件156耦合到转发平面157或者将转发平面157中的任何两个级进行耦合的发生故障的芯片到芯片链路的指示。
在Pradeep S.Sindhu的于2008年2月21日公布的题为“Multi-chassis router with multiplexed optical interconnects”的美国专利公布第2008/0044181A1号中找到关于多机箱式路由器的示例的附加细节,将其整体通过引用并入。
图4是图示了根据本文中描述的技术操作的三级交换网络250(或“交换结构250”)的逻辑表示的方框图。三级网络250可以在逻辑上表示图1的交换结构12、图2的交换结构18、以及图3的交换结构157中的任何或者其中部件或设备相互连接以提供多级交换机结构的任何其他交换结构。图4的示例网络250的三级包括:包括纵横式交换机256A–256R(统称为“交换机256”)的第1级251、包括纵横式交换机258A–258M(统称为“交换机258”)的第2级252以及包括纵横式交换机260A–260R(统称为“交换机260”)的第3级。交换机256经由输入端(统称为“254”)接收数据分组;在该示例总共有NxR个输入端254。交换机260经由输出端口(统称为“262”)发送数据分组;在该示例中总共有NxR个输出端262。
如图4中所示出的,第1级251和第3级253均包括R个纵横式交换机,而第2级252包括M个纵横式交换机。三级网络与N个输入端和N个输出端耦合,因此使Clos网络的特性变得完整。针对M和N的整数值定义三级交换网络250的阻塞特性。例如,第2级252可以包括比第1级251和第3级253更多的纵横式交换机(即,M>R)以减小或消除输入端254的开放输入端能够被输出端262中的开放输出端阻塞的可能性。
交换机256、258、260中的每个可以由结构芯片实施。在一些情况下,对应的第1级交换机256和第3级交换机260(例如,交换机256A和交换机260A)可以由相同的结构芯片实施。如关于图3的多机箱式路由器150所描述的,第1级251和第3级253可以被定位在多个LCC中,而第2级252被定位在SCC中。
为了建立通过网络250从输入端254中的一个输入端到预期输出端262的路径,与接收输入端254相关联的交换机256中的一个确定允许到包括预期输出端262的第3级253交换机260的连接路径的可用的第2级252交换机258。例如,假设由交换机256A接收到的分组要被中继到交换机256A上的输出端262A中的一个输出端。交换机256A选择具有到交换机256A和交换机260A两者的开放连接的交换机258中的任何交换机。假设交换机256A选择交换机258B。一旦交换机258B接收到数据分组,则交换机258B确定到交换机260A的可用路径并将数据分组转发到交换机260A。例如,交换机258B可以具有到交换机260A的超过一条路径。
根据本文中描述的技术,交换机256、258、260中的每个可以包括用于确定结构连接性和链路故障的指示并将其分布到耦合到网络250的结构端点20的故障处理模块30的实例。
虽然一般被描述为三级交换网络(例如网络250),但是在其他示例中,本文中描述的结构平面可以包含不同的交换体系结构。例如,三级网络中的第二级可以由另外的三级网络替换,由此形成五级网络。其他交换结构体系结构也是可能的。
图5是图示了根据本文中描述的技术的在其中结构端点验证连接性的示例交换系统的方框图。交换系统300包括结构端点20A和结构平面22A。结构平面22A在该示例中包括三级交换网络,例如图4中的具有第1级交换机256A1至256R1、第2级交换机258A1至258M1、和第2级交换机260A1至260R1的网络250。下标标识结构平面22(下标1针对结构平面22A,下标2针对结构平面22B,等等)。
为便于说明的目的,示出了通过结构平面22A的第1级交换机256A1、第2级交换机258B1和第3级交换机260A1的单条路径。尽管仅仅示出了第2级交换机258B1,但是在各种情况下可以通过第2级交换机258A1–258M1中的任何交换自查验单元302。交换机256A1和交换机260A1可以被定位在相同的设备或部件(例如,LCC)上并且由使得能够在这两个交换机之间进行直接通信的“配对链路”进行耦合。
为了检测针对结构端点20A的关于结构平面22A的平面级别结构故障,故障检测模块28A生成自查验单元302,如此命名是因为自查验单元302被寻址到结构端点20A,并且将自查验单元302发送到耦合到结构端点20A的第1级交换机256A1。因为自查验单元302被寻址到结构端点20A,所以结构平面22A将自查验单元302交换到结构端点20再通过第2级交换机258B1(或者在其他情况下,其他适当的第2级交换机)交换到第3级交换机260A1,其将自查验单元302输出到结构端点20A。如果故障检测模块28A没有在发送自查验单元302之后的预定时间内接收到自查验单元302,则故障检测模块28A可以声明超时错误,其可以指示结构连接性故障。预定时间可以例如为100μs。尽管仅仅参考结构平面22A示出,但是故障检测模块28A在结构平面22中的每个上生成、发送和接收类似的自查验单元以验证结构平面22的相应部分的结构连接性。然而,因为耦合到每个结构平面22中的每个结构端点20可以执行类似的自查验操作,所以所有这样的自查验操作的组合和对结构连接性故障的指示到所有结构端点20的分布允许结构端点至少暂时地修改它们的交换操作以避免发生在结构22中的任何地方的结构连接性故障。
故障检测模块28A可以由专用处理线程运行以促进不间断的结构连接性故障检测和处理。故障检测模块28A可以周期性地生成并发送自查验单元302并且仅仅在出现连续的超时错误时声明连接性故障。因为针对高带宽交换系统的流量黑洞可以导致数吉比特的数据的丢失,所以可以为亚毫秒级的自查验周期促进对针对结构端点20A的结构连接性故障的快速检测。尽管故障检测模块28A可以仅仅在出现连续的超时错误时声明连接性故障,但是故障检测模块28A可以通知控制结构平面22A的控制路径模块,以便报告结构平面22A的健康状况。例如,故障检测模块28A可以报告在一时间段内由结构端点20经历的多个超时错误。控制路径模块可以响应于频繁的且规则的超时错误(其可以指示结构平面22A上的连接性的部分丢失)而对结构平面22A进行重新路由或者采取其他动作。
图6A至6C是描绘了根据本公开内容中描述的技术的结构故障检测和通过结构平面的对这样的结构故障的指示的分布的方框图。6A示出了每个具有三级交换网络的结构平面22A、22B,三级交换网络可以为图4中描述的网络250的示例。尽管关于三级交换网络进行描述,但是本文中描述的技术可适用于5级交换网络和其他n级交换网络,其中n>=3。针对各种交换机参考标记的下标标识结构平面22(下标1针对结构平面22A,下标2针对结构平面22B,等等)。各级交换机中的每个可以包括故障处理模块30的示例实例,或者与用于实现本文中描述的技术的合适的级相对应的故障处理模块180A、182A、184A的示例实例。
相应的结构端点20A、20X的故障检测模块28A、28X生成并发送相应的自查验单元302A、302X以尝试验证关于结构平面22A的结构连接性。故障检测模块28A、28X中没有一个接收到自查验单元302A、302X并且声明针对那些自查验单元的超时错误。超时错误可以使得故障检测模块28A、28X声明相应的结构连接性故障(例如,在最新的超时错误满足指示结构连接性故障的阈值数目的连续的错误的情况下)。
图6B示出了结构端点20A经由链路310耦合到第1级交换机256R1并且经由链路316耦合到第3级交换机260R1。另外,链路312将第1级交换机256R1耦合到第2级交换机258M1,并且链路314将第2级交换机258M1耦合到第3级交换机260R1
链路310表示结构端点到第1级交换机链路(在后文中为“FE→F1”链路)。链路312表示第1级交换机到第2级交换机(在后文中为“F1→F2”链路)。链路314表示第2级交换机到第3级交换机链路(在后文中为“F2→F3”链路)。链路316表示第3级交换机到结构端点链路(在后文中为“F3→FE”链路)。链路310、312、314、316中的每个可以被称为芯片到芯片链路(CCL),并且每个可以包括高速光学链路。尽管图6B仅仅示出了针对从结构端点20A到结构平面22A并返回的单条路径的链路,但是交换系统包括针对结构端点20和级交换机的类似的链路,如例如关于图4的多级结构250所图示的。
数据单元的每个接收者(或“CCL接收者”)将接收链路(“Rx链路”或“in-link”)状态传送到针对将发送者连接到接收者的链路(或“CCL链路”)的数据单元的每个发送者(或“CCL发送者”)。示例状态信息可以包括链路上行、链路下行以及链路故障。在检测到链路上的链路故障之后,接收者可以将链路故障的指示发送到发送者。
例如,结构端点20A是针对链路316的发送者,针对其第1级交换机256R1是接收者。第1级交换机256R1可以检测链路310上的链路故障并将包括链路310上的链路故障的指示的故障消息318发送到结构端点20A。在图示的示例中,故障消息318是经由通过结构平面22A的数据路径发送的专门生成的数据单元。在一些情况下,针对结构平面22A的控制模块将链路310上的链路故障的指示发送到结构端点20A。针对链路312、314和316上的链路故障的指示可以类似地被传播到链路310上的链路故障的指示。然而,在一些情况下,第1级交换机256R1可以经由将这些交换机耦合的配对链路将故障直接传送到对应的第3级交换机260R1,配对链路可以为专用流控制CCL链路。
转到图6C,响应于获得故障的指示,通过故障检测模块28A使用自查验单元来检测故障或者通过接收到链路故障的指示,结构端点20A至少暂时地停止将单元散布到结构平面22A。如本文中所使用的,术语对数据单元“散布”是指通过结构级交换机来选择针对数据单元的输出端口并将数据单元在输出端口上发送。例如,故障检测模块28A可以修改针对结构端点20A的对所有目的(例如,交换系统中的所有其他结构端点)的散布编程,以使得结构端点20A不再跨结构平面22A发送单元。故障检测模块28A额外地开始向可由剩余活跃的结构平面22(即,不是在该示例中的结构平面22A)到达的所有结构端点20通知针对结构端点20A的结构连接性故障。具体地,故障检测模块28A将指示连接性故障的故障数据单元304A发送到活跃的结构平面22B的第1级交换机256R2。故障检测模块28A可以额外地向针对结构平面22的结构管理软件或其他控制路径部件通知针对结构端点20A的故障。
故障检测模块28X响应于检测到如以上关于故障检测模块28A描述的连接性故障的连接性故障而执行类似的操作,包括将指示连接性故障的故障数据单元304X发送到活跃的结构平面22B的第1级交换机256R2。结构端点20A和20X两者都耦合到第1级交换机256R2的输入端。故障数据单元304A例如可以为指示连接性故障并例如使用广播地址将所有结构端点20指定为目的地的单元。故障数据单元304A例如可以指示整个结构平面22A是否由于检测到的故障而是不可使用的。故障数据单元304A例如可以指示故障是否限于结构平面22A的特定链路,使得结构平面22A的部分保持不可用于将单元传输到结构端点20A。
在一些情况下,不是所有目的结构端点20可以是可从结构端点20A经由结构平面22B被到达。在这样的情况下,故障检测模块28A可以在多个结构平面22上发送故障通知消息。例如,故障检测模块28A可以首先确定操作结构平面22B提供到操作结构平面22中的任何的大多数目的结构端点20的可到达性。作为响应,故障检测模块28A将具有广播目的地地址的故障数据单元304A发送到第1级交换机256R2,使得结构平面22B停止将故障的指示发送到可通过结构平面22B到达的结构端点20中的每个。故障检测模块28A还经由至少一个其他操作结构平面22将单独的故障消息(未示出)单播到不可通过结构平面22B到达的目的结构端点20中的每个。故障检测模块28A可以确定具有大多数可到达的结构端点20的结构平面22以及通过其使用例如针对故障检测模块28A的散布掩膜对单独的故障消息进行单播的其他结构平面22。结构端点20中的每个因此接收通过故障检测模块28A获得的故障的指示。
第1级交换机256R2响应于故障数据单元304A、304X中的任一或两者向交换系统中的所有其他结构端点20通知连接性故障。具体地,第1级交换机256R2将故障消息广播到结构平面22B的所有的第3级交换机260A2–260R2,其将故障消息中继到连接到它们的相应输出端口的结构端点20。结果,故障检测模块28A可以使用到结构平面22B的单个故障数据单元304A向多个目的结构端点20通知连接性故障而非必须将故障消息单播到每个其他结构端点20。
第1级交换机256R2可以等待预定义时间以便合并多个故障数据单元304A、304X,而不是响应于接收到故障数据单元304A、304X中的一个立即将故障消息广播到第3级交换机260A2–260R2。因为连接性故障常常是局部的,所以它们倾向于影响耦合到相同的第1级交换机或第3级交换机的多个结构端点20,正如关于结构端点20A、20X的情况。合并可以在一些示例中由故障检测模块28A执行,故障检测模块28A可以收集针对由故障检测模块28A检测到的多个不同的故障的故障信息并使用到第1级交换机256R2的单个故障数据单元304A向其他结构端点20通知故障。在一些示例中,用于合并的预定义时间是1ms。
为了促进由针对可通过其到达大多数结构端点20的结构平面22的第1级交换机的合并,耦合到针对相应的结构平面22的相同的第1级交换机256的所有结构端点20(例如,特定LCC上的所有结构端点20)应当将故障数据单元304的实例发送到针对相同的结构平面22的相同的第1级交换机256。故障检测模块28可以通过选择提供到目的地结构端点20的最好可到达性的结构平面22来接收故障数据单元304的实例来完成这一点。
如以上所指出的,结构平面22的结构端点20和级交换机可以使用目的地地址来对结构端点20进行寻址。结构平面22的结构端点20和级交换机还可以使用由用于交换到3级交换机的结构平面22级交换机使用的地址空间中的保留地址的集合中的一个来对共同地耦合到第3级交换机中的一个的结构端点20的集合进行寻址。结构平面22的结构端点20和级交换机可以备选地共同地使用来自保留地址的集合的广播地址来对所有结构端点20进行寻址。在一个示例中,目的地地址的集合被保留:0xF00+F3_ID(高达最大值0xFFF),其中F3_ID是距标识结构平面中的第3级交换机260中的一个的0xF00的偏移,并且通过扩展,所有结构端点20耦合到所标识的第3级交换机260。值0xFFF被保留为指示交换系统中的所有结构端点20而非仅仅耦合到特定第3级交换机260的结构端点的广播地址。其他目的地地址(例如,0x0–0xF00)可以可用于对单个结构端点20进行寻址。
如果第1级交换机256或第2级交换机258中的任何接收到包括故障的指示并被寻址到保留目的地地址中的一个的单元,则交换机将单元(或也包括指示的不同的单元)散布到所标识的第3级260交换机。然而,如果保留目的地地址是广播地址,则交换机可以在一些情况下生成每个具有故障的指示的相应的单元并将其发送到可从交换机到达的所有第3级260交换机。在一些实例中,交换机可以简单地将接收到的单元散布到可利用广播地址从交换机到达的所有第3级260交换机。如果第3级260交换机中的任何接收到被寻址到其自身(例如,其是由在以上的示例中的偏移F3_ID标识的交换机)或来自保留目的地地址中的一个的广播地址(例如,0xFFF)的单元,则交换机生成每个具有故障的指示的相应的单元并将其发送到耦合到交换机的所有结构端点20。通过这种方式,结构平面22可以以相对于从结构端点20A单个地对结构端点20中的每个进行寻址减少的数目的消息来分布由结构端点20或由结构平面22的交换机检测到的故障的指示。
在图6C的示例中,第1级交换机256R2接收故障数据单元304A,故障数据单元304A可以去往广播地址从而向所有结构端点20通知由故障检测模块28A检测到的连接性故障。作为响应,第1级交换机256R2生成被寻址到可从第1级交换机256R2到达的相应的第3级交换机260的故障通知数据单元306(故障通知单元306)。例如,发送到第3级交换机260A2的故障通知单元306可以被寻址到标识第3级交换机260A2的0xF00。第3级交换机260接收故障通知单元306并且每个这样的交换机生成每个具有故障的指示的相应的故障通知数据单元308(或“故障通知单元308”)并将其发送到耦合到交换机的所有结构端点20。
图7是图示了根据本公开内容中描述的技术的结构故障检测和按结构平面的对这样的结构故障的指示的分布的方框图。如以上所描述的,数据单元的每个接收者将接收链路状态传送到针对将发送者连接到接收者的链路的数据单元的每个发送者。在图示的示例中,第3级交换机260B2接收将第2级交换机268B2耦合到第3级交换机260B2的F2→F3链路上的链路错误344的指示。在结构平面22的一些示例中,第1级交换机每个具有含有直接通信链路(例如,流控制链路,例如图3的链路186)的对应的第3级交换机,反之亦然。第3级交换机260B2通过使用故障通知消息340将链路错误344的指示中继到第1级交换机256B2来处理该指示。故障通知消息340可以在一些实例中为包括故障的指示的单元。第1级交换机256B2通过禁用到受影响的F2→F3链路的散布并且还通过以类似于以上关于图6C的故障通知单元306描述方式的方式生成并发送被寻址到可从第1级交换机256B2到达的第3级交换机260B2的相应的故障通知数据单元342(或“故障通知单元342”)来对故障通知消息340做出响应。故障通知单元342可以包括故障的指示并且可以标识发生故障的链路。尽管为便于说明的目的未示出,但是第1级交换机256B2还可以将故障通知单元306发送到第3级交换机260B2。接收到故障通知单元342的第3级交换机260生成每个具有故障的指示的相应的故障通知单元342并将其发送到耦合到交换机的所有结构端点20。
除了该图示的示例,第1级交换机256可以被配置为处理除了针对F2→F3链路的链路错误之外的其他链路错误。例如,在接收到FE→F1或F1→F2链路错误的指示时,其中F1是第1级交换机256B2,例如第1级交换机256B2可以以类似于以上关于故障通知单元342描述方式的方式将相应的故障通知单元发送到可从第1级交换机256B2到达的第3级交换机260。故障通知单元包括故障的指示并且可以标识发生故障的链路。
第1级交换机256在可能的情况下可以针对耦合到第1级交换机的所有结构端点20在每平面的基础上将到第3级交换机260中的每个的故障通知单元合并,并且报告结构平面22上的故障。因此,第1级交换机256可以仅仅跨交换结构发送少量故障通知单元以传达结构平面22/链路故障。
在FE→F1链路发生错误的情况下,向结构端点20通知故障的职责由F1交换机(例如,第1级交换机256中的一个)承担。因此,在一些实施例中,能够在亚毫秒的时间内检测到线路卡的不优雅的拔出。针对一个或多个结构平面的交换卡的不优雅的拔出另一方面将被检测为F3→FE错误并由FE处理。例如,故障检测模块28A可以接收F3→FE链路350中的链路故障的指示。作为响应,故障检测模块28A将结构平面22B声明为发生故障并且执行类似于以上关于图6A–6C描述的响应于由故障检测模块28A使用自查验技术确定的连接性故障动作的动作。也就是说,结构端点20A停止散布在针对所有目的结构端点20的结构平面22B上。另外,故障检测模块28A可以将类似于故障数据单元304A的消息发送到活跃的结构平面22,消息指示到活跃的结构平面的第1级交换机256的链路故障。第1级交换机生成并发送被寻址到可从第1级交换机到达的相应的第3级交换机260的故障通知单元,其中第1级交换机接收消息从而对指示进行广播。
在接收到故障通知单元(例如,故障通知单元308、342)时,结构端点20停止使用故障结构平面22进行散布以到达报告故障的结构端点20,从而防止任何额外的流量黑洞。本文中描述的提供故障的指示的故障通知单元和其他消息可以包括标识故障结构平面22的信息。
中间级交换机(例如交换机258)可以被配置为处理标识末级(第3级或F3)交换机的目的地地址和广播地址,以便将单元散布到所标识的末级交换机。在F2→F3结构链路发生错误的情况下,交换机258禁用到受影响的链路的散布。在F1→F2结构链路发生错误的情况下,交换机258将错误向上游中继到发送F1。
由于应用了本文中描述的技术,交换系统可以标识故障并以相对少量的消息/单元分发故障通知。在一些实施方式中,最坏情况是放下针对系统中的所有结构端点20的结构平面的中间级机箱的丢失。如果每个结构端点20要将故障通知单播到每个其他结构端点20,则这将需要O(N)2个消息,其中,N=结构端点20的数目。使用以上技术,需要的消息的数目可以被减少,这是因为每个结构端点20可以仅仅将单个消息发送到仍然活跃的结构平面上的第1级交换机。活跃的结构平面上的第1级交换机可以核对它们从它们连接的结构端点20接收到的这样的消息并将单个消息发送到活跃的结构平面上的每个第3级交换机。在一些示例中,这可以导致被发送的这样的消息的数目与系统中的第1级/第3级交换机的数目成线性比例。
例如,实施方式可以具有针对结构平面的16个第1级交换机和16个第3级交换机。如果耦合到第1级交换机的每个结构端点20将故障通知消息发送到它的第1级交换机,则这可以仍然仅仅得到由每个第1级交换机针对总共16*16故障通知单元散布的16个故障通知单元(从每个第1级交换机到每个第3级交换机的1个故障通知单元)。这可以是来自传统技术的减少的图表,例如在每个结构端点20要将消息发送到每个其他结构端点20并且存在512个结构端点20的情况下,需要512*512个消息。
图8是描绘了被配置为实施级交换机并执行根据本公开内容中描述的技术的故障检测和故障指示的分布的专用集成电路(ASIC)的方框图。ASIC 410表示基于硬件的逻辑并且可以包括可编程集成电路。ASIC 410可以表示结构芯片的示例并且实施针对多级交换机结构的级的纵横式交换机400。纵横式交换机400可以例如表示交换机256、258、260、162、164和166中的任何。
纵横式交换机400具有输入端口402A–402S(统称为“输入端口402”),其每个能够经由全网格将单元散布到输出端口404A–404T(统称为“输出端口404”)中的每个。交换模块412被编程具有散布罩具416,其标识可用于到达目的地结构端点20的输出端口404。故障处理模块414可以被配置为执行本文中描述的技术以例如检测链路故障并处理故障通知单元并且生成并发送故障通知单元/消息。尽管本文中将单个F1、F2和F3级纵横机分别描述为多级交换机结构的第一级、第二级和第三级中的部件,但是单个通用类型的F级纵横式交换机可以通过相应地配置ASIC 410的操作模式而被用于所有三级。
图9是图示了根据本公开内容的技术的示例数据单元格式的方框图。根据数据单元450的不同的单元类型定义针对多级交换机结构的结构端点20和不同的级交换机的操作,如下面进一步详细描述的。数据单元450包括单元头451和单元有效载荷464。单元头451包括以下字段:单元大小452、单元类型454、序列号(SEQ NO.)456、目的地标识符(DST ID)458以及源标识符460(SRC ID)。针对单元头451的各种示例实施方式可以对字段进行重新布置,包括更多的或更少的字段等。
单元大小452指定单元有效载荷464的大小,或者在一些情况下,包括单元头451和单元有效载荷464两者的数据单元450的大小。示例单元大小包括16个、24个和32字节。单元类型454标识单元的类型,包括要消耗并处理单元的结构芯片的类型(例如,第一级、中间级/第二级、第三级/末级,或者结构端点)。序列号456标识针对单元的序列号。单元目的地标识符458和单元源标识符458分别标识针对单元的目的地结构端点和源结构端点。平面标识符462标识用于交换单元的结构平面。针对数据单元450的数据有效载荷464通常是针对由交换系统交换的分组的分组数据,例如无论是分组交换还是数据中心结构。然而,如下面进一步详细描述的,有效载荷464可以将单元标识为自查验消息或者包括交换系统的结构平面中的连接性故障或结构故障的指示。
在一个示例实例中,数据单元450是自查验单元。数据单元450实例可以例如是自查验单元302的示例实例。单元头451的字段可以如下设置:
单元大小452 CELL_SIZE
单元类型454 FOR_ENDPOINT
序列号456 [序列号]
DST ID 458 SELF_ID
SRC ID 460 SELF_ID
平面ID 462 [结构平面]
FOR_ENDPOINT单元类型指示单元要由结构端点消耗。所有结构端点端口可以包括被配置为捕获具有FOR_ENDPOINT单元类型的数据单元的过滤器。因为源标识符460和目的地标识符458两者将由SELF_ID标识的起源结构端点指定为单元的源和目的地,所以在平面标识符462中指定的结构平面将单元朝向起源结构端点交换回。数据有效载荷464可以包括指示单元是查验请求的数据。
在另一示例实例中,数据单元450是要被多播到由故障影响的目的地结构端点的自查验超时故障信号通知单元。对于F3→FE链路错误,FE将故障信号通知到所有连接的结构端点。数据单元450实例可以例如为故障数据单元304的示例实例。针对该实例,单元头451的字段可以如下设置:
单元大小452 CELL_SIZE
单元类型454 EP_TO_F1
序列号456 0
DST ID 458 BROADCAST_ADDRESS
SRC ID 460 SOURCE_ID
平面ID 462 [结构平面]
EP_TO_F1单元类型指示单元已经由结构端点(SOURCE_ID)发送并且要由第1级(F1)交换机消耗。所有第1级交换机端口可以包括被配置为捕获具有EP_TO_F1单元类型(或任何其他TO_F1单元类型)的数据单元。BROADCAST_ADDRESS指示接收到单元的第1级交换机要将(下面描述的)结构端点故障信号通知中继单元发送到可从第1级交换机到达的第3级交换机。数据有效载荷464可以包括指示故障是自查验超时错误的数据。该故障结构平面将不同于在平面标识符462中标识的结构平面。
在另一示例实例中,数据单元450是要被多播到由故障影响的目的结构端点的结构链路故障信号通知单元。对于F3→FE链路错误,FE将故障信号通知到所有连接的结构端点。数据单元450实例可以例如是故障数据单元304的示例实例。针对该实例,单元头451的字段可以如下设置:
EP_TO_F1单元类型指示单元已经由结构端点(SOURCE_ID)发送并且要由级1(F1)交换机消耗。BROADCAST_ADDRESS指示接收到单元的第1级交换机要将(下面描述的)结构端点故障信号通知中继单元发送到可从第1级交换机到达的第3级交换机。数据有效载荷464可以包括指示故障是结构链路错误的数据并且可以标识故障结构平面。该故障结构平面将不同于在平面标识符462中所标识的结构平面。
在另一示例实例中,数据单元450是可用于将由第1级交换机接收到的故障信号通知单元中继/多路播送到末级(F3)交换机的结构端点故障信号通知中继单元。所有末级交换机端口可以包括被配置为捕获具有F1_TO_F3单元类型(或任何其他TO_F3单元类型)的数据单元的过滤器。结构端点故障信号通知中继单元可以为故障通知单元306的示例实例。结构端点故障信号通知中继单元基于来自结构端点的故障广播,并且接收的第1级交换机将相应的结构端点故障信号通知中继单元散布到结构平面上的每个结构末级。针对该实例,单元头451的字段可以如下设置:
单元大小452 CELL_SIZE
单元类型454 F1_TO_F3
序列号456 0
DST ID 458 F3_ADDRESS
SRC ID 460 SOURCE_ID
平面ID 462 [结构平面]
F1_TO_F3单元类型指示单元已经由第1级交换机发送并要由末级交换机消耗。末级交换机由目的地标识符458中的F3_ADDRESS标识。源标识符460中的SOURCE_ID被拷贝自由结构端点发送的原始自查验超时故障信号通知单元。数据有效载荷464可以包括指示故障是自查验超时错误的数据并且可以标识故障结构平面。故障结构平面将不同于在平面标识符462中标识的结构平面。
在另一示例实例中,数据单元450是可用于对结构链路故障的指示进行多播的结构链路故障信号通知单元。结构链路故障信号通知单元由第1级交换机响应于接收到链路故障的指示(包括来自结构端点的那些)而生成。结构链路故障信号通知单元可以为故障通知单元342的示例实例。对于FE→F1类型或F1→F2类型链路错误,第1级交换机可以将故障信号通知到所有受影响的第3级交换机。针对该实例,单元头451的字段可以如下设置:
单元大小452 CELL_SIZE
单元类型454 F1_TO_F3
序列号456 0
DST ID 458 F3_ADDRESS
SRC ID 460 F1_ADDRESS
平面ID 462 [结构平面]
F1_TO_F3单元类型指示单元已经通过由源标识符460中的F1_ADDRESS标识的第1级交换机发送并且要由末级交换机消耗。该末级交换机由目的地标识符458中的F3_ADDRESS标识。数据有效载荷464可以包括指示故障是结构链路故障、标识具有故障的结构链路的类型的数据并且可以标识故障结构平面。该故障结构平面将不同于在平面标识符462中标识的结构平面。数据有效载荷464中的数据还可以标识针对F1→F2链路错误的第2级交换机地址。
在另一示例实例中,数据单元450是从末级交换机到结构端点的结构端点故障信号通知中继单元。该实例可以为故障通知单元308的示例实例。这些结构端点故障信号通知中继单元由末级交换机响应于接收到自查验超时错误的指示而生成。接收到该指示的末级生成结构端点故障信号通知中继单元并将其散布到连接到其的每个结构端点。针对该实例,单元头451的字段可以如下设置:
数据有效载荷464可以包括指示故障是自查验超时错误的数据,并且可以标识故障结构平面。该故障结构平面将不同于在平面标识符462中所标识的结构平面。
在另一示例实例中,数据单元450是从末级交换机到结构端点的结构端点故障信号通知单元。该实例可以为故障通知单元342的示例实例。这些结构端点故障信号通知中继单元由末级交换机响应于接收到F2→F3链路错误的指示而生成。接收到该指示的末级生成结构端点故障信号通知中继单元并将其散布到连接到其的每个结构端点。针对该实例,单元头451的字段可以如下设置:
数据有效载荷464可以包括指示故障是结构链路故障、标识具有故障的结构链路的类型的数据并且可以标识故障结构平面。该故障结构平面将不同于在平面标识符462中所标识的结构平面。数据有效载荷464中的数据还可以标识针对F2→F3链路错误的第2级交换机地址。
图10是图示了本文中描述的技术的示例可以被实施在其中的具有数据中心510的示例网络508的方框图。总体上,数据中心510向通过服务提供商网络507耦合到数据中心的客户511提供针对应用和服务的操作环境。数据中心510可以例如托管基础设施设备,例如联网和存储系统、冗余电源和环境控制。服务提供商网络507可以耦合到由其他提供商管理的一个或多个网络,并且可以因此形成大规模公共网络基础设施(例如,因特网)的部分。
在一些示例中,数据中心510可以表示许多地理分布式网络数据中心中的一个。如图10的示例中所图示的,数据中心510可以为向客户511提供网络服务的设施。客户511可以为集体实体,例如企业和政府或个人。例如,网络数据中心可以托管若干企业和终端用户的网络服务。其他示范性服务可以包括数据存储、虚拟专网、交通工程、文件服务、数据挖掘、科学计算或超计算等。在一些实施例中,数据中心510可以为单个网络服务器、对等网络或其他。
在该示例中,数据中心510包括通过由物理网络交换机和路由器中的一个或多个层提供的高速交换结构514互连的存储系统和应用服务器512A–512X(本文中为“服务器512”)的集合。服务器512提供针对与客户511相关联的应用和数据的运行和存储环境并且可以为物理服务器、虚拟机或它们的组合。在一些示例中,服务器512能够均为或表示例如虚拟网络、局域网(LAN)、广域网(WAN)和/或存储区域网络(SAN),并且均能够包括一个或多个有线段和/或无线段。
总体上,交换结构514表示提供服务器512之间的点对点连接性的第二层(L2)和第三层(L3)交换和路由部件,交换结构由控制器522控制。在一个示例中,交换结构514包括实施工业标准协议的相互连接的高性能的且现成的基于分组的路由器和交换机的集合。在一个示例中,交换结构514可以包括提供在以太网(IPoE)点对点连接性上的因特网协议(IP)的现成部件。交换结构514可以基于单元(固定长度或可变长度)的或基于分组。
如图10中所示出的,边缘设备517处在数据中心510的边缘并且表示到服务器512的网关。数据中心510的交换结构514是用于在边缘设备517之间交换数据单元的多级交换机结构。在一些示例中,交换结构514能够由一个或多个多级交换机(未示出)定义,每个多级交换机包括一个或多个交换结构。在一些示例中,交换结构514能够被配置为用作单个逻辑实体。交换结构514可以例如包括操作为多级交换机结构的第一级(F1)和末级(F3)的访问交换机的第一层和操作为多级交换机结构的中间级(F2)的聚合交换机的第二层。交换结构514可以被实施为多个平行的结构平面,其中平行的结构平面中的每个提供独立的多级交换机结构以提供交换冗余。
服务器512经由交换结构514将数据单元的流指引到彼此。在这方面,边缘设备514中的每个可以表示以上关于结构端点20描述的功能的示例并执行以上关于结构端点20描述的功能,并且交换结构514可以表示图2的多级交换机结构18或多级交换机网络250的示例。因此,构成交换结构514的单个交换机中的每个表示执行以上描述的用于故障检测和故障指示分布的对应的F1、F2或F3功能的示例并执行以上描述的用于故障检测和故障指示分布的对应的F1、F2或F3功能。
图11是图示了根据本公开内容中描述的技术的针对结构端点的、用于检测关于结构平面的故障的操作的示例模式的流程图。出于说明的目的关于图5的结构平面20A和结构平面22A描述操作600的模式。结构端点20A将自查验数据单元302周期性地发送到结构平面22A(602)。如果结构端点20A在预定义时间到期之前接收到从结构平面22A返回的自查验数据单元302(604的是分支),则结构端点继续将自查验数据单元302发送到结构平面22A(602)。然而,如果在结构端点20A接收到从结构平面22A返回的自查验数据单元302之前预定义时间到期,则结构端点20A声明针对结构平面22A的故障(606)。作为响应于声明故障的一个示例操作,结构端点22A可以至少暂时地停止将数据单元散布在结构平面22A上。在一些示例中,结构端点20A仅仅在及时接收自查验数据单元302的多次连续的故障之后声明故障。
图12是图示了根据本公开内容中描述的技术的针对第一级交换机的、用于通知针对结构平面的故障的结构端点的操作的示例模式的流程图。出于说明的目的关于图5的结构平面22A和22B描述操作700的模式,但是根据本文中的描述操作的模式700可适用于任何两个结构平面。耦合到结构平面22的结构端点20将故障数据单元发送到结构平面22B的第1级(或“第一级”)交换机256R2(701),其接收故障数据单元304A(702)。故障数据单元304A包括针对结构平面22A的故障的指示。第1级交换机256R2确定故障数据单元304A指定广播地址(704),并且作为响应,第1级交换机256R2生成故障的指示,并且将故障的指示作为被寻址到可从第1级交换机256R2到达的相应的第3级(或“末级”)交换机260A2–260R2的故障通知数据单元306(故障通知单元306)进行发送(706)。提供这种方式,第一级交换机可以使用少量数据单元(等于可到达第3级交换机260的数目)来对指示进行多播。
本公开内容中描述的技术可以至少部分地被实施在硬件、软件、固件或它们的任何组合中。例如,所描述的技术的各种方面可以被实施在一个或多个处理器内,一个或多个处理器包括一个或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或任何其他等效集成电路或单独逻辑电路以及这样的部件的任何组合。术语“处理器”或“处理电路”一般可以指单独的或与其他逻辑电路组合的前述逻辑电路中的任何或任何其他等效电路。包括硬件的控制单元还可以执行本公开内容的技术中的一个或多个。
这样的硬件、软件和固件可以被实施在相同设备内或分离的设备内,以支持本公开内容中描述的各种操作和功能。另外,所描述的单元、模块或部件中的任何可以一起被实施或单独地被实施为分离但可互操作的逻辑设备。对作为模块或单元的不同特征的描绘旨在突出不同的功能方面并且不一定暗示这样的模块或单元必需通过单独的硬件或软件部件来实现。相反,与一个或多个模块或单元相关联的功能可以通过单独的硬件或软件部件来执行,或被集成在共同或单独的硬件或软件部件内。
本公开内容中描述的技术还可以被实现或被编码在包含指令的诸如计算机可读存储介质的计算机可读介质中。嵌入或编码在计算机可读介质中的指令可以例如当指令被运行时,使得可编程处理器或其他处理器执行方法。计算机可读介质可以包括非暂态计算机可读存储介质和暂态通信介质。有形且非暂态的计算机可读存储介质可以包括随机存储存储器(RAM)、只读存储器(ROM)、可编程只读存储器(PROM)、可擦可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)、闪速存储器、硬盘、CD-ROM、软盘、磁带、磁性介质、光学介质或其他计算机可读存储介质。应当理解,术语“计算机可读存储介质”指物理存储介质而非信号、载波或其他暂态介质。
除了以上或作为对以上的备选,描述了下面的示例。在下面的示例中的任何中描述的特征可以与本文所描述的其他示例中的任何一起加以利用。
示例1.一种验证与多级交换机结构的结构连接性的方法,多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多级,该方法包括:由多个结构端点中的结构端点将自查验消息发送到多个结构平面中的第一结构平面的第一级交换机,自查验消息去往发送自查验消息的端点;并且由结构端点响应于确定结构端点在预定时间之后尚未接收到自查验消息而发送针对第一结构平面的连接性故障的指示。
示例2.根据示例1的方法,还包括:由多级交换机结构的中间级交换机将自查验消息交换到第一结构平面的末级交换机,末级交换机通过输出端口耦合到结构端点;由末级交换机将自查验消息交换到结构端点;并且由结构端点响应于在预定时间内接收到自查验消息而确定第一结构平面不具有连接性故障。
示例3.根据示例1的方法,其中多个结构端点包括在网络路由器内由多级交换机结构互连的多个转发部件中的一个和在数据中心内由多级交换机结构互连的多个边缘设备。
示例4.根据示例1的方法,其中结构平面包括第一结构平面,并且其中,发送连接性故障的指示包括:由结构端点将包括连接性故障的指示的故障数据单元发送到多个结构平面中的第二结构平面的第一级交换机,第一结构平面不同于第二结构平面。
示例5.根据示例1的方法,其中结构端点包括第一结构端点,该方法还包括:由多级交换机结构的第二结构平面的第一级交换机从第一结构端点接收包括连接性故障的指示的第一故障数据单元;由第一级交换机从多个结构端点中的第二结构端点接收包括连接性故障的指示的第二故障数据单元;并且由第一级交换机在合并了第一故障数据单元和第二故障数据单元之后将包括连接性故障的指示的故障通知数据单元发送到第二结构平面的末级交换机。
示例6.根据示例1的方法,其中连接性故障的指示标识第一结构平面。
示例7.根据示例1的方法,其中故障数据单元去往广播地址,该广播地址将多个结构端点中的每个指定为故障数据单元的预期接收者。
示例8.一种发信号通知针对多级交换机结构的结构故障的方法,多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多级,该方法包括:由多个结构平面中的第一结构平面的第一级交换机接收针对多个结构平面中的第二结构平面的结构故障的指示,第一结构平面不同于第二结构平面;由第一级交换机将包括结构故障的指示的第一故障通知数据单元发送到第一结构平面的第一末级交换机;并且由第一级交换机将包括结构故障的指示的第二故障通知数据单元发送到第一结构平面的第二末级交换机。
示例9.根据示例8的方法,其中指示包括由多个结构端点中的结构端点发送的故障数据单元,并且结构故障是针对第二结构平面的连接性故障,其中发送第一故障通知数据单元包括:由第一级交换机响应于确定故障数据单元包括将多个结构端点中的每个指定为故障数据单元的预期接收者的广播地址而发送第一故障通知数据单元,并且其中发送第二故障通知数据单元包括:由第一级交换机响应于确定故障数据单元包括广播地址而发送第二故障通知数据单元。
示例10.根据示例8的方法,还包括:由第一末级交换机响应于接收到第一故障通知数据单元,将包括结构故障的指示的第三故障通知数据单元发送到耦合到第一末级交换机的多个结构端点中的至少一个结构端点。
示例11.根据示例8的方法,还包括:由至少一个结构端点响应于接收到第三故障通知数据单元,修改至少一个结构端点的配置,以使得至少一个结构端点至少暂时停止经由具有结构故障的第二结构平面发送数据单元。
示例12.根据示例8的方法,其中第一故障通知数据单元包括标识第一末级交换机的第一目的地标识符,并且其中第二故障通知数据单元包括标识第二末级交换机的第二目的地标识符。
示例13.根据示例8的方法,还包括:由第一结构平面的中间级交换机接收第一故障通知数据单元;并且由中间级交换机响应于确定第一故障通知数据单元包括标识第一末级交换机的第一目的地标识符而将第一故障通知数据单元发送到第一末级交换机。
示例14.根据示例8的方法,其中结构故障包括针对将第一级交换机与第二级交换机、第二级交换机与第三级交换机、以及第三级交换机与多个结构端点中的一个结构端点中的任一项进行连接的结构链路的结构链路故障。
示例15.一种交换系统,包括:多个结构端点;多级交换机结构,其具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多级,其中多个结构端点中的结构端点被配置为在多个结构平面中的第一结构平面内将去往结构端点的自查验消息发送到多级中的第一级的交换机,并且其中结构端点被配置为响应于确定结构端点在预定时间之后尚未接收到自查验消息而发送针对第一结构平面的连接性故障的指示。
示例16.根据示例15的交换系统,还包括:由多级交换机结构的中间级交换机将自查验消息交换到第一结构平面的末级交换机,末级交换机通过输出端口耦合到结构端点;由末级交换机将自查验消息交换到结构端点;并且由结构端点响应于在预定时间内接收到自查验消息而确定第一结构平面不具有连接性故障。
示例17.根据示例15的交换系统,其中多个结构端点包括在网络路由器内由多级交换机结构互连的多个转发部件中的一个和在数据中心内由多级交换机结构互连的多个边缘设备。
示例18.根据示例15的交换系统,其中结构平面包括第一结构平面,并且其中为了发送连接性故障的指示,结构端点被配置为将包括连接性故障的指示的故障数据单元发送到多个结构平面中的第二结构平面的第一级交换机,第一结构平面不同于第二结构平面。
示例19.根据示例15的交换系统,其中结构端点包括第一结构端点,其中多个结构平面中的第二结构平面的第一级交换机被配置为接收包括连接性故障的指示的第一故障数据单元;其中第一级交换机被配置为从多个结构端点中的第二结构端点接收包括连接性故障的指示的第二故障数据单元;并且其中第一级交换机被配置为在合并了第一故障数据单元和第二故障数据单元之后,将包括连接性故障的指示的故障通知数据单元发送到第二结构平面的末级交换机。
示例20.根据示例15的交换系统,其中连接性故障的指示标识第一结构平面。
示例21.根据示例15的交换系统,其中故障数据单元去往将多个结构端点中的每个指定为故障数据单元的预期接收者的广播地址。
示例22.一种交换系统,包括:多个结构端点;多级交换机结构,其具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多级;其中多个结构平面中的第一结构平面的第一级交换机被配置为接收针对多个结构平面中的第二结构平面的结构故障的指示,第一结构平面不同于第二结构平面;其中第一级交换机被配置为将包括结构故障的指示的第一故障通知数据单元发送到第一结构平面的第一末级交换机;并且其中第一级交换机被配置为将包括结构故障的指示的第二故障通知数据单元发送到第一结构平面的第二末级交换机。
示例23.根据示例22的交换系统,其中指示包括由多个结构端点中的结构端点发送的故障数据单元,并且结构故障是针对第二结构平面的连接性故障,其中为了发送第一故障通知数据单元,第一级交换机被配置为响应于确定故障数据单元包括将多个结构端点中的每个指定为故障数据单元的预期接收者的广播地址而发送第一故障通知数据单元,并且其中发送第二故障通知数据单元包括:由第一级交换机响应于确定故障数据单元包括广播地址而发送第二故障通知数据单元。
示例24.根据示例22的交换系统,其中第一末级交换机被配置响应于接收到第一故障通知数据单元而将包括结构故障的指示的第三故障通知数据单元发送到耦合到第一末级交换机的多个结构端点中的至少一个结构端点。
示例25.根据示例22的交换系统,其中至少一个结构端点被配置为响应于接收到第三故障通知数据单元而修改至少一个结构端点的配置,以使得至少一个结构端点至少暂时停止经由具有结构故障的第二结构平面发送数据单元。
示例26.根据示例22的交换系统,其中第一故障通知数据单元包括标识第一末级交换机的第一目的地标识符,并且其中第二故障通知数据单元包括标识第二末级交换机的第二目的地标识符。
示例27.根据示例22的交换系统,其中第一结构平面的中间级交换机被配置为接收第一故障通知数据单元;其中中间级交换机被配置为响应于确定第一故障通知数据单元包括标识第一末级交换机的第一目的地标识符而将第一故障通知数据单元发送到第一末级交换机。
示例28.根据示例22的交换系统,其中结构故障包括针对将第一级交换机与第二级交换机、第二级交换机与第三级交换机、以及第三级交换机与多个结构端点中的一个结构端点中的任一项进行连接的结构链路的结构链路故障。
示例29.一种计算机可读存储介质,计算机可读存储介质包括用于使得多级交换机结构的至少一个可编程处理器执行以下操作的指令,多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多级:由多个结构端点中的结构端点将自查验消息发送到多个结构平面中的第一结构平面的第一级交换机,其中自查验消息去往发送自查验消息的端点;并且由结构端点响应于确定结构端点在预定时间之后尚未接收到自查验消息而发送针对第一结构平面的连接性故障的指示。
示例30.一种计算机可读存储介质,计算机可读存储介质包括用于使得多级交换机结构的至少一个可编程处理器执行以下操作的指令,多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多级:由多个结构平面中的第一结构平面的第一级交换机接收针对多个结构平面中的第二结构平面的结构故障的指示,第一结构平面不同于第二结构平面;由第一结构平面的第一级交换机将包括结构故障的指示的第一故障通知数据单元发送到第一结构平面的第一末级交换机;并且由第一结构平面的第一级交换机将包括结构故障的指示的第二故障通知数据单元发送到第一结构平面的第二末级交换机。
此外,在以上描述的示例中的任何示例中阐述的具体特征中的任何可以被组合成所描述的技术的有益示例。也就是说,具体特征中的任何特征通常可适用于本发明的所有示例。已经描述了本发明的各种示例。

Claims (13)

1.一种验证与多级交换机结构的结构连接性的方法,所述多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多个级,所述方法包括:
由所述多个结构端点中的结构端点向所述多个结构平面中的第一结构平面的第一级交换机发送自查验消息,所述自查验消息去往发送所述自查验消息的所述结构端点;以及
由所述结构端点响应于确定所述结构端点在预定时间之后尚未接收到所述自查验消息,发送针对所述第一结构平面的连接性故障的指示。
2.根据权利要求1所述的方法,还包括:
由所述多级交换机结构中的中间级交换机将所述自查验消息交换到所述第一结构平面的末级交换机,所述末级交换机通过输出端口耦合到所述结构端点;
由所述末级交换机将所述自查验消息交换到所述结构端点;以及
由所述结构端点响应于在所述预定时间内接收到所述自查验消息,确定所述第一结构平面没有连接性故障。
3.根据权利要求1至2中的任意组合所述的方法,
其中所述结构平面包括第一结构平面,并且
其中发送所述连接性故障的所述指示包括:由所述结构端点向所述多个结构平面中的第二结构平面的第一级交换机发送包括所述连接性故障的所述指示的故障数据单元,所述第一结构平面不同于所述第二结构平面。
4.根据权利要求1至3中的任意组合所述的方法,其中所述结构端点包括第一结构端点,所述方法还包括:
由所述多级交换机结构的第二结构平面的第一级交换机从所述第一结构端点接收包括所述连接性故障的所述指示的第一故障数据单元;
由所述第一级交换机从所述多个结构端点中的第二结构端点接收包括所述连接性故障的所述指示的第二故障数据单元;以及
由所述第一级交换机在合并所述第一故障数据单元和所述第二故障数据单元之后,向所述第二结构平面的末级交换机发送包括所述连接性故障的所述指示的故障通知数据单元。
5.根据权利要求1至4中的任意组合所述的方法,其中所述故障数据单元去往广播地址,所述广播地址将所述多个结构端点中的每个结构端点指定为所述故障数据单元的预期接收者。
6.一种发信号通知针对多级交换机结构的结构故障的方法,所述多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多个级,所述方法包括:
由所述多个结构平面中的第一结构平面的第一级交换机接收针对所述多个结构平面中的第二结构平面的结构故障的指示,所述第一结构平面不同于所述第二结构平面;
由所述第一级交换机向所述第一结构平面的第一末级交换机发送包括所述结构故障的所述指示的第一故障通知数据单元;以及
由所述第一级交换机向所述第一结构平面的第二末级交换机发送包括所述结构故障的所述指示的第二故障通知数据单元。
7.根据权利要求6所述的方法,
其中所述指示包括由所述多个结构端点中的结构端点发送的故障数据单元,并且所述结构故障是针对所述第二结构平面的连接性故障,
其中发送所述第一故障通知数据单元包括:由所述第一级交换机响应于确定所述故障数据单元包括广播地址,发送所述第一故障通知数据单元,所述广播地址将所述多个结构端点中的每个结构端点指定为所述故障数据单元的预期接收者,并且
其中发送所述第二故障通知数据单元包括:由所述第一级交换机响应于确定所述故障数据单元包括所述广播地址,发送所述第二故障通知数据单元。
8.根据权利要求6至7中的任意组合所述的方法,还包括:
由所述第一末级交换机响应于接收到所述第一故障通知数据单元,向所述多个结构端点中的耦合到所述第一末级交换机的至少一个结构端点发送包括所述结构故障的所述指示的第三故障通知数据单元。
9.根据权利要求6至8中的任意组合所述的方法,还包括:
由所述至少一个结构端点响应于接收到所述第三故障通知数据单元,修改所述至少一个结构端点的配置,以使得所述至少一个结构端点至少暂时停止经由具有所述结构故障的所述第二结构平面发送数据单元。
10.一种交换系统,包括:
多个结构端点;以及
多级交换机结构,所述多级交换机结构具有多个结构平面,每个结构平面具有用于在所述多个结构端点中的任何结构端点之间交换数据单元的多个级,
其中所述多个结构端点中的结构端点被配置为在所述多个结构平面中的第一结构平面内向所述多个级中的第一级的交换机发送去往所述结构端点的自查验消息,并且
其中所述结构端点被配置为响应于确定所述结构端点在预定时间之后尚未接收到所述自查验消息,发送针对所述第一结构平面的连接性故障的指示。
11.根据权利要求10所述的交换系统,还包括用于执行根据权利要求1至5中的任一项所述的方法的装置。
12.一种交换系统,包括:
多个结构端点;
多级交换机结构,所述多级交换机结构具有多个结构平面,每个结构平面具有用于在多个结构端点中的任何结构端点之间交换数据单元的多个级,
其中所述多个结构平面中的第一结构平面的第一级交换机被配置为接收针对所述多个结构平面中的第二结构平面的结构故障的指示,所述第一结构平面不同于所述第二结构平面,
其中所述第一级交换机被配置为向所述第一结构平面的第一末级交换机发送包括所述结构故障的所述指示的第一故障通知数据单元,并且
其中所述第一级交换机被配置为向所述第一结构平面的第二末级交换机发送包括所述结构故障的所述指示的第二故障通知数据单元。
13.根据权利要求12所述的交换系统,还包括用于执行根据权利要求6至9中的任一项所述的方法的装置。
CN201610087847.7A 2015-02-16 2016-02-16 多级交换机结构故障检测和处理 Active CN105897459B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/623,083 2015-02-16
US14/623,083 US9866427B2 (en) 2015-02-16 2015-02-16 Multi-stage switch fabric fault detection and handling

Publications (2)

Publication Number Publication Date
CN105897459A true CN105897459A (zh) 2016-08-24
CN105897459B CN105897459B (zh) 2020-02-11

Family

ID=55405141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610087847.7A Active CN105897459B (zh) 2015-02-16 2016-02-16 多级交换机结构故障检测和处理

Country Status (3)

Country Link
US (3) US9866427B2 (zh)
EP (2) EP3057334B1 (zh)
CN (1) CN105897459B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108259260A (zh) * 2017-01-24 2018-07-06 新华三技术有限公司 链路检测方法及装置
CN109769154A (zh) * 2017-11-10 2019-05-17 丛林网络公司 数据中心分组光学传输失败保护

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9866427B2 (en) 2015-02-16 2018-01-09 Juniper Networks, Inc. Multi-stage switch fabric fault detection and handling
US9967160B2 (en) * 2015-05-21 2018-05-08 International Business Machines Corporation Rerouting data of a streaming application
US10009293B1 (en) 2016-09-30 2018-06-26 Juniper Networks, Inc. Shared memory switch fabric system and method
US10326696B2 (en) 2017-01-02 2019-06-18 Microsoft Technology Licensing, Llc Transmission of messages by acceleration components configured to accelerate a service
US10320677B2 (en) 2017-01-02 2019-06-11 Microsoft Technology Licensing, Llc Flow control and congestion management for acceleration components configured to accelerate a service
US10425472B2 (en) 2017-01-17 2019-09-24 Microsoft Technology Licensing, Llc Hardware implemented load balancing
CN110710139A (zh) 2017-03-29 2020-01-17 芬基波尔有限责任公司 具有光置换器的无阻塞全网状数据中心网络
WO2018183553A1 (en) 2017-03-29 2018-10-04 Fungible, Inc. Non-blocking any-to-any data center network having multiplexed packet spraying within access node groups
CN110731070A (zh) 2017-03-29 2020-01-24 芬基波尔有限责任公司 通过多个交替数据路径进行分组喷射的无阻塞的任意到任意数据中心网络
WO2018191257A1 (en) 2017-04-10 2018-10-18 Fungible, Inc. Relay consistent memory management in a multiple processor system
WO2019014265A1 (en) 2017-07-10 2019-01-17 Fungible, Inc. DATA PROCESSING UNIT FOR CALCULATION NODES AND STORAGE NODES
US10725825B2 (en) 2017-07-10 2020-07-28 Fungible, Inc. Data processing unit for stream processing
WO2019068017A1 (en) 2017-09-29 2019-04-04 Fungible, Inc. RESILIENT NETWORK COMMUNICATION USING SELECTIVE PULVER FLOW SPRAY BY MULTIPATH PATH
US11178262B2 (en) 2017-09-29 2021-11-16 Fungible, Inc. Fabric control protocol for data center networks with packet spraying over multiple alternate data paths
US10841245B2 (en) 2017-11-21 2020-11-17 Fungible, Inc. Work unit stack data structures in multiple core processor system for stream data processing
CN109936518B (zh) * 2017-12-18 2022-02-11 迈普通信技术股份有限公司 交换芯片通道故障的检测方法和分布式机架交换机
WO2019152063A1 (en) 2018-02-02 2019-08-08 Fungible, Inc. Efficient work unit processing in a multicore system
US11750441B1 (en) * 2018-09-07 2023-09-05 Juniper Networks, Inc. Propagating node failure errors to TCP sockets
US10929175B2 (en) 2018-11-21 2021-02-23 Fungible, Inc. Service chaining hardware accelerators within a data stream processing integrated circuit
WO2020107208A1 (zh) * 2018-11-27 2020-06-04 陈翰霖 故障通知方法、装置及设备
US10951527B2 (en) 2018-12-28 2021-03-16 Juniper Networks, Inc. Switch fabric packet flow reordering
US11251245B1 (en) * 2019-01-21 2022-02-15 Xsight Labs Ltd. Responding to a failure of a main die of a switch data-plane device
US11070285B2 (en) * 2019-02-15 2021-07-20 The Boeing Company System and method for configuring a multistage interconnection network based on user traffic demand
US20210037091A1 (en) * 2019-07-30 2021-02-04 Cisco Technology, Inc. Peer discovery process for disconnected nodes in a software defined network
US11316796B2 (en) * 2019-12-30 2022-04-26 Juniper Networks, Inc. Spraying for unequal link connections in an internal switch fabric
US11438217B1 (en) * 2021-02-12 2022-09-06 Dell Products L.P. Storage area network connectivity management using switch fabric conditions

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110228782A1 (en) * 2003-08-21 2011-09-22 Brixham Solutions Ltd. Method for Performing Protocol Translation in a Network Switch
CN102263646A (zh) * 2010-03-23 2011-11-30 丛林网络公司 交换机的分布式控制平面内的多播
CN102487358A (zh) * 2010-12-01 2012-06-06 丛林网络公司 用于与交换机结构相关的流控制的方法和装置
EP2680510A1 (en) * 2012-06-26 2014-01-01 Juniper Networks, Inc. Service plane triggered fast reroute protection

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2041673A5 (zh) * 1969-05-22 1971-01-29 Cit Alcatel
CA2048717A1 (en) 1990-08-17 1992-02-18 Tsutomu Tanaka Growable interconnect fabric cell switch module
US5321813A (en) 1991-05-01 1994-06-14 Teradata Corporation Reconfigurable, fault tolerant, multistage interconnect network and protocol
SG48361A1 (en) 1994-02-04 1998-04-17 Philips Electronics Nv Sorting sequential data prior to distribution over parallel processors in random access manner
JPH11122261A (ja) * 1997-10-17 1999-04-30 Fujitsu Ltd Atm交換機の装置内導通試験装置
US6661773B1 (en) * 1999-06-07 2003-12-09 Intel Corporation Method for detection of stale cells following route changes in a data communication
US7102999B1 (en) 1999-11-24 2006-09-05 Juniper Networks, Inc. Switching device
US6990063B1 (en) * 2000-03-07 2006-01-24 Cisco Technology, Inc. Distributing fault indications and maintaining and using a data structure indicating faults to route traffic in a packet switching system
AU2001243534A1 (en) 2000-03-10 2001-09-24 Tellabs Operations, Inc. Non-consecutive data readout scheduler
US6654373B1 (en) 2000-06-12 2003-11-25 Netrake Corporation Content aware network apparatus
US7200107B2 (en) 2001-01-06 2007-04-03 Mindspeed Technologies, Inc. Method and apparatus for lossless switchover in a redundant switch fabric
US7099330B2 (en) 2001-01-10 2006-08-29 Lucent Technologies Inc. Method and apparatus for integrating guaranteed-bandwidth and best-effort traffic in a packet network
US6658494B2 (en) * 2001-04-20 2003-12-02 Nvision, Inc. Router topology having N on 1 redundancy
US20030063839A1 (en) * 2001-05-11 2003-04-03 Scott Kaminski Fault isolation of individual switch modules using robust switch architecture
US7161902B2 (en) 2001-08-08 2007-01-09 Nortel Networks Limited Reducing network traffic congestion
US7031331B2 (en) 2001-08-15 2006-04-18 Riverstone Networks, Inc. Method and system for managing packets in a shared memory buffer that serves multiple output links
WO2003020810A1 (en) 2001-08-30 2003-03-13 Tellabs Operations, Inc. System and method for communicating data using a common switch fabric
JP2003124956A (ja) 2001-10-10 2003-04-25 Sony Corp 通信制御方法及びネットワークシステム
US8305882B2 (en) * 2001-12-18 2012-11-06 Horizon Technology Funding Company V Llc Methods, systems, and computer program products for detecting and/or correcting faults in a multiprotocol label switching network by using redundant paths between nodes
JP3750612B2 (ja) * 2002-02-13 2006-03-01 日本電気株式会社 リング網におけるパケットプロテクション方法及び伝送装置並びにプログラム
JP4020753B2 (ja) * 2002-10-25 2007-12-12 富士通株式会社 リング切替方法
JP4107083B2 (ja) * 2002-12-27 2008-06-25 株式会社日立製作所 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム
US7606236B2 (en) 2004-05-21 2009-10-20 Intel Corporation Forwarding information base lookup method
US7801125B2 (en) 2004-10-22 2010-09-21 Cisco Technology, Inc. Forwarding table reduction and multipath network forwarding
EP1729458A1 (en) * 2005-06-01 2006-12-06 Thomson Licensing Method for determining connection topology of home network
US7505410B2 (en) 2005-06-30 2009-03-17 Intel Corporation Method and apparatus to support efficient check-point and role-back operations for flow-controlled queues in network devices
US20070053283A1 (en) * 2005-09-06 2007-03-08 International Business Machines Corporation Correlation and consolidation of link events to facilitate updating of status of source-destination routes in a multi-path network
US8050559B2 (en) 2006-08-21 2011-11-01 Juniper Networks, Inc. Multi-chassis router with multiplexed optical interconnects
US8867338B2 (en) * 2006-09-19 2014-10-21 Futurewei Technologies, Inc. Faults Propagation and protection for connection oriented data paths in packet networks
JP2008172517A (ja) 2007-01-11 2008-07-24 Nec Corp 輻輳制御システム、輻輳制御方法、輻輳制御プログラム、及び、プログラム記録媒体
US8144575B2 (en) * 2009-06-30 2012-03-27 Juniper Networks, Inc. Redundant pseudowires for border gateway patrol-based virtual private local area network service multi-homing environments
JP5424754B2 (ja) * 2009-07-13 2014-02-26 株式会社豊田中央研究所 リンク旅行時間算出装置及びプログラム
US8122127B2 (en) * 2009-12-31 2012-02-21 Juniper Networks, Inc. Automatic aggregation of inter-device ports/links in a virtual device
US8325726B2 (en) 2010-02-09 2012-12-04 Juniper Networks, Inc. Data structure-less distributed fabric multicast
US9769016B2 (en) * 2010-06-07 2017-09-19 Brocade Communications Systems, Inc. Advanced link tracking for virtual cluster switching
US8798456B2 (en) * 2010-09-01 2014-08-05 Brocade Communications Systems, Inc. Diagnostic port for inter-switch link testing in electrical, optical and remote loopback modes
CN107071088B (zh) 2011-08-17 2020-06-05 Nicira股份有限公司 逻辑l3路由
KR101516135B1 (ko) * 2011-10-19 2015-04-29 니폰 덴신 덴와 가부시끼가이샤 광 네트워크 시스템
US8953605B1 (en) * 2012-01-03 2015-02-10 Juniper Networks, Inc. Methods and apparatus for a handshake protocol in a LAG-based multipath switch fabric for multipath OAM
US8902780B1 (en) 2012-09-26 2014-12-02 Juniper Networks, Inc. Forwarding detection for point-to-multipoint label switched paths
KR102195366B1 (ko) * 2014-10-15 2020-12-24 한국전자통신연구원 패킷 기반 보호 절체 기능을 구비한 패킷 또는 수동광 네트워크 시스템
US9742489B2 (en) * 2015-01-08 2017-08-22 Nec Corporation Survivable hybrid optical/electrical data center networks using loss of light detection
US9866427B2 (en) 2015-02-16 2018-01-09 Juniper Networks, Inc. Multi-stage switch fabric fault detection and handling
US9654849B2 (en) 2015-05-15 2017-05-16 Huawei Technologies Co., Ltd. System and method for photonic switching
US10164906B1 (en) 2015-09-30 2018-12-25 Juniper Networks, Inc. Scalable switch fabric cell reordering

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110228782A1 (en) * 2003-08-21 2011-09-22 Brixham Solutions Ltd. Method for Performing Protocol Translation in a Network Switch
CN102263646A (zh) * 2010-03-23 2011-11-30 丛林网络公司 交换机的分布式控制平面内的多播
CN102487358A (zh) * 2010-12-01 2012-06-06 丛林网络公司 用于与交换机结构相关的流控制的方法和装置
EP2680510A1 (en) * 2012-06-26 2014-01-01 Juniper Networks, Inc. Service plane triggered fast reroute protection

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108259260A (zh) * 2017-01-24 2018-07-06 新华三技术有限公司 链路检测方法及装置
WO2018137578A1 (zh) * 2017-01-24 2018-08-02 新华三技术有限公司 链路检测
CN108259260B (zh) * 2017-01-24 2020-12-04 新华三技术有限公司 链路检测方法及装置
CN109769154A (zh) * 2017-11-10 2019-05-17 丛林网络公司 数据中心分组光学传输失败保护
CN109769154B (zh) * 2017-11-10 2021-10-08 瞻博网络公司 数据中心分组光学传输失败保护

Also Published As

Publication number Publication date
CN105897459B (zh) 2020-02-11
US20160241430A1 (en) 2016-08-18
EP3451687B1 (en) 2021-01-06
US20180131561A1 (en) 2018-05-10
EP3057334B1 (en) 2018-11-07
US11178001B2 (en) 2021-11-16
US10382254B2 (en) 2019-08-13
EP3057334A1 (en) 2016-08-17
US20190319832A1 (en) 2019-10-17
EP3451687A1 (en) 2019-03-06
US9866427B2 (en) 2018-01-09

Similar Documents

Publication Publication Date Title
CN105897459A (zh) 多级交换机结构故障检测和处理
CN101155109B (zh) 一种以太网交换系统及设备
KR101406922B1 (ko) 공급자 링크 상태 브리징
US7558194B2 (en) Virtual private network fault tolerance
CN100442779C (zh) 一种以太网中的控制系统和数据报文传输方法
CN104811400B (zh) 一种分布式网络设备
EP2608459B1 (en) Router, virtual cluster router system and establishing method thereof
US8650285B1 (en) Prevention of looping and duplicate frame delivery in a network environment
CN108880970A (zh) 端口扩展器的路由信令和evpn收敛
Lee et al. Path layout planning and software based fast failure detection in survivable OpenFlow networks
CN102546351A (zh) openflow网络和现有IP网络互联的系统和方法
CN104798350B (zh) 跨多个架构交换机的虚拟链路聚合的方法和系统
WO2007086157A1 (ja) ネットワークシステム
GB2483563A (en) Dual homing connection of access network to transport network
CN104221336A (zh) 用于虚拟网络架构链路故障恢复的系统和方法
US9054983B2 (en) Centralized control and management planes for different independent switching domains
CN105490937B (zh) 以太虚拟网络网关切换方法和服务商边缘节点设备
US9036644B2 (en) Method of provisioning H-VPLS services in a multi-domain MPLS network
CN106803803B (zh) 虚拟局域网络复原方法、系统及其装置
WO2014075594A1 (zh) 基于多环结构网络相交环的业务的传输保护方法及装置
CN101087240B (zh) 最短路径优先协议中的路由选择方法及其装置
CN102150053A (zh) 用于提供商骨干网桥流量工程的保护
JP5519549B2 (ja) 通信システム、通信制御方法及び通信装置
CN109495286A (zh) 相交环复用段告警检测方法及装置、计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant