CN103107960A - 通过开关卡减少交换结构中交换故障的影响的方法和系统 - Google Patents
通过开关卡减少交换结构中交换故障的影响的方法和系统 Download PDFInfo
- Publication number
- CN103107960A CN103107960A CN2012102339158A CN201210233915A CN103107960A CN 103107960 A CN103107960 A CN 103107960A CN 2012102339158 A CN2012102339158 A CN 2012102339158A CN 201210233915 A CN201210233915 A CN 201210233915A CN 103107960 A CN103107960 A CN 103107960A
- Authority
- CN
- China
- Prior art keywords
- card
- server
- midplane
- switch
- switching module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/161—Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
-
- H—ELECTRICITY
- H05—ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
- H05K—PRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
- H05K7/00—Constructional details common to different types of electric apparatus
- H05K7/14—Mounting supporting structure in casing or on frame or rack
- H05K7/1438—Back panels or connecting means therefor; Terminals; Coding means to avoid wrong insertion
- H05K7/1439—Back panel mother boards
- H05K7/1445—Back panel mother boards with double-sided connections
-
- H—ELECTRICITY
- H05—ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
- H05K—PRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
- H05K7/00—Constructional details common to different types of electric apparatus
- H05K7/14—Mounting supporting structure in casing or on frame or rack
- H05K7/1485—Servers; Data center rooms, e.g. 19-inch computer racks
- H05K7/1488—Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures
- H05K7/1492—Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures having electrical distribution arrangements, e.g. power supply or data communications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/18—Packaging or power distribution
- G06F1/183—Internal mounting support structures, e.g. for printed circuit boards, internal connecting means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明涉及通过开关卡减少交换结构中交换故障的影响的方法和系统。公开了用于减少交换结构中的交换故障的影响的技术。在一个实施例中,提供一种服务器系统,包括中平面,一个或多个服务器卡以及一个或多个开关卡。所述中平面可包括用于交换结构的结构互连。所述一个或多个服务器卡可与所述中平面耦接,其中每个服务器卡可从所述中平面热插拔。所述一个或多个开关卡还可与所述中平面耦接,其中每个开关卡还可从所述中平面热插拔。每个开关卡包括一个或多个交换模块,以及每个交换模块被配置成为至少一个服务器卡交换网络业务。
Description
技术领域
本发明涉及计算机体系结构,具体地,涉及用于通过开关卡(switch card)减少交换结构中交换故障的影响的方法和系统。
背景技术
尽管早期计算机体系结构使用独立的单一计算机(通常被成为个人计算机(PC)),但是更强大的现代计算机系统通常使用在公共机箱(common chassis)内耦接在一起的多个计算机。示例的公共机箱被称作刀片机箱(blade chassis),其包括通过刀片机箱内的公共骨干(common backbone)耦接的多个服务器刀片。每个服务器刀片是可插入板,包括至少一个处理器、片上存储器以及输入/输出(I/O)接口。多个服务器刀片被配置成彼此通信以及共享公共资源,例如存储装置、监视器、输入装置等。此外,一个或多个刀片机箱可以构成刀片系统,所述刀片系统通常专用于单个企业和/或特定功能,例如处理借款、管理工资单等。
发明内容
本发明的一个实施例提供了一种系统,所述系统包括:中平面、与所述中平面耦接的一个或多个服务器卡、以及与所述中平面耦接的一个或多个开关卡。所述中平面包括用于交换结构的结构互连。每个服务器卡可从所述中平面热插拔。所述一个或多个开关卡可操作地连接至所述一个或多个服务器卡。每个开关卡可从所述中平面热插拔并且包括一个或多个交换模块。每个交换模块被配置成为所述一个或多个服务器卡中的至少一个服务器卡交换网络业务。第一开关卡的第一交换模块被配置成一旦包括在第一开关卡和第二开关卡之一中的第二交换模块故障时为所述一个或多个服务器卡交换网络业务。
本发明的另一实施例提供了一种交换模块,所述交换模块包括计算机处理器和存储器。所述存储器存储管理固件,所述存储管理固件当在所述计算机处理器上被执行时,执行包括为服务器系统中的第一服务器卡交换网络业务的操作。所述操作还包括一旦为第二服务器卡交换网络业务的第二交换模块故障时,为所述第二服务器卡交换网络业务。所述交换模块包括在第一开关卡中。所述第二交换模块包括在第一开关卡和第二开关卡之一中。每个开关卡和每个服务器卡与中平面耦接。所述中平面包括用于交换结构的结构互连。每个插卡可从所述中平面热插拔,以及每个服务器卡可从相应的插卡热插拔。
本发明的另一实施例提供了一种计算机实现方法,包括:在包括中平面、与所述中平面耦接的一个或多个服务器卡和与所述中平面耦接的一个或多个开关卡的系统中,检测第一开关卡的第一交换模块已经故障。所述一个或多个服务器卡可操作地连接至所述一个或多个开关卡。所述中平面包括用于交换结构的结构互连。每个开关卡包括一个或多个交换模块。每个交换模块被配置成为所述一个或多个服务器卡中的至少一个服务器卡交换网络业务。每个服务器卡和每个开关卡可从所述中平面热插拔。所述操作还包括一旦检测到所述第一开关卡的所述第一交换模块故障时,则通过包括在第一开关卡和第二开关卡之一中的第二交换模块为所述一个或多个服务器卡交换网络业务。
附图说明
通过参考附图对上面简单概括的本发明的实施例的更具体的描述,上述方面被实现的方式可以更具体地理解。
然而,注意附图仅示意了本发明的典型实施例,并不应被认为限制本发明的范围,因为本发明可以得到其他等同效果的实施例。
图1是根据本发明的一个实施例的具有访问服务器系统的多个主机的计算环境的框图。
图2示出了根据本发明的一个实施例的插卡(interposer card)可操作地连接至服务器系统中的服务器卡的结构。
图3示出了根据本发明的一个实施例的插卡可操作地连接至服务器系统中的两个服务器卡的结构。
图4示出了根据本发明的一个实施例的被配置成减少维修动作对交换模块的影响的服务器系统。
图5还示出了根据本发明的一个实施例的被配置成减少维修动作对交换模块的影响的服务器系统。
图6示出了根据本发明的一个实施例的用于服务器系统的交换结构。
图7示出了根据本发明的一个实施例的具有与多个插卡耦接的中平面的服务器系统。
图8示出了根据本发明的一个实施例的包括多个框架的服务器系统。
图9示出了根据本发明的一个实施例的包括多个框架的服务器系统,其中每个框架具有四个机箱。
图10示出了根据本发明的一个实施例的被封装成包括插入互连(interposer interconnect)的服务器系统。
图11示出了根据本发明的一个实施例的去除作为一对存储ITE中的SPOF的交换模块的服务器系统的结构。
图12示出了根据本发明的一个实施例的一对互连插卡的结构。
图13示出了根据本发明的一个实施例的包括多个开关卡的服务器系统的结构。
图14示出了根据本发明的一个实施例的包括多个开关卡的服务器系统的结构的逻辑视图。
图15示出了根据本发明的一个实施例的包括多个开关卡的服务器系统的结构。
图16是描述根据本发明的一个实施例的用于减少交换结构中交换故障的影响的方法的流程图。
图17是描述根据本发明的一个实施例的用于消除作为SPOF的交换模块的方法的流程图。
具体实施方式
本发明的实施例减少交换结构中交换故障的影响。如在此所使用的,交换结构表示网络节点通过一个或多个网络交换机彼此连接的网络拓扑。在一个实施例中,提供了一种服务器系统,所述服务器系统包括中平面,第一插卡(interposer card),以及一个或多个服务器卡,每个服务器卡对应于一个或多个网络节点。在一个实施例中,每个服务器卡可以是服务器刀片(也被称作刀片服务器或刀片)。尽管参考第一插卡进行描述,但是中平面可以被配置成与多个插卡耦接。第一插卡布置在中平面和一个或多个服务器卡之间,由此可操作地将中平面连接至一个或多个服务器卡。此外,第一插卡包括为一个或多个服务器卡交换网络业务的交换模块。第一插卡可从中平面热插拔,以及一个或多个服务器卡可从第一插卡热插拔。
在一个实施例中,当交换模块故障时,交换模块可以使用最小化或减少对交换结构的影响的维修动作来替换。该维修动作包括用包括功能交换模块的第二插卡替换第一插卡,以及通过在服务器系统上执行的配置工具来将第二插卡重新并入网络结构中。由于服务器系统的封装以及插卡和服务器卡的热插拔特性,维修动作可以被执行而不扰乱服务器系统或交换结构-例如,不断电或重启服务器系统和/或交换结构。在交换结构提供连接性冗余时,维修动作还可最小化或减少对所提供的冗余的影响。因此,维修动作的影响被本地化至服务器卡。换句话说,维修动作对交换结构的影响仅限于第一插卡和/或服务器卡的范围;服务器系统和交换结构,即可操作地连接至中平面的其他插卡和服务器卡保持运行。优点是,与要求断电服务器系统和/或交换结构来替换交换模块(即通过替换中平面或通过替换与中平面耦接的非热插拔开关卡)相比,维修动作的影响被减少了。服务器系统和/或交换结构的可用性因此被提高,进而减少了与维修动作相关的成本。
在一个实施例中,服务器系统和/或交换结构的可用性-或其冗余特性可以相对于要求替换中平面来纠正故障交换模块的服务器系统的第二封装被改进。例如,服务器系统的第二封装可以包括互连在与中平面耦接的单个卡(或平板)上的一个或多个交换芯片。将单个卡耦接至中平面可以提供增加数量的端口,提供增加的带宽,和/或改进交换结构的可用性。服务器系统的第二封装还可以包括通过多个交换芯片的多个冗余路径,从而服务器系统可以在交换芯片故障时继续运行。然而,影响单个卡至平板的其他故障可能导致部分或甚至整个交换结构停止工作。其他故障的示例包括功率部件故障、电压调节模块(VRM)故障、电源层短路等。
在一个实施例中,即使交换结构可以在存在一个或多个故障交换芯片时保持运行,但是对一个或多个故障交换芯片的维修动作可能要求替换单个卡、平板和/或中平面,这就导致在维修动作过程中由中平面支持的交换结构的至少部分操作丢失。为了避免在维修动作中丢失操作,服务器系统可以被配置为包括第二完全冗余单个卡(或平板)。可替换地,可以使用在此披露的技术来封装服务器系统以减少维修动作对交换结构的影响,同时避免使用第二完全冗余单个卡或平板配置服务器系统的费用。因此,服务器系统的可用性可以被提高,因为单点故障(SPOF)和/或单点维修(SPOR)被减少或最小化。在服务器系统可以在存在任何部件故障时继续运行时,可以说SPOF被去除了。
在一个实施例中,服务器系统可以被封装成包括在第一插卡和第二插卡之间的互连。该互连在此可以被称作插入互连或交换互连。插入互连可以包括第一插卡的网络适配器和第二插卡的网络适配器之间的缆线,其中该缆线在中平面外部。因此,如果第一插卡的交换模块故障,则第二插卡的交换模块除了管理第二插卡的服务器卡之外,还可以代表故障插卡管理服务器卡的网络业务。因此,封装服务器系统以包括插入互连去除了作为SPOF的第一插卡的交换模块。换句话说,第一插卡的服务器卡保持与交换结构和/或其冗余的连接性,即使第一插卡的交换模块故障。根据在此所述的实施例封装服务器系统减少和/或消除了SPOR和SPOF。
在替换实施例中,封装服务器系统以包括一个或多个与中平面耦接的开关卡消除了作为SPOF的交换模块。中平面包括用于交换结构的结构互连。该开关卡与中平面的第一面耦接,以及一个或多个服务器卡与中平面的第二面耦接。此外,开关卡可以沿第一轴排列,以及服务器卡沿第二轴排列。第一轴和第二轴可以彼此垂直。例如,开关卡可以与中平面的第一面水平耦接,以及服务器卡可以与中平面的第二面垂直耦接,或反之亦然。交换结构包括将每个开关卡与每个服务器卡连接的布线,和/或将开关卡彼此连接的布线。这样做提供了冗余路径来减少和/或消除交换结构中的SPOR和/或SPOF,以及(至少一些情况下)减少所需布线的总数量。有利地,作为SPOF的交换模块可以被去除,而不要求任何插卡或相关布线。
下面参考本发明的实施例。然而,应该理解,本发明不限于具体描述的实施例。相反,下面特征和元件的任意组合,不论与不同实施例相关与否,都被认为执行和实施本发明。此外,尽管本发明的实施例可以相对于其他可能的解决方案和/或相关技术可以实现多个优点,但是特定优点是否由给定实施例实现并不限制本发明。因此,下面的各个方面、特征、实施例和优点仅是示例性的,并不被认为是所附权利要求的元素或限定,除非在权利要求中明确说明。类似的,引用“本发明”不应被解释为概括了在此披露的任何发明主题,并且不应被认为是所附权利要求的元素或限定,除非在权利要求中明确说明。
如本领域技术人员应该理解的,本发明的各个方面可以实施为系统、方法和计算机程序产品。因此,本发明的各个方面可以采用完全硬件实施例、完全软件实施例(包括固件、常驻软件、微代码等)、或组合软件和硬件方面(在此可以被统称为“电路”、“模块”或“系统”)的实施例的形式。此外,本发明的各个方面可以采用嵌入在一个或多个其上嵌入有计算机可读程序代码的计算机可读介质中的计算机程序产品的形式。
可以使用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质例如但不限于电子、磁性、光、电磁、红外线或半导体系统、设备或装置或上述任意适当组合。更具体的计算机可读存储介质示例(非穷举列表)可以包括:具有一个或多个电线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光纤、便携式光盘只读存储器(CD-ROM)、光存储装置、磁存储装置或上述的任意适当组合。在该文档的上下文中,计算机可读存储介质可以是任何有形介质,可以包含或存储供指令执行系统、设备或装置使用或与其结合使用的程序。
计算机可读信号介质可以包括传播数据信号,所述传播数据信号具有嵌入在其中(例如,在基带或部分载波中)的计算机可读程序代码。这样的传播信号可以采用多种形式中的任意一种,包括但不限于电磁、光学或其任何适当组合。计算机可读信号介质可以是任何计算机可读介质,其不是计算机可读存储介质并且能够传递、传播、或运送供指令执行系统、设备或装置使用或与其结合使用的程序。
嵌入在计算机可读介质上的程序代码可以使用任何适当介质被传递,包括但不限于无线、有线、光纤缆线、RF等或上述的任意适当组合。
用于实现用于本发明的各个方面的操作的计算机程序代码可以以一种或多种编程语言的任意组合编写,所述编程语言包括面向对象的编程语言,例如Java、Smalltalk、C++或类似语言,以及传统程序化编程语言,例如C编程语言或类似的编程语言。程序代码可以完全在用户计算机上执行、部分在用户计算机上执行、作为独立软件包执行、部分在用户的计算机上部分在远程计算机上执行、或完全在远程计算机或服务器上执行。在后面的情景下,远程计算机可以通过任何类型的网络连接至用户的计算机,包括局域网(LAN)或广域网(WAN)、或可以连接至外部计算机(例如,通过使用因特网服务提供商的因特网)。
下面参考根据本发明的方法、设备(系统)和计算机程序产品的流程示意图和/或框图来描述本发明的各个方面。应该理解,流程示意图和/或框图的每个块、以及流程示意图和/或框图中的块的组合可以被计算机程序指令实现。这些计算机程序指令可以被提供至通用目的计算机、特殊目的计算机或其他程序数据处理设备的处理器,以产生机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于执行流程图和/或框图示意块或多个块中指定的功能/动作的装置。
这些计算机程序指令还可以存储在计算机可读介质中,其可以指示计算机、其他可编程数据处理设备或其他装置以特定方式工作,从而存储在计算机可读介质中的指令生产出包括执行在流程图和/或框图块中指定的功能/动作的指令的制品,。
计算机程序指令还可以加载在计算机上、其他可编程数据处理设备、或其他装置上来使得一系列操作步骤在计算机、其他可编程设备或其他装置上执行,来产生计算机执行过程,从而在计算机或其他可编程设备上执行的指令提供执行在流程图和/或框图块中指定的功能/动作。
图中示出的流程图和框图示例了根据本发明的各种实施例的系统、方法和计算机程序产品的可能实施方案的体系结构、功能和操作。在这点上,流程图或框图中的每个块可以表示模块、代码的片段或部分,其包括用于执行特定逻辑功能的一个或多个可执行指令。还应该注意,在一些可替换实施方式中,在块中指出的功能可以以不同于图中指出的顺序发生。例如,连续示出的两个块事实上可以基本同时被执行,或者块有时以相反的顺序被执行,这取决于所涉及的功能。还应该注意,框图和/或流程示意图中的每个块以及框图和/或流程示意图中的块的组合可以被特定目的的基于硬件的系统实现,来执行特定功能或动作,或特定目的硬件和计算机指令的组合。
图1是根据本发明的一个实施例的具有多个访问服务器系统102的主机的计算环境100的框图。尽管为了简洁仅示出了三个主机134a、b、n,但是本领域技术人员应该理解更多的主机可以访问服务器系统102。主机134a、b、n通过网络结构132连接至服务器系统102。根据该实施例,每个主机134a、b、n可以作为访问由服务器系统102提供的功能的客户端,和/或可以提供服务器系统102外部的相应服务器功能。网络结构132可以是电信网和/或广域网(WAN)。在特定实施例中,网络结构132是因特网。服务器系统102包括容纳服务器刀片104a、b、n的机箱。服务器刀片104a、b、n耦接至中平面123,其提供了服务器刀片104a、b、n之间的机械和逻辑连接(例如,数据和控制信号交换)。尽管示出了三个服务器刀片104a、b、n,但是本领域技术人员应该理解更多的服务器刀片可以连接至中平面123。此外,尽管在此参考刀片系统描述了各实施例,但是可以广泛预料其他形状因数或物理结构(例如支架系统)。
此外,尽管在此参考耦接至中平面123的服务器刀片104a、b、n描述了各实施例,但是本领域技术人员应该理解,更一般地服务器刀片可以耦接至用作机箱的骨干的任何印刷电路板(PCB),例如底板、母板等。此外,尽管在此参考具有单个机箱的服务器系统102描述了各实施例,但是本领域技术人员应该理解在其他实施例中,服务器系统102可以包括多个机箱。例如,在替换实施例中,服务器系统102可以是包括至少两个刀片机箱的刀片系统,每个刀片机箱具有多个刀片。
在一个实施例中,服务器系统102还包括一个或多个管理模块124。在所述实施例中,服务器系统102包括主管理模块124a和备用管理模块124b。每个管理模块124能够管理多个服务器刀片104。在正常操作过程中,管理模块124之一可操作地通过局域网(LAN)122、中平面123以及每个服务器刀片104的基板管理控制器(BMC)110连接至服务器刀片104以形成带内管理路径。在一个实施例中,网络结构132用作LAN 122的延伸。LAN 122和BMC110将在下面进一步讨论。
在一个实施例中,中平面123安装在服务器系统102的机箱的中央,并且包括其他电子装置或卡(包括服务器刀片104)可以被插入的电路和套接字112。中平面123包括至少一个总线,用于保证经由BMC 110以及管理模块124和服务器刀片104之间和/或服务器刀片104本身之间的带内通信。
在一个实施例中,当服务器刀片104被插入特定套接字112时,为服务器刀片104建立物理地址。例如,假设服务器刀片104a被插入套接字112a。在一个实施例中,控制逻辑116a检测到在套接字112a中存在服务器刀片104a。控制逻辑116a可以符合电子工业协会(EIA)的用于数据通信的RS485标准。在其他实施例中,控制逻辑116a可以符合Phillips公司的IC间(集成电路间,或I2C)标准或符合以太网标准。控制逻辑116a与管理模块124a结合操作,以响应于服务器刀片104a插入套接字112a,将中平面123中的总线上的物理地址分配给服务器刀片104a。如图所示,每个服务器刀片104与可操作地连接至中平面123的相应控制逻辑116相关。在替换实施例中,多个服务器刀片104可以共享单个控制逻辑116。
在一个实施例中,给每个服务器刀片104分配中平面123上的唯一网际协议(IP)地址。即,中平面123可以支持使用IP寻址协议的双向通信,其中可操作地连接至中平面123的每个装置具有由或者位于服务器系统102的机箱内部或外部的逻辑(未示出)分配的IP地址。例如,动态主机配置协议(DHCP)服务器可以用于将IP地址分配给服务器刀片104a。其后与服务器刀片104a的通信通过与服务器刀片104a相关的网络接口控制器(NIC)114a发生。NIC 114a可以是任何类型的网络通信装置,允许服务器刀片104a经由LAN122和/或网络结构132与其他服务器刀片104b、n和/或计算机通信。
在一个实施例中,集成模块126a可操作地连接至NIC 114a。该集成模块126a可以(例如,与集成模块126b)成对使用以提供冗余。如已知的,小型计算机系统接口(SCSI)表示一组用于在计算机和外围设备之间物理连接和传输数据的标准。在一个实施例中,集成模块126包括交换模块128,例如串行SCSI(SAS)交换模块。该交换模块128为服务器刀片104提供至以太网、以太网光纤通道(FCoE)、SAS等的连接性。在一个实施例中,每个交换模块128是交换芯片。根据该实施例,集成模块126还可以包括独立磁盘冗余阵列(RAID)控制器130。每个RAID控制器130互连至RAID装置,例如RAID结构中的存储装置。RAID装置可以位于一个或多个服务器刀片104中。RAID控制器130和RAID装置可以被统一看做服务器系统102的RAID子系统。
在一个实施例中,每个存储装置可以是永久存储装置。此外,每个存储装置可以是固定和/或可移除存储装置的组合,例如,固定磁盘驱动器、软盘驱动器、磁带驱动器、可去除存储卡、固态驱动器或光存储器。存储器108和存储装置可以是横跨多个主要和次要存储装置的一个虚拟地址空间的一部分。
在一个实施例中,每个服务器刀片104可以具有至少一个中央处理单元(CPU)106和存储器108。所包括的CPU 106代表单个CPU、多个CPU、具有多个处理核的单个CPU以及类似物。类似的,存储器108可以是随机存取存储器。尽管存储器108被示出为单个体,但是应该理解存储器108可以包括多个模块,以及存储器108可以存在多个等级,从高速寄存器和高速缓冲器至较低速但是较大的DRAM芯片。存储器108可以是闪存只读存储器(闪存ROM或闪存存储器),其可以在被称作“块”的存储单元中被擦除和重新编程。存储器108还可以包括类似于闪存的非易失性电可擦除可编程只读存储器(EEPROM),除了EEPROM是以字节等级来擦除和重写的并且容量通常较小。每个服务器刀片104可以被定位为处理器刀片或存储刀片。处理器刀片包括一个或多个处理装置,而存储刀片包括多个集成存储装置,例如磁盘驱动器。
在一个实施例中,当服务器刀片104是由制造商组装时,存储器108可以预烧有固件,所述固件包括基本输入/输出系统(BIOS)和用于监视服务器刀片104的软件。监视可以包括控制存储装置、监视和控制整个系统的电压、确定服务器刀片104的电源开启状态、请求访问共享键盘、视频、鼠标、光盘只读存储器(CD-ROM)和/或软盘驱动器、监视运行在服务器刀片104上的操作系统(OS)等。操作系统的示例包括UNIX、各种版本的微软操作系统、以及分布式Linux操作系统。更通用地,可以使用支持在此公开的功能的任何操作系统。
在一个实施例中,管理模块124能够检测系统中每个服务器刀片104、功率模块118以及中平面123在系统中的存在、数量、类型以及修订级别。管理模块124还直接控制每个服务器刀片104和功率模块118的操作。管理模块124还可以直接控制冷却风扇120和服务器系统102的机箱中的其他部件的操作。直接控制操作必然导致不使用服务器刀片104中的BIOS控制操作。在替换实施例中,管理模块124可以使用BIOS间接控制冷却风扇120和服务器系统102的机箱中的其他部件的操作。
在一个实施例中,每个服务器刀片104包括基板管理控制器(BMC)110,所述基板管理控制器110提供与BMC 110相关的服务器刀片104的本地管理控制。每个BMC 110被配置为通过使用LAN 122的通信路径(即,通过带内网络)或可选的通过使用交换模块128和NIC 114(即,通过带外网络)与管理模块124通信。管理模块124可以使用LAN 122中的多个通信路径,例如RS485路径、LAN路径、以及I2C路径,来与每个服务器刀片104通信。
在一个实施例中,LAN 240是也符合电子工业协会(EIA)的用于数据通信的RS485标准的带内网络。管理模块124,例如主要管理模块124a或如果主要管理模块124a失效时的备用管理模块124b,通过LAN 122与BMC 110通信,BMC 110包括用于协调通过套接字112与服务器刀片104的通信的逻辑。
在一个实施例中,LAN 122可以被配置为允许服务器刀片104和与远程BIOS设置和BIOS管理相关的管理模块124之间的通信。服务器刀片104可以使用BMC 110作为代理来通过RS485协议与管理模块124通信。类似的,管理模块可以使用BMC 110作为代理来通过RS485协议与服务器刀片104通信。在替换实施例中,RS485连接可以在每个服务器刀片104和管理模块124之间分开建立。此外,可以在交换模块128上使用其他通信协议和路径,例如I2C、TCP/IP、以太网、FCoE等。
根据该实施例,服务器系统102还可以可操作地连接至输入装置和/或输出装置。输入装置可以是用于向服务器系统102提供输入的任何装置。例如,可以使用键盘、键区、光笔、触摸屏、跟踪球或语音识别单元、音频/视频播放器等等。输出装置可以是用于向服务器系统102的用户提供输出的任何装置。例如,输出装置可以是任何传统显示屏或扬声器组,连同他们各自的接口卡,即视频卡和声卡。此外,输入装置和输出装置可以被组合。例如,可以使用具有集成触摸屏的显示屏、具有集成键盘的显示器、或与文字语音转换器组合的语音识别单元。
图2示出了根据本发明的一个实施例的插卡可操作地连接至服务器系统中的服务器卡的结构200。根据该实施例,插卡还可以耦接至服务器卡和/或中平面。如上所述,在一个实施例中,为了减少维修动作对故障交换模块的影响,服务器系统被配置为包括中平面123和服务器卡202,其中中平面和服务器卡202通过一个或多个插卡204可操作地连接。每个服务器卡202可以对应于服务器刀片104。每个插卡204是可热插拔的并且包括一个或多个交换模块206。交换模块206为可操作地与各个插卡连接的一个或多个服务器卡202交换网络业务。
在一个实施例中,服务器系统被配置为检测交换模块206的故障。一旦检测到交换模块206的故障,服务器系统可以输出显示一个对交换模块206执行维修动作的指示。例如,该指示可以在图形用户界面(GUI)窗口中输出显示,或作为报警向用户发送电子邮件。根据该实施例,检测和/或输出可以由服务器系统的任意部件实现,例如服务器卡202、交换模块206和/或包含在服务器系统中的固件。例如,在一个实施例中,服务器系统包括监视服务器系统的健康以及检测交换模块206的故障的管理固件。
因此,当交换模块206故障时,包括交换模块206的插卡204可以被具有功能交换模块的插卡替换。此外,插卡204可以不要求服务器系统和/或交换结构被断电或重新启动就可以被替换,这是因为插卡、服务器卡和/或中平面的可热插拔特性。具有功能交换模块的插卡然后可以通过配置工具被重新集成在交换结构中。根据该实施例,配置工具可以在服务器系统或通过网络结构132连接至服务器系统的其他计算机上执行。
因此,在替换具有故障交换模块的插卡的过程中,仅故障交换模块和相关服务器卡是从网络结构不能达到的。在替换具有故障的交换模块的插卡的过程中,可操作地连接至中平面的其他交换模块和/或服务器卡保持可以达到。因此,维修动作对故障交换模块的影响局限于与故障交换模块相关的服务器卡。换句话说,在维修动作期间从网络结构不可达到的网络节点仅是与可操作地连接至故障交换模块的服务器卡相关的网络节点。
图3示出了根据本发明的一个实施例的插卡可操作地连接至服务器系统中的两个服务器卡的结构300。如图所示,插卡204包括交换模块206以及两个融合网络适配器(CNA)302。两个服务器卡202可以每个还包括两个CPU 106和CNA 304。在一个实施例中,CPU106连接至具有CNA的FCoE,其包括光纤通道主机总线适配器(HBA)以及以太网NIC功能。CNA可以包括一个或多个物理以太网端口并且可以被配置为从CPU 106卸载通常由光线通道主机总线适配器执行的低等级帧处理和/或SCSI协议功能。如上所述,交换模块206为服务器卡202交换网络业务。如果交换模块206故障,则结构300允许在不要求重新启动与中平面耦接的其他插卡的服务器卡的情况下替换交换模块206。
图4示出了根据本发明的一个实施例的用于减少维修动作对交换模块的影响的服务器系统400。如图所示,服务器系统400包括被配置成跨接处理器信息技术元件(ITE)404和I/O ITE 406的逻辑服务器402。如在此所使用的,ITE通常表示任何被配置成可操作地连接至中平面123的装置。在替换实施例中,逻辑服务器402可以被配置为跨接存储ITE 408。I/O ITE 406和存储ITE 408被配置为分别为一个或多个处理器ITE提供额外的I/O容量和存储容量。根据该实施例,每个ITE 404、406、408可以被集成为一个或多个服务器刀片的一部分,或可以作为独立卡与中平面123耦接。处理器ITE 404包括一个或多个虚拟机410、系统管理程序(hypervisor)412、存储器414、处理器416和硬盘驱动器418。I/O ITE 406包括共享I/OITE部件422以及I/O适配器424,而存储ITE 408包括共享存储ITE部件426以及固态驱动器428。
在一个实施例中,服务器刀片404和ITE 406、408每个还包括交换模块206。每个交换模块206可以是交换芯片并且可以包括在布置在中平面123和处理器ITE 404和/或ITE 406、408之间的插卡(未示出)中。共同地,交换模块206提供交换结构432。处理器ITE 404的交换模块2061的故障(由符号X 430表示)仅影响处理器ITE 404,并且不影响可操作地连接至中平面123的其他ITE。因此,配置为跨接I/O ITE 406和/或存储ITE 408的其他逻辑服务器保持运行,以及交换结构432中的连接性保持大部分操作,即,除了至处理器ITE 404的连接性。根据该实施例,保持可操作的交换结构432中的连接性还可以包括交换结构432中的冗余连接性。此外,可以在不影响其他ITE、逻辑服务器和/或交换结构432的情况下,替换交换模块2061。因此,交换结构432的可用性可以被改进。
图5还示出了根据本发明的一个实施例的用于减少维修动作对交换模块的影响的服务器系统500。如图所示,服务器系统500包括被配置成跨接第一处理器ITE 404和I/O ITE 406的第一逻辑服务器402。服务器系统500还包括被配置成跨接第二处理器ITE 504和I/O ITE 406的第二逻辑服务器502。在替换实施例中,第一逻辑服务器402和/或第二逻辑服务器502还可以被配置成跨接存储ITE408。ITE 404、406、408、504每个都包括交换模块206。处理器ITE 404的交换模块2061的故障(由符号X 506表示)仅影响第一处理器ITE 404而不影响第二处理器ITE 504。因此,在交换模块2061的故障和/或替换过程中,第二处理器ITE 504、I/O ITE 406和存储ITE 408保持操作以及保持至交换结构的连接性。
图6示出了根据本发明的一个实施例的用于服务器系统的交换结构432。如图所示,交换结构432包括多个交换模块206,每个包括在相应的插卡204中。每个插卡204可操作地将两个服务器卡202连接至交换结构432。根据该实施例,交换模块可以通过容纳在中平面中的布线、中平面外部的缆线或其组合,在交换结构中彼此连接。此外,一个或多个交换模块206可以与装置602耦接,而不与服务器卡202耦接。装置602的示例包括网络装置、存储装置和I/O装置。因此,交换模块206的故障和/或替换仅影响与交换模块206耦接的服务器卡202并且不影响交换结构432的剩余部分和/或其他服务器卡。
图7示出了根据本发明的一个实施例的具有与多个插卡204耦接的中平面123的服务器系统700。每个插卡204包括交换模块206,并且可操作地将一个或两个服务器卡202连接至中平面123。中平面包括连接交换模块206以形成交换结构的结构布线。服务器系统700被配置为使得服务器卡202可与插卡204热插拔。服务器系统700还被配置为使得插卡204可与中平面123热插拔。因此,服务器系统700的封装和热插拔特性使得故障的交换模块206可以被替换,同时最小化或减少对服务器系统700和/或交换结构的影响。
图8示出了根据本发明的一个实施例的包括多个框架804的服务器系统800。每个框架包括通过机箱连接卡806和相关缆线808可操作地连接的一个或多个机箱802。此外,机箱802可以通过框架连接卡810和相关缆线812跨两个框架可操作地连接。每个机箱802根据在此公开的技术容纳通过插卡204与一个或两个服务器卡202耦接的中平面123。每个插卡204包括交换模块206,用于为服务器卡202交换业务。中平面123包括用于互连交换模块206的结构布线。交换模块206、结构布线、机箱连接卡806和相关布线808以及框架连接卡810和相关布线812一起形成用于服务器系统800的交换结构。换句话说,用于服务器系统800的交换结构包括交叉机箱(cross-chassis)和交叉框架(cross-frame)互连。因此,交换模块206的故障和/或替换(由符号X 814表示)仅从交换结构去除了相关服务器卡202。因此其他服务器卡的操作和/或交换结构的连接性在交换模块206的故障和/或替换过程中被保持。
图9示出了根据本发明的一个实施例的包括多个框架,每个框架具有四个机箱802的服务器系统900。每个框架中的机箱可以通过机箱内缆线904可操作地连接。来自不同框架的机箱可以通过框架间缆线906可操作地连接。根据在此披露的技术,每个机箱容纳具有结构布线的中平面,具有交换模块的至少一个插卡,以及至少一个服务器卡。交换模块、结构布线、机箱间缆线904、以及框架间缆线906和任何相关连接卡一起形成用于服务器系统900的交换结构。服务器系统900因此在交换模块的故障和/或替换过程中被配成增加交换结构和/或服务器系统900的可用性。
图10示出了根据本发明的一个实施例的被封装为包括插入互连的服务器系统1000。如上所述,服务器系统1000的封装可以包括至少第一插卡和第二插卡之间的插入互连1006。以及每个插卡包括与两个服务器卡202耦接的交换模块206。插入互连1006可以包括第一插卡的网络适配器和第二插卡的网络适配器之间的缆线。这样的缆线本身可以在中平面的外部。每个网络适配器可以是相应插卡的CNA 302或相应服务器卡的CNA 304。服务器系统1000还可以包括提供至外部服务器系统和/或存储控制器的连接性的交换模块1002。交换模块1002可以通过一个或多个CNA 1004可操作地连接至交换模块206。
因此,当第一插卡的交换模块2061故障时,第二插卡的交换模块2062除了为第二插卡的服务器卡2023、2024交换网络业务之外,还可以为第一插卡的服务器卡2021、2022交换网络业务。因此,封装服务器系统以包括插入互连1006消除了作为SPOF的第一插卡的交换模块2061。换句话说,第一插卡的服务器卡2021、2022保持至交换结构的连接性和/或保持其冗余,即使在第一插卡的交换模块2061故障时。
在一个实施例中,插卡互连1006还可以包括第二插卡的CNA3023、3024至第一插卡的交换模块2061之间的缆线。这样做除了消除了作为SPOF的交换模块2061,还消除了作为SPOF的第二插卡的交换模块2062。因此,消除了作为SPOF的第一插卡的交换模块2061和第二插卡的交换模块2062。
在一个实施例中,CNA 3024通过缆线连接至交换模块2061,并且为第二插卡提供冗余。因此,当第二插卡的交换模块2062故障时,第一插卡的交换模块2061除了为第一插卡的服务器卡2021和2022交换网络业务之外,还可以为第二插卡的服务器卡2023、2024交换网络业务。
更一般地,将服务器系统1000封装为包括成对插卡之间的插入互连1006消除了作为SPOF的每个插卡的交换模块。每对插卡可以包括根据服务器系统1000的机箱内的预定轴彼此邻近的两个插卡。在替换实施例中,每对插卡位于服务器系统1000的单个支架中。预定轴可以包括x-轴、y-轴、z-轴或适于描述插卡在服务器系统1000的机箱内的相对位置的任意轴。
此外,尽管在此参考互连在一起的成对插卡描述了实施例,但是可以广泛实施其他实施例。例如,在替换实施例中,三个或更多插卡可以以菊花链的方式互连。在该示例中,插入互连包括:(i)第一插卡的CNA和第二插卡的交换模块之间的缆线,(ii)第二插卡的CNA和第三插卡的交换模块之间的缆线,以及(iii)第三插卡的CNA和第一插卡的交换模块之间的缆线。在替换实施例中,插入互连包括第三插卡的CNA和第二插卡的交换模块(而不是第一插卡)之间的缆线。此外,为了提供额外的冗余,每个插卡可以与多个其他插卡互连。例如,插入互连可以包括:(i)第三插卡的第一CNA和第一插卡的交换模块之间的缆线;(ii)第三插卡的第二CNA和第二插卡的交换模块之间的配线。因此,如果交换模块故障分别发生在第二和第三插卡,则第一插卡被配置成为与第三插卡耦接的服务器卡交换网络业务。本领域的技术人员应该理解可以使用在此披露的技术互连任何预定数量的插卡。
图11示出了根据本发明的一个实施例的消除一对存储ITE中的作为SPOF的交换模块206的服务器系统的结构1100。结构1100包括第一存储ITE 11021以及第二存储ITE 11022。每个存储ITE11021、11022可以通过包括交换模块206的插卡204连接至中平面。在替换实施例中,每个存储ITE与中平面耦接并包括交换模块206。如图所示,每个存储ITE包括多个部件,包括功能卡(featurecard)1108、两个扇出卡1104和存储装置1106。每个存储ITE 1102的功能卡1108可以被配置成定制相应存储ITE 1102的功能。例如,功能卡1108可以被配置成将存储ITE定制为RQAID ITE、网络连接的存储(NAS)ITE和/或文件缓存ITE等。每个存储ITE 1102的扇出卡1104为存储ITE 1102提供网络连接性和/或改进相应存储ITE 1102的可用性。每个扇出卡1104包括一个或多个扇出部件1112。每个存储ITE 1102还可以包括可操作地连接相应存储ITE1102的部件的存储互连11101、11102。在一个实施例中,存储互连11101、11102提供存储ITE 1102的部件之间的串行SCSI(SAS)连接性。在替换实施例中,存储互连提供FCoE或串行ATA(SATA)连接性。
在一个实施例中,结构1100还包括交换互连,连同存储ITE1102的存储互连1110之间的缆线。缆线1114可以将第一存储ITE11021的扇出卡11041连接至第二存储ITE 11022的扇出卡11044。根据该实施例,为了提供增加的带宽,交换互连可以包括每个存储ITE1102的其他扇出卡之间的缆线1116。因此,当第一存储ITE 11021的交换模块2061故障时,第二存储ITE 11022的交换模块2062除了为第二存储ITE 11022交换网络业务之外,还可以为第一存储ITE11021交换网络业务。封装存储ITE 1102以包括存储互连1110之间的缆线1114,使用存储ITE 1102的存储互连1110消除了作为SPOF的每个交换模块2061、2062。
图12示出了根据本发明的一个实施例的一对插卡204的结构1200,其中结构1200包括插入互连。代替使用存储互连来消除SPOF,结构1200包括与不同插卡相关的CNA之间的缆线来消除SPOF。每个插卡204包括交换模块206并且可操作地将两个服务器卡202连接至中平面。每个插卡204的交换模块206被配置成为与相应插卡204耦接的服务器卡202交换网络业务。每个插卡204还包括一个或多个CNA 302。每个服务器卡202包括一个或多个CPU106。根据该实施例,每个服务器卡202还包括一个或多个CNA304。插卡202的结构1200还可以包括插卡202之间的缆线1202。缆线1202可以将与第一插卡2041耦接的服务器卡202的CNA3041、3042连接至第二插卡2042的交换模块2062。缆线1202还可以将与第二插卡2042耦接的服务器卡202的CNA 3043、3044连接至第一插卡2041的交换模块2061。
如果第一插卡2041的交换模块2061故障,则第二插卡2042的交换模块2062除了为与第二插卡2042耦接的服务器卡202交换网络业务之外,还为与第一插卡2041耦接的服务器卡202管理网络业务。因此,结构1200消除了作为SPOF的每个交换模块。换句话说,与每个插卡耦接的服务器卡202保留至交换结构的连接性和/或维持其冗余,即使在交换模块206之一故障的情况下。
如上所述,封装服务器系统以包括与中平面耦接的一个或多个开关卡可以消除作为SPOF的交换模块。在这种情况下,中平面包括用于交换结构的结构互连。中平面可以耦接一个或多个(CIE)板,所述机箱互连元件板本身包括一个或多个管理处理子系统。尽管在此参考作为单独部件的开关卡和CIE板描述了实施例,但是根据该实施例,CIE板的一些或所有功能可以被集成在开关卡中。开关卡和/或CIE板可以与中平面的第一面耦接,以及一个或多个服务器卡可以与中平面的第二面耦接。
在一个实施例中,开关卡和/或CIE卡可以沿第一轴排列,以及服务器卡可以沿第二轴排列。此外,第一轴至少基本垂直于第二轴。例如,开关卡可以与中平面的第一面垂直耦接,以及服务器卡可以与中平面的第二面水平耦接,反之亦然。根据该实施例,交换结构包括将每个开关卡与每个服务器卡连接的配线和/或将每个开关卡与每个其他开关卡连接的配线。这样的配线提供了冗余路径来减少和/或消除交换结构中的SPOR和/或SPOF。此外,沿垂直轴将开关卡和服务器卡与中平面耦接可以简化和/或减少所需的配线的数量(至少在一些情况下)。
图13示出了根据本发明的一个实施例的包括多个开关卡1302的服务器系统的结构1300。如图所示,结构1300包括中平面123、服务器卡202和CIE板1304。服务器卡202与中平面123水平耦接,以及开关卡1302和CIE板1304与中平面123垂直耦接。开关卡1302和/或服务器卡202可以从中平面123上热插拔。每个开关卡1302可以包括一个或多个交换模块206,以及每个服务器卡202可以包括一个或多个CPU。
根据该实施例,交换结构可以包括每个开关卡1302或每个交换模块206至每个服务器卡202或每个CPU之间的配线。交换结构还可以包括每个开关卡1302或交换模块206至每个其他开关卡1302或交换模块206之间的配线。因此,结构1300在交换结构中的元件之间提供冗余路径,从而消除了作为交换结构中的SPOF的交换模块206和/或开关卡1302。具体地,服务器卡202在交换模块206或开关卡1302故障时也能保持至交换结构的连接性。此外,对故障交换模块206或开关卡1302的维修动作不影响服务器卡202至交换结构的连接性。维修动作可以包括使用具有功能交换模块的第二开关卡替换开关卡206,并且不重新启动服务器系统和/或交换结构。
图14示出了根据本发明的一个实施例的包括多个开关卡的服务器系统的结构的逻辑视图1400。如图所示,逻辑视图1400包括服务器系统的多个服务器卡202和多个交换模块206、1304。服务器系统还可以包括交换结构的结构互连。交换模块206靠近交换结构中的服务器卡202布置并为服务器卡202提供交换网络业务冗余。交换模块206还可以被称作北交换模块。交换模块1404靠近北交换模块布置并且提供北交换模块和交换结构剩余部分之间的连接性。交换模块1404也可以被称作南交换模块。
在一个实施例中,每个服务器卡202包括两个CPU 106和两个CNA 304。交换结构可以包括每个交换模块206和每个服务器卡202之间的配线1404。交换结构还可以包括局部支架互连1402,其包括交换模块206和交换模块1404之间的配线。根据该实施例,局部支架互连1402还可以包括每个交换模块206和每个其他交换模块206之间的配线,从而提供交换模块206之间的完全连接性。优点在于,该结构消除了交换结构中作为SPOF的每个交换模块206。例如,如果交换模块2061故障,则交换模块2062可以为每个服务器卡202传递网络业务。这样做使得每个服务器卡202保持至交换结构的连接,尽管交换模块2061中有故障。
图15示出了根据本发明的一个实施例的包括多个开关卡1302的服务器系统的结构1500。如图所示,多个开关卡1302每个包括两个交换模块206,或北交换模块。每个交换模块为至少一个服务器卡202管理网络业务。该结构1500包括每个服务器交换模块206和每个服务器卡202的一个子集之间的配线1404。例如,服务器卡202的子集可以包括具有服务器卡2021-7的第一子集和具有服务器卡2028-14的第二子集。结构1500还可以包括交换模块206的每个子集之间的完全配线(未示出)。例如,交换模块206的子集可以包括具有交换模块2061-4的第一子集和具有交换模块2065-8的第二子集。换句话说,开关卡1302和/或服务器卡202可以在交换结构中的配线方面物理划分成多个子集,其中配线提供交换结构中的连接性和/或冗余。结构1500还可以包括跨接交换模块206的子集的配线。
在一个实施例中,开关卡13021,3还包括一个或多个管理处理子系统。该管理处理子系统包括被配置成监视服务器系统和/或交换结构元件的健康状况、配置元件、和/或检测并响应件故障的管理固件。如图所示,管理处理子系统包括输入/输出主控制器(IoMC)和机箱服务元件(CSE)。IoMC管理交换结构中的元件,而CSE包括服务器机箱中的管理部件。此外,IoMC可以通过开关卡1302上的IoMC互连可操作地彼此连接,以提供监视和/或管理交换结构的冗余,其中IoMC互连包括IoMC之间的物理配线。一旦第一IoMC15061故障,第二IoMC 15062可以被配置成替换第一IoMC 15061来提供交换结构监视和/或管理能力。有利地,结构1500消除作为SPOF的每个交换模块206,并且进一步消除交换结构中作为SPOF的每个IoMC 1506。
在一个实施例中,开关卡13022,4还包括交换模块1404或南交换模块。如上所述,南交换模块提供北交换模块和剩余交换结构之间的连接性。每个开关卡1302还包括本地链接(L链接)1502和远距离链接(D链接)1504。L链接1502为开关卡1302提供至单个物理框架中的其他机箱的物理连接性。D链接1504为开关卡1302提供跨过物理框架至其他机箱的物理连接性。因此,交换结构进而包括用于交换结构的元件的其他冗余路径。
图16示出了根据本发明的一个实施例的用于减少交换结构中交换故障的影响的方法1600的流程图。如图所示,方法1600开始于步骤1610,其中服务器系统的提供者封装服务器系统以包括中平面,该中平面包括用于交换结构的结构互连。在步骤1620,服务器系统的提供者还封装服务器系统以包括与中平面耦接的一个或多个服务器卡,其中每个服务器卡可从中平面热插拔。在步骤1630,服务器系统的提供者还封装服务器系统以包括与中平面耦接的一个或多个开关卡,从而所述一个或多个开关卡可操作地连接至所述一个或多个服务器卡。每个开关卡可从中平面热插拔并且包括一个或多个交换模块。每个交换模块被配置成为至少一个服务器卡交换网络业务。在步骤1630之后,方法1600终止。
图17是示出了根据本发明的一个实施例的用于消除作为SPOF的交换模块的方法1700的流程图。如图所示,方法1700开始于步骤1710,其中提供包括中平面、与中平面耦接的一个或多个服务器卡、以及与中平面耦接的一个或多个开关卡的服务器系统,从而所述一个或多个服务器卡可操作地连接至所述一个或多个开关卡。在步骤1720,服务器系统检测第一开关卡的第一交换模块已经故障。例如,该检测可以由服务器系统的管理固件部件来执行。在步骤1730,一旦服务器系统检测到第一开关卡的第一交换模块已经故障,则第二交换模块为所述一个或多个服务器卡交换网络业务,其中第二交换模块被包括在第一开关卡和第二开关卡之一中。在步骤1730之后,方法1700终止。
有利地,本发明的实施例减少了交换结构中的交换故障的影响。本发明的一个实施例是具有中平面的服务器系统,该中平面本身包括用于交换结构的结构互连。服务器系统还可以包括与中平面耦接的一个或多个服务器卡。每个服务器卡可从中平面热插拔。服务器系统还包括一个或多个与中平面耦接的开关卡。并且,该一个或多个开关卡可操作地连接至一个或多个服务器卡。每个开关卡可从中平面热插拔并且包括一个或多个交换模块。每个交换模块被配置成为至少一个服务器卡交换网络业务。
在一个实施例中,为了提供冗余路径,交换结构可以包括每个开关卡和每个服务器卡之间的配线,和/或每个开关卡和每个其他开关卡之间的配线。服务器系统还可以包括被配置成检测和/或响应交换结构中的故障元件的管理固件。因此,当第一开关卡的交换模块故障时,第一开关卡或第二开关卡上的第二交换模块被配置成为由第一开关卡的交换模块支持的服务器卡传递网络业务。因此,服务器系统的该结构消除了作为SPOF的第一开关卡的交换模块。
此外,本发明的一些实施例还减少了维修动作对交换结构的影响。例如,如果第一开关卡的交换模块故障,则可以使用第三开关卡来替换第一开关卡,而不用断电或重新启动服务器系统和/或交换结构。这样做减少了维修动作的影响(至少在一些情况下),并且提高了服务器系统和/或交换结构的冗余。在交换结构提供连接性方面的冗余的情况下,本发明的实施例将服务器系统配置为减少维修动作可能对提供的冗余的影响。
尽管上面针对本发明的实施例,但是本发明的其他和进一步的实施例可以在不背离其基本范围的情况下被设计出,其范围由下面的权利要求确定。
Claims (24)
1.一种系统,包括:
包括用于交换结构的结构互连的中平面;
与所述中平面耦接的一个或多个服务器卡,其中每个服务器卡可从所述中平面热插拔;以及
与所述中平面耦接的一个或多个开关卡,其中所述一个或多个开关卡可操作地连接至所述一个或多个服务器卡,其中每个开关卡可从所述中平面热插拔并且包括一个或多个交换模块,其中每个交换模块被配置成为所述一个或多个服务器卡中的至少一个服务器卡交换网络业务,以及其中第一开关卡的第一交换模块被配置成一旦包括在第一开关卡和第二开关卡之一中的第二交换模块故障时,为所述一个或多个服务器卡交换网络业务。
2.根据权利要求1所述的系统,其中所述一个或多个服务器卡与所述中平面的第一面耦接,以及其中所述一个或多个开关卡与所述中平面的第二面耦接。
3.根据权利要求1所述的系统,其中所述交换结构包括以下至少一种:(i)每个开关卡和每个服务器卡之间的配线,以及(ii)每个开关卡和每个其他开关卡之间的配线。
4.根据权利要求1所述的系统,其中所述一个或多个服务器卡沿第一轴排列在所述中平面上,以及其中所述一个或多个开关卡沿第二轴排列在所述中平面上,以及其中所述第二轴垂直于所述第一轴。
5.根据权利要求4所述的系统,其中所述一个或多个服务器卡与所述中平面的表面侧水平耦接,以及其中所述一个或多个开关卡与所述中平面的第二面垂直耦接。
6.根据权利要求1所述的系统,其中服务器卡和开关卡中至少一个被配置成用功能替换件来替换,而不要求重启系统和不要求重启交换结构。
7.根据权利要求1所述的系统,其中所述系统被配置成将所述功能替换件集成在所述交换结构中,而不要求重启所述系统和不要求重启所述交换结构。
8.根据权利要求1所述的系统,其中所述系统包括刀片系统,其中每个服务器卡包括服务器刀片,以及其中所述网络业务包括以下至少之一:(i)以太网业务,和(ii)以太网光纤通道(FCoE)业务。
9.一种交换模块,包括:
计算机处理器;以及
存储管理固件的存储器,所述管理固件当在所述计算机处理器上被执行时,执行以下操作,所述操作包括:
为服务器系统中的第一服务器卡交换网络业务;以及
一旦为第二服务器卡交换网络业务的第二交换模块故障时,为所述第二服务器卡交换网络业务;
其中所述交换模块包括在第一开关卡中,其中所述第二交换模块包括在第一开关卡和第二开关卡之一中,其中每个开关卡与中平面耦接,其中每个服务器卡与所述中平面耦接,其中所述中平面包括用于交换结构的结构互连,其中每个插卡可从所述中平面热插拔,以及其中每个服务器卡可从相应的插卡热插拔。
10.根据权利要求9所述的交换模块,其中每个服务器卡与所述中平面的第一面耦接,以及其中每个开关卡与所述中平面的第二面耦接。
11.根据权利要求9所述的交换模块,其中所述交换结构包括以下至少之一:(i)每个开关卡和每个服务器卡之间的配线,以及(ii)每个开关卡和每个其他开关卡之间的配线。
12.根据权利要求9所述的交换模块,其中每个服务器卡沿第一轴排列在所述中平面上,以及其中每个开关卡沿第二轴排列在所述中平面上,以及其中所述第二轴垂直于所述第一轴。
13.根据权利要求12所述的交换模块,其中每个服务器卡与所述中平面的表面侧水平耦接,以及其中每个开关卡与所述中平面的第二面垂直耦接。
14.根据权利要求9所述的交换模块,其中服务器卡和开关卡中至少一个被配置成由功能替换件来替换,而不要求重启系统和不要求重启交换结构。
15.根据权利要求9所述的交换模块,其中所述服务器系统被配置成将所述功能替换件集成在所述交换结构中,而不要求重启所述服务器系统和不要求重启所述交换结构。
16.根据权利要求9所述的交换模块,其中所述服务器系统包括刀片系统,其中每个服务器卡包括服务器刀片,以及其中所述网络业务包括以下至少之一:(i)以太网业务,和(ii)以太网光纤通道(FCoE)业务。
17.一种计算机实现方法,包括:
在包括中平面、与所述中平面耦接的一个或多个服务器卡、以及与所述中平面耦接的一个或多个开关卡的服务器系统中,检测第一开关卡的第一交换模块已经故障,其中所述一个或多个服务器卡可操作地连接至所述一个或多个开关卡,其中所述中平面包括用于交换结构的结构互连,其中每个开关卡包括一个或多个交换模块,其中每个交换模块被配置成为所述一个或多个服务器卡中的至少一个服务器卡交换网络业务,其中每个服务器卡可从所述中平面热插拔,以及其中每个开关卡可从所述中平面热插拔;以及
一旦检测到所述第一开关卡的所述第一交换模块已经故障,则通过包括在第一开关卡和第二开关卡之一中的第二交换模块为所述一个或多个服务器卡交换网络业务。
18.根据权利要求17所述的计算机实现方法,其中所述一个或多个服务器卡与所述中平面的第一面耦接,以及其中所述一个或多个开关卡与所述中平面的第二面耦接。
19.根据权利要求17所述的计算机实现方法,其中所述交换结构包括以下至少之一:(i)每个开关卡和每个服务器卡之间的配线,以及(ii)每个开关卡和每个其他开关卡之间的配线。
20.根据权利要求17所述的计算机实现方法,其中所述一个或多个服务器卡沿第一轴排列在所述中平面上,以及其中所述一个或多个开关卡沿第二轴排列在所述中平面上,以及其中所述第二轴垂直于所述第一轴。
21.根据权利要求20所述的计算机实现方法,其中所述一个或多个服务器卡与所述中平面的表面侧水平耦接,以及其中所述一个或多个开关卡与所述中平面的第二面垂直耦接。
22.根据权利要求17所述的计算机实现方法,其中服务器卡和开关卡中的至少一个被配置成由功能替换件来替换,而不要求重启所述服务器系统和不要求重启所述交换结构。
23.根据权利要求17所述的计算机实现方法,其中所述服务器系统被配置成将所述功能替换件集成在所述交换结构中,而不要求重启所述系统和不要求重启所述交换结构。
24.根据权利要求17所述的计算机实现方法,其中所述服务器系统包括刀片系统,其中每个服务器卡包括服务器刀片,以及其中所述网络业务包括以下至少之一:(i)以太网业务,和(ii)以太网光纤通道(FCoE)业务。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/177,639 | 2011-07-07 | ||
US13/177,639 US8874955B2 (en) | 2011-07-07 | 2011-07-07 | Reducing impact of a switch failure in a switch fabric via switch cards |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103107960A true CN103107960A (zh) | 2013-05-15 |
CN103107960B CN103107960B (zh) | 2016-08-17 |
Family
ID=47426726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210233915.8A Expired - Fee Related CN103107960B (zh) | 2011-07-07 | 2012-07-06 | 通过开关卡减少交换结构中交换故障的影响的方法和系统 |
Country Status (3)
Country | Link |
---|---|
US (2) | US8874955B2 (zh) |
CN (1) | CN103107960B (zh) |
DE (1) | DE102012210582B4 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115568153A (zh) * | 2022-09-26 | 2023-01-03 | 超聚变数字技术有限公司 | 服务器 |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6718415B1 (en) | 1999-05-14 | 2004-04-06 | Acqis Technology, Inc. | Computer system and method including console housing multiple computer modules having independent processing units, mass storage devices, and graphics controllers |
US6643777B1 (en) | 1999-05-14 | 2003-11-04 | Acquis Technology, Inc. | Data security method and device for computer modules |
US8671153B1 (en) * | 2010-08-20 | 2014-03-11 | Acqis Llc | Low cost, high performance and high data throughput server blade |
US8745437B2 (en) * | 2011-07-07 | 2014-06-03 | International Business Machines Corporation | Reducing impact of repair actions following a switch failure in a switch fabric |
US8547825B2 (en) | 2011-07-07 | 2013-10-01 | International Business Machines Corporation | Switch fabric management |
US9021076B2 (en) | 2011-07-07 | 2015-04-28 | International Business Machines Corporation | Managing inventory data for components of a server system |
US8880937B2 (en) | 2011-07-07 | 2014-11-04 | International Business Machines Corporation | Reducing impact of a repair action in a switch fabric |
US8874955B2 (en) | 2011-07-07 | 2014-10-28 | International Business Machines Corporation | Reducing impact of a switch failure in a switch fabric via switch cards |
EP3605969B1 (en) | 2011-08-17 | 2021-05-26 | Nicira Inc. | Distributed logical l3 routing |
US9829935B2 (en) * | 2012-04-23 | 2017-11-28 | Microsoft Technology Licensing, Llc | SAS integration with tray and midplane server architecture |
US20130326053A1 (en) * | 2012-06-04 | 2013-12-05 | Alcatel-Lucent Usa Inc. | Method And Apparatus For Single Point Of Failure Elimination For Cloud-Based Applications |
US9025434B2 (en) | 2012-09-14 | 2015-05-05 | Microsoft Technology Licensing, Llc | Automated datacenter network failure mitigation |
US10411812B1 (en) * | 2013-03-15 | 2019-09-10 | Forrest Rose | Optical interconnect computing module tolerant to changes in position and orientation |
US20140337457A1 (en) * | 2013-05-13 | 2014-11-13 | Datadirect Networks, Inc. | Using network addressable non-volatile memory for high-performance node-local input/output |
US9747183B2 (en) * | 2013-12-31 | 2017-08-29 | Ciena Corporation | Method and system for intelligent distributed health monitoring in switching system equipment |
CN104064893B (zh) * | 2014-06-06 | 2016-06-29 | 华为技术有限公司 | 一种背板及通讯设备 |
TWI543576B (zh) | 2014-07-22 | 2016-07-21 | 廣達電腦股份有限公司 | 網路協定位址之設定方法及伺服管理系統 |
CN104135447B (zh) * | 2014-08-06 | 2018-03-23 | 曙光信息产业(北京)有限公司 | 一种数据包的传输方法和装置 |
US10778779B2 (en) * | 2016-06-17 | 2020-09-15 | Huawei Technologies Co., Ltd. | Method and system for session management for ultra reliable and low latency communications in high mobility scenarios |
US10888013B2 (en) | 2017-10-04 | 2021-01-05 | Google Llc | Managing a data center |
JP7099272B2 (ja) * | 2018-11-19 | 2022-07-12 | 富士通株式会社 | 情報処理装置、ネットワークシステム及びチーミングプログラム |
CN109684136A (zh) * | 2018-11-30 | 2019-04-26 | 北京百卓网络技术有限公司 | 一种灵活配置主控的通信架构系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1543609A (zh) * | 2000-12-19 | 2004-11-03 | ض� | 利用高速数据总线的高密度服务器块 |
US20040255190A1 (en) * | 2003-06-12 | 2004-12-16 | Sun Microsystems, Inc | System and method for providing switch redundancy between two server systems |
US20080288685A1 (en) * | 2004-10-29 | 2008-11-20 | International Business Machines Corporation | Shared simultaneously-connected drives |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3937214B2 (ja) | 1999-09-17 | 2007-06-27 | 株式会社ルネサステクノロジ | エラー訂正回数を記録する記憶装置 |
US20020080575A1 (en) * | 2000-11-27 | 2002-06-27 | Kwanghee Nam | Network switch-integrated high-density multi-server system |
US7529819B2 (en) | 2001-01-11 | 2009-05-05 | Microsoft Corporation | Computer-based switch for testing network servers |
US7010715B2 (en) * | 2001-01-25 | 2006-03-07 | Marconi Intellectual Property (Ringfence), Inc. | Redundant control architecture for a network device |
US7339786B2 (en) | 2001-03-05 | 2008-03-04 | Intel Corporation | Modular server architecture with Ethernet routed across a backplane utilizing an integrated Ethernet switch module |
US7310306B1 (en) | 2001-10-16 | 2007-12-18 | Cisco Technology, Inc. | Method and apparatus for ingress port filtering for packet switching systems |
US6976112B2 (en) * | 2002-11-27 | 2005-12-13 | International Business Machines Corporation | Apparatus, method and program product for automatically distributing power to modules inserted in live chassis |
US7191347B2 (en) * | 2002-12-31 | 2007-03-13 | International Business Machines Corporation | Non-disruptive power management indication method, system and apparatus for server |
US7359317B1 (en) | 2004-02-20 | 2008-04-15 | Excel Switching Corporation | Redundancy arrangement for telecommunications switch |
US7418633B1 (en) * | 2004-05-13 | 2008-08-26 | Symantec Operating Corporation | Method and apparatus for immunizing applications on a host server from failover processing within a switch |
US7356638B2 (en) | 2005-10-12 | 2008-04-08 | International Business Machines Corporation | Using out-of-band signaling to provide communication between storage controllers in a computer storage system |
US7298614B2 (en) | 2005-11-28 | 2007-11-20 | Motorola, Inc. | Telco hub and method |
US7295446B2 (en) | 2005-12-30 | 2007-11-13 | International Business Machines Corporation | Midplane connector for blades |
US8369212B2 (en) | 2006-08-29 | 2013-02-05 | Hewlett-Packard Development Company, L.P. | Network path validation based on user-specified criteria |
US7636823B1 (en) | 2006-09-27 | 2009-12-22 | Symantec Corporation | Switching roles between a production storage device and a snapshot device |
US8250382B2 (en) | 2007-08-22 | 2012-08-21 | International Business Machines Corporation | Power control of servers using advanced configuration and power interface (ACPI) states |
US8804710B2 (en) | 2008-12-29 | 2014-08-12 | Juniper Networks, Inc. | System architecture for a scalable and distributed multi-stage switch fabric |
US8433190B2 (en) | 2009-11-13 | 2013-04-30 | Verizon Patent And Licensing Inc. | Hot-swapping in-line optical amplifiers in an optical network |
US20120117040A1 (en) | 2010-11-10 | 2012-05-10 | Oracle International Corporaton | Method and System for Verifying Data Stored on a Medium |
US20120170191A1 (en) * | 2010-12-30 | 2012-07-05 | International Business Machines Corporation | Midplane With A Direct Connect Adapter |
US9021076B2 (en) | 2011-07-07 | 2015-04-28 | International Business Machines Corporation | Managing inventory data for components of a server system |
US8745437B2 (en) | 2011-07-07 | 2014-06-03 | International Business Machines Corporation | Reducing impact of repair actions following a switch failure in a switch fabric |
US8547825B2 (en) | 2011-07-07 | 2013-10-01 | International Business Machines Corporation | Switch fabric management |
US8880937B2 (en) | 2011-07-07 | 2014-11-04 | International Business Machines Corporation | Reducing impact of a repair action in a switch fabric |
US8874955B2 (en) | 2011-07-07 | 2014-10-28 | International Business Machines Corporation | Reducing impact of a switch failure in a switch fabric via switch cards |
-
2011
- 2011-07-07 US US13/177,639 patent/US8874955B2/en not_active Expired - Fee Related
-
2012
- 2012-06-22 DE DE102012210582.4A patent/DE102012210582B4/de not_active Expired - Fee Related
- 2012-07-06 CN CN201210233915.8A patent/CN103107960B/zh not_active Expired - Fee Related
- 2012-12-07 US US13/708,157 patent/US8745438B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1543609A (zh) * | 2000-12-19 | 2004-11-03 | ض� | 利用高速数据总线的高密度服务器块 |
US20040255190A1 (en) * | 2003-06-12 | 2004-12-16 | Sun Microsystems, Inc | System and method for providing switch redundancy between two server systems |
US20080288685A1 (en) * | 2004-10-29 | 2008-11-20 | International Business Machines Corporation | Shared simultaneously-connected drives |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115568153A (zh) * | 2022-09-26 | 2023-01-03 | 超聚变数字技术有限公司 | 服务器 |
CN115568153B (zh) * | 2022-09-26 | 2023-11-03 | 超聚变数字技术有限公司 | 服务器 |
WO2024066452A1 (zh) * | 2022-09-26 | 2024-04-04 | 超聚变数字技术有限公司 | 服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN103107960B (zh) | 2016-08-17 |
US8745438B2 (en) | 2014-06-03 |
DE102012210582B4 (de) | 2018-05-30 |
DE102012210582A1 (de) | 2013-01-10 |
US20130094351A1 (en) | 2013-04-18 |
US20130013957A1 (en) | 2013-01-10 |
US8874955B2 (en) | 2014-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103107960A (zh) | 通过开关卡减少交换结构中交换故障的影响的方法和系统 | |
CN103117866A (zh) | 交换结构管理方法和系统 | |
US10754742B2 (en) | Network failover handling in computing systems | |
US11119963B2 (en) | Modular system architecture for supporting multiple solid-state drives | |
EP3158455B1 (en) | Modular switched fabric for data storage systems | |
US8880938B2 (en) | Reducing impact of a repair action in a switch fabric | |
EP3458931A1 (en) | Independent scaling of compute resources and storage resources in a storage system | |
US8677175B2 (en) | Reducing impact of repair actions following a switch failure in a switch fabric | |
US7787482B2 (en) | Independent drive enclosure blades in a blade server system with low cost high speed switch modules | |
US20170220506A1 (en) | Modular Software Defined Storage Technology | |
GB2543981A (en) | Modular computer system and server module |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160817 Termination date: 20200706 |
|
CF01 | Termination of patent right due to non-payment of annual fee |