CN1602471A - 具有专用系统管理总线的计算机系统 - Google Patents

具有专用系统管理总线的计算机系统 Download PDF

Info

Publication number
CN1602471A
CN1602471A CN02824740.XA CN02824740A CN1602471A CN 1602471 A CN1602471 A CN 1602471A CN 02824740 A CN02824740 A CN 02824740A CN 1602471 A CN1602471 A CN 1602471A
Authority
CN
China
Prior art keywords
management
agency
coupled
bus
central management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN02824740.XA
Other languages
English (en)
Other versions
CN100351806C (zh
Inventor
彼得·霍金斯
库里阿潘·阿拉帕特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN1602471A publication Critical patent/CN1602471A/zh
Application granted granted Critical
Publication of CN100351806C publication Critical patent/CN100351806C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种系统,该系统包括中央管理代理和一个或多个现场可置换单元类型相关的管理总线。每个现场可置换单元类型相关的管理总线都可将中央管理代理耦合到一组现场可置换单元,其中每一组中的每个单元都是相同类型的现场可置换单元。

Description

具有专用系统管理总线的计算机系统
技术领域
本发明的实施例涉及计算机系统管理与维护。具体地说,本发明的实施例涉及具有多种类型的现场可置换单元的计算机系统中的系统管理总线的设置。
背景技术
在计算机系统的运行寿命期间,计算机系统中的各种组件都可能会出故障。这些故障可能是可控制的不同压力因素(stress factor)所造成的。例如,可通过使用风扇来控制高运行温度。然而,即使在减少了组件上的压力的情况下,组件仍可能出故障而需要置换。
一些计算机系统包括可监视并控制系统硬件的“健康状况”的系统管理功能。系统管理功能可包括对诸如系统温度、电压、风扇、电源、总线错误、系统物理安全性等要素的监视。另外,系统管理功能还可包括对可能有助于识别发生故障的硬件组件的信息的确定,并且可包括发出指明组件已出故障的警报。一接收到警报,维修技术人员就可来到计算机系统所在地(如果他们当时不在现场),并进行必要的维修或组件置换。通过使用这些系统管理功能,可将一定级别的可管理性内建到平台硬件中。
附图说明
图1是根据本发明的实施例的具有专用系统管理总线的计算机系统的框图。
图2是一种方法的流程图,用于根据本发明的实施例,检测具有专用系统管理总线的计算机系统中的组件故障。
图3是根据本发明的实施例的另一种具有专用系统管理总线的计算机系统的框图。
具体实施方式
本发明公开了一种具有系统管理功能的计算机系统,其具有专用于特定组件类型的一个或多个独立的系统管理总线。本发明的实施例包含多个现场可置换单元(FRU)、中央管理代理以及多个现场可置换单元类型相关(“FRU类型相关”)的管理总线,所述多个管理总线将中央管理代理耦合到所述现场可置换单元。现场可置换单元是可被整体置换的组件,所述置换是现场服务维修操作的一部分。根据本发明,FRU可由使用FRU类型相关的管理总线的系统管理功能来监视。
在本发明的实施例中,除了中央管理代理之外,耦合到每个管理总线的只有一种类型的FRU。根据这些实施例,当发生使得特定管理总线不可操作的故障时,中央管理代理可基于接收到的故障指示所来自于的总线的标识来确定某种类型的FRU可能已发生故障。在此情形下,中央管理代理可发送一个警报,该警报可由维修技术人员所接收。一接收到这一故障消息,维修技术人员可确定所述故障或者是由于在中央管理代理中识别出的特定类型的FRU中的一个或多个FRU中发生的故障而引起的,或者是由于被导致不可操作的特定管理总线中的故障而引起的。因此,技术人员可以只配备这些FRU,因而可以减少替换FRU所必需的备件。以下将更详细地描述这些及其他实施例。
图1是根据本发明的实施例的具有专用系统管理总线的计算机系统的框图。图1示出了具有多个组件101的计算机系统100。该计算机系统可以是任何类型的具有系统管理功能的计算机系统。例如,计算机系统100可以是服务器、客户端、单机、通用系统、专用系统、包含一个或多个计算单元的底座(chassis)、应用处理器、控制处理器等等,或者是这些系统的任意组合。如图1所示,计算机系统100中的组件包括中央管理代理105,以及多个不同类型的FRU和FRU类型相关的管理总线。具体地说,计算机系统100包含5个电源(111-115)、2个扇座(fan tray)(121-122)和3个温度传感器(131-133)。电源111-115通过电源管理总线110耦合到中央管理代理105。扇座121-122通过扇座管理总线120耦合到中央管理代理105。温度传感器131-133通过温度传感器管理总线130耦合到中央管理代理105。术语“耦合”应当包含直接或间接连接的多个元件。例如,如果信号可从一个元件通过总线发送到另一个元件,该总线就耦合了这两个元件,无论所述信号在从一个元件到另一个元件的途中是否还经过了其他连接器。
中央管理代理105可以是为计算机系统100或计算机系统100中的一个组件子集执行系统管理处理的任何组件。例如,中央管理代理105可以监视和/或控制电源111-115、扇座121-122和温度传感器131-133。因此,中央管理代理105可确定系统一部分的温度过高,在此情形下,中央管理代理105可发送信号到扇座121-122之一以提高风扇速度。中央管理代理105还可确定系统中的组件之一(例如电源111)工作不正常。中央管理代理105可以是处理器、微控制器、专用集成电路等等。在实施例中,中央管理代理105处理存储在诸如只读存储器(ROM)的存储器设备中的指令。中央管理代理105可对系统硬件的信息作出日志,并将该日志存储在诸如闪存、可擦除可编程只读存储器(EPROM)等的存储器设备中。
中央管理代理105可以是FRU。中央管理代理105可以是中央管理实体,例如由智能平台管理接口(IPMI)定义的底板管理控制器(BMC),其与系统中的其他由IPMI定义的IPMI控制器通信。在实施例中,中央管理代理105可从其他FRU收集管理信息,可监视它自己的专用管理总线上的不同传感器,可向远程管理用户/系统管理员发送警报,等等。中央管理代理105还可以是一个提取代理(abstracting agent),例如IPMI控制器,其例如可以从整个底座上的非智能温度传感器提取信息。
在实施例中,中央管理代理105耦合到外部通信链路140,所述链路例如可以是耦合到电话线的调制解调器、耦合到因特网或专用网的网卡等等。根据本实施例,中央管理代理105可通过外部通信链路140,将与计算机系统100的健康状况有关的信息发送到远程位置例如网络管理员。所述信息可定期发送,和/或当事件发生例如检测到组件故障时发送。
在图1所示的实施例中,管理总线与任何类型的FRU相关(专用)。在其他实施例中,管理总线可与一类可互换的组件相关。在这样的实施例中,该类型的每个组件都可与该类型的任何其他组件互换。如图1所示,电源管理总线110、扇座管理总线120和温度传感器管理总线130都是FRU类型相关的管理总线,因为他们只将一种类型的FRU耦合到中央管理代理105。因此,除了一个或多个中央管理代理之外,耦合到电源管理总线110的唯一一类FRU是电源,耦合到扇座管理总线120的唯一一类FRU是扇座,而耦合到温度传感器管理总线130的唯一一类FRU是温度传感器。根据这一设置,如果在类型相关的管理总线之一上检测到故障,则中央管理代理105可确定可能发生故障的FRU类型。如果出现总线故障,则其根本原因可能是该总线上的FRU当中的任何一个,包括中央管理代理、具有专用于总线的类型的FRU或者该总线自身。例如,如果中央管理代理105确定扇座管理总线120变得不可操作(例如由于没有在扇座管理总线120上接收到预期的信号),则扇座管理总线120、扇座121-122中之一或中央管理代理105已发生故障。故障也可例如由在管理总线上接收的故障信号来指示,或者由没有接收到所预期的信号(例如响应)来指示。
在实施例中,中央管理代理105可通过外部通信链路140发送信号,表明已检测到某种类型的故障。在实施例中,中央管理代理105将信息通过外部通信链路140进行中继,而不进行任何分析。在另一个实施例中,中央管理代理105在将信息通过外部通信链路140发送之前可进行分析(例如通过寻找重复发生的故障来校验所述信息)。根据实施例,FRU类型相关的管理总线可耦合到两个或更多的冗余中央管理代理以及相同类型或可互换类型的一个或多个FRU。
计算机系统100中的FRU类型相关的管理总线可用来在中央管理代理105和计算机系统100的组件中的一个或多个之间传送管理信息。在实施例中,计算机系统100中的FRU类型相关的管理总线可以较小(例如2条线路),可以是双向的,和/或可以具有低带宽。FRU类型相关的管理总线可以是任何公知的管理总线类型,例如遵循菲利浦半导体公司开发的Inter-IC(I2C)总线规范的I2C总线、遵循系统管理总线实现论坛的系统管理总线(SMBus)规范的系统管理总线、遵循智能平台管理总线(IPMB)通信协议规范的智能平台管理总线或遵循电子产业协会(EIA)和电信产业协会(TIA)的RS-485标准的RS-485总线。计算机系统100中的FRU类型相关的管理总线可以全都是相同类型的总线,或者其中一个或多个可以是不同类型的总线。
在图1所示的实施例中,电源111-115可以是彼此可互换的任何电源,扇座121-122可以是可互换的任何扇座,而温度传感器131-133可以是可互换的任何温度传感器。每个FRU都可以和相同类型的其他FRU互换。例如,电源111可以代替电源112而使用,而电源112可代替电源113而使用,等等。另外,特定类型的电源可以被相同类型的另一个电源所置换。在实施例中,FRU(例如电源)的类型可包括具有特定特性或特性范围的任何组件,所述特性例如是外形参数(form factor)、电压使用、灵敏度、速度等等。例如,电源类型可以是至少提供一定电压下一定安培数的任何电源,或者是提供每分钟至少一定数量立方英尺的气流并适配一定空间的扇座。
图1所示的电源、扇座和温度传感器是FRU的示例,本发明的实施例还可包含任何其他类型的FRU,例如板卡、网络交换机、电源接入模块、电源滤波器、系统状态显示器等等。在其他实施例中,所述计算机系统可包括任意数量的FRU类型,并且所述计算机系统对每种类型都可具有任意数量的FRU。
在实施例中,去除单个FRU和/或管理总线不会导致计算机系统停止运行,对系统可用性没有直接影响。在实施例中,计算机系统100具有冗余组件作为出现故障时的备用。例如,计算机系统100可能不需要5个电源来运行(例如它可能只需要3个电源),因此一个电源例如电源111发生故障不会导致系统运行的中断。在这一示例中,维修技术人员能够在任何其他电源出故障之前用另一个电源来置换电源111,因此确保不会出现系统运行的中断。这种持续运行例如在企业级和高可用性的系统中具有重要意义。
图2是一种方法的流程图,用于根据本发明的实施例,检测具有专用系统管理总线的计算机系统中的组件故障。图2是参考图1所示的实施例来描述的,但是这一方法当然也可用于其他实施例。如图2所示,中央管理代理(例如中央管理代理105)监视管理总线(例如总线110、120和130)以确定是否已出现任何故障(201)。只要未检测到总线故障(202),中央管理代理就可继续监视总线,将信息写入日志和/或对管理功能进行控制。如果检测到总线故障(202),则中央管理代理可确定哪个管理总线发生了故障(203)。中央管理代理可基于检测到故障指示的管理总线的标识来确定可能发生故障的FRU的类型(204)。例如,如果中央管理代理105发现扇座管理总线120不可操作(例如未接收到对查询的响应),则中央管理代理105可确定扇座之一可能已发生故障、扇座总线120已发生故障、或者中央管理代理自身已发生故障。中央管理代理然后可发送信号到远程位置,所述信号表示所述FRU类型(例如扇座)是所述故障的可能原因(205)。如上所述,接收这一信号的技术人员在为该报修呼叫而出发之前可得出如下结论,即所指明的FRU类型(例如扇座)、对应的FRU类型相关的管理总线(例如扇座管理总线120)、或者中央管理代理已发生了故障,因此服务技术人员不必为该报修呼叫而携带一整套所有系统组件的备件。在图2所示的实施例中,在向远程位置发送信号之后,中央管理代理可继续监视管理总线,以例如采取纠正式动作(例如尝试增加其他风扇的速度)并确定是否存在任何其他的故障。
图3是根据本发明的实施例的另一种具有专用系统管理总线的计算机系统的框图。图3示出了作为计算机系统的底座的计算机系统底座300。计算机系统底座300内的组件包括中央管理代理105、第一类型的两个组件311-312构成的组、第二类型的3个组件321-323构成的组以及中央处理单元350。中央管理代理105可与图1的中央管理代理105相同。第一类型的组件311-312和第二类型的组件321-323可以是任何类型的组件,例如图1所示和/或上面所列出的FRU。第一类型的组件311-312和第二类型的组件321-323也可以是其他类型的组件。第一类型的组件311-312都是相同类型的组件,并且都可彼此互换,第二类型的组件321-323也都是相同类型的组件,并且都可彼此互换。第一类型的组件311-312通过第一组件类型相关的管理总线310和冗余的第一组件类型相关的管理总线315耦合到中央管理代理105。冗余的第一组件类型相关的管理总线315可执行与第一组件类型相关的管理总线310相同的功能,并且在第一组件类型相关的管理总线310不可操作的时候可作为第一组件类型相关的管理总线310的后备。在实施例中,对所有的管理总线或其中的一些存在冗余的管理总线。注意,第一组件类型相关的管理总线310和冗余的第一组件类型相关的管理总线315没有耦合到中央管理代理105和第一类型的组件之外的任何其他组件。第二类型的组件321-323通过第二组件类型相关的管理总线320耦合到中央管理代理105。第二组件类型相关的管理总线320没有耦合到中央管理代理105和第二类型的组件之外的任何组件。
图3示出了中央处理单元250耦合到中央管理代理105。在实施例中,中央管理代理105监视中央处理单元350(例如检测其中的故障等)。在一些实施例中,中央管理代理105将管理信息传送到中央处理单元350,在其他实施例中,中央处理单元将管理信息发送到远程位置。外部链路340耦合到中央管理代理105,外部链路340可以与图1的外部链路140相同。
如图3所示,中央管理代理105包含系统管理电路301,系统管理电路301耦合到第一组件类型管理总线接口306、冗余的第一组件类型管理总线接口309、第二组件类型管理总线接口307以及外部通信接口308。第一组件类型管理总线接口306可以是被用来连接中央管理代理105和第一组件类型相关的管理总线以传送管理信息的套接口和/或逻辑,而第二组件类型管理总线接口307可以是被用来连接中央管理代理105和第二组件类型相关的管理总线以传送管理信息的套接口和/或逻辑。系统管理电路301包含故障检测逻辑302。在实施例中,故障检测逻辑302可(例如基于确定对应的管理总线不可操作而)确定在特定的组件类型中已出现故障。故障检测逻辑302可以是硬件、软件、固件等等。在其他实施例中,计算机系统底座300可包含其他组件类型相关的管理总线,并且中央管理代理105可包含其他的组件类型相关的管理总线接口。除了所述管理总线之外,所述系统还可包括其他总线(未示出),例如数据总线和地址总线。另外,所述系统还可包含如上所述的冗余中央管理代理。
在此具体说明和/或描述了本发明的若干实施例。然而,可以认识到本发明的各种修改与变动都为上述教导所覆盖,并处于所附的权利要求的范围之内,而未偏离本发明的精神和应有范围。例如,虽然所公开的实施例只示出了组件类型相关的管理总线,但是本发明也可实现在同时具有类型相关的管理总线和非类型相关的管理总线的系统中。

Claims (30)

1.一种系统,包括:
中央管理代理;和
耦合到所述中央管理代理的现场可置换单元类型相关的管理总线。
2.如权利要求1所述的系统,其中所述系统还包括多个第一类型的现场可置换单元,所述多个第一类型的现场可置换单元由所述现场可置换单元类型相关的管理总线耦合到所述中央管理代理。
3.如权利要求2所述的系统,其中所述系统还包括:
第二现场可置换单元类型相关的管理总线;和
多个第二类型的第二现场可置换单元,所述第二现场可置换单元由所述第二现场可置换单元类型相关的管理总线耦合到所述中央管理代理。
4.如权利要求3所述的系统,其中所述现场可置换单元类型相关的管理总线是Inter-IC总线。
5.如权利要求1所述的系统,其中所述系统还包括第二中央管理代理,该第二中央管理代理耦合到所述现场可置换单元类型相关的管理总线之一。
6.一种系统,包括:
中央管理代理;
多个第一类型的现场可置换单元;
将所述中央管理代理只耦合到所述第一类型的现场可置换单元的第一管理总线;
多个第二类型的现场可置换单元;以及
将所述中央管理代理只耦合到所述第二类型的现场可置换单元的第二管理总线。
7.如权利要求6所述的系统,其中所述中央管理代理是处理器。
8.如权利要求6所述的系统,其中所述多个第一类型的现场可置换单元是温度传感器,而所述多个第二类型的现场可置换单元是电源。
9.如权利要求6所述的系统,还包括:
多个第三类型的现场可置换单元;和
将所述中央管理代理只耦合到所述第三类型的现场可置换单元的第三管理总线。
10.如权利要求9所述的系统,其中所述多个第三类型的现场可置换单元是扇座。
11.如权利要求6所述的系统,还包括第二中央管理代理,该第二中央管理代理耦合到所述第一现场可置换单元类型相关的管理总线并耦合到所述第二现场可置换单元类型相关的管理总线。
12.一种中央管理代理,包括:
系统管理电路;
第一管理总线接口,其耦合到所述系统管理电路,以只与第一类型的现场可置换单元传送管理信息;以及
第二管理总线接口,其耦合到所述系统管理电路,以只与第二类型的现场可置换单元传送管理信息。
13.如权利要求12所述的中央管理代理,其中所述系统管理电路包含下述逻辑,所述逻辑基于确定所述第一管理总线不可操作来确定所述第一类型的现场可置换单元中可能已发生故障。
14.如权利要求13所述的中央管理代理,其中所述中央管理代理还包含耦合到所述系统管理电路以与远程位置通信的接口。
15.如权利要求14所述的中央管理代理,其中所述中央管理代理还包括耦合到所述处理器的第三接口,该第三接口用于将管理信息只传送到第三类型的现场可置换单元。
16.一种系统,包括:
底座;
位于所述底座内的多个第一可互换组件;
位于所述底座内的多个第二可互换组件;
位于所述底座内的中央管理代理;
第一管理总线,其耦合到所述中央管理代理并耦合到所述多个第一可互换组件中的每一个,其中所述第一管理总线不耦合到任何其他组件;以及
第二管理总线,其耦合到所述中央管理代理并耦合到所述多个第二可互换组件中的每一个,其中所述第二管理总线不耦合到任何其他组件。
17.如权利要求16所述的系统,其中所述系统还包括耦合到所述中央管理代理的中央处理单元。
18.如权利要求17所述的系统,其中所述多个第一可互换组件是电源。
19如权利要求18所述的系统,其中所述多个第二可互换组件是扇座。
20.如权利要求19所述的系统,其中所述中央管理代理耦合到外部通信链路。
21.如权利要求17所述的系统,其中所述系统还包括耦合到所述第一管理总线、所述第二管理总线和所述中央管理代理的第二中央管理代理。
22.如权利要求16所述的系统,其中所述系统还包括耦合到所述中央管理代理并耦合到所述多个第一可互换组件中的每一个的冗余的第一管理总线,其中所述第一管理总线不耦合到任何其他组件。
23.一种检测计算机系统中的组件故障的方法,该方法包括:
在中央管理代理处检测多个管理总线中第一管理总线的故障指示;和
基于所述第一管理总线的标识,确定一种类型的现场可置换单元可能已发生故障。
24.如权利要求23所述的方法,其中所述故障指示是来自所述第一管理总线的预期信号的缺失。
25.如权利要求23所述的方法,其中所述方法还包括从所述中央管理代理向远程位置发送信号,所述信号表明可能已发生故障的现场可置换单元的类型。
26.如权利要求23所述的方法,其中所述方法还包括:
在所述计算机系统中,在所述中央管理代理处检测来自所述多个管理总线中第二管理总线的故障指示;和
基于所述第二管理总线的标识,确定第二类型的现场可置换单元可能已发生故障。
27.一种系统,包括:
中央管理代理;
第一组第一类型的组件,其中所述第一组组件中的每一个组件都可与所述第一组中的其他组件互换;
第一管理总线,其耦合到所述中央管理代理和所述第一组组件,并专用于所述第一组组件;
第二组第二类型的组件,其中所述第二组组件中的每一个组件都可与所述第二组中的其他组件互换,但不能与所述第一组组件中的组件互换;以及
第二管理总线,其耦合到所述中央管理代理和所述第二组组件,并专用于所述第二组组件。
28.如权利要求27所述的系统,其中所述中央管理代理适于管理计算机系统中一个子系统中的硬件。
29.如权利要求27所述的系统,其中所述中央管理代理是提取代理。
30.如权利要求27所述的系统,还包括第三管理总线,该第三管理总线耦合到所述中央管理代理和所述第一组组件,并且所述第三管理总线专用于所述第一组组件。
CNB02824740XA 2001-12-14 2002-12-16 具有专用系统管理总线的计算机系统 Expired - Fee Related CN100351806C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/014,904 2001-12-14
US10/014,904 US20030115397A1 (en) 2001-12-14 2001-12-14 Computer system with dedicated system management buses

Publications (2)

Publication Number Publication Date
CN1602471A true CN1602471A (zh) 2005-03-30
CN100351806C CN100351806C (zh) 2007-11-28

Family

ID=21768462

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB02824740XA Expired - Fee Related CN100351806C (zh) 2001-12-14 2002-12-16 具有专用系统管理总线的计算机系统

Country Status (6)

Country Link
US (1) US20030115397A1 (zh)
EP (1) EP1461702A2 (zh)
CN (1) CN100351806C (zh)
AU (1) AU2002351390A1 (zh)
TW (1) TWI238933B (zh)
WO (1) WO2003052605A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107885687A (zh) * 2017-12-04 2018-04-06 盛科网络(苏州)有限公司 一种用于将fru模块连接到i2c总线的接口

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069349B2 (en) * 2002-01-10 2006-06-27 Intel Corporation IPMI dual-domain controller
US20030130969A1 (en) * 2002-01-10 2003-07-10 Intel Corporation Star intelligent platform management bus topology
US6772099B2 (en) * 2003-01-08 2004-08-03 Dell Products L.P. System and method for interpreting sensor data utilizing virtual sensors
US7519847B2 (en) * 2005-06-06 2009-04-14 Dell Products L.P. System and method for information handling system clock source insitu diagnostics
US8150953B2 (en) * 2007-03-07 2012-04-03 Dell Products L.P. Information handling system employing unified management bus
DE102007033346A1 (de) * 2007-07-16 2009-05-20 Certon Systems Gmbh Verfahren und Vorrichtung zur Administration von Computern
US7861110B2 (en) * 2008-04-30 2010-12-28 Egenera, Inc. System, method, and adapter for creating fault-tolerant communication busses from standard components
US8648690B2 (en) * 2010-07-22 2014-02-11 Oracle International Corporation System and method for monitoring computer servers and network appliances
CN103684817B (zh) * 2012-09-06 2017-11-17 百度在线网络技术(北京)有限公司 数据中心的监控方法及系统
US9143338B2 (en) * 2012-10-05 2015-09-22 Advanced Micro Devices, Inc. Position discovery by detecting irregularities in a network topology
TWI607315B (zh) * 2016-08-19 2017-12-01 神雲科技股份有限公司 判定設備連接狀態及設備類型的方法
TWI601014B (zh) * 2016-11-15 2017-10-01 英業達股份有限公司 記憶體訪問衝突控制的電腦系統

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5295258A (en) * 1989-12-22 1994-03-15 Tandem Computers Incorporated Fault-tolerant computer system with online recovery and reintegration of redundant components
US5367669A (en) * 1993-03-23 1994-11-22 Eclipse Technologies, Inc. Fault tolerant hard disk array controller
US5544304A (en) * 1994-03-25 1996-08-06 International Business Machines Corporation Fault tolerant command processing
US6070253A (en) * 1996-12-31 2000-05-30 Compaq Computer Corporation Computer diagnostic board that provides system monitoring and permits remote terminal access
US5892933A (en) * 1997-03-31 1999-04-06 Compaq Computer Corp. Digital bus
JP3637181B2 (ja) * 1997-05-09 2005-04-13 株式会社東芝 コンピュータシステムおよびそのクーリング制御方法
US5987554A (en) * 1997-05-13 1999-11-16 Micron Electronics, Inc. Method of controlling the transfer of information across an interface between two buses
DE19750662C2 (de) * 1997-11-15 2002-06-27 Daimler Chrysler Ag Prozessoreinheit für ein datenverarbeitungsgestütztes elektronisches Steuerungssystem in einem Kraftfahrzeug
EP0957431A1 (en) * 1998-05-11 1999-11-17 Alcatel Processor system and method for testing a processor system
US6161197A (en) * 1998-05-14 2000-12-12 Motorola, Inc. Method and system for controlling a bus with multiple system hosts
US6487463B1 (en) * 1998-06-08 2002-11-26 Gateway, Inc. Active cooling system for an electronic device
US6622188B1 (en) * 1998-09-30 2003-09-16 International Business Machines Corporation 12C bus expansion apparatus and method therefor
US6145036A (en) * 1998-09-30 2000-11-07 International Business Machines Corp. Polling of failed devices on an I2 C bus
US6477139B1 (en) * 1998-11-15 2002-11-05 Hewlett-Packard Company Peer controller management in a dual controller fibre channel storage enclosure
JP2000346512A (ja) * 1999-06-03 2000-12-15 Fujitsu Ltd 冷却装置
JP2001056724A (ja) * 1999-08-18 2001-02-27 Nec Niigata Ltd パーソナルコンピュータの冷却方式
JP2002006991A (ja) * 2000-06-16 2002-01-11 Toshiba Corp コンピュータシステム及び冷却ファンの回転数制御方法
US6795871B2 (en) * 2000-12-22 2004-09-21 General Electric Company Appliance sensor and man machine interface bus
US6833634B1 (en) * 2001-01-04 2004-12-21 3Pardata, Inc. Disk enclosure with multiple power domains
US6597972B2 (en) * 2001-02-27 2003-07-22 International Business Machines Corporation Integrated fan assembly utilizing an embedded fan controller
US6826456B1 (en) * 2001-05-04 2004-11-30 Rlx Technologies, Inc. System and method for controlling server chassis cooling fans
US6901303B2 (en) * 2001-07-31 2005-05-31 Hewlett-Packard Development Company, L.P. Method and apparatus for controlling fans and power supplies to provide accelerated run-in testing
US6968470B2 (en) * 2001-08-07 2005-11-22 Hewlett-Packard Development Company, L.P. System and method for power management in a server system
US20030055846A1 (en) * 2001-09-20 2003-03-20 International Business Machines Corporation Method and system for providing field replaceable units in a personal computer

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107885687A (zh) * 2017-12-04 2018-04-06 盛科网络(苏州)有限公司 一种用于将fru模块连接到i2c总线的接口

Also Published As

Publication number Publication date
EP1461702A2 (en) 2004-09-29
AU2002351390A8 (en) 2003-06-30
TW200301418A (en) 2003-07-01
CN100351806C (zh) 2007-11-28
WO2003052605A3 (en) 2004-07-08
WO2003052605A2 (en) 2003-06-26
AU2002351390A1 (en) 2003-06-30
US20030115397A1 (en) 2003-06-19
TWI238933B (en) 2005-09-01

Similar Documents

Publication Publication Date Title
US7657698B2 (en) Systems and methods for chassis identification
US7543191B2 (en) Method and apparatus for isolating bus failure
CN100351806C (zh) 具有专用系统管理总线的计算机系统
AU607689B2 (en) Diagnostic system
US20040228063A1 (en) IPMI dual-domain controller
KR20010006897A (ko) 멀티 프로세서 기반 컴퓨터 시스템의 핫 플러그 제어
CN111414268A (zh) 故障处理方法、装置及服务器
US7266628B2 (en) System and method of retiring events upon device replacement
US20060209680A1 (en) Network link backup system
US20240111584A1 (en) Server management system capable of supporting multiple vendors
CN109995597B (zh) 一种网络设备故障处理方法及装置
US6622257B1 (en) Computer network with swappable components
US20040030413A1 (en) Computer assembly
CN111414267A (zh) 运用于数据中心的机柜异常状态的远端排除方法
CN111416721A (zh) 运用于数据中心的机柜异常状态的远端排除方法
CN111414274A (zh) 运用于数据中心的机柜异常状态的远端排除方法
JPH1188471A (ja) 試験方法及び試験装置
US7131028B2 (en) System and method for interconnecting nodes of a redundant computer system
JP4779948B2 (ja) サーバシステム
JPH1153329A (ja) 情報処理システム
KR20040026934A (ko) 교환기의 장애 처리 방법 및 장치
JPH113293A (ja) 計算機システム
JPH06311568A (ja) 動力制御システム
CN117453496A (zh) 一种服务器硬件异常的报警方法、系统以及装置
EP2000911B1 (en) Computer system comprising at least two computers for continuous operation of said system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20071128

Termination date: 20131216