CN102469740A - 机架级模块化服务器以及存储结构框架 - Google Patents

机架级模块化服务器以及存储结构框架 Download PDF

Info

Publication number
CN102469740A
CN102469740A CN2011102486097A CN201110248609A CN102469740A CN 102469740 A CN102469740 A CN 102469740A CN 2011102486097 A CN2011102486097 A CN 2011102486097A CN 201110248609 A CN201110248609 A CN 201110248609A CN 102469740 A CN102469740 A CN 102469740A
Authority
CN
China
Prior art keywords
domain controller
controller
server
fan
primary domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011102486097A
Other languages
English (en)
Other versions
CN102469740B (zh
Inventor
G·夫劳兹-拉尔洪都
J·派克
J·施蒂韦
J·塞凯里
R·米尔斯
J·维维欧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dell Products LP
Original Assignee
Dell Products LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dell Products LP filed Critical Dell Products LP
Publication of CN102469740A publication Critical patent/CN102469740A/zh
Application granted granted Critical
Publication of CN102469740B publication Critical patent/CN102469740B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/18Packaging or power distribution
    • G06F1/181Enclosures
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/14Mounting supporting structure in casing or on frame or rack
    • H05K7/1485Servers; Data center rooms, e.g. 19-inch computer racks
    • H05K7/1488Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • H04L67/125Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20718Forced ventilation of a gaseous coolant
    • H05K7/20736Forced ventilation of a gaseous coolant within cabinets for removing heat from server blades
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S40/00Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them
    • Y04S40/18Network protocols supporting networked applications, e.g. including control of end-device applications over a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Human Computer Interaction (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Thermal Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Power Engineering (AREA)
  • Power Sources (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种模块化的机架级服务器和存储结构框架。模块化的机架系统包括置于一个或多个机架内的若干机箱以及置于每一机箱内的若干滑动部件。每一滑动部件包括一个信息处理系统、共享的风扇模块、共享的电源模块以及共享的管理模块。共享的风扇模块冷却每一机箱内的若干滑动部件以及共享的电源模块将电源供应给一个或多个机箱内的一个或多个滑动部件。共享的管理模块管理若干机箱的操作。

Description

机架级模块化服务器以及存储结构框架
技术领域
本发明通常涉及信息处理系统,以及更具体地涉及模块化机架级服务器以及存储结构框架。
背景技术
随着信息的价值和用途的不断增长,个人和商业寻求处理和存储信息的其它方法。这些用户可用的一个方案就是信息处理系统。信息处理系统通常处理、编译、存储和/或传输用于商业、个人或其它目的的信息或数据,从而允许用户利用信息的价值。由于技术和信息处理需要和需求因不同的用户或应用而不同,信息处理系统可以作出下述而变化:处理的信息类型;用于处理信息的方法;用于处理、存储或传输信息的方法;处理、存储或传输的信息量;以及处理、存储或传输信息的速度和效率。信息处理系统的不同允许信息处理系统是公共的或配置为用于特定的用户或用于特定的用途,例如金融交易处理、航空系统预定、企业数据存储或全球通信。此外,信息处理系统可以包括或包含可配置为处理、存储和传输信息的各种硬件和软件元件,以及可以包括一个或多个计算机系统、数据存储系统以及网络系统。
诸如服务器系统的信息处理系统可放置于机架内。机架可容纳多个服务器系统,以及多个机架通常放置于公知为数据中心或服务室的空间内。典型的服务室将包括若干排机架。数据中心的一个难题是由数据中心内的多个服务器产生的热量。对于数据中心而言过量热量导致高的冷却成本,且会导致机架或数据中心的计算机系统性能降低。此外,服务器通常包括有源元件。一旦服务器被安装于机架内,服务器有源元件的停止运转会造成进行维修的必要,上述使得系统成本增加且是费时的。
希望有效地管理和监控处于数据中心内的服务器,以及将与服务器相关的安装后的维修成本最小化。此外,希望通过允许服务器共享系统资源(诸如冷却服务器和服务器配电单元所需的风扇)来获得最佳的系统效率。
发明内容
本发明通常涉及信息处理系统,以及更具体地涉及模块化机架级服务器以及存储结构框架。
在一个示范性实施例中,本发明涉及模块化的信息处理系统结构框架。模块化的信息处理系统可包括机架,其包含至少一个机箱;置于机箱内的滑动部件,其中滑动部件包括至少一个信息处理系统;置于机箱内以便冷却信息处理系统的风扇;通信连接到风扇的风扇控制器,其中风扇控制器管理风扇的操作;与滑动部件相关联的节点控制器,其中节点控制器管理滑动部件的操作;用于将电源供应给信息处理系统的电源模块;用于管理电源模块操作的电源模块控制器;以及与风扇控制器、节点控制器以及电源模块通信耦联的主域控制器,其中主域控制器管理风扇控制器、节点控制器以及电源模块的至少之一的操作。
在另一示范性实施例中,本发明涉及模块化机架系统。模块化机架系统可包括置于一个或多个机架内的若干机箱;置于每一机箱内的若干滑动部件,其中每一滑动部件包括信息处理系统;用于冷却每一机箱内的若干滑动部件的共享风扇模块;用于将电源供应给一个或多个机箱内的一个或多个滑动部件的共享电源模块;以及用于管理若干机箱操作的共享管理模块。
因此,在此公开的方法和系统提供对可处于数据中心内的信息处理系统的有效管理和监控,以及将与其相关的安装后维修成本最小化。此外,本申请的方法和系统通过允许两个或多个信息处理系统共享诸如电源和风扇的系统资源而将系统效率最佳化。对于本领域的那些普通技术人员而言,在参考了下述说明、权利要求书和附图之后其它技术优势是显而易见的。
附图说明
通过参照结合附图和下述说明可获得对本发明实施例及其优势的更全面理解,其中在附图中相同的附图标记指代相同的部件,在附图中:
图1是根据本发明示范性实施例的模块化机架系统的示图;
图2是根据本发明示范性实施例的机箱的图示;
图3是图2所示机箱的透视图;
图4是根据本发明示范性实施例的模块化机架系统的特写视图;
图5是适于根据本发明示范性实施例的模块化机架系统的系统管理结构框架的框图;
图6是适于根据本发明示范性实施例的图5所示风扇控制器的软件栈的框图;
图7是适于根据本发明示范性实施例的图5所示节点控制器的软件栈的框图;
图8是适于根据本发明示范性实施例的图5所示主域控制器的软件架构的框图;
图9是根据本发明示范性实施例的共享电源系统;
图10示出根据本发明示范性实施例的机箱到配电单元的连接;
图11示出根据本发明示范性实施例的管理系统。
虽然参考本发明的示范性实施例示出、描述和限定了本发明的实施例,但是上述参考并不暗示对本发明的限制,且不能推断出有任何的上述限制。公开的主题能够在形式和功能上进行相当多的变型、改变和等价替换,就像对于相关技术领域的那些普通技术人员会发生的那样且具有本发明的益处。本发明的图示和描述的实施例仅仅是实例,并不是本发明范围的穷举。
具体实施例
对于本发明目的而言,信息处理系统可包括任何媒介或媒介的集合,其可操作以便计算、分类、处理、传输、接收、检索、产生、转换、存储、显示、证明、检测、记录、复制、操作或利用用于商业、科学、控制或者其它目的的任何形式的信息、情报或数据。例如,信息处理系统可以是个人电脑、网络存储装置或任何其它合适的装置,并且可以在大小、形状、性能、功能以及价格上不同。信息处理系统可以包括随机存取存储器(RAM)、一个或多个处理资源,例如中央处理器(CPU)或硬件或软件控制逻辑、ROM和/或其它类型的非易失性存储器。信息处理系统另外的元件可以包括一个或多个磁盘驱动器、一个或多个用于和外部设备通信的网络端口以及各种各样的输入和输出(I/O)装置,例如键盘、鼠标以及视频显示器。信息处理系统还可以包括一个或者多个用于各种各样硬件元件之间传输通信的总线。
信息处理系统可容纳于机架内。例如,如图1中所示,数据中心内的服务器和/或数据存储装置可布置于机架102内。如由本领域的那些普通技术人员意识到的那样,服务器可包括至少一主板、CPU和存储器。取决于用户的系统需求,数据中心可包括一个或多个机架102。机架102可包括一个或多个机箱104。根据本发明示范性实施例的机箱104是模块化组件,其有利于在许多服务器之间共享关键的服务器组件。在一个示范性实施例中,机箱104可以是4U的机箱。每一机箱104有目的地避免在其内或其底板内存在有源元件,以便将其安装后的维修需求最小化。
如在图2和图4中更详细示出的那样,机箱104可包括滑动部件106。滑动部件106可包括一个或多个服务器107。机架102可包括一个或多个计算滑动部件、存储滑动部件或其组合。如对于本领域的技术人员显而易见的那样,根据本发明的益处,虽然在示范性实施例中计算和/或数据存储滑动部件垂直地布置,它们也可以是水平布置的。如图2和3中所示,在一个示范性实施例中,机箱104可包括高达十个垂直的计算滑动部件,包含十二个或更多存储驱动器的双五宽的滑动部件,或包括计算和存储滑动部件组合的混合布置。如由本领域的那些普通技术人员意识到的那样,并不将本发明限制到机箱104内滑动部件106的任何具体数目或构造。在水平滑动部件的情况下,在一个示范性的实施例中,可以使用包括四个插孔系统的支撑每个1U中密集服务器的四个1U全宽的滑动部件。如对于本领域的那些普通技术人员显而易见的那样,根据本发明的益处,取决于系统需求和/或喜好也可使用计算和存储滑动部件的其它布置。
机箱104还可包括在机箱104后部处的冷却区域110内的共享风扇模块。在示范性实施例中,共享的风扇模块具有4U的分辨率。在一个实施例中,可在共享的风扇模块中使用三个风扇108以便冷却将机箱104中的所有滑动部件106。但是,取决于系统性能和需求,在共享风扇模块中可使用更多或更少的风扇。风扇108可由风扇控制器508来管理,在下面结合附图5和6来更详细地论述该风扇控制器508的操作。如由本领域的那些普通技术人员意识到的那样,根据本发明的益处,风扇控制器508可从机架102的后部热插拔。
此外,每一机箱104可接收来自电缆(从配电单元(“PDU”)引出)的电力,下面结合附图5,9和10来更详细地论述该配电单元。如下面论述的那样,PDU 902可具有一个或多个配电单元(“PSUs”)904。因此由所有PSUs904产生的电力在连接到PDU 902的所有机箱104之间共享。然后,每一机箱104依次将其接收的电力分配到包含于该机箱104内的单独滑动部件106。
在冷却区域110和滑动部件106之间存在背板112。机箱104可包括将电力分配到每一个滑动部件106的电力和管理背板。电力和管理背板还可携载高速网络信号(例如,以太网)和低速网络信号(例如,系统管理总线)。在一个实施例中,该系统可进一步包括任选的存储背板,其允许计算滑动部件经由SATA/SAS信号访问在同一机箱104内的一个或多个存储滑动部件。存储背板连接器可经由STA/SAS插塞式电缆连接到计算背板连接器。
如图5中所示,在此公开的系统和方法提供用于共享滑动部件106的冷却、共享滑动部件106的电力以及共享滑动部件106的管理的结构框架。机箱104内的每一滑动部件106可作为节点进行处理,节点可通过网络(诸如像基于以太网的管理网络)进行中央管理。域控制器514可为用户提供访问点以便管理系统。下面更详细地论述域控制器514的操作。因此,如图5所示,每一滑动部件106可进一步包括提供系统管理和监控能力的一节点控制器502。节点控制器502可管理滑动部件106中的每一服务器107。节点控制器502通电管理服务器107,打开LED灯,读取温度、从串行控制器传递数据等。其还负责提供合适的电压轨以便给服务器107的组件供电。终端用户518不与节点控制器502直接交互。相反,节点控制器504与管理网络中的域控制器514和其它装置通信。术语“管理网络”指的是不能由终端用户访问的内部网络,其允许网络内的不同控制器在自身之间通信,且具体地与域控制器514会话。在一示范性实施例中,管理网络可为以太网10/100网络。在此使用的术语“域”指的是一个逻辑概念,其指示位于机架102内或分布在一组机架之间的且可由同一域控制器514管理的一套滑动部件106,风扇108,电源510、116,以及其它装置。
网络可将每一机箱104内的整合交换机506在中央管理域控制器514连接到中央管理交换机516,中央管理域控制器514提供适于用户通过界面访问的单一(冗余)接入点,上述界面诸如像命令行界面、简易网络管理协定或数据中心管理界面。域控制器514允许终端用户对域进行管理和监控。例如,域控制器514可管理一个或多个机箱104内的所有滑动部件106、风扇108以及电源单元510、116。域控制器514利用管理网络与低级控制器通信。如在此所论述的,术语“低级控制器”指的是提供功能、但不由终端用户518直接访问的节点控制器、风扇控制器以及电源控制器。域控制器514可具有强大的软件栈以便给终端用户518提供管理系统的许多方式。在一个实施例中,系统可包括两个域控制器514、524。如果主域控制器514停止运转,可进行自动的失效备援程序以及辅助控制器524可进行备援并且成为主域控制器。
在正常的操作条件下,主域控制器514可具有通过管理网络到辅助域控制器524的连接。如本领域的那些普通技术人员会意识到的那样,根据本发明的益处,可利用各种合适的方法来提供该连接。在一示范性实施例中,连接可为TCP连接。主域控制器514可每几秒就通过TCP连接将“我在起作用”(“I′m alive”)消息发送到辅助域控制器524。主域控制器514还可通过TCP连接将重要的更新内容(诸如注册消息、警告等)发送到辅助域控制器524。辅助域控制器524以环路操作,该环路检测最后从主域控制器514接收的“我在起作用”(“I′m alive”)消息的时间戳。
如果辅助域控制器524脱机离线或另外变得不可操作而主域控制器514可操作,那么主域控制器514将检测到联系不到辅助域控制器524(TCP连接中断)。然后可产生警告。之后主域控制器514将尝试重新连接TCP连接(在尝试之间静止几秒钟)。当与辅助域控制器524成功建立TCP连接时,发生通知系统错误已经解决的事件。
如果主域控制器514脱机离线或另外变得不可操作而辅助域控制器524可操作,辅助域控制器524将不再接收“我在起作用”(“I′m alive”)消息。如果在经过预定时间之后,辅助域控制器524没有检测到“我在起作用”(“I′m alive”)消息,那么将认定主域控制器514变得不可操作。作为响应,辅助域控制器524会产生到系统的警告和/或改变其模式以便成为适于系统的主域控制器。低级控制器不会即刻注意到域控制器中的变化。结果,在发生瞬变时会丢失几个“旧”的传感器数据包。但是只要辅助域控制器524一备援成功,那么就会呈现更新的传感器数据。类似的,由于主域控制器514的停止运转,在主域控制器处的用户界面(例如,命令行界面或网络服务)可能被中断。但是,当几秒钟之后发生瞬变时,将成功尝试新的连接,以及用户可重试命令。接着,新的主域控制器将尝试与新的辅助域控制器建立TCP程序。
图11示出根据本发明实施例的管理系统1100。管理系统1100可包括高达两个的域控制器514、524以及以太网交换机516。根据本发明的系统可包括对每一机架102的一个管理系统1100。在用户希望系统冗余的情况下,管理系统1100可包括主域控制器514和辅助域控制器524两者。相反,当用户不希望冗余时,管理系统1100可仅仅包括主域控制器514。此外,不需要冗余的多机架系统可包括带有管理系统1100(其具有一个域控制器和以太网交换机)以及其它管理系统1100(其仅具有交换机)的机架102。根据本发明实施例的管理系统1100可包括可由机架102的位置设定的旋转开关,这样每个机架102可赋予不同的数字。这是系统中的每一装置具有的位置信息的一部分。例如,滑动部件106将具有与其相关联的给定机架/机箱/滑动部件的身份识别。
现在参照图5,为了管理和监控滑动部件106,与滑动部件106相关联的节点控制器502可具有到传感器、主板和扩充卡(对滑动部件106中的多个服务器107提供管理)的物理连接。节点控制器502可在微处理器上运行。在一个实施例中,微处理器可包括小的嵌入式的操作系统。节点控制器502的主要职责之一是可给滑动部件106(包括与滑动部件106相关联的主板、硬盘驱动器和/或存储滑动部件)供电和提供管理。通过管理网络和/或基板管理控制器(“BMC”)可从机箱104上的面板将供电管理命令提供给节点控制器502。节点控制器502可负责数据收集和发出警告。之后当发生令人关注事件时,节点控制器502会定期地将数据发送到域控制器514和/或发送通知到域控制器514。此外,节点控制器502可发送传感器数据到机箱的风扇控制器508。例如,出了发送机箱传感器数据(诸如温度传感器数据)到域控制器514以便存储之外,节点控制器502还可发送传感器数据到机箱104的风扇控制器508。然后风扇控制器508可利用传感器数据来控制风扇108的速度。
风扇控制器508可包括软件,以便控制和监控风扇108的速度和状态,以及通知域控制器514的与风扇108相关的任意关键问题。风扇控制器508可通过管理网络与域控制器514通信。风扇控制器508可接收来自位于同一机箱104内的所有节点控制器502的温度数据,以便调节风扇速度使其符合系统的热需求。风扇控制器508可包括主要的配置文件,在启动时必须读取其不同内容,且可从域控制器514被覆盖。具体的,必须从配置文件读取控制风扇控制器508性能(诸如查询频率、缺省调试水平等)的参数,且参数可因应测试或调整目的而可被域控制器514清除。
现在参照图6,示出风扇控制器508的组件的框图。风扇控制器508可包括网络抽象层602和硬件抽象层604。风扇控制器508中服务器之间的互连可与执行有关且将受到底层硬件的较大影响。例如,互连可以是到下载图书库、共享的存储器、或像队列的内部程序通信架构的简单访问。网络抽象层602可在不受到所使用的底层网络程序的影响下允许风扇控制器508从网络发送和接收消息。风扇控制器508可包括确定风扇控制器508的物理位置的识别服务器606。具体的,风扇控制器508的首要任务是识别其自身。由于风扇控制器508位于机架102中的机箱104内,该识别是基于风扇控制器508的物理位置的。利用硬件抽象层604,风扇控制器508将确定与其相关联的机箱号。机箱号将公知为位置字符串且可指定为风扇控制器508的主机名。如由本领域的那些普通技术人员意识到的那样,根据本发明的益处,基于风扇控制器508的物理位置,可给风扇控制器508分配静态地址。一旦IP地址分配到风扇控制器508,那么必须重新启动风扇控制器508中的任何其它服务器。然后风扇控制器508将验证地址在网络中是否是唯一的。如果分配的地址不是唯一的,那么风扇控制器508将发送错误消息到日志服务器614并且尝试从地址的存储池获取地址。
在一个实施例中,可提供用于调整风扇108速度的动态风扇控制器608。传感器(未示出)可置于该系统中。动态风扇控制器608可接收来自机箱104的一个或多个传感器的定期传感器读数并且利用PID控制器算法动态调整风扇108的速度,该控制器算法馈入来自机箱104中的滑动部件106或位于机箱104前面的其它环境传感器的传感器数据。例如,动态风扇控制器608可接收来自每一滑动部件106的下述传感器数据:出口环境温度(基于节点控制器502的温度探测器);CPU温度(来自BMC);DIMM温度(来自BMC);以及滑动部件功率消耗。此外,动态风扇控制器608可接收来自机箱104的定期传感器读数,诸如环境温度。对于每一传感器读数而言,在动态风扇控制器608中将存在分立的PID控制器。如本领域的普通技术人员会意识到的那样,根据本发明的益处,PID控制器会基于从用于系统中的传感器接收到的一个或多个变量来控制风扇速度。如果存在传感器停止运转,风扇传感器508停止运转,或另外如果动态风扇控制器608也停止运转且不能恢复的情况,风扇108将被指令在最大速度下操作。
由于对于本领域的普通技术人员而言这种回馈控制系统的操作是公知的,因此在此将不再进行更详细的论述。如果风扇模块的一个风扇108停止运转,风扇控制器508将指令其余风扇在最大速度下运行。在一个示范性实施例中,在固件停止运转的情况下,风扇108可设定成在最大速度下操作,而风扇控制器508重新启动。
风扇控制器508的通知服务器610可将来自风扇控制器508的消息发送到域控制器514和其它接收器。消息可包括数据更新或令人关注的事件(例如,风扇错误)。通知服务器610的首要任务是通知域控制器514风扇控制器508已经准备好。此外,在初始“注册”之后,通知服务器610将来自风扇控制器508的其它组件的消息传送到域控制器514和其它装置(例如,动态风扇控制器608)。风扇控制器508还可包括命令监听服务器612,其通过先前产生的面向连接会话接收来自域控制器514的消息或命令。命令监听服务器612可将收到的请求排序以及一次解决一个请求。队列的最大数目可从配置文件读取。结果,从命令监听服务器612执行的以便管理和监控操作的方法不需要是线程安全的,但是建议使用线程安全方法。虽然在正常的操作条件下仅仅需要来自域控制器514的一个连接,但是为了调试目的,希望具有在队列中允许建立多于一个连接的能力,这样即使在连接到某一域控制器514的情况下,测试客户端仍可将命令发送到风扇控制器508。
风扇控制器508可进一步包括一日志服务器614,其接收来自风扇控制器508的其它组件的消息并且将它们存储在物理介质中,该物理介质可为永久位置(例如,EEPROM)。日志服务器614可将日志在物理介质内按顺序循环,这样其从不会满,且最近的消息仍可得到。日志的最大尺寸取决于可用的且可以是配置文件一部分的硬件资源。例如,在一个实施例中,日志服务器614中的消息数目可为500,而在另一实施例中,消息数目可为20。
此外,风扇控制器508可包括监控服务器616,对于每一令人关注的传感器(例如速度传感器)而言,其保持最后的读取值,并且如果传感器数值落到预定的可接受范围之外,则将令人关注的事件(例如,风扇错误)发送到通知服务器610。此外,监控服务器616可经由通知服务器610将定期更新的动态数据发送到域控制器514。在一个实施例中,监控服务器616可为每个“传感器”不断地以每个预定频率从硬件抽象层604轮询数据,并且可将预定数目的传感器读数存储于存储器内。然后所存储的传感器读数可用于计算适于特定传感器的平均值,该平均值是当监控服务器616询问传感器时被报告的值。可在配置文件中设定将被存储的传感器数目以及取样率。
在一个实施例中,风扇控制器508的监控服务器616可利用所接收的传感器数据以及将它们与三个操作范围相比较以便确定风扇108是否是在正常范围内操作、在警告范围内操作或是在报警范围内操作。传感器进入上述范围之一的每一次,风扇控制器508的监控服务器616会将该事件发送给通知服务器610,其将通过域控制器514通知终端用户518。可通过域控制器514将适于每一类的范围设定于配置文件内。
最后,风扇控制器508可包括信跳信号618,其是在预定频率下轮询风扇控制器508的低端装置,并且如果其没有接收到来自风扇控制器508的回复,那么其将重新设定风扇以便在全速下操作。
为了产生灵活性的和可维持的编码,风扇控制器服务器可布置成使得它们不与硬件直接交互。相反,风扇控制器508可包括作为服务器和硬件620之间界面的硬件抽象层604。例如,如果命令监听服务器612接收到将风扇108关闭的命令,命令监听服务器612可将请求发送到硬件抽象层604,该硬件抽象层604知晓用于执行任务的物理介质和程序。如对于本领域的那些普通技术人员而言显而易见的那样,根据本发明的益处,风扇控制器508可管理许多硬件装置620,包括但不限于风扇PWM 620a,风扇转速表620b,EEPROM/Flash 620c,以及“停止运转无害(fail no harm)”控制器620d。
现在参照图5,节点控制器502可执行由域控制器514请求的管理和监控操作,诸如服务器的供电管理。节点控制器502可利用管理网络与域控制器514通信。
域控制器514可包括主要的配置文件,在节点控制器502的不同组件启动时必须读取该主要的配置文件。该配置文件可从域控制器514覆盖。读取控制节点控制器502性能(诸如查询频率、缺省调试水平等)的参数必须从配置文件读取,且可为了测试和/或调整目的而可被清除。在系统的测试过程中,主要配置文件的存在将硬编码从上述编码中去除以及允许小的变化容易地执行。此外,原始配置文件的拷贝文件可保持在系统中允许“重新设定”,由此将原始配置文件写入到节点控制器内以及重新启动系统。
现在参照图7,示出节点控制器502的某些示范性组件的框图。节点控制器502可包括一系列充分定义的服务器且利用赋予软件灵活性和便携性的网络抽象层702和硬件抽象层704。服务器之间的互连可以相关的关系执行,并且会受到底层硬件的影响。在某些实施例中,其(互连)可以是访问下载图书库、共享的存储器、或像队列的内部程序通信架构的简单方法。
网络抽象层702可在不受到所使用的底层网络程序的影响下允许软件从网络发送和接收消息。节点控制器502的一个首要任务是将其自身识别确认到系统。在一个实施例中,节点控制器502可通过明确其在具体机架102、机箱104以及滑动部件106中的物理位置而将其自身识别确认到系统。因此启动的第一组件之一可为识别服务器,其确定节点控制器502的物理位置。利用硬件抽象层704,节点控制器502将确定其所定位的机箱号和机箱104内部的节点号。然后将给特定节点控制器502的位置分配静态地址。一旦分配IP地址,那么必须重新启动节点控制器502内的任意其它服务器。然后节点控制器502将验证地址在网络中是否是唯一的。如果分配的地址不是唯一的,那么节点控制器502将记录错误并且尝试从存储池获取地址。可频繁地(例如,每十秒)执行识别程序,且如果地址变化,则其应该重新注册。
通知服务器708可将来自节点控制器502的消息发送到域控制器514和其它接收器。这些消息可包括数据更新(例如,传感器数据)或令人关注的事件(例如,状态变化和错误)。通知服务器708的首要任务是通知域控制器514节点控制器502已经准备好以及利用域控制器514来“注册”节点控制器502。如果初始尝试注册节点控制器502未成功,那么通知服务器708可等待预定的时间量以及继续尝试直到建立连接。此外,通知服务器708可通过管理网络发送来自节点控制器502中的其它服务器和/或模块的消息。在一个实施例中,通知服务器708可以预定的间隔将消息发送到域控制器514,以便检测主域控制器514和辅助域控制器514(在下面进行更详细的论述)两者同时脱机离线的不太可能发生的事件。一旦注册完成,通知服务器708可读取传感器以及来自由节点控制器502管理硬件的其它动态数据;通过将它们与可接受的范围进行比较来确定读数是否导致由通知服务器708发送的令人关注的事件;以及经由通知服务器708将定期更新的动态数据发送到域控制器514。
节点控制器502还可包括命令监听服务器710。命令监听服务器710可通过先前产生的面向连接会话接收来自域控制器514的消息或命令。命令监听服务器710可将收到的请求排序以及一次解决一个请求。因此,从命令监听服务器710执行的以便管理和监控操作的方法不需要是线程安全的。在一个实施例中,可允许在队列中建立多于一个的连接。
此外,节点控制器502可包括串行控制服务器712。串行控制服务器712可以两种模式运行。第一模式是缓冲模式,在该模式下,节点控制器502收集来自服务器107的控制端口的任何数据以及将其存储在按顺序循环的缓冲器内。第二模式是交互模式,其允许终端用户518经由节点控制器502与服务器107的串行控制进行交互。即使实际上终端用户518和串行控制服务器712之间的任意通信必须通过域控制器514和节点控制器502,但是交互模式的执行也模拟终端用户518直接连接到串行控制服务器712的串行端口。在一个实施例中,缓冲模式可为适于串行控制服务器712的服务器缺省模式。缓冲器可具有FIFO设计,数据的时间较前的字节可被删除以便允许将新的字节添加到缓冲器的顶部。
还可提供日志服务器714,其接收来自节点控制器502的其它组件的消息并且将它们存储在诸如像EEPROM的物理介质中。节点控制器502还可包括适于每一传感器的监控服务器716,其监控令人关注的系统特性(例如温度、功率消耗、电压、电流等)。在一个实施例中,监控服务器716可不断地从硬件抽象层704轮询适于每一管理硬件718的数据。监控服务器716可保持传感器的最后读取值以及可将事件发送给通知服务器708。例如,如果温度传感器(未示出)指示温度超过预定的安全阈值,监控服务器716会将事件发送到通知服务器708,将该事实告知通知服务器708。在一个实施例中,通过由监控服务器716存储的令人关注的特性值(该值是经过预定时间间隔读取的许多传感器读数的平均值)可降低潜在的系统错误。在一个实施例中,传感器数据可与适于特定传感器的“可接受范围”相比以确定是否达到了阈值极限。监控服务器716可在预定频率下将传感器数据推送到域控制器514和/或其它接收器(例如,风扇控制器508)。在一个实施例中,监控服务器716还可与滑动部件106的BMC交互以便收集和/或推送数据。
如由本领域的那些普通技术人员会意识到的那样,根据本发明的益处,节点控制器502服务器可管理许多硬件组件718,包括但不限于,主板718a,物理位置总线/插头718b,多个LED 718c,多个传感器718d,以及EEPROM/FLASH 718e。但是,为了产生灵活性的和可维持的编码,节点控制器502服务器可不与所管理的系统硬件718直接交互。相反,节点控制器502服务器可利用对硬件进行抽象的硬件抽象层704。例如,当命令监听服务器719接收到关闭LED 718c的命令,命令监听服务器710可将请求发送到硬件抽象层704。该硬件抽象层704知晓用于管理LED的物理介质和程序。结果,在节点控制器502运行的硬件改变时,仅仅硬件抽象层704以及可能还有网络抽象层702需要改变,而其它系统组件基本保持相同。节点控制器502比多功能的基板管理控制器更便宜,但是提供了超大规模数据中心的客户希望的最关键能力。
现在参照图5,I2C信号504可用于指示每一滑动部件106自身定位于机箱104内。此外,I2C信号504可用作后门,以便在节点控制器502不能获得IP地址或以太网交换机506受到损坏的情况下发送/接收数据。在每一机箱104的后部,可存在产生以太网网络的交换机506,允许节点控制器502与其它装置通信。
如图5所示,系统可包括一个或多个电源模块510,其可将电源供应给一个或多个机箱104。电源模块510可包括从数据中心和/或AC插座(馈给第三方组件)接收电力以及给机箱104供电的配电单元(“PDU”)。电源模块510可耦联到电源模块控制器512,其为电源模块510(其可包括PDU,PSUs,AC插座等)提供管理和监控能力。电源模块控制器512可通过管理网络与域控制器514通信。因此,系统可包括将来自电源模块510的电力分配到一个或多个机箱104的共享电源子系统。结合图9更详细地论述共享电源系统的操作。
在一个示范性实施例中,机箱104还可包括后备电池116。在PDU停止运转的情况下,后备电池116给服务器107供应直流电。电源模块控制器512给后备电池116提供管理和监控。电源模块控制器512可仅仅获取由后备电池116提供的最关设置和度量设置(例如,电池状态,剩余时间等)并且将上述呈现给终端用户518。由后备电池116产生的任何警告和/或事件还可通过电源模块控制器512传输。
如下面更详细论述的那样,取决于系统需求可操作域控制器514来执行一项或多项下述功能:显示机箱104内的所有装置的目录;允许设定和显示诸如机箱名、机箱类型和机箱高度(例如,42U)的机箱信息以便允许目录管理;给一个或多个滑动部件106中的服务器供电管理;监控由机架内的每一装置消耗的功率以及总功率消耗;监控机箱104控制器中的不同传感器的温度;监控风扇温度;提供诸如最高温度、平均温度、装置误差等的关键测量值的集合;检测机箱104中任意控制器的停止运转以及其它关键状况;允许在不影响系统性能的情况下对机箱104内的控制器升级;将历史传感器数据保持在数据库中以及提供性能的统计数据;当总的机架功率消耗超过预定阈值时,当电源或调解系统工作负荷无效时,允许机箱级的功率消耗。
域控制器514可连接到用于会聚机箱104内交换机的总交换机516。终端用户518可利用域控制器514管理机架内的任意装置。上述包括电源的管理和监控、传感器监控、通过LAN的串行、检测机架内的关键警告、和/或希望被监控或控制的其它系统特性。
结合图8更详细地描述域控制器514的操作。如图8所示,域控制器514的两个主要组件是管理器802和界面804。管理器是负责管理和监控系统特定件的模块以及界面是给终端用户518提供管理和监控能力的编码。管理器802可包含存储于数据库内的对象。可存在对应于从机架102到域控制器514本身的系统中的每一装置的对象。对象将具有性能和方法。例如,机架对象可具有像最高温度、总功率消耗等的性能以及像(开/关)电源管理的方法。对象可存储于包含最新更新数据的数据库中的表格内。
界面804接收来自终端用户518的命令以及与合适管理器802通信以便满足各种需求。因此,界面804和管理器802是独立的,这样例如从节点控制器502读取功率测量值的编码与允许域控制器514重新启动的编码没有任何关系。
管理器802可包括装置管理器806。装置管理器806可通信耦联到由低级控制器提供的传感器数据的高效缓存808。单域控制器514可与许多低级控制器交互。例如,装置管理器806可接收来自滑动部件106、风扇108、机箱114和后备电池116的传感器数据。低级控制器可将数据推送到域控制器514的装置管理器806。装置管理器806可将该数据存储在高效缓存808内,这样当终端用户518请求监控数据时可快速地重新获取。因此,装置管理器806可将数据存储在数据库内,其将允许用户518转储历史数据以及允许装置管理器806给用户518提供关于系统性能的统计数据。例如,在一个示范性实施例中,来自每一低级控制器的传感器可集中在中央高效缓存808内。在经过预定的取样间隔之后,整个高效缓存808可转储到数据库中。此外,高效缓存808可提供客户需求的即时监控数据。例如,可以由高效缓存808满足终端用户518关于滑动部件106的实时功率消耗的查询,而没有必要将TCP命令从装置管理器806发送到节点控制器502。
在发生域控制器514从没有注册的低级控制器接收数据包的不太可能事件的情况中,域控制器514将产生事件,检查底层的用户数据报程序数据包,获取低级控制器的IP地址,以及发送用于获取控制器信息的命令,这样高效缓存808可被更新。如本领域的普通技术人员会意识到的那样,根据本发明的益处,上述只有在如果在更新数据发送到辅助冗余的域控制器524之前低级控制器由域控制器514注册以及域控制器514脱机离线的情况下才会发生。
低级控制器(例如,节点控制器502)具有一次执行一个命令的能力。相反,为了扩充目的,可由域控制器514在给定时间下执行多于一个的命令。在一个实施例中,域控制器514的装置管理器806组件可包括任务组合架构(Task Pool Architecture)(如在从软件基金会(并入到特拉华州)获得的网络服务器中使用的那样)以便允许一次执行多于一个的命令。具体的,利用任务组合架构,一组线程可平行操作以便执行一组命令。例如,通过具有10个线程供电管理10节点可对100个节点进行供电管理。
在一个示范性实施例中,如果高效缓存808检测到低级控制器没有以及时方式更新其数据,其会将“获取传感器数据”信号发送到具体的低级控制器。在将“获取传感器数据”信号发送到具体的低级控制器之前允许经过的时间量由用户518根据系统需求来预先设定。如果将“获取传感器数据”信号传输到具体的低级控制器失败,或者如果高效缓存808沒有接收到来自低级控制器的响应信号,那么高效缓存808会将关于那个低级控制器的过期数据去除以及产生用于提供通知问题的事件。
在一个示范性实施例中,域控制器514可进一步包括通知管理器810。通知管理器810起到适于事件的“贮存器”的作用,并且在系统中会发出警告,其可被排序成队列811且传送到通知管理器810。例如,通知管理器810会包含“系统被启动”或者“节点1的温度传感器超过临界阈值”的信息。通知管理器810负责将令人关注的事件(例如,温度高于阈值,系统初始化等)发送到不同的目的地。在一个实施例中,通知管理器810可将事件和/或警告发送到简单网络管理程序(SNMP)陷阱812,其可用于监控网络连接装置的注意保证授权的状况。SNMP陷阱812的操作对于本领域的那些普通技术人员而言是众所周知的因此在此不再详细论述。类似的,如本领域的那些普通技术人员意识到的那样,根据本发明的益处,通知管理器810可将事件和/或警告发送到其它目的地,诸如像日志、系统日志814或其它合适的目的地。SNMP陷阱812和/或系统日志814可用于通过用户界面816和/或其它发送器818将保存于通知管理器810中的事件和/或警告通知给终端用户518。
在一个实施例中,域控制器514可进一步包括安全管理器820。安全管理器820负责验证和/或基于角色授权。可利用本地或异地目录进行验证。在一个实施例中,本地目录可在轻量目录访问程序(“LDAP”)下进行操作。目录可包含关于本地LDAP服务器822上用户的信息,并且如果必要或必要时可扩充以便添加附加信息。通过缺省,系统可包括带有本地用户(例如,管理员)的本地LDAP服务器822。但是,终端用户518可添加另一LDAP服务器或类似的客户目录服务器823,这样域控制器514可了解其它用户。因此,在一个示范性实施例中,域控制器514可通过缺省具有三个用户:客户、管理员、操作员。信息可存储在本地LDAP服务器822中。但是,终端用户518可具有带有成百上千用户的其自身的客户目录服务器823。终端用户518应该能够将其自身的客户目录服务器823链接到域控制器514,这样此时域控制器514可由那些成百上千的用户的任意用户使用。多数用户的信息可存储在本地LDAP目录(例如,Opendap)内。如由本领域的那些普通技术人员会意识到的那样,根据本发明的益处,如果域控制器514在Linux系统上运行,Linux系统必须知晓用户信息已经存储在本地LDAP目录中且必须允许用户经由LDAP进行Secure Shell(SSH)或Telnet验证。
每一系统管理器必须由安全管理器820进行检查以便确定是否可执行允许基于角色进行访问控制的动作。在一个实施例中,系统可仅仅允许两个角色:(1)具有只读特权的客户角色;以及(2)具有读/写特权的管理员角色。
此外,安全管理器必须设定防火墙以及限制进出域控制器514的流量。在一个实施例中,通过使得安全管理器820允许所有流量流出以及限制流入流量而可简化系统的操作。
在一个实施例中,域控制器514可包括域控制器管理器824,其负责管理域控制器514本身。域控制器管理器824的功能例如可包括网络覆盖域控制器514、重新启动域控制器514等。此外,域控制器管理器824可允许从底层的文件系统恢复日志。
域控制器514可进一步包括冗余管理器826。冗余管理器826负责发送和/或从网络中的域控制器(诸如像辅助域控制器524)接收“信跳”。冗余控制器826的工作是确保当域控制器停止运转时,另一个将会备援而不中断系统性能。
在一个实施例中,域控制器514可操作以便起到适于文件传输例如当进行文件更新时的简单文件传输程序(“TFTP”)的作用。类似的,域控制器514可操作成起到动态主机设置程序(“DHCP”)服务器的作用,当控制器不能获取物理位置时进行动态IP地址配置。此外,域控制器514可操作成起到简单网络时间程序(“SNTP”)服务器的作用以便将网络中的所有控制器的时间同步。
除了管理器802之外,域控制器514包括界面804。在一个实施例中,域控制器514可包括可编写脚本的命令行界面(“CLI”)828。在一个实施例中,命令行界面可用类似于适于服务器硬件(“SMASH”)/通信链接程序(“CLP”)的系统管理架构的特征写入。所有系统能力可通过可编写脚本的CLI 828显现。可编写脚本的CLI 828可利用SSH或Telnet程序与终端用户518通信。
在串行控制服务器712为缓冲模式的情況下,终端用户518可登录到域控制器514以便访问CLI 828。在CLI 828中,终端用户518可键入请求以便请求缓冲数据。作为响应,CLI 828在装置管理器806中执行任务。之后装置管理器806可将TCP/IP消息发送到访问缓冲串行数据的合适节点控制器502。然后节点控制器502将产生回复消息以及将其FIFO缓冲数据放入到那个回复消息内。该消息通过网络由装置管理器806接收,以及装置管理器806将利用数据回复到CLI 828。然后可由CLI 828显示数据。当为缓冲模式时,串行数据从主板到节点控制器502的FIFO的传输从来不会被中断。
在一个实施例中,串行控制服务器712还可以交互模式操作,其允许终端用户518通过其串行端口与服务器107交互。在该实施例中,终端用户518可登录到域控制器514以便经由SSH或Telnet访问CLI 828。然后终端用户518可将命令键入以便开始与滑动部件106中的服务器107交互会话。此时,CLI 828在装置管理器806中执行任务。装置管理器806将TCP消息发送到合适的节点控制器502,请求开始交互会话。然后节点控制器502可获知该命令并且回复域控制器514其已准备好。此外,节点控制器502会产生将发送和接收来自通用异步接收/发送装置(“UART”)的数据的警告。装置管理器806将连接已准备好回复到CLI 828,以及CLI 828开始TCP连接到节点控制器502,其中给定端口以便接收和发送数据。每次接收到字符,可将字符发送到节点控制器502,其依次将所接收的字符发送到特定服务器107的串行端口。此时,节点控制器502可读取服务器107的串行端口以及通过TCP连接将响应回送到CLI 828。然后在装置管理器806处的线程/程序可将数据放入CLI 828中。通过架合适的命令输入到CLI 828终端用户518可退出交互会话。如果缓冲模式可用,其将不会干扰交互会话。相反,其应该表现正常,以及记录串行控制服务器713的输出。此外,由于域控制器514具有串行端口,客户可通过该端口访问CLI 828以及执行任何CLI命令,包括通过LAN串行到服务器107。
域控制器514界面804可进一步包括SNMP 830,其可用于执行基本的系统操作,诸如像对节点供电管理、读取目录等。
职能平台管理界面(“IPMI”)832可允许用户518通过局域网(“LAN”)将IPMI或数据中心管理界面(“DCMI”)消息发送到域控制器514。域控制器514可提供IP别名以将几个IP地址呈现给网络,每一IP地址与特定的滑动部件106相关联。由域控制器514接收消息并将其发送到合适的滑动部件106。节点控制器502可处理包含于远程管理和控制程序+(“RMCP+”)消息内的未处理的IPMI数据包,并且在域控制器514处处理任何的IPMI软件栈。
对于每一机架102而言,IPMI界面还可存在于域控制器514中,其可为机架级管理提供OEM命令。例如,机架级管理可包括机架102中的机箱104的列表目录(包括插入于其内的滑动部件106,滑动部件106位于机箱104内),经受管理的滑动部件106的IPMI地址以及滑动部件106的状态。此外,机架级管理可包括风扇控制器508上的信息,诸如像每一风扇108的状态和/或每一风扇108的速度。机架级管理可进一步包括电源模块控制器512上的信息,诸如每一PDU的状态,被消耗的功率,以及机箱104关键测量值的显示,诸如总的功率消耗和最高温度。
域控制器514可进一步包括SMASH界面834。SMASH是可置于管理器802顶部上的标准管理结构框架。如由本领域的那些普通技术人员意识到的那样,SMASH利用面向对象的方法来限定系统的管理和监控能力,以及利用“提供器”来从进入该面向对象的结构框架内的管理系统获取数据。利用SMASH界面的优势是它们允许使用标准的用户界面,诸如适于命令行界面的SMASH/CLP 836以及适于网络服务器的通用信息模型(“CIM”)/可扩展标记语言(“XML”)或网络服务管理(“WS-MAN”)838。
在一个实施例中,操作系统监视器840可不断地检查不同系统组件的状态以及在失败或死机的情况下重新启动必要的组件。
在一个实施例中,如果域控制器514可由用户设定为机架级功率上限策略的一部分,那么域控制器514负责制定功率上限。在该实施例中,功率监控传感器(未示出)可以预定频率更新。如果功率消耗超过适于特定时间量的阈值界限,功率阈值可执行如以功率循环选项或日志请求的异常动作。异常的时间界限可以是功率监控取样时间的倍数。在操作过程中,用户518可限定适于机箱104的预先设定的总功率上限。然后域控制器514将消息发送到节点控制器502以便启动功率上限。该消息可包括功率阈值、异常时间界限、如果超过异常时间界限采取的动作、以及突发情况的时间界限。然后系统可将上限设定为阈值或仅仅记录超过阈值的事件。如由本领域的那些普通技术人员会意识到的那样,根据本发明的益处,阈值可指定为经过预先设定时间量的平均功率消耗。在一个实施例中,如果功率消耗超过阈值,通知则会发送到域控制器514。如果在时间界限终止之前功率消耗下降到阈值以下,节点控制器502将不再采取进一步的动作。但是,如果时间界限终止,那么取决于从域控制器514接收到的指令,节点控制器502可执行上限或发出通知。如果由节点控制器502成功地执行上限程序,那么系统继续其操作。但是如果达到突发情况时间界限以及功率消耗没有下降到阈值以下,服务器107关闭。在一个实施例中,节点控制器502可将功率上限设定存储于闪存内,这样甚至在复位之后,仍然保持上述设定值。域控制器514可使得系统的功率上限能力可用或不可用。因此,终端用户518可通过CLI 828和域控制器514使得功率上限可用或不可用,以及指定各种功率上限参数。
在一个示范性实施例中,可利用机架级上盲限来指定适于服务器107的功率上限。在该实施例中,该上限由机架102中的所有服务器107之间均分。当所有的服务器具有类似的特性以及提供相似功能时该方法是有利的。在另一实施例中,利用机架级的一般上限可指定适于服务器107的功率上限。在该实施例中,通过允许服务器107之间的功率重新分配来制定功率上限,尽可能地避免比较忙碌的服务器(通常,比较忙碌的服务器消耗更多的功率)功率上设有制定。这是一个持续的过程,且其是避免最关键服务器性能降低的好方法,尽管消耗更少功率的服务器性能将最大程度地受到影响。如由本领域的那些普通技术人员会意识到的那样,根据本发明的益处,在任一方法中,如果服务器107不能再进一步地制定上限(也就是,降低功率消耗的进一步尝试会失败),那么它应该被关闭,这样可确保功率分配。
在终端用户518对应用具有特定性能目标(例如,查询的响应时间)的情况下,可以使用制定功率上限来降低服务器107中的功率,同时保持目标性能,最后降低机箱104的操作成本。因此,终端用户518可在机架102或一组服务器107中首先对功率消耗取样,以及给系统制定上限以便降低功率。然后终端用户518可在指定的功率计划方案下测量应用性能。该过程可重复直到确认达到最佳的性能和功率上限架构。
在一个示范性实施例中,终端用户518可将上限应用于服务器107。在另一实施例中,群体级的上盲限可用于确定适于系统组件的功率上限。在该实施例中,一旦通过试验确定最佳的功率上限,则该同一功率上限可应用于机架102中的一个或多个服务器(預計服务器运行用于确定最佳上限的相同应用程序)。由于可编写脚本的CLI 828允许终端用户518设定服务器级的功率上限以及读取机架102中的不同装置的功率消耗,终端用户可从外部服务器控制制定功率上限的程序。
在某些情况下,在冷却系统中出现关键失败的情况下希望使用功率上限。例如,如果入口温度大幅上升,通过定制上限来调节系统组件可有助于临时降低系统温度,而不需要等待内部热量散失。具体的,在热量传感器读数超过某一温度的情况下,终端用户518可预先设定希望的降低功率消耗的百分比。然后在热量突发事件发生的情况下,可相应地降低功率消耗。
在一个实施例中,终端用户可在服务器107上获得功率消耗的估计值和/或在机架102(包括服务器、风扇、交换机等)上获得总的功率消耗。在该实施例中,域控制器514可从每一控制器访问更新的传感器信息,上述控制器包括节点控制器502(适于服务器级的测量)和电源模块控制器512(适于PDU测量)。因此可以计算由机架102、机箱104或由服务器107在给定时间的总的功率消耗。此外,终端用户可利用可编写脚本的CLI 828来读取单个服务器107的功率消耗,以及使用这些读数来在外部服务器上执行计算。
现在参照图9,根据本发明示范性实施例的共享电源系统通常用附图标记900标注。在该示范性实施例中,每个机箱104存在5个滑动部件106。但是,如由本领域的那些普通技术人员会意识到的那样,根据本发明的益处,在此公开的系统和方法可用于每个机箱104内的不同数目的滑动部件106。在一个实施例中,共享电源系统900允许将来自PDU 902的12V分配到一个或多个机箱104。如图2和3所示,滑动部件106可连接到机箱104内的同一背板112以便供电和管理。在一个实施例中,两个或多个4U的机箱104可共享PDU 902,其包括产生电源域的1+N个PSU 904。每个机架102可包括两个或多个电源域。此外,诸如像交换机的第三方产品可设置在PDU902的前方。
在一个实施例中,每个机箱104可使用用于分配功率的总线906。具体的,由于机箱104安装于其它机箱104或电源模块510的顶部或上方,可利用机箱104后部中的总线906来分配功率。在另一示范性实施例中,可用电缆来提供将来自电源模块510的功率直接连接分配到每一机箱104。
图10示出机箱104到PDU 902的连接。如由本领域的那些普通技术人员会意识到的那样,根据本发明的益处,多于一个的机箱104可连接到PDU902。此外,PDU 902可包括一个或多个PSU 904。在一个实施例中,PDU 902可包括用于冗余的N+1个PSU 904,其中N是从电源馈入到滑动部件106的号。具体的,利用N+1个PSU 904允许PDU 902满足负载需求,同时提供冗余,这样如果PSU 904停止运转,还存在剩余的PSU 904来承载负载。如图10中所示,PDU 902的总线906可通过一个或多个电源电缆连接到机箱104的总线908。然后总线908可通过背板112给滑动部件106供电。
虽然结合机架中的服务器对示范性实施例进行了描述,但是如由本领域的那些普通技术人员会意识到的那样,根据本发明的益处,本发明并不限于服务器,而是可以结合用于诸如数据存储装置的其它信息处理系统中。此外,在此公开的系统和方法并不限于包括一个机架的系统,而是可结合用于两个或多个机架中。如由本领域的那些普通技术人员会意识到的那样,根据本发明的益处,在多机架的域控制器514通过将来自其它机架的管理交换机连接到总交换机516而允许扩充且可支持多机架的管理能力。
虽然已经详细地描述了本发明,但是应该理解在不脱离本发明精神和范围的情况下可对其进行各种改变、替换和更改,本发明的精神和范围由所附的权利要求限定。

Claims (47)

1.模块化的信息处理系统结构框架,包括:
机架,其包含至少一个机箱;
置于机箱内的滑动部件,其中滑动部件包括至少一个信息处理系统;
置于机箱内以便冷却信息处理系统的风扇;
通信连接到风扇的风扇控制器,其中风扇控制器管理风扇的操作;
与滑动部件相关联的节点控制器,其中节点控制器管理滑动部件的操作;
用于将电源供应给信息处理系统的电源模块;
用于管理电源模块操作的电源模块控制器;以及
与风扇控制器、节点控制器以及电源模块的至少之一通信耦联的主域控制器,其中主域控制器管理风扇控制器、节点控制器以及电源模块的至少之一的操作。
2.根据权利要求1所述的系统,其中主域控制器提供适于模块化信息处理系统结构框架的用户界面。
3.根据权利要求2所述的系统,其中主域控制器可操作来将关于模块化信息处理系统结构框架性能的信息显示给用户。
4.根据权利要求2所述的系统,其中主域控制器允许用户控制模块化信息处理系统结构框架的性能参数。
5.根据权利要求1所述的系统,还包括辅助域控制器,其中如果主域控制器变得不可操作,则辅助域控制器管理风扇控制器、节点控制器以及电源模块的至少之一的操作。
6.根据权利要求5所述的系统,还包括管理系统,其中管理系统包括主域控制器、辅助域控制器以及管理交换机的一个或多个。
7.根据权利要求1所述的系统,其中主域控制器通过管理网络通信耦联到电源模块控制器、风扇控制器以及节点控制器的至少之一。
8.根据权利要求7所述的系统,其中管理网络是以太网网络。
9.根据权利要求1所述的系统,其中信息处理系统选自于由服务器和数据存储装置构成的组。
10.根据权利要求1所述的系统,还包括用于监控滑动部件、风扇和电源模块至少之一的操作状况的一个或多个传感器。
11.根据权利要求10所述的系统,其中一个或多个传感器选自于由温度传感器和功率监控传感器构成的组。
12.根据权利要求1所述的系统,其中主域控制器包括一个或多个管理器以及一个或多个界面。
13.根据权利要求10所述的系统,其中主域控制器包括:
通信耦联到一个或多个传感器的装置管理器,其中装置管理器接收来自一个或多个传感器的传感器数据;
用于管理主域控制器的主域控制器管理器;
用于验证到主域控制器连接的安全管理器;以及
用于监控由装置管理器所接收的传感器数据的通知管理器。
14.根据权利要求13所述的系统,其中如果传感器数据指示发生了令人关注的事件,则通知管理器产生通知。
15.根据权利要求14所述的系统,其中令人关注的事件选自于由指示温度超过温度阈值的传感器数据和指示功率消耗超过阈值的传感器数据构成的组。
16.根据权利要求14所述的系统,其中通知管理器通过用户界面产生给终端用户的通知。
17.根据权利要求5所述的系统,其中主域控制器包括冗余管理器,其中冗余管理器允许主域控制器和辅助域控制器之间的通信。
18.根据权利要求17所述的系统,其中如果辅助域控制器不能与冗余管理器通信,则将主域控制器的操作传送到辅助域控制器。
19.根据权利要求13所述的系统,其中装置管理器包括用于对从一个或多个传感器接收的传感器数据进行缓冲的高效缓存。
20.根据权利要求19所述的系统,其中在预定频率下将传感器数据从高效缓存移动到永久性存储器。
21.根据权利要求1所述的系统,其中风扇控制器包括:
用于识别风扇控制器在系统中的物理位置的识别服务器;
通知服务器,其可操作以便将来自风扇控制器的消息发送到主域控制器;
用于从主域控制器接收消息的命令监听服务器;
监控服务器,其中监控服务器保持跟踪来自与风扇相关联的一个或多个传感器的数据;
动态风扇控制器,用于基于从监控服务器得到的信息来调节风扇速度;
日志服务器,其可操作来接收和存储来自风扇控制器组件的消息;以及
信跳信号,其用于确定风扇控制器是否在操作。
22.根据权利要求21所述的系统,其中如果来自一个或多个传感器的数据指示令人关注的事件,则监控服务器产生到通知服务器的信号。
23.根据权利要求20所述的系统,其中动态风扇控制器包括比例-积分-微分控制器。
24.根据权利要求21所述的系统,其中如果风扇控制器不可操作,则信跳信号指导风扇在最大速度下操作。
25.根据权利要求1所述的系统,其中节点控制器对滑动部件的供电进行管理。
26.根据权利要求1所述的系统,其中节点控制器包括:
用于识别节点控制器在系统中的物理位置的识别服务器;
通知服务器,其可操作以便将来自节点控制器的消息发送到主域控制器和风扇控制器的至少之一;
用于从主域控制器接收消息的命令监听服务器;
用于与信息处理系统交互的串行控制服务器;
监控服务器,其中监控服务器保持跟踪来自与滑动部件相关联的一个或多个传感器的数据;以及
日志服务器,其可操作来接收和存储来自节点控制器的一个或多个组件的消息。
27.根据权利要求26所述的系统,其中如果来自一个或多个传感器的数据指示令人关注的事件,则监控服务器可操作以产生到通知服务器的信号。
28.根据权利要求1所述的系统,其中节点控制器通信耦联到风扇控制器。
29.根据权利要求1所述的系统,其中风扇控制器和节点控制器的至少之一包括包含其操作参数的配置文件。
30.根据权利要求1所述的系统,其中主域控制器可操作以便配置风扇控制器的配置文件和节点控制器的配置文件。
31.模块化机架系统,包括:
置于一个或多个机架内的若干机箱;
置于每一机箱内的若干滑动部件,其中每一滑动部件包括信息处理系统;
用于冷却每一机箱内的若干滑动部件的共享风扇模块;
用于将电源供应给一个或多个机箱内的一个或多个滑动部件的共享电源模块;以及
用于管理若干机箱操作的共享管理模块。
32.根据权利要求31所述的系统,其中共享的风扇模块包括一个或多个风扇和用于控制共享风扇模块操作的风扇控制器。
33.根据权利要求32所述的系统,其中风扇控制器包括:
用于识别风扇控制器在系统中的物理位置的识别服务器;
通知服务器,其可操作以便将来自风扇控制器的消息发送到主域控制器;
用于从主域控制器接收消息的命令监听服务器;
监控服务器,其中监控服务器保持跟踪来自与风扇相关联的一个或多个传感器的数据;
动态风扇控制器,用于基于从监控服务器得到的信息来调节风扇速度;
日志服务器,其可操作来接收和存储来自风扇控制器组件的消息;以及
信跳信号,其用于确定风扇控制器是否在操作。
34.根据权利要求33所述的系统,其中如果来自一个或多个传感器的数据指示令人关注的事件,则监控服务器可操作以产生到通知服务器的信号。
35.根据权利要求31所述的系统,其中共享电源模块包括配电单元和用于控制共享电源模块操作的电源模块控制器。
36.根据权利要求35所述的系统,其中配电单元包括一个或多个供电单元。
37.根据权利要求31所述的系统,其中共享的管理模块包括主域控制器。
38.根据权利要求37所述的系统,其中主域控制器执行功率上限策略。
39.根据权利要求37所述的系统,其中主域控制器跟踪模块化机架系统的一个或多个组件的功率消耗。
40.根据权利要求37所述的系统,还包括辅助域控制器,如果主域控制器变得不可操作,则辅助域控制器代替主域控制器。
41.根据权利要求37所述的系统,其中主域控制器包括:
通信耦联到一个或多个传感器的装置管理器,其中一个或多个传感器监控滑动部件、共享的风扇模块的组件、以及共享的电源模块的组件的至少之一的操作状况;其中装置管理器接收来自一个或多个传感器的传感器数据;
主域控制器管理器,其可操作来管理主域控制器;
安全管理器,其可操作来验证到主域控制器的连接;以及
通知管理器,其可操作来监控由装置管理器所接收的传感器数据。
42.根据权利要求41所述的系统,其中如果传感器数据指示发生令人关注的事件,则通知服务器可操作以产生通知。
43.根据权利要求37所述的系统,进一步包括与滑动部件相关联的节点控制器。
44.根据权利要求43所述的系统,其中节点控制器包括:
用于识别节点控制器在系统中的物理位置的识别服务器;
通知服务器,其可操作以便将来自节点控制器的消息发送到主域控制器和共享的风扇控制器的至少之一;
用于从主域控制器接收消息的命令监听服务器;
用于与滑动部件内的信息处理系统交互的串行控制服务器;
监控服务器,其中监控服务器保持跟踪来自与滑动部件相关联的一个或多个传感器的数据;其中如果来自一个或多个传感器的数据指示令人关注的事件,则监控服务器可操作以产生到通知服务器的信号;以及
日志服务器,其可操作来接收和存储来自节点控制器的一个或多个组件的消息。
45.根据权利要求31所述的系统,其中共享的风扇模块、共享的电源模块以及共享的管理模块通过管理网络通信耦联。
46.根据权利要求45所述的系统,其中管理网络是以太网网络。
47.根据权利要求31所述的系统,其中电源通过机箱背板分配到滑动部件。
CN201110248609.7A 2010-11-04 2011-08-26 机架级模块化服务器以及存储结构框架 Active CN102469740B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/939,939 US8838286B2 (en) 2010-11-04 2010-11-04 Rack-level modular server and storage framework
US12/939,939 2010-11-04

Publications (2)

Publication Number Publication Date
CN102469740A true CN102469740A (zh) 2012-05-23
CN102469740B CN102469740B (zh) 2016-04-27

Family

ID=45219968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110248609.7A Active CN102469740B (zh) 2010-11-04 2011-08-26 机架级模块化服务器以及存储结构框架

Country Status (5)

Country Link
US (1) US8838286B2 (zh)
CN (1) CN102469740B (zh)
DE (1) DE102011085335A1 (zh)
GB (1) GB2485643B (zh)
SG (1) SG180070A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103491743A (zh) * 2012-06-11 2014-01-01 波音公司 用于保持和保护电子模块的底盘系统和方法
US9037309B2 (en) 2012-09-26 2015-05-19 Inventec (Pudong) Technology Corporation Rack server system and operating method thereof
TWI488572B (zh) * 2012-10-29 2015-06-11 英業達股份有限公司 機架式伺服器系統及其操作方法
CN105681359A (zh) * 2016-04-01 2016-06-15 浪潮电子信息产业股份有限公司 一种监控机柜的装置及方法
CN105700655A (zh) * 2014-11-24 2016-06-22 英业达科技有限公司 机柜服务器系统及其电源管理方法
CN107170476A (zh) * 2016-03-08 2017-09-15 广达电脑股份有限公司 用于高密度存储装置以减少上游预热的不同hdd间隙架构
CN107515654A (zh) * 2016-06-15 2017-12-26 广达电脑股份有限公司 伺服器机架组件及其元件载具
CN107624017A (zh) * 2017-07-27 2018-01-23 郑州云海信息技术有限公司 一种整机柜服务器多形态节点混布的方法
CN108701006A (zh) * 2016-03-01 2018-10-23 亚马逊科技公司 服务器系统
CN109417861A (zh) * 2016-07-22 2019-03-01 英特尔公司 用于机架冷却的技术
CN109800082A (zh) * 2018-12-18 2019-05-24 平安科技(深圳)有限公司 结合实际功耗采购服务器的方法、装置及存储介质
TWI737970B (zh) * 2019-03-18 2021-09-01 神雲科技股份有限公司 伺服器機櫃
TWI749072B (zh) * 2017-09-29 2021-12-11 中華電信股份有限公司 異常訊務偵測伺服器及其異常訊務偵測方法

Families Citing this family (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201223423A (en) * 2010-11-23 2012-06-01 Inventec Corp Heat dissipating device and method thereof
WO2012073408A1 (ja) * 2010-11-29 2012-06-07 日本電気株式会社 表示処理システム、表示処理方法、およびプログラム
TWI403884B (zh) * 2010-11-30 2013-08-01 Inventec Corp 機架伺服系統
CN102478006A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 风扇控速系统及其风扇转速读取方法
US20120160469A1 (en) * 2010-12-22 2012-06-28 Alcate-Lucent Canada Inc. Adaptive cooling using power monitoring
US9182874B2 (en) * 2011-01-31 2015-11-10 Dell Products, Lp System and method for out-of-band communication between a remote user and a local user of a server
US8467175B2 (en) * 2011-02-07 2013-06-18 Dell Products L.P. System and method for an optimizable rack solution
US8816868B2 (en) * 2011-06-06 2014-08-26 Apple Inc. Adaptive low-battery warnings for battery-powered electronic devices
MX2014001056A (es) * 2011-07-25 2014-09-16 Servergy Inc Método y sistema para construir un sistema informatico de baja potencia.
TWI448886B (zh) 2011-07-28 2014-08-11 Quanta Comp Inc 伺服器機櫃系統及其控制方法
TW201321943A (zh) * 2011-11-17 2013-06-01 Hon Hai Prec Ind Co Ltd 風扇控制系統及方法
CN103138974A (zh) * 2011-11-28 2013-06-05 英业达科技有限公司 管理风扇转速的服务器机架系统
CN103138975B (zh) * 2011-11-28 2016-01-06 英业达科技有限公司 多个机架系统的托管方法
CN103139248B (zh) * 2011-11-28 2016-04-20 英业达科技有限公司 机架系统
TW201324094A (zh) * 2011-12-13 2013-06-16 Hon Hai Prec Ind Co Ltd 伺服器機櫃
TW201324100A (zh) * 2011-12-13 2013-06-16 Hon Hai Prec Ind Co Ltd 伺服器機櫃
TWI571733B (zh) * 2012-01-10 2017-02-21 廣達電腦股份有限公司 伺服器機櫃系統與其電源管理方法
US8708736B2 (en) 2012-02-01 2014-04-29 Dell Products L.P. Systems and methods for coupling AC power to a rack-level power infrastructure
US10123464B2 (en) 2012-02-09 2018-11-06 Hewlett Packard Enterprise Development Lp Heat dissipating system
EP2826347B1 (en) 2012-03-12 2017-10-25 Hewlett-Packard Enterprise Development LP Liquid temperature control cooling
US8902593B2 (en) * 2012-04-11 2014-12-02 Dell Products L.P. System and method for coupling information handling systems in a modular chassis
US9372786B1 (en) * 2012-06-13 2016-06-21 Amazon Technologies, Inc. Constructing state-transition functions for mobile devices
US9658661B2 (en) 2012-06-22 2017-05-23 Microsoft Technology Licensing, Llc Climate regulator control for device enclosures
US8819779B2 (en) * 2012-07-05 2014-08-26 Dell Products L.P. Methods and systems for managing multiple information handling systems with a virtual keyboard-video-mouse interface
CN103685074B (zh) 2012-09-11 2016-09-28 英业达科技有限公司 机架式服务器系统及自动管理机架配置信息的方法
CN104685984A (zh) 2012-09-28 2015-06-03 惠普发展公司,有限责任合伙企业 冷却组件
US9158345B1 (en) * 2012-10-15 2015-10-13 Google Inc. Managing computer performance
TWI509392B (zh) * 2012-10-23 2015-11-21 Inventec Corp 機架式伺服器系統及自動管理機架配置信息的方法
CN104756618B (zh) 2012-10-31 2017-07-21 慧与发展有限责任合伙企业 模块式机架系统
US9541299B2 (en) 2012-12-14 2017-01-10 Microsoft Technology Licensing, Llc Setting-independent climate regulator control
CN103118103A (zh) * 2013-01-29 2013-05-22 浪潮电子信息产业股份有限公司 一种可实现多节点间互联与管理的云服务器架构
EP2952076B1 (en) 2013-01-31 2019-10-30 Hewlett-Packard Enterprise Development LP Liquid cooling
US20140344431A1 (en) * 2013-05-16 2014-11-20 Aspeed Technology Inc. Baseboard management system architecture
JP6474091B2 (ja) * 2013-06-04 2019-02-27 日本電気株式会社 サーバシステム、その制御方法および制御プログラム
CN104238691B (zh) * 2013-06-07 2017-08-25 英业达科技有限公司 服务器系统及其散热方法
US10423970B2 (en) * 2013-08-26 2019-09-24 Adobe Inc. Changing depth of analytics tracking or content targeting based on user value
JP6020390B2 (ja) * 2013-08-30 2016-11-02 日立金属株式会社 冷却ファンシステム及び通信機器
US9282660B2 (en) 2013-09-17 2016-03-08 Dell Products, Lp Modular data center cabinet rack
WO2015047212A1 (en) 2013-09-24 2015-04-02 Hewlett-Packard Development Company, L.P. Slot based management controller address
CN104571273A (zh) * 2013-10-12 2015-04-29 英业达科技有限公司 风扇控制器以及具有该风扇控制器的服务器系统
KR20150049572A (ko) * 2013-10-30 2015-05-08 한국전자통신연구원 랙 마운트 서버의 전원을 공유하기 위한 시스템 및 그 운영 방법
TW201520752A (zh) 2013-11-29 2015-06-01 Ibm 電腦系統中的電源消耗控制
US20150160627A1 (en) * 2013-12-05 2015-06-11 Dell Products L.P. Methods and systems for monitoring and management in a distributed architecture information handling system chassis
US9874414B1 (en) * 2013-12-06 2018-01-23 Google Llc Thermal control system
US9753520B2 (en) 2013-12-23 2017-09-05 Dell Products, L.P. Predictive power capping and power allocation to computing nodes in a rack-based information handling system
US9625974B2 (en) 2013-12-23 2017-04-18 Dell Products, L.P. Global throttling of computing nodes in a modular, rack-configured information handling system
US10004162B2 (en) * 2013-12-23 2018-06-19 Dell Products, L.P. Enhanced fan design, configuration, and control for modular, scalable and expandable, rack-based information handling system
US9232678B2 (en) * 2013-12-30 2016-01-05 Dell Products L.P. Modular, scalable, expandable, rack-based information handling system
JP6314533B2 (ja) * 2014-02-25 2018-04-25 富士通株式会社 データセンター
TW201533564A (zh) * 2014-02-27 2015-09-01 萬國商業機器公司 電腦系統中基於功率比値的風扇控制系統與方法
US9686882B2 (en) 2014-05-16 2017-06-20 Dell Products, Lp Modular data center cabinet rack guide and retention mechanism
WO2016036383A1 (en) 2014-09-05 2016-03-10 Hewlett Packard Enterprise Development Lp Backup power and load discovery
US9414531B1 (en) * 2014-09-24 2016-08-09 Amazon Technologies, Inc. Modular data center without active cooling
US9871705B2 (en) 2014-10-08 2018-01-16 International Business Machines Corporation Intelligently managing pattern contents across multiple racks based on workload and human interaction usage patterns
TWI561031B (en) * 2014-12-04 2016-12-01 Inventec Corp Method of determining status of serving node
US10216212B1 (en) * 2014-12-16 2019-02-26 Amazon Technologies, Inc. Operating temperature-based mass storage device management
US10225158B1 (en) * 2014-12-22 2019-03-05 EMC IP Holding Company LLC Policy based system management
CN104582449B (zh) * 2015-01-06 2017-08-18 华为技术有限公司 一种通信设备及用于该通信设备的单板
DE102015101304B3 (de) * 2015-01-29 2016-03-17 Fujitsu Technology Solutions Intellectual Property Gmbh Rackserver für ein Serverrack
US9250684B1 (en) * 2015-02-25 2016-02-02 Quanta Computer Inc. Dynamic power capping of a subset of servers when a power consumption threshold is reached and allotting an amount of discretionary power to the servers that have power capping enabled
KR20160112792A (ko) * 2015-03-20 2016-09-28 한국전자통신연구원 데이터 센터의 전력 분산공유 장치 및 분산공유 방법
US9622376B2 (en) 2015-05-04 2017-04-11 Dell Products, L.P. Methodology for electronic equipment to self-identify submersion in mineral oil
US10078610B2 (en) * 2015-05-04 2018-09-18 Dell Products, L.P. System and method for optimized thermal control for management controller offline
US10108236B2 (en) 2015-05-21 2018-10-23 Dell Products, Lp System and method for adjusting cooling fan control settings based on identification of a module
DE102015111097A1 (de) * 2015-07-09 2017-01-12 Ebm-Papst St. Georgen Gmbh & Co. Kg Ansteuervorrichtung sowie Lüftersystem
US11567962B2 (en) * 2015-07-11 2023-01-31 Taascom Inc. Computer network controlled data orchestration system and method for data aggregation, normalization, for presentation, analysis and action/decision making
US10235447B2 (en) * 2015-07-30 2019-03-19 Honeywell International Inc. Method and system for co-operative intelligent HMIs for effective process operations
US10554519B2 (en) * 2016-02-08 2020-02-04 Cray Inc. System and method for dampening power swings in distributed computer environments
US9832905B2 (en) 2016-03-31 2017-11-28 Amazon Technologies, Inc. Server system
US10254807B2 (en) * 2016-06-13 2019-04-09 Dell Products L.P. Systems and methods for policy-based per-zone air mover management for offline management controller
US11232091B2 (en) * 2016-09-29 2022-01-25 Vmware, Inc. Software-defined data center (SDDC) rack quick discovery after hardware management system (HMS) restart
US10433036B1 (en) * 2016-12-21 2019-10-01 Arizona Board Of Regents Data logger system and related methods
US10402887B2 (en) * 2017-01-06 2019-09-03 Tyco Fire & Security Gmbh Systems and methods of product interaction recognition using sensors within a tag
US20190068466A1 (en) * 2017-08-30 2019-02-28 Intel Corporation Technologies for auto-discovery of fault domains
US10942557B2 (en) 2018-07-18 2021-03-09 Dell Products L.P. System and method to maintain optimal system performance while adhering to competing power cap policies
US10788876B2 (en) 2018-07-27 2020-09-29 Dell Products L.P. System and method to maintain power cap while baseboard management controller reboots
US10856436B2 (en) * 2019-01-31 2020-12-01 Seagate Technology Llc Multilevel enclosure cooling
US11422912B2 (en) 2019-04-19 2022-08-23 Vmware, Inc. Accurate time estimates for operations performed on an SDDC
US11424940B2 (en) 2019-06-01 2022-08-23 Vmware, Inc. Standalone tool for certificate management
US10980159B2 (en) 2019-07-19 2021-04-13 Dell Products L.P. System and method for managing multiple connections
US11132038B2 (en) * 2019-07-19 2021-09-28 Dell Products L.P. System and method for thermal management of shadowed devices
US11129307B2 (en) 2019-07-19 2021-09-21 Dell Products L.P. System and method for managing thermal states of devices
US11399450B2 (en) 2019-07-19 2022-07-26 Dell Products L.P. System and method for managing electromagnetic interference
US11644425B2 (en) 2019-07-19 2023-05-09 Dell Products L.P. System and method for optical state determination
US11143682B2 (en) 2019-07-19 2021-10-12 Dell Products L.P. System and method for communicating externally from an electromagnetic interference suppressed volume
US11122718B2 (en) 2019-07-19 2021-09-14 Dell Products L.P. System and method for device level electromagnetic interference management
US11378608B2 (en) 2019-07-19 2022-07-05 Dell Products L.P. System and method for device state determination
US11234347B2 (en) 2019-07-19 2022-01-25 Dell Products L.P. System and method for physical management of devices
US11234350B2 (en) 2019-08-21 2022-01-25 Dell Products L.P. System and method for isolated device access
US11147194B2 (en) 2019-08-21 2021-10-12 Dell Products L.P. System and method for managing electromagnetic interference
US11271259B2 (en) * 2019-09-04 2022-03-08 Baidu Usa Llc Airflow management for battery module cooling
US11537191B2 (en) * 2020-01-31 2022-12-27 Intel Corporation Technologies for providing advanced management of power usage limits in a disaggregated architecture
US10951325B1 (en) 2020-03-19 2021-03-16 Dell Products L.P. Use of siilicon photonics (SiP) for computer network interfaces
EP3889820A1 (en) * 2020-03-31 2021-10-06 Schneider Electric IT Corporation Systems and methods for determining liquid cooled architectures in an it room
US11467636B1 (en) 2020-09-29 2022-10-11 Amazon Technologies, Inc. Limited blast radius storage server system
US11550370B2 (en) 2020-10-30 2023-01-10 Seagate Technology Llc Modular data storage systems
US11836028B2 (en) * 2021-01-20 2023-12-05 Dell Products L.P. System and method for closed-loop memory power capping
CN115086387B (zh) * 2022-05-24 2024-01-26 福瑞泰克智能系统有限公司 域控制器的控制方法和装置、存储介质及电子装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5777874A (en) * 1996-02-12 1998-07-07 Allen-Bradley Company, Inc. Programmable controller backup system
US6182199B1 (en) * 1998-09-03 2001-01-30 International Business Machines Corporation System and method for granting permission to modify a memory area
US20060282685A1 (en) * 2005-06-09 2006-12-14 International Business Machines Corporation Distributed system and method for managing power usage among server data processing systems
US20070027948A1 (en) * 2005-06-23 2007-02-01 International Business Machines Corporation Server blades connected via a wireless network
US20090265045A1 (en) * 2008-04-21 2009-10-22 Dell Products, Lp Information handling system including cooling devices and methods of use thereof
US20100032142A1 (en) * 2008-08-11 2010-02-11 Sun Microsystems, Inc. Liquid cooled rack with optimized air flow rate and liquid coolant flow
US20100172076A1 (en) * 2009-01-07 2010-07-08 Dell Products L.P. Sliding Front Carriage for an Information Handling System Chassis

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE40866E1 (en) * 2000-09-27 2009-08-04 Huron Ip Llc System, method, and architecture for dynamic server power management and dynamic workload management for multiserver environment
US6867966B2 (en) 2002-05-31 2005-03-15 Verari Systems, Inc. Method and apparatus for rack mounting computer components
US6909611B2 (en) 2002-05-31 2005-06-21 Verari System, Inc. Rack mountable computer component and method of making same
US6836030B2 (en) 2002-05-31 2004-12-28 Verari Systems, Inc. Rack mountable computer component power distribution unit and method
US7272732B2 (en) * 2003-06-30 2007-09-18 Hewlett-Packard Development Company, L.P. Controlling power consumption of at least one computer system
US7512830B2 (en) * 2004-05-14 2009-03-31 International Business Machines Corporation Management module failover across multiple blade center chassis
US7461274B2 (en) * 2005-08-23 2008-12-02 International Business Machines Corporation Method for maximizing server utilization in a resource constrained environment
US8692506B2 (en) * 2006-03-15 2014-04-08 Nec Corporation Charging apparatus and charging/discharging apparatus including temperature adjusting element of secondary battery for buffering
US7783903B2 (en) * 2007-08-07 2010-08-24 International Business Machines Corporation Limiting power consumption by controlling airflow
US8350711B2 (en) * 2009-10-19 2013-01-08 Dell Products L.P. System and method for safe handling of information resources by monitoring thermal properties and controlling operation of a cooling fan

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5777874A (en) * 1996-02-12 1998-07-07 Allen-Bradley Company, Inc. Programmable controller backup system
US6182199B1 (en) * 1998-09-03 2001-01-30 International Business Machines Corporation System and method for granting permission to modify a memory area
US20060282685A1 (en) * 2005-06-09 2006-12-14 International Business Machines Corporation Distributed system and method for managing power usage among server data processing systems
US20070027948A1 (en) * 2005-06-23 2007-02-01 International Business Machines Corporation Server blades connected via a wireless network
US20090265045A1 (en) * 2008-04-21 2009-10-22 Dell Products, Lp Information handling system including cooling devices and methods of use thereof
US20100032142A1 (en) * 2008-08-11 2010-02-11 Sun Microsystems, Inc. Liquid cooled rack with optimized air flow rate and liquid coolant flow
US20100172076A1 (en) * 2009-01-07 2010-07-08 Dell Products L.P. Sliding Front Carriage for an Information Handling System Chassis

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103491743A (zh) * 2012-06-11 2014-01-01 波音公司 用于保持和保护电子模块的底盘系统和方法
US9037309B2 (en) 2012-09-26 2015-05-19 Inventec (Pudong) Technology Corporation Rack server system and operating method thereof
TWI488572B (zh) * 2012-10-29 2015-06-11 英業達股份有限公司 機架式伺服器系統及其操作方法
CN105700655A (zh) * 2014-11-24 2016-06-22 英业达科技有限公司 机柜服务器系统及其电源管理方法
CN108701006A (zh) * 2016-03-01 2018-10-23 亚马逊科技公司 服务器系统
US11395433B2 (en) 2016-03-01 2022-07-19 Amazon Technologies, Inc. Server system
CN108701006B (zh) * 2016-03-01 2021-11-09 亚马逊科技公司 服务器系统
CN107170476B (zh) * 2016-03-08 2019-03-29 广达电脑股份有限公司 用于高密度存储装置以减少上游预热的系统及方法
CN107170476A (zh) * 2016-03-08 2017-09-15 广达电脑股份有限公司 用于高密度存储装置以减少上游预热的不同hdd间隙架构
CN105681359A (zh) * 2016-04-01 2016-06-15 浪潮电子信息产业股份有限公司 一种监控机柜的装置及方法
CN107515654B (zh) * 2016-06-15 2020-03-03 广达电脑股份有限公司 伺服器机架组件及其元件载具
CN107515654A (zh) * 2016-06-15 2017-12-26 广达电脑股份有限公司 伺服器机架组件及其元件载具
CN109417861A (zh) * 2016-07-22 2019-03-01 英特尔公司 用于机架冷却的技术
CN107624017A (zh) * 2017-07-27 2018-01-23 郑州云海信息技术有限公司 一种整机柜服务器多形态节点混布的方法
TWI749072B (zh) * 2017-09-29 2021-12-11 中華電信股份有限公司 異常訊務偵測伺服器及其異常訊務偵測方法
CN109800082A (zh) * 2018-12-18 2019-05-24 平安科技(深圳)有限公司 结合实际功耗采购服务器的方法、装置及存储介质
CN109800082B (zh) * 2018-12-18 2022-09-02 平安科技(深圳)有限公司 结合实际功耗采购服务器的方法、装置及存储介质
TWI737970B (zh) * 2019-03-18 2021-09-01 神雲科技股份有限公司 伺服器機櫃

Also Published As

Publication number Publication date
GB2485643A (en) 2012-05-23
DE102011085335A1 (de) 2012-05-10
GB201118076D0 (en) 2011-11-30
US20120116590A1 (en) 2012-05-10
CN102469740B (zh) 2016-04-27
GB2485643B (en) 2015-04-01
US8838286B2 (en) 2014-09-16
SG180070A1 (en) 2012-05-30

Similar Documents

Publication Publication Date Title
CN102469740B (zh) 机架级模块化服务器以及存储结构框架
CN101821724B (zh) 使用usb的集中式服务器机架管理
US6757748B1 (en) Modular network interface system and method
US6985967B1 (en) Web server network system and method
US6325636B1 (en) Passive midplane for coupling web server processing cards with a network interface(s)
US7436303B2 (en) Rack sensor controller for asset tracking
US6411506B1 (en) High density web server chassis system and method
US6934786B2 (en) Server chassis hardware master system and method
US20070220301A1 (en) Remote access control management module
US20030069953A1 (en) Modular server architecture with high-availability management capability
CN107070726A (zh) 一种基于mdc的综合管理方法
US20030188051A1 (en) System with redundant central management controllers
US20050262392A1 (en) Embedded server chassis hardware master system and method
US9619422B2 (en) Server system and method for transferring at least one chassis-specific configuration value
US20070002730A1 (en) Computer platform system program remote recovery control method and system
US20080052505A1 (en) Device and Method for Configuration of a Data Processing Unit
US20060168189A1 (en) Advanced IPMI system with multi-message processing and configurable capability and method of the same
US8782462B2 (en) Rack system
WO2011133274A2 (en) System and method for remotely determining identification and physical location of equipment in a rack
US9485133B2 (en) Platform independent management controller
CN113434356A (zh) 自动检测及警示计算装置组件变更的方法和系统
US20040059903A1 (en) Control system and method for rack mounted computer units
US20140230342A1 (en) Building support with concealed electronic component for a structure
US10852792B2 (en) System and method for recovery of sideband interfaces for controllers
US20080086553A1 (en) Device, Particularly a Plug-In Card, for a Data Processing Device

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant