CN107346163B - 服务器机架电力管理 - Google Patents

服务器机架电力管理 Download PDF

Info

Publication number
CN107346163B
CN107346163B CN201610618256.8A CN201610618256A CN107346163B CN 107346163 B CN107346163 B CN 107346163B CN 201610618256 A CN201610618256 A CN 201610618256A CN 107346163 B CN107346163 B CN 107346163B
Authority
CN
China
Prior art keywords
server
power
power consumption
rack
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610618256.8A
Other languages
English (en)
Other versions
CN107346163A (zh
Inventor
林士杰
钱威宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Publication of CN107346163A publication Critical patent/CN107346163A/zh
Application granted granted Critical
Publication of CN107346163B publication Critical patent/CN107346163B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3209Monitoring remote activity, e.g. over telephone lines or network connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/14Mounting supporting structure in casing or on frame or rack
    • H05K7/1485Servers; Data center rooms, e.g. 19-inch computer racks
    • H05K7/1488Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures
    • H05K7/1492Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures having electrical distribution arrangements, e.g. power supply or data communications

Abstract

服务器机架电力管理。本发明公开一种藉由服务器机架的机架管理控制器(RMC)作电力管理的方法,其包括:从服务器机架中的第一服务器的第一基板管理控制器(BMC)收集电力消耗数据及送出电力消耗数据给管理服务器。机架管理控制器从管理服务器接收电力要求并根据电力消耗数据与电力要求来决定电力设定。机架管理控制器根据电力设定,要求第一基板管理控制器限制第一服务器的电力消耗。

Description

服务器机架电力管理
技术领域
本申请案涉及计算机系统,更具体地说,涉及服务器机架的电力管理的系统与方法。
背景技术
在近代数据中心的计算机服务器系统一般以特定配置安装于服务器机架上,亦即多个计算模块,如服务器托盘、服务器机壳、服务器滑轨、服务器刀锋等,被彼此上下置放层迭在服务器机架中。机架安装系统让计算模块可垂直配置以有效使用空间。一般来说,各计算模块可滑进滑出服务器机架,且各种电缆如输入/输出(IO)电缆、网络电缆、电力电缆等在机架前方或后方连接计算模块。各计算模块包含一个或多个计算机服务器,亦或可容纳一个或多个计算机服务器构件。举例来说,计算模块包括处理用的硬件电路、存储器、网络控制器、碟盘驱动器、电缆端口、电力供应器等。
计算机系统中电力一般在多个电平上作管理。以在数据中心为例,配置给整个数据中心的总量电力可能根据随时间变化的能源成本而波动。配置给数据中心的电力可细分给数据中心的多个机架和机架所安装的机壳。
服务器系统所消耗的电力表示服务器系统操作成本的重要部分。服务器系统的电力成本表示整个所有者开销的重要部分。在数据中心这些花费尤其可观,其可包含成千上万的多的高电力、安装于多个高密度机壳或机架中的安装型机架服务器。因此,电力管理在计算机系统的设计、发展和操作中是重要的考虑因素。
发明内容
以下描述一个或多个实施例的简化概要以提供对本技术的基本了解。此概要并非本技术所有预期实施例的广泛总览,且其意并非识别所有范例的关键或重要元件,亦非划定本技术任一或所有态样的范围。其唯一的目的是以简单的形式来描述一个或多个范例的一些概念以作为稍后描述的更仔细说明的序言。
控制器在一些实施方式中,使用服务器机架的机架管理控制器(RackManagement Controller,RMC)来做电力管理的方法,包括从服务器机架中第一服务器的第一基板管理控制器(Baseboard Management Controller,BMC)收集电力消耗数据且送出电力消耗数据给管理服务器。机架管理控制器从管理服务器接收电力要求并根据电力消耗数据与电力要求来决定电力设定。根据电力设定,机架管理控制器要求第一基板管理控制器限制第一服务器的电力消耗。
在一些实施方式中,RMC使用频带外(out-of-band)接口与管理服务器及第一BMC通信。在一些实施方式中,RMC使用表征性状态传送 (Representational State Transfer,REST)接口与管理服务器及第一BMC通信。
在一些实施方式中,RMC进一步从服务器机架中的机架电力供应单元 (PowerSupply Unit,PSU)收集电力消耗数据。在一些实施方式中,RMC进一步从第一BMC收集更新的电力消耗数据,根据更新的电力消耗数据和电力要求来决定更新的电力设定,并根据更新的电力设定,要求第一BMC限制第一服务器的电力消耗。
在一些实施方式中,使用服务器机架中第一服务器的基板管理控制器 (BMC)来做电力管理的方法,包括从服务器机架的机架管理控制器(RMC)接收第一服务器的电力消耗数据的要求。BMC从至少一个处理器特定模式寄存器(Model-Specific Register,MSR)读取处理器电力数据、从至少一个存储器 MSR读取存储器电力数据及从母板电力转换器传感器读取母板电力数据。然后BMC根据处理器、存储器及母板电力数据来决定电力消耗数据,且将电力消耗数据送给RMC。
在一些实施方式中,用于电力管理的系统包括:具有第一基板管理控制器(BMC)的第一服务器和机架管理控制器(RMC)。RMC被设置以:从第一服务器的第一BMC收集电力消耗数据、将电力消耗数据传送给管理服务器、从管理服务器接收电力要求、根据电力消耗数据和电力要求来决定电力设定并根据电力设定要求第一BMC限制第一服务器的电力消耗。
在一些实施方式中,系统进一步包括电力供应单元(PSU),其中RMC进一步设置以从机架PSU收集电力消耗数据。
附图说明
本技术的这些及其他实例态样将搭配图式在以下实施方式及权利要求书描述:
图1绘示用于服务器机架电力管理的范例系统的方块图;
图2绘示用于服务器节点电力管理的范例系统的方块图;
图3绘示藉由服务器机架的机架管理控制器(RMC)作电力管理的范例方法;
图4绘示藉由服务器机架中第一服务器的第一基板管理控制器(BMC)作电力管理的范例方法;
图5绘示服务器机架电力管理的范例系统的流程图;
图6绘示范例计算机系统的方块图。
【符号说明】
100、200:系统
110:服务器机架
120、220:机架电力供应单元
130、230、530:机架管理控制器
150、250:服务器节点
152、252、520:基板管理控制器
160:网络
170、540:管理服务器
253:中央处理单元
254:母板电力转换器传感器
255:CPU电压调整器
256:存储器电压调整器
257、620:存储器
300、400:方法
310、320、330、340、350、360、410、420、430、440、450、460、470、 480:步骤
500:流程图
510:BIOS/UEFI
600:计算机系统
610:BIOS
630:存储器
640:处理器
650:网络接口
660:北桥
670:南桥
680:管理控制器
具体实施方式
所公开的标的提供了服务器机架的电力管理技术。本发明的各种态样将参照附图加以说明。在以下说明书中,阐述许多特定细节以为了解释的目的而提供对一个或多个态样详尽的了解。然而明显的是,本技术可在没有这些特定细节下实施。在其他的一些情况下,众所周知的结构和装置以方块图的形式来表示以便于描述这些态样。
所公开的标的提供了根据服务器机架电力消耗的数据及在管理服务器的管理者对电力要求的设定的服务器机架的电力管理的方法。在服务器机架中服务器的第一基板管理控制器(BMC)从服务器的各个构件收集电力消耗数据并将电力消耗通报给机架管理控制器(RMC)以通报给管理服务器。管理服务器将电力要求传送给RMC。RMC根据电力消耗数据和电力要求来决定电力设定。然后RMC命令BMC根据电力设定来限制服务器的电力消耗。
图1绘示用于服务器机架110的电力管理的范例系统100的方块图。此系统100包括服务器机架110,在一些实施方式中,包含网络160和管理服务器170。服务器机架110包括机架电力供应单元(PSU)120、机架管理控制器(RMC)130及多个服务器节点150。
举例来说,每个服务器150可为计算节点、存储节点或交换节点。计算节点一般关注于处理电力且包括大量中央处理单元(CPU)。存储节点一般关注于高密度数据存储且包括大量高容量存储驱动器,如硬盘驱动器(HDD)或固态驱动器(SSD)。切换节点一般包括多个交换装置。交换装置(如以太网络 (Ethernet)交换)被使用在计算机网络以将装置物理连接在一起。
管理服务器170可设定电力要求使服务器机架遵循。举例来说,电力要求可限制所拉出的最大电力或可限制在一段时间的平均电力消耗。然而电力要求可以其他未明确描述于此的方式设定。
管理服务器170可经由网络160通信及管理服务器机架110。网络160 可为无线局域网络(Local Area Network,LAN)或广域网络(Wide Area Network, WAN),如以太网络、光纤波道(Fibre Channel)、Wi-Fi、蓝牙(Bluetooth)、火线(Firewire)、互联网(Internet)等。
RMC 130为管理服务器机架110的各种功能的微控器。RMC 130可使用各种传感器监测机架服务器110的健康与状态、管理服务器PSU、风扇、及经由网络160与管理服务器170通信。RMC 130也可从各服务器150收集电力消耗数据。然后RMC 130可通报电力消耗数据、健康及状态、系统日志或错误讯息给管理服务器170。其后,RMC 130自管理服务器170接收电力要求,如限制服务器机架110电力消耗的命令。然后RMC 130根据电力消耗数据和电力要求决定电力设定,并将电力设定施加于服务器150。
每个服务器150包括管理控制器,如基板管理控制器(BMC)152。每个 BMC 152从服务器150的各个构件收集电力消耗数据并通报电力消耗数据给 RMC 130。每个BMC 152亦根据RMC 130的要求在服务器150的各个构件上执行电力消耗操作。
BMC 152包括用以管理系统管理软件和平台硬件之间的接口的微控器。 BMC可监测内建于装置的不同种类的传感器的参数,如温度、冷却风扇速度、电力状态、负载状态、操作系统状态等。
BMC 152可使用IPMI协议与BMC 152所管理的各个服务器构件通信。 IPMI为管理及监测计算机系统的CPU、固件和OS的自律计算机子系统及由系统管理员管理及监测的频带外(out-of-band)的一组设定。BMC 152可使用任何总线接口,如系统管理总线(SystemManagement Bus,SMBus)、RS-232串行总线、IIC协议、以太网络、IPMB、低引脚计数(low-pincount,LPC)总线、增强串行周边接口(Enhanced Serial Peripheral Interface,eSPI)等来连接各种服务器构件(如:南桥或网络控制器)。
RMC 130和服务器150的BMC 152可使用IPMI指令或表征性状态传送应用程序设计接口(Representational State Transfer Application Programing Interfaces,RESTful API)通信。RESTful API为架构式样及常使用在网络服务的发展上的通信方法。RESTful API明确地利用了超文件传送协议(Hypertext Transfer Protocol,HTTP)。RESTful API使用PUT改变资源状态或更新资源,资源可为物件、文件或块(block)、使用GET取回资源、使用POST建立资源及使用DELETE移除资源。
交换机(如,以太网络交换)是使用在计算机网络的装置,其使用分组交换以接收、处理和转送数据到目标装置而将装置连接在一起。多个电缆连接到交换机以使网络装置可彼此通信。交换机利用仅将所接收的讯息传输给讯息所针对的装置以跨越网络管理数据流。连接到交换机的各个网络装置可使用介质访问控制(media access control,MAC)地址来识别,使交换机可调节流量的流动。交换机可包括特定应用集成电路(applicationspecific integrated circuit, ASIC)以建立并维护MAC地址表。然后ASIC可在交换端口、交换处理器、与上游端口之间安排数据流动路线。
图2绘示用于服务器节点250电力管理的范例系统200的方块图。系统 200包括机架PSU 220、RMC 230及服务器节点250。其他服务器节点虽未显示但可包括在系统200中。服务器节点250可为计算节点、存储节点、交换节点或服务器分类中的其他种类。服务器节点205包括中央处理单元 (CPU)253、BMC 252、存储器257。
BMC 252从服务器250中各个传感器和装置来收集电力消耗数据并将电力消耗数据送给RMC 230。RMC 230根据电力消耗数据和服务器250的电力要求决定服务器节点250的电力要求。RMC 230要求BMC252实施的服务器 250电力要求。
BMC 252可藉由读取来自CPU 253、存储器257和母板电力转换器传感器254的电力消耗而计算出服务器250的电力消耗。
举例来说,BMC 252藉可由读取CPU上一个或多个特定模式寄存器 (MSR)而从CPU读取电力消耗数据。BMC 252可读取在存储了整个组件 (package)(如内核和系统代理)的能量数据的CPU 253上的组件能量状态寄存器(package energy status register)。组件能量状态寄存器为在溢流时滚动并持续计数的计数器。BMC 252藉由读取在一时间间隔的计数并将其与时间间隔差相除以决定整个组件所消耗的电力。BMC 252可藉由送出平台环境控制接口 (platform environment control interface,PECI)指令(如,累计能量状态读取指令)读取组件能量状态寄存器。累计能量状态读取指令回传被整个处理器组件消耗的所有能量的数值或由集成电路电力供应引脚(VCC)电源层所供应的逻辑数值,当参数栏指定时。其值被到达极限值后折返并持续计数的32位计数器追踪。
举例来说,BMC 252可藉由判定服务器250中的每个双行存储器模块 (Dual In-Line Memory Module,DIMM)的电压和电流以从存储器读取电力消耗数据而计算电力。BMC252可读取存储DDR平面的能量数据的CPU 253 上的双倍数据速率(Double Data Rate,DDR)平面能量状态寄存器。DDR平面能量状态寄存器为在溢流时滚动并持续计数的计数器。BMC 252可藉由读取在一时间间隔的计数并将其与时间间隔差相除以判定存储器的电力消耗。 BMC 252可藉由送出PECI指令(如,DDR能量状态读取指令),读取DDR平面能量状态寄存器。DDR能量状态指令让PECI Host可读取所有存储器通道和DIMM的累计能量。
服务器250可包括母板电力转换器传感器254。举例来说,BMC 252可使用电源管理总线(Power Management Bus,PMBus)从电力转换器传感器254 读取电力消耗数据。PMBus是系统管理总线(SMBus)的变种,特别用于PSU 的数字管理。BMC 252可使用PMBus指令,如READ_POUT指令,以收集模拟数字转换(ADC)电压/耦合电流(current coupledmeasurements)测量的最新计算的电力测量值。
服务器250可包括存储器电压调整器256及CPU电压调整器255。BMC 252可藉由管理存储器电压调整器256及CPU电压调整器255以实施服务器 250上的电力要求。为了减少CPU 253的电力消耗,BMC 253可减少操作频率和/或CPU电压。BMC 252可用CPU MSR指令限制CPU 253的电力预算以管理CPU电压或电流。BMC 252也可设定CPU 253的能量效率政策在低电力能量效率状态。
为了减少存储器257的电力消耗,BMC 253可减少操作频率和/或存储器模块的链路宽度(linkwidth)。BMC 252可以使用CPU MSR指令来限制DDR 平面的电力预算。BMC 252也可启用存储器257的电力节流以减少电力消耗。
为了减少快速周边构件互连(Peripheral Component Interconnect Express,PCIe)总线和/或周边构件的电力消耗,BMC 252可减少PCIe宽度(如从x16 至x8、x4或x2)、负载大小或最大连结速度。BMC 252也可启用主动状态电源管理(active state powermanagement,ASPM)以进一步减少电力消耗。
为减少交换装置的电力消耗,BMC 252可监测于交换装置的附接连结传输的数据分组。没有节能功能的网络装置会随时保持连续传输的连结,这即使在只需要很少的数据传输的离峰期间亦会不停地消耗电力。BMC 252可在交换装置启用高能效以太网络(EnergyEfficient Ethernet,EEE)。BMC 252可对低功耗闲置(Low Power Idle,LPI)指令应用EEE协议以关闭未被占用而没有使用的连结。当一些连结的数据流被停止一段时间,EEE使交换机将它们标示为"闲置连结",并暂时使他们静止以减少电力消耗。当再次要求数据传输时,闲置连结可使用解除LPI指令被唤醒作为"有效连结",以使数据可再次被送出。
BMC 252可减少交换装置的帧大小顺序(如从1518字节减少至1280、 1024、512、256、128、64字节等)或减少交换装置的能力(如从五百亿位以太网络(50GigabitEthernet,50GE)减少到10GE、5GE、1GE等)。
图3绘示藉由服务器机架的RMC作电力管理的范例方法300。
在步骤310,RMC从服务器机架中的第一服务器的第一基板管理控制器 (BMC)收集电力消耗数据。在一些实施方式中,第一BMC读取第一服务器的电力消耗传感器并计算电力消耗数据。在一些实施方式中,电力消耗数据包括根据处理器的特定模式寄存器决定的处理器电力和存储器电力。
在步骤320,RMC送出电力消耗数据给管理服务器。在一些实施方式中,RMC使用频带外接口(如IPMI)与管理服务器和第一BMC通信。在一些实施方式中,RMC使用REST接口与管理服务器和RMC通信。
在步骤330,RMC从管理服务器接收电力要求。
在步骤340,RMC根据电力消耗数据及电力要求决定电力设定。RMC 亦根据其他的因子和数据决定电力设定。举例来说,RMC可使用作为高峰时段和廉价时段的电力成本差异的历史数据。RMC可使用服务器电力在一天中各个时段使用的历史数据。RMC可使用服务器机架中服务器的电力均衡数据。
在步骤350,RMC要求第一BMC根据电力设定限制第一服务器的电力消耗。在一些实施方式中,BMC藉由限制处理器操作频率、限制处理器电压或改变处理器的能量效率政策中的至少其一来限制处理器电力消耗。在一些实施方式中,BMC藉由减少PCIe宽度、减少PCIe最大负载大小、减少PCIe 最大连结速度或启用ASPM中的至少其一来限制PCIe电力消耗。在一些实施方式中,RMC藉由减少传输速度或增加写入缓冲区大小中的至少其一来限制存储装置电力消耗。在一些实施方式中,BMC藉由应用高能效以太网络 (EEE)协议送出低功耗闲置(LPI)信号以关闭没有使用的连结、减少帧大小顺序或减少交换能力中的至少其一来限制交换装置电力消耗。
在可选步骤360,RMC从第一BMC收集更新的电力消耗数据。然后方法300回到步骤340,根据更新的电力消耗数据和电力要求以决定更新的电力设定。
在一些实施方式中,RMC监测机架PSU的健康并进一步根据机架PSU 的健康决定电力设定。
在一些实施方式中,第一BMC命令第一服务器的基本输入/输出系统(basicinput/output system,BIOS)或统一可扩展固件接口(Unified Extensible FirmwareInterface,UEFI)执行节能动作。UEFI是取代BIOS的定义操作系统和固件之间软件接口的规格,但对BIOS服务提供了旧有的支持。UEFI支持没有操作系统下的服务器的远程诊断和修复。
图4绘示藉由服务器机架中第一服务器的BMC作电力管理的范例方法 400。
在步骤410,BMC从服务器机架RMC接收第一服务器电力消耗数据的要求。
在步骤420,BMC从至少一个处理器MSR读取处理器电力数据。
在步骤430,BMC从至少一个存储器MSR读取存储器电力数据。
在步骤440,BMC从母板电力转换器传感器读取母板电力数据。
在步骤450,BMC根据处理器、存储器及母板电力数据决定电力消耗数据。
在步骤460,BMC送出电力消耗数据给RMC。
在一些实施方式中,根据服务器是否为计算机节点、存储节点、交换节点或一些其他服务器分类,BMC可在服务器实施不同的节能动作。
在可选步骤470,BMC判定第一服务器是否为计算节点、存储节点或交换节点。
在可选步骤480,BMC根据第一服务器是否为计算节点、存储节点或交换节点,在第一服务器执行电力消耗动作。
在一些实施方式中,第一BMC命令第一服务器的BIOS或UEFI读取处理器、存储器及母板电力数据。
图5绘示服务器机架电力管理的范例系统的流程图500。系统包括带有BMC520的服务器及BIOS/UEFI 510、RMC530、管理服务器540。
在步骤1,RMC 530从BMC520收集服务器的电力消耗数据。
在步骤2,RMC 530通报电力消耗数据给管理服务器540。
在步骤3,RMC 530设定机架电力消耗的新政策。
在步骤3.1,RMC 530要求BMC 520限制服务器的电力消耗。
在步骤3.2,BMC 520送出中断指令给BIOS/UEFI 510以限制服务器的电力消耗。BMC 520可使用IPMI和/或RESTful命令在BIOS/UEFI 510上。 UEFI BIOS 510提供最佳设定及操作模式给CPU、存储器、快速周边构件互连(PCIe)总线、交换控制器及存储装置。BIOS/UEFI 510可直接与装置驱动器或控制硬件通信以减少工作量。举例来说,BIOS/UEFI 510可使用先进配置与电力接口(Advance Configuration Power Interface,ACPI)系统控制中断 (System Control Interrupt,SCI)指令来改变一些设定。
在步骤3.3,UEFI 510藉由如减少CPU或存储器的操作频率以减少服务器的电力消耗。
在步骤4,RMC再次从BMC520收集服务器更新的电力消耗数据。
在步骤4.1,根据更新的电力消耗数据,RMC 530再次要求BMC 520限制服务器的电力消耗。
在步骤4.2,BMC 520再次送出中断命令给BIOS/UEFI 510以限制服务器的电力消耗。
在步骤5,RMC 530通报管理服务器540对电力消耗的限制是否成功。
在步骤5.1,管理服务器540决定是否移动服务器的工作量给其他服务器。
图6绘示范例计算机系统600的方块图。计算机系统600包括处理器640、网络接口650、管理控制器680、存储器620、存储器630、BIOS 610、北桥 660及南桥670。
例如,计算机系统600为服务器(如在数据中心服务器机架的服务器)或个人计算机。处理器(如中央处理单元(CPU))640为母板上的芯片,其取回并执行存储在存储器620的程序指令。处理器640为具有单一处理内核的单一CPU、具有多个处理内核的单一CPU、或多个CPU。一个或多个总线(未显示于附图)在各种计算机构件,如处理器640、存储器620、存储器630及网络接口 650之间传输指令及应用程序数据。
存储器620包括用以暂时或永久地存储数据或程序的任意物理装置,如各种形式的随机存取存储器(Random-Access Memory,RAM)。存储器630包括用于非易失性数据存储的任意物理装置,如HDD或快闪驱动器(flash drive)。存储器630可具有比存储器620大的容量且每单位存储可更具经济性,但也可能具有较慢的传输速度。
BIOS 610包括基本输入/输出系统或其后继子(successors)或均等物,如可扩展固件接口(Extensible Firmware Interface,EFI)或统一可扩展固件接口 (UEFI)。BIOS610包括BIOS芯片,其存储BIOS软件程序并位于计算机系统600的母板上。BIOS 610存储当计算机系统第一次开机所被执行固件以及指定给BIOS 610的一组配置。BIOS固件及BIOS配置存储在非易失性存储器(例如,NARAM)或只读存储器(ROM),如快闪存储器中。快闪存储器为可被电子抹除及编程的非易失性计算机存储媒介。
BIOS 610在每次计算机系统600启动时如顺序程序(sequence program)被载入及执行。BIOS 610根据其配置组辨识、初始化及测试存在于给定计算系统的硬件。BIOS 610在计算机系统600执行自我测试,如电力开启自我测试 (Power-on-Self-Test,POST)。此自我测试测试各个硬件构件,如硬磁盘驱动机、光学读取装置、冷却装置、存储器模块、扩展卡等的功能性。BIOS定址和分配存储器620的区域用以存储操作系统。然后BIOS 610将计算机系统的控制交给OS。
计算机系统600的BIOS 610包括BIOS配置,其定义BIOS 610如何控制计算机系统600中的各个硬件构件。BIOS配置决定计算机系统600中各个硬件构件的启动顺序。BIOS610提供可使各式不同参数被设置的接口(如 BIOS设置应用程序(BIOS setup utility)),其可与BIOS预设配置的参数不同。举例来说,使用者(如管理者)可使用BIOS 610来指明时钟和总线速度、指明哪些周边装置附接在计算机系统、指明健康的监测(如风扇速度和CPU温度限制)及指明各式其他影响计算机系统的整体表现和电力使用的参数。
管理控制器680为嵌于计算机系统的母板上的特殊化微控器。举例来说,管理控制器680为基板管理控制器(BMC)。管理控制器680管理系统管理软件及平台硬件之间的接口。内建于计算机系统的不同种类的传感器通报参数,如温度、冷却风扇速度、电力状态、操作系统状态等给管理控制器680。管理控制器680监测传感器并在任何参数没有保持在预设限制内时,经由网络接口650送出指示系统潜在失效的警告给管理者的能力。管理者可与管理控制器680远程通信以执行一些校正动作,如重新设定或使系统电力循环(powercycling)以回复功能性。
北桥660为母板上的芯片,其可直接连接到处理器640或整合在处理器 640中。在有些情况中,北桥660和南桥670合并为单一晶粒。北桥660和南桥670管理处理器640和母板其他部分之间的通信。北桥660管理比南桥 670具有更高效能需求的工作。北桥660管理处理器640、存储器620及视频控制器(未显示于附图)之间的通信。在有些情况中,北桥660包括视频控制器。
南桥670为母板上连接至北桥660的芯片,但与北桥660不同的是,并不需要直接连接至处理器640。南桥670管理计算机系统600的输入/输出功能,如通用串行总线(Universal Serial Bus,USB)、音频(audio)、串行(serial)、 BIOS、串行先进技术附件(Serial Advanced Technology Attachment,SATA)、周边组件互连(PeripheralComponent Interconnect,PCI)总线,PCI扩展(PCI eXtended,PCI-X)总线、PCIe快速总线、ISA总线、SPI总线、eSPI总线、 SMBus。管理控制器680、直接存储器存取(Direct MemoryAccess,DMA)控制器、可编程中断控制器(Programmable Interrupt Controller,PIC)及实时时钟 (real-time clock)连接或包括在南桥670中。在有些其情况中,南桥670直接连接至处理器640,如在北桥660整合在处理器640的例子中。
网络接口650为任何支持有线或无线的局域网络(LAN)或广域网络 (WAN),如以太网络、光纤波道、Wi-Fi、蓝牙传输、火线、互联网等。举例来说,网络接口650可包括用于以太网络的网络接口控制器(network interface controller,NIC)。以太网络为目前为最广泛使用于连接局域网络(LAN)或广域网络(WAN)内计算机的网络标准。以太网络定义多个用于物理层(Physical Layer,PHY)的布线和发信标准,其是藉由在介质访问控制(MAC)/数据链路层的网络接入方法及公用地址格式。启用以太网络的装置一般藉由传输数据分组来通信,其包括独立发送及交付的数据段。
与本文的公开结合描述的各个绘示的逻辑区块、模块及电路可以通用处理器、数字信号处理器(Digital Signal Processor,DSP)、特定应用集成电路 (applicationspecific integrated circuit,ASIC)、现场可编程门阵列(Field Programmable GateArray,FPGA)或其他可编程逻辑装置、离散门或晶体管逻辑(transistor logic)、离散硬件构件、或设计以执行本文所述功能的其任何组合来实施或执行。通用处理器为微处理器或任何传统处理器、控制器、微控器或状态机(state machine)。处理器也可以计算装置的组合来实施,如DSP和微处理器、多个微处理器、与DSP内核结合的一个或多个微处理器或其他这样的配置的组合。
搭配在此所公开者所述方法或算法的操作可直接于硬件、被处理器执行的软件模块或两者的组合中实施。软件模块可位在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移磁盘、CD-ROM或所属技术领域中所知的任何其他形式的存储介质。例示性的存储介质耦合至处理器,使处理器从存储介质读取讯息或写入讯息至存储介质。或者,存储介质可整合到处理器。处理器及存储介质位于ASIC中。 ASIC位于使用者终端中。或者,处理器及存储介质为位于使用者终端机中的离散构件。
在一个或多个例示性设计中,所述功能在硬件、软件、固件或其任意组合中实施。若在软件中实施,则功能以一个或多个指令或编码存储或传输在非暂时性计算机可读取介质上。非暂时性计算机可读取介质包括计算机存储介质及通信介质两者,通信介质包括有助于将计算机程序从一个地方传送到另一个地方的任何介质。存储介质为可藉由通用或特殊用途计算机存取的任何可用的介质。举例来说,所述计算机可读取介质包括RAM、ROM、EEPROM、 CD-ROM或其他光盘存储器、磁盘或其他磁性存储器或可以指令或数据结构形式用以携带或存储所需程序编码的手段且可被通用或特殊用途计算机或通用或特殊用途处理器所存取的任何其他工具,但不限于此。使用于此的碟片 (disk)或碟盘(disc),包括光盘(compact disc,CD)、激光盘、光盘(optical disc)、多样化数字光盘(versatile disc,DVD)、软盘和蓝光光盘,其中碟片通常以磁性方法复制数据,而碟盘用激光的方法光学地复制数据。上述的组合亦应包括在非暂时性计算机可读取介质的范围中。
提供以上本公开的描述以使本领域技术人员可以制造或使用本公开。本公开的各种修改对本领域技术人员而言是显而易见的,且在此界定的一般原理可用于其他变形例而不会脱离本公开的范围。因此,本公开并不意图限于已在此说明的范例及设计,而是意图赋予与本文所揭示的原理及特点一致的最大范围。

Claims (9)

1.一种使用服务器机架的机架管理控制器的电力管理方法,其包括:
从服务器机架中的第一服务器的第一基板管理控制器收集电力消耗数据;
送出该电力消耗数据给管理服务器;
从该管理服务器接收电力要求;
根据该电力消耗数据及该电力要求判断电力设定;
根据该电力设定要求该第一基板管理控制器限制该第一服务器的电力消耗;
判断该第一服务器的服务器分类的种类,该服务器分类的种类包括计算节点、存储节点或交换节点;以及
根据该服务器分类的种类在该第一服务器上执行限制该第一服务器的电力消耗的动作,包括:
限制处理器操作频率、限制处理器电压或改变处理器的能量效率政策中的至少其一;
减少传输速度或增加写入缓冲区大小中的至少其一;
应用高能效以太网络协议送出低功耗闲置信号以关闭没有使用的连结、减少帧大小顺序或减少交换能力中的至少其一。
2.如权利要求1所述的电力管理方法,其进一步包括从该服务器机架中的至少一个其他的服务器的至少一个其他的基板管理控制器或从该服务器机架中的机架电力供应单元收集该电力消耗数据。
3.如权利要求1所述的电力管理方法,其中该机架管理控制器使用频带外接口或表征性状态传送接口与该管理服务器和该第一基板管理控制器通信。
4.如权利要求1所述的电力管理方法,其进一步包括:
从该第一基板管理控制器收集更新的电力消耗数据;
根据该更新的电力消耗数据和该电力要求来决定更新的电力设定;以及
根据该更新的电力设定要求该第一基板管理控制器限制该第一服务器的电力消耗。
5.如权利要求1所述的电力管理方法,其中该第一基板管理控制器读取该第一服务器的电力消耗传感器并计算该电力消耗数据或命令该第一服务器的基本输出入系统或统一可扩展固件接口执行节能动作。
6.如权利要求1所述的电力管理方法,其进一步包括:
监测机架电力供应单元的健康;以及
进一步根据该机架电力供应单元的健康来决定该电力设定。
7.一种使用服务器机架中的第一服务器的第一基板管理控制器的电力管理方法,其包括:
从服务器机架的机架管理控制器接收第一服务器的电力消耗数据的要求;
从至少一个处理器特定模式寄存器读取处理器电力数据;
从至少一个存储器特定模式寄存器读取存储器电力数据;
从母板电力转换器传感器读取母板电力数据;
根据该处理器电力数据、该存储器电力数据、及该母板电力数据决定该电力消耗数据;以及
送出该电力消耗数据给该机架管理控制器,并且该机架管理控制器送出该电力消耗数据给管理服务器以用于判断电力设定;
要求该机架管理控制器根据该电力设定来限制该第一服务器的电力消耗;以及其中
判断该第一服务器的服务器分类的种类,该服务器分类的种类包括计算节点、存储节点或交换节点;以及
根据该服务器分类的种类在该第一服务器上执行限制该第一服务器的电力消耗的动作,包括:
限制处理器操作频率、限制处理器电压或改变处理器的能量效率政策中的至少其一;
减少传输速度或增加写入缓冲区大小中的至少其一;
应用高能效以太网络协议送出低功耗闲置信号以关闭没有使用的连结、减少帧大小顺序或减少交换能力中的至少其一。
8.如权利要求7所述的电力管理方法,其中该第一基板管理控制器命令该第一服务器的基本输出入系统或统一可扩展固件接口读取该处理器电力数据、该存储器电力数据及该母板电力数据。
9.一种电力管理系统,包括:
第一服务器,具有第一基板管理控制器;及
机架管理控制器,其设置以:
从该第一服务器的该第一基板管理控制器收集电力消耗数据;
送出该电力消耗数据给管理服务器;
从该管理服务器接收电力要求;
根据该电力消耗数据及该电力要求判断电力设定;以及
要求该第一基板管理控制器根据该电力设定来限制该第一服务器的电力消耗,并且其中
由该机架管理控制器判断该第一服务器的服务器分类的种类,该服务器分类的种类包括计算节点、存储节点或交换节点;以及
根据该服务器分类的种类在该第一服务器上执行限制该第一服务器的电力消耗的动作,包括:
限制处理器操作频率、限制处理器电压或改变处理器的能量效率政策中的至少其一;
减少传输速度或增加写入缓冲区大小中的至少其一;
应用高能效以太网络协议送出低功耗闲置信号以关闭没有使用的连结、减少帧大小顺序或减少交换能力中的至少其一。
CN201610618256.8A 2016-05-06 2016-08-01 服务器机架电力管理 Active CN107346163B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/149,009 US10509456B2 (en) 2016-05-06 2016-05-06 Server rack power management
US15/149,009 2016-05-06

Publications (2)

Publication Number Publication Date
CN107346163A CN107346163A (zh) 2017-11-14
CN107346163B true CN107346163B (zh) 2020-05-12

Family

ID=58606177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610618256.8A Active CN107346163B (zh) 2016-05-06 2016-08-01 服务器机架电力管理

Country Status (5)

Country Link
US (1) US10509456B2 (zh)
EP (1) EP3242185B1 (zh)
JP (1) JP6323821B2 (zh)
CN (1) CN107346163B (zh)
TW (1) TWI621068B (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10257268B2 (en) 2015-03-09 2019-04-09 Vapor IO Inc. Distributed peer-to-peer data center management
US10817398B2 (en) * 2015-03-09 2020-10-27 Vapor IO Inc. Data center management via out-of-band, low-pin count, external access to local motherboard monitoring and control
US10404523B2 (en) * 2015-03-09 2019-09-03 Vapor IO Inc. Data center management with rack-controllers
US10108436B2 (en) * 2016-08-25 2018-10-23 American Megatrends, Inc. Techniques for bridging BIOS commands between client and host via BMC
US10235074B2 (en) * 2016-09-29 2019-03-19 Hewlett Packard Enterprise Development Lp Management processor executing peripheral device registration script
US11349339B1 (en) * 2017-04-27 2022-05-31 EMC IP Holding Company LLC Usage-based cost structuring system and method
US10824437B1 (en) * 2017-04-27 2020-11-03 American Megatrends International, Llc Platform management for computing systems without baseboard management controllers
US10810085B2 (en) * 2017-06-30 2020-10-20 Western Digital Technologies, Inc. Baseboard management controllers for server chassis
US10805264B2 (en) 2017-06-30 2020-10-13 Western Digital Technologies, Inc. Automatic hostname assignment for microservers
US10409756B2 (en) * 2017-07-07 2019-09-10 Facebook, Inc. Multi-node server platform with modularly replaceable cards
US10445201B2 (en) * 2017-10-05 2019-10-15 American Megatrends International, Llc System and method for automated integration and stress testing of hardware and software service in management controller using containerized toolbox
JP6919538B2 (ja) * 2017-12-05 2021-08-18 富士通株式会社 電力制御システム及び電力制御プログラム
CN108090000A (zh) * 2018-01-11 2018-05-29 郑州云海信息技术有限公司 一种获取cpu寄存器信息的方法及系统
US11500439B2 (en) 2018-03-02 2022-11-15 Samsung Electronics Co., Ltd. Method and apparatus for performing power analytics of a storage system
US11481016B2 (en) 2018-03-02 2022-10-25 Samsung Electronics Co., Ltd. Method and apparatus for self-regulating power usage and power consumption in ethernet SSD storage systems
US10877553B2 (en) * 2018-04-13 2020-12-29 Dell Products L.P. Systems and methods for power control based on power consumption of storage devices
US11630496B1 (en) * 2018-06-28 2023-04-18 Amazon Technologies, Inc. Distributed computing device power
CN109116963B (zh) * 2018-07-26 2022-02-08 英业达科技有限公司 周期性事件记录方法
CN109032807A (zh) * 2018-08-08 2018-12-18 郑州云海信息技术有限公司 一种批量监控内存状态及限制内存功耗的方法及系统
CN109067743B (zh) * 2018-08-08 2021-03-19 郑州云海信息技术有限公司 一种服务器监控方法和装置
CN109240892A (zh) * 2018-10-08 2019-01-18 郑州云海信息技术有限公司 一种批量监控服务器整机状态的方法及系统
CN111414274A (zh) * 2019-01-04 2020-07-14 营邦企业股份有限公司 运用于数据中心的机柜异常状态的远端排除方法
TWI705334B (zh) * 2019-04-22 2020-09-21 緯創資通股份有限公司 擴展系統與伺服器主機及其操作方法
TWI709037B (zh) * 2019-05-23 2020-11-01 神雲科技股份有限公司 基本輸入輸出系統設置方法
CN110377136A (zh) * 2019-06-18 2019-10-25 苏州浪潮智能科技有限公司 一种psu原始值日志记录方法及装置
CN110531832A (zh) * 2019-07-24 2019-12-03 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 高密度异构化服务器多级管理系统
US11086390B2 (en) * 2019-11-07 2021-08-10 Dell Products L.P. Method and apparatus for improving power management by controlling a system input current in a power supply unit
KR102328939B1 (ko) * 2019-11-11 2021-11-19 한국전자기술연구원 Fpga-bmc 환경에서의 저지연 시스템 제어 관리 도구 연동 방법 및 장치
US11188130B2 (en) * 2019-11-19 2021-11-30 Dell Products L.P. Method and apparatus for thermal management using different customization modes
TWI751501B (zh) * 2020-02-25 2022-01-01 宏碁股份有限公司 鏈路狀態轉換的控制設定方法及使用此方法的電子裝置
CN112260257A (zh) 2020-03-27 2021-01-22 威锋电子股份有限公司 电力管理装置与方法
KR20230042887A (ko) * 2021-09-23 2023-03-30 주식회사 두비컴퓨팅 서버 랙
US11799714B2 (en) 2022-02-24 2023-10-24 Hewlett Packard Enterprise Development Lp Device management using baseboard management controllers and management processors

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103135732A (zh) * 2011-11-28 2013-06-05 英业达科技有限公司 服务器机柜系统
CN105100504A (zh) * 2014-05-22 2015-11-25 北京奇虎科技有限公司 设备应用耗电管理方法和装置
US9250684B1 (en) * 2015-02-25 2016-02-02 Quanta Computer Inc. Dynamic power capping of a subset of servers when a power consumption threshold is reached and allotting an amount of discretionary power to the servers that have power capping enabled

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7707443B2 (en) 2003-07-18 2010-04-27 Hewlett-Packard Development Company, L.P. Rack-level power management of computer systems
US20060156041A1 (en) * 2005-01-07 2006-07-13 Lee Zaretsky System and method for power management of plural information handling systems
US7421599B2 (en) 2005-06-09 2008-09-02 International Business Machines Corporation Power management server and method for managing power consumption
US8195340B1 (en) * 2006-12-18 2012-06-05 Sprint Communications Company L.P. Data center emergency power management
US7779276B2 (en) * 2007-03-05 2010-08-17 International Business Machines Corporation Power management in a power-constrained processing system
JP4395800B2 (ja) 2007-09-18 2010-01-13 日本電気株式会社 電力管理システムおよび電力管理方法
US20090243391A1 (en) * 2008-03-31 2009-10-01 Susong Iii Walter Multi-functional power supply with power over ethernet support, integrated monitoring and supplemental power source backup
JP5003661B2 (ja) * 2008-11-21 2012-08-15 日本電気株式会社 電力配分システム、電力配分方法、プログラム及び電力配分装置
US8049985B2 (en) * 2009-02-03 2011-11-01 Seagate Technology Llc Variable spindle speed control for data storage devices
JP2011013764A (ja) * 2009-06-30 2011-01-20 Hitachi Ltd 消費電力管理方法、消費電力管理システムおよびプログラム
US8478451B2 (en) * 2009-12-14 2013-07-02 Intel Corporation Method and apparatus for dynamically allocating power in a data center
US9647913B2 (en) * 2010-11-16 2017-05-09 Avago Technologies General Ip (Singapore) Pte. Ltd. Measuring and managing power usage and cooling in a network
JP2012173926A (ja) * 2011-02-21 2012-09-10 Nec Corp サーバシステム及び電力供給制御方法
JP5663383B2 (ja) 2011-04-18 2015-02-04 株式会社日立製作所 ブレードサーバの電力制御方法及びシステム
US10180665B2 (en) * 2011-09-16 2019-01-15 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Fluid-cooled computer system with proactive cooling control using power consumption trend analysis
US9436512B2 (en) * 2011-12-22 2016-09-06 Board Of Supervisors Of Louisana State University And Agricultural And Mechanical College Energy efficient job scheduling in heterogeneous chip multiprocessors based on dynamic program behavior using prim model
US9857858B2 (en) 2012-05-17 2018-01-02 Intel Corporation Managing power consumption and performance of computing systems
TW201405295A (zh) * 2012-07-18 2014-02-01 Hon Hai Prec Ind Co Ltd 電源供應電路
US9261945B2 (en) 2012-08-30 2016-02-16 Dell Products, L.P. Dynanmic peak power limiting to processing nodes in an information handling system
US9298247B2 (en) * 2012-11-27 2016-03-29 International Business Machines Corporation Distributed power budgeting
TWI544313B (zh) * 2013-04-30 2016-08-01 聯想企業解決方案(新加坡)有限公司 電力分配方法、電力分配裝置、及其資訊處理系統
CN104216499B (zh) 2013-05-31 2017-03-08 英业达科技有限公司 机柜与其电源控制方法
TW201520752A (zh) * 2013-11-29 2015-06-01 Ibm 電腦系統中的電源消耗控制
US9866548B2 (en) * 2014-12-17 2018-01-09 Quanta Computer Inc. Authentication-free configuration for service controllers
US9864719B2 (en) * 2015-03-12 2018-01-09 Dell Products L.P. Systems and methods for power optimization at input/output nodes of an information handling system
US9588571B2 (en) * 2015-07-08 2017-03-07 Quanta Computer Inc. Dynamic power supply management

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103135732A (zh) * 2011-11-28 2013-06-05 英业达科技有限公司 服务器机柜系统
CN105100504A (zh) * 2014-05-22 2015-11-25 北京奇虎科技有限公司 设备应用耗电管理方法和装置
US9250684B1 (en) * 2015-02-25 2016-02-02 Quanta Computer Inc. Dynamic power capping of a subset of servers when a power consumption threshold is reached and allotting an amount of discretionary power to the servers that have power capping enabled

Also Published As

Publication number Publication date
US10509456B2 (en) 2019-12-17
TW201740270A (zh) 2017-11-16
TWI621068B (zh) 2018-04-11
CN107346163A (zh) 2017-11-14
EP3242185B1 (en) 2020-03-11
JP2017201520A (ja) 2017-11-09
JP6323821B2 (ja) 2018-05-16
EP3242185A1 (en) 2017-11-08
US20170322613A1 (en) 2017-11-09

Similar Documents

Publication Publication Date Title
CN107346163B (zh) 服务器机架电力管理
US9710045B2 (en) Managing network wake-up commands
US10402207B2 (en) Virtual chassis management controller
EP3242218B1 (en) Dynamic pcie switch reconfiguration mechanism
JP5707321B2 (ja) スリーププロセッサ
US9936605B2 (en) Controlling air flow in a server rack
US10587935B2 (en) System and method for automatically determining server rack weight
JP6678929B2 (ja) 高スタンバイ電力システムのためのスマートな電源管理
TW202109235A (zh) 透過連接器向裝置提供電力之系統以及方法
US10809779B2 (en) Managing power in a high performance computing system for resiliency and cooling
JP6663970B2 (ja) システム電源管理方法及び計算機システム
US20170155579A1 (en) Centralized server switch management
CN107533348B (zh) 热管理高性能计算系统的方法和装置及计算机可读介质
US10489328B2 (en) Universal sleds server architecture
US20140337650A1 (en) System and Method for Power Management in a Multiple-Initiator Storage System
TWI496084B (zh) 用以設定以輸出入頻寬為基礎之處理器頻率下限的方法及裝置
US20230229594A1 (en) Selectable platform power limiting to enable efficient persistent memory flush
TW202027360A (zh) 在電力輔助單元中提供高頻寬電容器電路的方法與裝置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant