TWI621068B - 伺服器機架電力管理 - Google Patents

伺服器機架電力管理 Download PDF

Info

Publication number
TWI621068B
TWI621068B TW105121208A TW105121208A TWI621068B TW I621068 B TWI621068 B TW I621068B TW 105121208 A TW105121208 A TW 105121208A TW 105121208 A TW105121208 A TW 105121208A TW I621068 B TWI621068 B TW I621068B
Authority
TW
Taiwan
Prior art keywords
power
server
power consumption
rack
data
Prior art date
Application number
TW105121208A
Other languages
English (en)
Other versions
TW201740270A (zh
Inventor
林士傑
錢威宇
Original Assignee
廣達電腦股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 廣達電腦股份有限公司 filed Critical 廣達電腦股份有限公司
Publication of TW201740270A publication Critical patent/TW201740270A/zh
Application granted granted Critical
Publication of TWI621068B publication Critical patent/TWI621068B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3209Monitoring remote activity, e.g. over telephone lines or network connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/14Mounting supporting structure in casing or on frame or rack
    • H05K7/1485Servers; Data center rooms, e.g. 19-inch computer racks
    • H05K7/1488Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures
    • H05K7/1492Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures having electrical distribution arrangements, e.g. power supply or data communications

Abstract

本發明揭露一種藉由伺服器機架的機架管理控制器(RMC)作電力管理的方法,其包括:從伺服器機架中的第一伺服器的第一基板管理控制器(BMC)收集電力消耗資料及送出電力消耗資料給管理伺服器。機架管理控制器從管理伺服器接收電力要求並根據電力消耗資料與電力要求來決定電力設定。機架管理控制器根據電力設定,要求第一基板管理控制器限制第一伺服器的電力消耗。

Description

伺服器機架電力管理
本申請案是關於電腦系統,更具體的說,是關於伺服器機架之電力管理的系統與方法。
在近代資料中心的電腦伺服器系統一般以特定組態安裝於伺服器機架上,亦即多個計算模組,如伺服器托盤、伺服器機殼、伺服器滑軌、伺服器刀鋒等,被彼此上下置放層疊在伺服器機架中。機架安裝系統讓計算模組可垂直配置以有效使用空間。一般來說,各計算模組可滑進滑出伺服器機架,且各種電纜如輸入/輸出(IO)電纜、網路電纜、電力電纜等在機架前方或後方連接計算模組。各計算模組包含一個或多個電腦伺服器,亦或可容納一個或多個電腦伺服器構件。舉例來說,計算模組包括處理用之硬體電路、儲存器、網路控制器、碟盤驅動器、電纜埠、電力供應器等。
電腦系統中電力一般在多個位準上作管理。以在資料中心為例,配置給整個資料中心的總量電力可能根據隨時間變化的能源成本而波動。配置給資料中心的電力可細分給資料中心的多個機架和機架所安裝的機殼。
伺服器系統所消耗的電力表示伺服器系統作業成本的重要部分。伺服器系統的電力成本表示整個所有者開銷的重要部分。在資料中心這些 花費尤其可觀,其可包含成千上萬之多的高電力、安裝於多個高密度機殼或機架中的安裝型機架伺服器。因此,電力管理在電腦系統的設計、發展和作業中是重要的考慮因素。
以下描述一個或多個實施例的簡化概要以提供對本技術的基本瞭解。此概要並非本技術所有預期實施例的廣泛總覽,且其意並非識別所有範例的關鍵或重要元件,亦非劃定本技術任一或所有態樣的範圍。其唯一的目的是以簡單的形式來描述一個或多個範例的一些概念以作為稍後描述的更仔細說明的序言。
控制器在一些實施方式中,使用伺服器機架的機架管理控制器(Rack Management Controller,RMC)來做電力管理的方法,包括從伺服器機架中第一伺服器之第一基板管理控制器(Baseboard Management Controller,BMC)收集電力消耗資料且送出電力消耗資料給管理伺服器。機架管理控制器從管理伺服器接收電力要求並根據電力消耗資料與電力要求來決定電力設定。根據電力設定,機架管理控制器要求第一基板管理控制器限制第一伺服器的電力消耗。
在一些實施方式中,RMC使用出規頻帶(out-of-band)介面與管理伺服器及第一BMC通信。在一些實施方式中,RMC使用表徵性狀態傳送(Representational State Transfer,REST)介面與管理伺服器及第一BMC通信。
在一些實施方式中,RMC進一步從伺服器機架中的機架電力供應單元(Power Supply Unit,PSU)收集電力消耗資料。在一些實施方式中,RMC進一步從第一BMC收集更新的電力消耗資料,根據更新的電力消耗資料和電力要 求來決定更新的電力設定,並根據更新的電力設定,要求第一BMC限制第一伺服器的電力消耗。
在一些實施方式中,使用伺服器機架中第一伺服器之基板管理控制器(BMC)來做電力管理的方法,包括從伺服器機架的機架管理控制器(RMC)接收第一伺服器之電力消耗資料的要求。BMC從至少一個處理器特定模型暫存器(Model-Specific Register,MSR)讀取處理器電力資料、從至少一個記憶體MSR讀取記憶體電力資料及從母板電力轉換器感測器讀取母板電力資料。然後BMC根據處理器、記憶體及母板電力資料來決定電力消耗資料,且將電力消耗資料送給RMC。
在一些實施方式中,用於電力管理的系統包括:具有第一基板管理控制器(BMC)的第一伺服器和機架管理控制器(RMC)。RMC係設置以:從第一伺服器的第一BMC收集電力消耗資料、將電力消耗資料傳送給管理伺服器、從管理伺服器接收電力要求、根據電力消耗資料和電力要求來決定電力設定並根據電力設定要求第一BMC限制第一伺服器的電力消耗。
在一些實施方式中,系統進一步包括電力供應單元(PSU),其中RMC進一步設置以從機架PSU收集電力消耗資料。
100、200‧‧‧系統
110‧‧‧伺服器機架
120、220‧‧‧機架電力供應單元
130、230、530‧‧‧機架管理控制器
150、250‧‧‧伺服器節點
152、252、520‧‧‧基板管理控制器
160‧‧‧網路
170、540‧‧‧管理伺服器
253‧‧‧中央處理單元
254‧‧‧母板電力轉換器感測器
255‧‧‧CPU電壓調整器
256‧‧‧記憶體電壓調整器
257、620‧‧‧記憶體
300、400‧‧‧方法
310、320、330、340、350、360、410、420、430、440、450、460、470、480‧‧‧步驟
500‧‧‧流程圖
510‧‧‧BIOS/UEFI
600‧‧‧電腦系統
610‧‧‧BIOS
630‧‧‧儲存器
640‧‧‧處理器
650‧‧‧網路介面
660‧‧‧北橋
670‧‧‧南橋
680‧‧‧管理控制器
本技術之這些及其他實例態樣將搭配圖式在以下實施方式及申請專利範圍描述:第1圖繪示用於伺服器機架電力管理之範例系統之方塊圖;第2圖繪示用於伺服器節點電力管理之範例系統之方塊圖; 第3圖繪示藉由伺服器機架之機架管理控制器(RMC)作電力管理的範例方法;第4圖繪示藉由伺服器機架中第一伺服器之第一基板管理控制器(BMC)作電力管理的範例方法;第5圖繪示伺服器機架電力管理之範例系統的流程圖;第6圖繪示範例電腦系統之方塊圖。
所揭露的標的提供了伺服器機架之電力管理技術。本發明的各種態樣將參照圖式加以說明。於以下說明書中,闡述許多特定細節以為了解釋的目的而提供對一個或多個態樣詳盡的了解。然而明顯的是,本技術可在沒有這些特定細節下實施。在其他的一些情況下,眾所周知的結構和裝置以方塊圖的形式來表示以便於描述這些態樣。
所揭露之標的提供了根據伺服器機架電力消耗的數據及在管理伺服器的管理者對電力要求的設定之伺服器機架的電力管理的方法。在伺服器機架中伺服器的第一基板管理控制器(BMC)從伺服器的各個構件收集電力消耗資料並將電力消耗通報給機架管理控制器(RMC)以通報給管理伺服器。管理伺服器將電力要求傳送給RMC。RMC根據電力消耗資料和電力要求來決定電力設定。然後RMC命令BMC根據電力設定來限制伺服器的電力消耗。
第1圖繪示用於伺服器機架110的電力管理之範例系統100之方塊圖。此系統100包括伺服器機架110,在一些實施方式中,包含網路160和管理伺服器170。伺服器機架110包括機架電力供應單元(PSU)120、機架管理控制器(RMC)130及多個伺服器節點150。
舉例來說,每個伺服器150可為計算節點、儲存節點或交換節點。計算節點一般關注於處理電力且包括大量中央處理單元(CPU)。儲存節點一般關注於高密度資料儲存且包括大量高容量儲存驅動器,如硬碟驅動器(HDD)或固態驅動器(SSD)。切換節點一般包括多個交換裝置。交換裝置(如乙太網路(Ethernet)交換)被使用在電腦網路以將裝置實體連接在一起。
管理伺服器170可設定電力要求使伺服器機架遵循。舉例來說,電力要求可限制所拉出的最大電力或可限制在一段時間的平均電力消耗。然而電力要求可以其他未明確描述於此的方式設定。
管理伺服器170可經由網路160通信及管理伺服器機架110。網路160可為無線區域網路(Local Area Network,LAN)或廣域網路(Wide Area Network,WAN),如乙太網路、光纖波道(Fibre Channel)、Wi-Fi、藍牙(Bluetooth)、火線(Firewire)、網際網路(Internet)等。
RMC 130為管理伺服器機架110的各種功能之微控器。RMC 130可使用各種感測器監測機架伺服器110的健康與狀態、管理伺服器PSU、風扇、及經由網路160與管理伺服器170通信。RMC 130亦可從各伺服器150收集電力消耗資料。然後RMC 130可通報電力消耗資料、健康及狀態、系統日誌或錯誤訊息給管理伺服器170。其後,RMC 130自管理伺服器170接收電力要求,如限制伺服器機架110電力消耗的命令。然後RMC 130根據電力消耗資料和電力要求決定電力設定,並將電力設定施加於伺服器150。
每個伺服器150包括管理控制器,如基板管理控制器(BMC)152。每個BMC 152從伺服器150的各個構件收集電力消耗資料並通報電力消耗資料給RMC 130。每個BMC 152亦根據RMC 130的要求在伺服器150的各個構件上執行電力消耗作業。
BMC 152包括用以管理系統管理軟體和平台硬體之間的介面之微控器。BMC可監測內建於裝置的不同種類的感測器之參數,如溫度、冷卻風扇速度、電力狀態、負載狀態、作業系統狀態等。
BMC 152可使用IPMI協定與BMC 152所管理的各個伺服器構件通信。IPMI為管理及監測電腦系統的CPU、韌體和OS的自律計算機子系統及由系統管理員管理及監測的出規頻帶(out-of-band)的一組設定。BMC 152可使用任何匯流排介面,如系統管理匯流排(System Management Bus,SMBus)、RS-232串列匯流排、IIC協定、乙太網路、IPMB、低接腳計數(low-pin count,LPC)匯流排、增強串列週邊介面(Enhanced Serial Peripheral Interface,eSPI)等來連接各種伺服器構件(如:南橋或網路控制器)。
RMC 130和伺服器150的BMC 152可使用IPMI指令或表徵性狀態傳送應用程式設計介面(Representational State Transfer Application Programing Interfaces,RESTful API)通信。RESTful API為架構式樣及常使用在網路服務的發展上的通信方法。RESTful API明確地利用了超文件傳送協定(Hypertext Transfer Protocol,HTTP)。RESTful API使用PUT改變資源狀態或更新資源,資源可為物件、檔案或塊(block)、使用GET取回資源、使用POST建立資源及使用DELETE移除資源。
交換器(如,乙太網路交換)是使用在電腦網路的裝置,其使用封包交換以接收、處理和轉送資料到目標裝置而將裝置連接在一起。多個電纜連接到交換器以使網路裝置可彼此通信。交換器利用僅將所接收的訊息傳輸給訊息所針對的裝置以跨越網路管理資料流。連接到交換器的各個網路裝置可使用媒體存取控制(media access control,MAC)位址來識別,使交換器可調節流量的流動。交換器可包括特定應用積體電路(application specific integrated circuit, ASIC)以建立並維護MAC位址表。然後ASIC可在交換埠、交換處理器、與上游埠之間安排資料流動路線。
第2圖繪示用於伺服器節點250電力管理之範例系統200之方塊圖。系統200包括機架PSU 220、RMC 230及伺服器節點250。其他伺服器節點雖未顯示但可包括在系統200中。伺服器節點250可為計算節點、儲存節點、交換節點或伺服器分類中的其他種類。伺服器節點205包括中央處理單元(CPU)253、BMC 252、記憶體257。
BMC 252從伺服器250中各個感測器和裝置來收集電力消耗資料並將電力消耗資料送給RMC 230。RMC 230根據電力消耗資料和伺服器250的電力要求決定伺服器節點250的電力要求。RMC 230要求BMC252實施的伺服器250電力要求。
BMC 252可藉由讀取來自CPU 253、記憶體257和母板電力轉換器感測器254之電力消耗而計算出伺服器250的電力消耗。
舉例來說,BMC 252藉可由讀取CPU上一個或多個特定模型暫存器(MSR)而從CPU讀取電力消耗資料。BMC 252可讀取在儲存了整個組件(package)(如核心和系統代理)的能量資料之CPU 253上的組件能量狀態暫存器(package energy status register)。組件能量狀態暫存器為在溢流時滾動並持續計數之計數器。BMC 252藉由讀取在一時間間隔的計數並將其與時間間隔差相除以決定整個組件所消耗的電力。BMC 252可藉由送出平台環境控制介面(platform environment control interface,PECI)指令(如,累計能量狀態讀取指令)讀取組件能量狀態暫存器。累計能量狀態讀取指令回傳被整個處理器組件消耗的所有能量的數值或由積體電路電力供應接腳(VCC)電源層所供應的邏輯數值,當參數欄指定時。其值被到達極限值後折返並持續計數之32位元計數器追縱。
舉例來說,BMC 252可藉由判定伺服器250中的每個雙行記憶體模組(Dual In-Line Memory Module,DIMM)的電壓和電流以從記憶體讀取電力消耗資料而計算電力。BMC 252可讀取儲存DDR平面的能量數據之CPU 253上的雙倍資料速率(Double Data Rate,DDR)平面能量狀態暫存器。DDR平面能量狀態暫存器為在溢流時滾動並持續計數之計數器。BMC 252可藉由讀取在一時間間隔的計數並將其與時間間隔差相除以判定記憶體的電力消耗。BMC 252可藉由送出PECI指令(如,DDR能量狀態讀取指令),讀取DDR平面能量狀態暫存器。DDR能量狀態指令讓PECI Host可讀取所有記憶體通道和DIMM的累計能量。
伺服器250可包括母板電力轉換器感測器254。舉例來說,BMC 252可使用電源管理匯流排(Power Management Bus,PMBus)從電力轉換器感測器254讀取電力消耗資料。PMBus是系統管理匯流排(SMBus)的變種,特別用於PSU的數位管理。BMC 252可使用PMBus指令,如READ_POUT指令,以收集類比數位轉換(ADC)電壓/耦合電流(current coupled measurements)測量之最新計算的電力量測值。
伺服器250可包括記憶體電壓調整器256及CPU電壓調整器255。BMC 252可藉由管理記憶體電壓調整器256及CPU電壓調整器255以實施伺服器250上的電力要求。為了減少CPU 253的電力消耗,BMC 253可減少作業頻率及/或CPU電壓。BMC 252可用CPU MSR指令限制CPU 253的電力預算以管理CPU電壓或電流。BMC 252亦可設定CPU 253的能量效率政策在低電力能量效率狀態。
為了減少記憶體257的電力消耗,BMC 253可減少作業頻率及/或記憶體模組的鏈路寬度(linkwidth)。BMC 252可以使用CPU MSR指令來限制DDR平面的電力預算。BMC 252亦可啟用記憶體257的電力節流以減少電力消耗。
為了減少快速周邊構件互連(Peripheral Component Interconnect Express,PCIe)匯流排及/或周邊構件的電力消耗,BMC 252可減少PCIe寬度(如從x16至x8、x4或x2)、負載大小或最大連結速度。BMC 252亦可啟用主動狀態電源管理(active state power management,ASPM)以進一步減少電力消耗。
為減少交換裝置的電力消耗,BMC 252可監測於交換裝置的附接連結傳輸的資料封包。沒有節能功能的網路裝置會隨時保持連續傳輸的連結,這即使在只需要很少的資料傳輸的離峰期間亦會不停地消耗電力。BMC 252可在交換裝置啟用高能效乙太網路(Energy Efficient Ethernet,EEE)。BMC 252可對低功耗閒置(Low Power Idle,LPI)指令應用EEE協定以關閉未被佔用而沒有使用的連結。當一些連結的資料流被停止一段時間,EEE使交換器將它們標示為"閒置連結",並暫時使他們靜止以減少電力消耗。當再次要求資料傳輸時,閒置連結可使用解除LPI指令被喚醒作為"有效連結",以使資料可再次被送出。
BMC 252可減少交換裝置的框大小順序(如從1518位元組減少至1280、1024、512、256、128、64位元組等)或減少交換裝置的能力(如從五百億位元乙太網路(50Gigabit Ethernet,50GE)減少到10GE、5GE、1GE等)。
第3圖繪示藉由伺服器機架之RMC作電力管理的範例方法300。
在步驟310,RMC從伺服器機架中的第一伺服器的第一基板管理控制器(BMC)收集電力消耗資料。在一些實施方式中,第一BMC讀取第一伺服器的電力消耗感測器並計算電力消耗資料。在一些實施方式中,電力消耗資料包括根據處理器的特定模型暫存器決定之處理器電力和記憶體電力。
在步驟320,RMC送出電力消耗資料給管理伺服器。在一些實施方式中,RMC使用出規頻帶介面(如IPMI)與管理伺服器和第一BMC通信。在一些實施方式中,RMC使用REST介面與管理伺服器和RMC通信。
在步驟330,RMC從管理伺服器接收電力要求。
在步驟340,RMC根據電力消耗資料及電力要求決定電力設定。RMC亦根據其他的因子和資料決定電力設定。舉例來說,RMC可使用作為高峰時段和廉價時段的電力成本差異的歷史資料。RMC可使用伺服器電力在一天中各個時段使用的歷史資料。RMC可使用伺服器機架中伺服器的電力平衡資料。
在步驟350,RMC要求第一BMC根據電力設定限制第一伺服器的電力消耗。在一些實施方式中,BMC藉由限制處理器作業頻率、限制處理器電壓或改變處理器的能量效率政策中之至少其一來限制處理器電力消耗。在一些實施方式中,BMC藉由減少PCIe寬度、減少PCIe最大負載大小、減少PCIe最大連結速度或啟用ASPM中之至少其一來限制PCIe電力消耗。在一些實施方式中,RMC藉由減少傳輸速度或增加寫入緩衝區大小中之至少其一來限制儲存裝置電力消耗。在一些實施方式中,BMC藉由應用高能效乙太網路(EEE)協定送出低功耗閒置(LPI)信號以關閉沒有使用的連結、減少框大小順序或減少交換能力中之至少其一來限制交換裝置電力消耗。
在可選步驟360,RMC從第一BMC收集更新的電力消耗資料。然後方法300回到步驟340,根據更新的電力消耗資料和電力要求以決定更新的電力設定。
在一些實施方式中,RMC監測機架PSU的健康並進一步根據機架PSU的健康決定電力設定。
在一些實施方式中,第一BMC命令第一伺服器的基本輸入/輸出系統(basic input/output system,BIOS)或統一可延伸韌體介面(Unified Extensible Firmware Interface,UEFI)執行節能動作。UEFI係取代BIOS之定義作業系統和韌體之間軟體介面的規格,但對BIOS服務提供了舊有的支持。UEFI支援沒有操作系統下之伺服器的遠程診斷和修復。
第4圖繪示藉由伺服器機架中第一伺服器之BMC作電力管理的範例方法400。
在步驟410,BMC從伺服器機架RMC接收第一伺服器電力消耗資料的要求。
在步驟420,BMC從至少一個處理器MSR讀取處理器電力資料。
在步驟430,BMC從至少一個記憶體MSR讀取記憶體電力資料。
在步驟440,BMC從母板電力轉換器感測器讀取母板電力資料。
在步驟450,BMC根據處理器、記憶體及母板電力資料決定電力消耗資料。
在步驟460,BMC送出電力消耗資料給RMC。
在一些實施方式中,根據伺服器是否為電腦節點、儲存節點、交換節點或一些其他伺服器分類,BMC可在伺服器實施不同的節能動作。
在可選步驟470,BMC判定第一伺服器是否為計算節點、儲存節點或交換節點。
在可選步驟480,BMC根據第一伺服器是否為計算節點、儲存節點或交換節點,在第一伺服器執行電力消耗動作。
在一些實施方式中,第一BMC命令第一伺服器的BIOS或UEFI讀取處理器、記憶體及母板電力資料。
第5圖繪示伺服器機架電力管理之範例系統的流程圖500。系統包括帶有BMC520的伺服器及BIOS/UEFI 510、RMC530、管理伺服器540。
在步驟1,RMC 530從BMC520收集伺服器的電力消耗資料。
在步驟2,RMC 530通報電力消耗資料給管理伺服器540。
在步驟3,RMC 530設定機架電力消耗的新政策。
在步驟3.1,RMC 530要求BMC 520限制伺服器的電力消耗。
在步驟3.2,BMC 520送出中斷指令給BIOS/UEFI 510以限制伺服器的電力消耗。BMC 520可使用IPMI及/或RESTful命令在BIOS/UEFI 510上。UEFI BIOS 510提供最佳設定及操作模式給CPU、記憶體、快速周邊構件互連(PCIe)匯流排、交換控制器及儲存裝置。BIOS/UEFI 510可直接與裝置驅動器或控制硬體通信以減少工作量。舉例來說,BIOS/UEFI 510可使用先進組態與電力介面(Advance Configuration Power Interface,ACPI)系統控制中斷(System Control Interrupt,SCI)指令來改變一些設定。
在步驟3.3,UEFI 510藉由如減少CPU或記憶體的作業頻率以減少伺服器的電力消耗。
在步驟4,RMC再次從BMC520收集伺服器更新的電力消耗資料。
在步驟4.1,根據更新的電力消耗資料,RMC 530再次要求BMC 520限制伺服器的電力消耗。
在步驟4.2,BMC 520再次送出中斷命令給BIOS/UEFI 510以限制伺服器的電力消耗。
在步驟5,RMC 530通報管理伺服器540對電力消耗的限制是否成功。
在步驟5.1,管理伺服器540決定是否移動伺服器的工作量給其他伺服器。
第6圖繪示範例電腦系統600之方塊圖。電腦系統600包括處理器640、網路介面650、管理控制器680、記憶體620、儲存器630、BIOS 610、北橋660及南橋670。
例如,電腦系統600為伺服器(如在資料中心伺服器機架的伺服器)或個人電腦。處理器(如中央處理單元(CPU))640為母板上的晶片,其取回並執行儲存在記憶體620的程序指令。處理器640為具有單一處理核心的單一CPU、具 有多個處理核心的單一CPU、或多個CPU。一個或多個匯流排(未顯示於圖式)在各種電腦構件,如處理器640、記憶體620、儲存器630及網路介面650之間傳輸指令及應用程序資料。
記憶體620包括用以暫時或永久的儲存資料或程序之任意實體裝置,如各種形式的隨機存取記憶體(Random-Access Memory,RAM)。儲存器630包括用於非揮發性資料儲存之任意實體裝置,如HDD或快閃驅動器(flash drive)。儲存器630可具有比記憶體620大的容量且每單位儲存可更具經濟性,但亦可能具有較慢的傳輸速度。
BIOS 610包括基本輸入/輸出系統或其後繼子(successors)或均等物,如可延伸韌體介面(Extensible Firmware Interface,EFI)或統一可延伸韌體介面(UEFI)。BIOS 610包括BIOS晶片,其儲存BIOS軟體程序並位於電腦系統600的母板上。BIOS 610儲存當電腦系統第一次開機所被執行韌體以及指定給BIOS 610的一組組態。BIOS韌體及BIOS組態儲存在非揮發性記憶體(例如,NARAM)或唯讀記憶體(ROM),如快閃記憶體中。快閃記憶體為可被電子抹除及編程的非揮發性電腦儲存媒介。
BIOS 610在每次電腦系統600啟動時如順序程式(sequence program)被載入及執行。BIOS 610根據其組態組辨識、初始化及測試存在於給定計算系統的硬體。BIOS 610在電腦系統600執行自我測試,如電力開啟自我測試(Power-on-Self-Test,POST)。此自我測試測試各個硬體構件,如硬磁碟驅動機、光學讀取裝置、冷卻裝置、記憶體模組、擴充卡等的功能性。BIOS定址和分配記憶體620的區域用以儲存操作系統。然後BIOS 610將電腦系統的控制交給OS。
電腦系統600的BIOS 610包括BIOS組態,其定義BIOS 610如何控制電腦系統600中的各個硬體構件。BIOS組態決定電腦系統600中各個硬體構件的啟動順序。BIOS 610提供可使各式不同參數被設置的介面(如BIOS設置應用程 式(BIOS setup utility)),其可與BIOS預設組態的參數不同。舉例來說,使用者(如管理者)可使用BIOS 610來指明時脈和匯流排速度、指明哪些周邊裝置附接在電腦系統、指明健康的監測(如風扇速度和CPU溫度限制)及指明各式其他影響電腦系統的整體表現和電力使用的參數。
管理控制器680為嵌於電腦系統的母板上的特殊化微控器。舉例來說,管理控制器680為基板管理控制器(BMC)。管理控制器680管理系統管理軟體及平台硬體之間的介面。內建於電腦系統之不同種類的感測器通報參數,如溫度、冷卻風扇速度、電力狀態、操作系統狀態等給管理控制器680。管理控制器680監測感測器並在任何參數沒有保持在預設限制內時,經由網路介面650送出指示系統潛在失效之警告給管理者的能力。管理者可與管理控制器680遠程通信以執行一些校正動作,如重新設定或使系統電力循環(power cycling)以回復功能性。
北橋660為母板上的晶片,其可直接連接到處理器640或整合在處理器640中。在有些情況中,北橋660和南橋670合併為單一晶粒。北橋660和南橋670管理處理器640和母板其他部分之間的通信。北橋660管理比南橋670具有更高效能需求的工作。北橋660管理處理器640、記憶體620及視訊控制器(未顯示於圖式)之間的通信。在有些情況中,北橋660包括視訊控制器。
南橋670為母板上連接至北橋660的晶片,但與北橋660不同的是,並不需要直接連接至處理器640。南橋670管理電腦系統600的輸入/輸出功能,如通用串列匯流排(Universal Serial Bus,USB)、聲頻(audio)、串列(serial)、BIOS、序列先進技術附件(Serial Advanced Technology Attachment,SATA)、周邊組件互連(Peripheral Component Interconnect,PCI)匯流排,PCI延伸(PCI eXtended,PCI-X)匯流排、PCIe快速匯流排、ISA匯流排、SPI匯流排、eSPI匯流排、SMBus。管理控制器680、直接記憶體存取(Direct Memory Access,DMA)控 制器、可編程中斷控制器(Programmable Interrupt Controller,PIC)及即時時鐘(real-time clock)連接或包括在南橋670中。在有些其情況中,南橋670直接連接至處理器640,如在北橋660整合在處理器640的例子中。
網路介面650為任何支援有線或無線的區域網路(LAN)或廣域網路(WAN),如乙太網路、光纖波道、Wi-Fi、藍牙傳輸、火線、網際網路等。舉例來說,網路介面650可包括用於乙太網路的網路介面控制器(network interface controller,NIC)。乙太網路為目前為最廣泛使用於連接區域網路(LAN)或廣域網路(WAN)內電腦的網路標準。乙太網路定義多個用於實體層(Physical Layer,PHY)的佈線和發信標準,其係藉由在媒體存取控制(MAC)/資料鏈路層的網路存取方法及公用位址格式。啟用乙太網路的裝置一般藉由傳輸資料封包來通信,其包括獨立發送及交付的資料段。
與本文之揭露結合描述之各個繪示之邏輯區塊、模組及電路可以通用處理器、數位信號處理器(Digital Signal Processor,DSP)、特定應用積體電路(application specific integrated circuit,ASIC)、現場可編程閘陣列(Field Programmable Gate Array,FPGA)或其他可編程邏輯裝置、離散閘或電晶體邏輯(transistor logic)、離散硬體構件、或設計以執行本文所述功能之其任何組合來實施或執行。通用處理器為微處理器或任何傳統處理器、控制器、微控器或狀態機(state machine)。處理器亦可以計算裝置的組合來實施,如DSP和微處理器、複數個微處理器、與DSP核心結合之一個或多個微處理器或其他這樣的組態的組合。
搭配在此所揭露者所述方法或演算法的操作可直接於硬體、被處理器執行的軟體模組或兩者的組合中實施。軟體模組可位在RAM記憶體、快閃記憶體、ROM記憶體、EPROM記憶體、EEPROM記憶體、暫存器、硬碟、可移磁碟、CD-ROM或所屬技術領域中所知的任何其他形式的儲存媒體。例示性的 儲存媒體耦合至處理器,使處理器從儲存媒體讀取訊息或寫入訊息至儲存媒體。或者,儲存媒體可整合到處理器。處理器及儲存媒體位於ASIC中。ASIC位於使用者終端中。或者,處理器及儲存媒體為位於使用者終端機中之離散構件。
在一個或多個例示性設計中,所述功能在硬體、軟體、韌體或其任意組合中實施。若在軟體中實施,則功能以一個或多個指令或編碼儲存或傳輸在非暫時性電腦可讀取媒體上。非暫時性電腦可讀取媒體包括電腦儲存媒體及通信媒體兩者,通信媒體包括有助於將電腦程序從一個地方傳送到另一個地方的任何媒體。儲存媒體為可藉由通用或特殊用途電腦存取之任何可用的媒體。舉例來說,所述電腦可讀取媒體包括RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟或其他磁性儲存器或可以指令或資料結構形式用以攜帶或儲存所需程序編碼的手段且可被通用或特殊用途電腦或通用或特殊用途處理器所存取的任何其他工具,但不限於此。使用於此的碟片(disk)或碟盤(disc),包括光碟(compact disc,CD)、雷射碟、光碟(optical disc)、多樣化數位光碟(versatile disc,DVD)、軟碟和藍光光碟,其中碟片通常以磁性方法複製資料,而碟盤用雷射的方法光學地複製資料。上述的組合亦應包括在非暫時性電腦可讀取媒體的範疇中。
提供以上本揭露之描述以使所屬技術領域具通常知識者可以製造或使用本揭露。本揭露者的各種修改對所屬技術領域具通常知識者而言是顯而易見的,且在此界定的一般原理可用於其他變形例而不會脫離本揭露之範疇。因此,本揭露並不意圖限於已在此說明之範例及設計,而是意圖賦予與本文所揭示之原理及新穎特點一致的最大範疇。

Claims (9)

  1. 一種使用伺服器機架之一機架管理控制器之電力管理方法,其包括:從一伺服器機架中之一第一伺服器之一第一基板管理控制器收集一電力消耗資料;送出該電力消耗資料給一管理伺服器;從該管理伺服器接收一電力要求;監測一機架電力供應單元的健康;根據該機架電力供應單元的健康、該電力消耗資料及該電力要求判斷一電力設定;以及根據該電力設定要求該第一基板管理控制器限制該第一伺服器的電力消耗。
  2. 如申請專利範圍第1項所述之電力管理方法,其進一步包括從該伺服器機架中之至少一個其他的伺服器之至少一個其他的基板管理控制器或從該伺服器機架中之一機架電力供應單元收集該電力消耗資料。
  3. 如申請專利範圍第1項所述之電力管理方法,其中該機架管理控制器使用一出規頻帶介面或一表徵性狀態傳送介面與該管理伺服器和該第一基板管理控制器通信。
  4. 如申請專利範圍第1項所述之電力管理方法,其進一步包括:從該第一基板管理控制器收集一更新的電力消耗資料;根據該更新的電力消耗資料和該電力要求來決定一更新的電力設定;以及根據該更新的電力設定要求該第一基板管理控制器限制該第一伺服器的電力消耗。
  5. 如申請專利範圍第1項所述之電力管理方法,其中該第一基板管理控制器讀取該第一伺服器的電力消耗感測器並計算該電力消耗資料或命令該第一伺服器的一基本輸出入系統或一統一可延伸韌體介面執行節能動作。
  6. 一種使用伺服器機架中之第一伺服器之一基板管理控制器之電力管理方法,其包括:從一伺服器機架之一機架管理控制器接收一第一伺服器的一電力消耗資料的要求;從至少一個處理器特定模型暫存器讀取一處理器電力資料;從至少一個記憶體特定模型暫存器讀取一記憶體電力資料;從一母板電力轉換器感測器讀取一母板電力資料;根據該處理器電力資料、該記憶體電力資料、及該母板電力資料決定該電力消耗資料;以及送出該電力消耗資料給該機架管理控制器。
  7. 如申請專利範圍第6項所述之電力管理方法,其進一步包括:判斷該第一伺服器是否為一計算節點、一儲存節點或一交換節點;以及根據該第一伺服器是否為該計算節點、該儲存節點或該交換節點而在該第一伺服器上執行一電力消耗動作。
  8. 如申請專利範圍第6項所述之電力管理方法,其中該第一基板管理控制器命令該第一伺服器之一基本輸出入系統或一統一可延伸韌體介面讀取該處理器電力資料、該記憶體電力資料及該母板電力資料。
  9. 一電力管理系統,包括:一第一伺服器,具有一第一基板管理控制器;及一機架管理控制器,其設置以:從該第一伺服器之該第一基板管理控制器收集一電力消耗資料;送出該電力消耗資料給一管理伺服器;從該管理伺服器接收一電力要求;監測一機架電力供應單元的健康;根據該機架電力供應單元的健康、該電力消耗資料及該電力要求判斷一電力設定;以及要求該第一基板管理控制器根據該電力設定來限制該第一伺服器的電力消耗。
TW105121208A 2016-05-06 2016-07-05 伺服器機架電力管理 TWI621068B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/149,009 US10509456B2 (en) 2016-05-06 2016-05-06 Server rack power management
US15/149,009 2016-05-06

Publications (2)

Publication Number Publication Date
TW201740270A TW201740270A (zh) 2017-11-16
TWI621068B true TWI621068B (zh) 2018-04-11

Family

ID=58606177

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105121208A TWI621068B (zh) 2016-05-06 2016-07-05 伺服器機架電力管理

Country Status (5)

Country Link
US (1) US10509456B2 (zh)
EP (1) EP3242185B1 (zh)
JP (1) JP6323821B2 (zh)
CN (1) CN107346163B (zh)
TW (1) TWI621068B (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10257268B2 (en) 2015-03-09 2019-04-09 Vapor IO Inc. Distributed peer-to-peer data center management
US10817398B2 (en) * 2015-03-09 2020-10-27 Vapor IO Inc. Data center management via out-of-band, low-pin count, external access to local motherboard monitoring and control
US10404523B2 (en) * 2015-03-09 2019-09-03 Vapor IO Inc. Data center management with rack-controllers
US10108436B2 (en) * 2016-08-25 2018-10-23 American Megatrends, Inc. Techniques for bridging BIOS commands between client and host via BMC
US10235074B2 (en) * 2016-09-29 2019-03-19 Hewlett Packard Enterprise Development Lp Management processor executing peripheral device registration script
US10824437B1 (en) * 2017-04-27 2020-11-03 American Megatrends International, Llc Platform management for computing systems without baseboard management controllers
US11349339B1 (en) * 2017-04-27 2022-05-31 EMC IP Holding Company LLC Usage-based cost structuring system and method
US10810085B2 (en) * 2017-06-30 2020-10-20 Western Digital Technologies, Inc. Baseboard management controllers for server chassis
US10805264B2 (en) 2017-06-30 2020-10-13 Western Digital Technologies, Inc. Automatic hostname assignment for microservers
US10409756B2 (en) * 2017-07-07 2019-09-10 Facebook, Inc. Multi-node server platform with modularly replaceable cards
US10445201B2 (en) * 2017-10-05 2019-10-15 American Megatrends International, Llc System and method for automated integration and stress testing of hardware and software service in management controller using containerized toolbox
JP6919538B2 (ja) * 2017-12-05 2021-08-18 富士通株式会社 電力制御システム及び電力制御プログラム
CN108090000A (zh) * 2018-01-11 2018-05-29 郑州云海信息技术有限公司 一种获取cpu寄存器信息的方法及系统
US11481016B2 (en) 2018-03-02 2022-10-25 Samsung Electronics Co., Ltd. Method and apparatus for self-regulating power usage and power consumption in ethernet SSD storage systems
US11500439B2 (en) 2018-03-02 2022-11-15 Samsung Electronics Co., Ltd. Method and apparatus for performing power analytics of a storage system
US10877553B2 (en) * 2018-04-13 2020-12-29 Dell Products L.P. Systems and methods for power control based on power consumption of storage devices
US11630496B1 (en) * 2018-06-28 2023-04-18 Amazon Technologies, Inc. Distributed computing device power
CN109116963B (zh) * 2018-07-26 2022-02-08 英业达科技有限公司 周期性事件记录方法
CN109067743B (zh) * 2018-08-08 2021-03-19 郑州云海信息技术有限公司 一种服务器监控方法和装置
CN109032807A (zh) * 2018-08-08 2018-12-18 郑州云海信息技术有限公司 一种批量监控内存状态及限制内存功耗的方法及系统
CN109240892A (zh) * 2018-10-08 2019-01-18 郑州云海信息技术有限公司 一种批量监控服务器整机状态的方法及系统
CN111414274A (zh) * 2019-01-04 2020-07-14 营邦企业股份有限公司 运用于数据中心的机柜异常状态的远端排除方法
TWI705334B (zh) 2019-04-22 2020-09-21 緯創資通股份有限公司 擴展系統與伺服器主機及其操作方法
TWI709037B (zh) * 2019-05-23 2020-11-01 神雲科技股份有限公司 基本輸入輸出系統設置方法
CN110377136A (zh) * 2019-06-18 2019-10-25 苏州浪潮智能科技有限公司 一种psu原始值日志记录方法及装置
CN110531832A (zh) * 2019-07-24 2019-12-03 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 高密度异构化服务器多级管理系统
US11086390B2 (en) * 2019-11-07 2021-08-10 Dell Products L.P. Method and apparatus for improving power management by controlling a system input current in a power supply unit
KR102328939B1 (ko) * 2019-11-11 2021-11-19 한국전자기술연구원 Fpga-bmc 환경에서의 저지연 시스템 제어 관리 도구 연동 방법 및 장치
US11188130B2 (en) * 2019-11-19 2021-11-30 Dell Products L.P. Method and apparatus for thermal management using different customization modes
TWI751501B (zh) * 2020-02-25 2022-01-01 宏碁股份有限公司 鏈路狀態轉換的控制設定方法及使用此方法的電子裝置
CN213817241U (zh) 2020-03-27 2021-07-27 威锋电子股份有限公司 电力管理装置
KR20230042887A (ko) * 2021-09-23 2023-03-30 주식회사 두비컴퓨팅 서버 랙
US11799714B2 (en) 2022-02-24 2023-10-24 Hewlett Packard Enterprise Development Lp Device management using baseboard management controllers and management processors

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060156041A1 (en) * 2005-01-07 2006-07-13 Lee Zaretsky System and method for power management of plural information handling systems
TW201403303A (zh) * 2012-05-17 2014-01-16 Intel Corp 管理運算系統的電力消耗與效能之技術
TW201428476A (zh) * 2012-11-27 2014-07-16 Ibm 分散式電源預算編制
TW201520752A (zh) * 2013-11-29 2015-06-01 Ibm 電腦系統中的電源消耗控制

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7707443B2 (en) 2003-07-18 2010-04-27 Hewlett-Packard Development Company, L.P. Rack-level power management of computer systems
US7421599B2 (en) 2005-06-09 2008-09-02 International Business Machines Corporation Power management server and method for managing power consumption
US8195340B1 (en) * 2006-12-18 2012-06-05 Sprint Communications Company L.P. Data center emergency power management
US7779276B2 (en) * 2007-03-05 2010-08-17 International Business Machines Corporation Power management in a power-constrained processing system
JP4395800B2 (ja) 2007-09-18 2010-01-13 日本電気株式会社 電力管理システムおよび電力管理方法
US20090243391A1 (en) * 2008-03-31 2009-10-01 Susong Iii Walter Multi-functional power supply with power over ethernet support, integrated monitoring and supplemental power source backup
JP5003661B2 (ja) * 2008-11-21 2012-08-15 日本電気株式会社 電力配分システム、電力配分方法、プログラム及び電力配分装置
US8049985B2 (en) * 2009-02-03 2011-11-01 Seagate Technology Llc Variable spindle speed control for data storage devices
JP2011013764A (ja) * 2009-06-30 2011-01-20 Hitachi Ltd 消費電力管理方法、消費電力管理システムおよびプログラム
US8478451B2 (en) * 2009-12-14 2013-07-02 Intel Corporation Method and apparatus for dynamically allocating power in a data center
US9647913B2 (en) * 2010-11-16 2017-05-09 Avago Technologies General Ip (Singapore) Pte. Ltd. Measuring and managing power usage and cooling in a network
JP2012173926A (ja) * 2011-02-21 2012-09-10 Nec Corp サーバシステム及び電力供給制御方法
JP5663383B2 (ja) 2011-04-18 2015-02-04 株式会社日立製作所 ブレードサーバの電力制御方法及びシステム
US10180665B2 (en) * 2011-09-16 2019-01-15 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Fluid-cooled computer system with proactive cooling control using power consumption trend analysis
CN103135732B (zh) * 2011-11-28 2016-04-20 英业达科技有限公司 服务器机柜系统
US9436512B2 (en) * 2011-12-22 2016-09-06 Board Of Supervisors Of Louisana State University And Agricultural And Mechanical College Energy efficient job scheduling in heterogeneous chip multiprocessors based on dynamic program behavior using prim model
TW201405295A (zh) * 2012-07-18 2014-02-01 Hon Hai Prec Ind Co Ltd 電源供應電路
US9261945B2 (en) 2012-08-30 2016-02-16 Dell Products, L.P. Dynanmic peak power limiting to processing nodes in an information handling system
TWI544313B (zh) * 2013-04-30 2016-08-01 聯想企業解決方案(新加坡)有限公司 電力分配方法、電力分配裝置、及其資訊處理系統
CN104216499B (zh) 2013-05-31 2017-03-08 英业达科技有限公司 机柜与其电源控制方法
CN105100504B (zh) * 2014-05-22 2018-04-27 北京奇虎科技有限公司 设备应用耗电管理方法和装置
US9866548B2 (en) * 2014-12-17 2018-01-09 Quanta Computer Inc. Authentication-free configuration for service controllers
US9250684B1 (en) * 2015-02-25 2016-02-02 Quanta Computer Inc. Dynamic power capping of a subset of servers when a power consumption threshold is reached and allotting an amount of discretionary power to the servers that have power capping enabled
US9864719B2 (en) * 2015-03-12 2018-01-09 Dell Products L.P. Systems and methods for power optimization at input/output nodes of an information handling system
US9588571B2 (en) * 2015-07-08 2017-03-07 Quanta Computer Inc. Dynamic power supply management

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060156041A1 (en) * 2005-01-07 2006-07-13 Lee Zaretsky System and method for power management of plural information handling systems
TW201403303A (zh) * 2012-05-17 2014-01-16 Intel Corp 管理運算系統的電力消耗與效能之技術
TW201428476A (zh) * 2012-11-27 2014-07-16 Ibm 分散式電源預算編制
TW201520752A (zh) * 2013-11-29 2015-06-01 Ibm 電腦系統中的電源消耗控制

Also Published As

Publication number Publication date
TW201740270A (zh) 2017-11-16
JP6323821B2 (ja) 2018-05-16
EP3242185B1 (en) 2020-03-11
US10509456B2 (en) 2019-12-17
US20170322613A1 (en) 2017-11-09
JP2017201520A (ja) 2017-11-09
CN107346163A (zh) 2017-11-14
CN107346163B (zh) 2020-05-12
EP3242185A1 (en) 2017-11-08

Similar Documents

Publication Publication Date Title
TWI621068B (zh) 伺服器機架電力管理
US9710045B2 (en) Managing network wake-up commands
EP3242218B1 (en) Dynamic pcie switch reconfiguration mechanism
US10402207B2 (en) Virtual chassis management controller
US9547359B2 (en) Dynamic system management communication path selection
US9936605B2 (en) Controlling air flow in a server rack
US10587935B2 (en) System and method for automatically determining server rack weight
TWI640147B (zh) 控制電路及用以藉由其管理與系統機板有關之電源供應單元的方法
JP5246673B2 (ja) コンピュータの電力消費を管理する方法、コンピュータ・システム及びコンピュータ・プログラム
TW201015318A (en) Performance based cache management
TWI585675B (zh) 磁碟驅動器速度管理方法與系統及其相關非暫態電腦可讀取存取媒體
JP6333971B2 (ja) ジェネリックホストベースのコントローラレイテンシ方法及び装置
US20170155579A1 (en) Centralized server switch management
TW202026805A (zh) 提供峰值優化電力供應單元的方法與裝置
US10489328B2 (en) Universal sleds server architecture
Lefurgy et al. Energy-efficient data centers and systems
TW202027360A (zh) 在電力輔助單元中提供高頻寬電容器電路的方法與裝置