TW201800952A - 機箱管理系統及機箱管理方法 - Google Patents

機箱管理系統及機箱管理方法 Download PDF

Info

Publication number
TW201800952A
TW201800952A TW105130119A TW105130119A TW201800952A TW 201800952 A TW201800952 A TW 201800952A TW 105130119 A TW105130119 A TW 105130119A TW 105130119 A TW105130119 A TW 105130119A TW 201800952 A TW201800952 A TW 201800952A
Authority
TW
Taiwan
Prior art keywords
chassis
management
management controller
controllers
controller
Prior art date
Application number
TW105130119A
Other languages
English (en)
Other versions
TWI631466B (zh
Inventor
古凱帆
蔡錦富
Original Assignee
廣達電腦股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 廣達電腦股份有限公司 filed Critical 廣達電腦股份有限公司
Publication of TW201800952A publication Critical patent/TW201800952A/zh
Application granted granted Critical
Publication of TWI631466B publication Critical patent/TWI631466B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3031Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a motherboard or an expansion card
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44505Configuring for program initiating, e.g. using registry, configuration files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3027Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3048Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the topology of the computing system or computing system component explicitly influences the monitoring activity, e.g. serial, hierarchical systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/36Handling requests for interconnection or transfer for access to common bus or bus system
    • G06F13/362Handling requests for interconnection or transfer for access to common bus or bus system with centralised access control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4027Coupling between buses using bus bridges
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/14Mounting supporting structure in casing or on frame or rack
    • H05K7/1485Servers; Data center rooms, e.g. 19-inch computer racks
    • H05K7/1498Resource management, Optimisation arrangements, e.g. configuration, identification, tracking, physical location

Abstract

一種機箱管理系統,包括:複數個主機板,設置於一機箱中;複數個基板管理控制器,上述基板管理控制器之每一者與上述主機板之一者有關;以及至少一機箱等級元件,其中上述基板管理控制器透過一第一通訊匯流排互相連接,上述基板管理控制器與上述至少一機箱等級元件透過一第二通訊匯流排互相連接,上述基板管理控制器中之一者用以操作為上述機箱之一虛擬機箱管理控制器,上述虛擬機箱管理控制器用以透過上述第一通訊匯流排與上述基板管理控制器中之其他的基板管理控制器交換資料且透過上述第二通訊匯流排管理上述至少一機箱等級元件。

Description

機箱管理系統及機箱管理方法
本發明係有關於電腦系統,特別是一種用以管理一伺服器機箱之系統及方法。
電腦設備通常被儲存或安裝於資料中心中的伺服器機架(server rack)上。每個機架可以有組織配置的方式來容納多個元件,此有組織配置的方式有效率地利用空間,且使電腦設備及相關的基礎設施設置於系統管理者可輕易到達的範圍內。資料中心中的許多電腦設備係以伺服器的形式呈現,此等伺服器被儲存於標準化的伺服器機架(諸如:19英吋的機架機櫃)中所堆疊之外殼中。
伺服器機架安裝許多計算模組(諸如:托盤(tray)、機箱(chassis)、滑槽式計算機伺服器(sled)等),此等計算模組被設置且堆疊於此伺服器機架中。伺服器機架允許計算機模組的垂直配置,以有效率地使用空間。伺服器機架中的機箱通常包括一或多個伺服器,每個伺服器係由基板管理控制器(BMC)來予以管理。基板管理控制器可管理在系統管理軟體與平台硬體間之介面。內建於伺服器中之不同型式的感測器可回報參數(諸如:溫度、冷卻風扇速度、功率狀態、作業系統的狀態等) 給基板管理控制器。若任何參數沒有在預設的範圍(preset limit)內,基板管理控制器可監控感測器及擁有可藉由網路介面傳送警告訊息(alert)給系統管理員的能力,並指出系統的潛在錯誤(failure)。
每個機箱還包括安裝於機架中的風扇,複數個電源供應單元(PSUs),複數個感測器,複數個網路卡,以及其他諸如此類的硬體元件。與每個服務器如何包括用以管理各種服務器功能之基板管理控制器類似的是,機箱典型上包括用以管理各種機箱功能(諸如:風扇控制、電源管理、感測器管理、及/或允許透過網路進行遠端管理)之機箱管理控制器。
下列段落係提供本發明一或多個實施例中之簡單摘要以提供本發明技術之基本理解。此摘要並非本發明技術之所有考慮之實施例的延伸概觀,且不是用以分辨所有例子之關鍵或重要元件也不是描述本發明中任何或所有方面的範圍。其目的是以一簡單形式呈現一或多個實施例中之一些概念以做為本發明後述詳細說明部分之前言。
一種機箱管理系統包括一機箱中之複數個主機板、複數個基板管理控制器以及至少一機箱等級元件。上述基板管理控制器之每一者與上述主機板之一者有關。上述基板管理控制器透過一第一通訊匯流排互相連接。上述基板管理控制器與上述至少一機箱等級元件透過一第二通訊匯流排互相連接。上述基板管理控制器中之一者用以操作為上述機箱之一虛 擬機箱管理控制器。上述虛擬機箱管理控制器用以透過上述第一通訊匯流排與上述基板管理控制器中之其他的基板管理控制器交換資料且透過上述第二通訊匯流排管理上述至少一機箱等級元件。
在某些實施例中,機箱管理系統更包括一機箱管理控制器,其中當上述機箱管理控制器故障時,上述基板管理控制器中之上述一者被操作為上述虛擬機箱管理控制器。在某些實施例中,上述基板管理控制器之上述一者被用以作為一預設的虛擬機箱管理控制器。在某些實施例中,上述基板管理控制器中之上述一者係根據一管理者選擇被操作為上述虛擬機箱管理控制器。
在某些實施例中,當判斷出上述基板管理控制器中之上述一者不可被操作為上述虛擬機箱管理控制器時,上述基板管理控制器中之另一者被操作為上述虛擬機箱管理控制器。在某些實施例中,用以機箱管理之上述系統更包括用以將上述虛擬機箱管理控制器連接至一或多個機箱等級元件之一通用目的基本輸入輸出擴充器。
在某些實施例中,上述第一通訊匯流排係為一智慧平台管理匯流排。在某些實施例中,上述第二通訊匯流排係為一內部整合電路(Inter-Integrated Circuit,簡稱I2C)匯流排。在某些實施例中,上述至少一機箱等級元件包括一感測器、一風扇或一電源供應單元中之至少一者。
另一機箱管理系統包括一機箱交換器、複數個主機板、複數個基板管理控制器以及至少一機箱等級元件。上述 基板管理控制器之每一者與上述主機板之一者有關且耦接至上述機箱交換器。上述基板管理控制器透過一第一通訊匯流排互相連接。上述基板管理控制器與上述至少一機箱等級元件透過一第二通訊匯流排互相連接。上述至少一機箱等級元件係透過上述第二通訊匯流排耦接至上述機箱交換器。上述機箱交換器用以與上述機板管理控制器中之上述基板管理控制器交換資料且選擇性地將上述至少一機箱等級元件之每一者連接至上述基板管理控制器之一者。
在某些實施例中,上述機箱交換器用以判斷出上述基板管理控制器之哪一者連接於上述至少一機箱等級元件之每一者。在某些實施例中,上述機箱交換器用以根據一優先圖表判斷出上述基板管理控制器之哪一者連接於上述至少一機箱等級元件之每一者。在某些實施例中,上述機箱交換器用以根據上述至少一機箱等級元件之每一者的分類類型判斷出上述基板管理控制器之哪一者連接於上述至少一機箱等級元件之每一者。
100‧‧‧系統
110、210、310‧‧‧基板管理控制器
120、220、320‧‧‧主機板
130、230、330‧‧‧機箱等級元件
150‧‧‧機箱管理控制器
200‧‧‧第一範例系統
240、340‧‧‧通用目的輸入輸出擴充器
300‧‧‧第二範例系統
350‧‧‧機箱交換器
400‧‧‧方法
410、420、430、440‧‧‧步驟
500‧‧‧電腦系統
510‧‧‧基本輸入輸出系統
520‧‧‧記憶體
530‧‧‧儲存單元
540‧‧‧處理器
550‧‧‧網路介面
560‧‧‧北橋
570‧‧‧南橋
580‧‧‧管理控制器
本發明之實施例將可參考所附圖式與後續的詳細說明而得知,其中:第1圖係描繪出先前技術中包括一機箱管理控制器之一系統的方塊圖;第2圖係描繪出用以機箱管理之一第一範例系統之一方塊 圖;第3圖係描繪出用以機箱管理之一第二範例系統之一方塊圖;第4圖係根據第2圖之系統描繪出用以機箱管理之一實施方法;以及第5圖為電腦系統之一實施例的方塊圖。
本發明提供一種用以管理一伺服器機箱之技術。本技術的各個方面將參照圖中所示進行說明。在以下描述中,出於解釋的目的,許多具體細節被闡述以便提供一或多個方面之徹底理解。然而,可以顯而易見的是,本技術可以在沒有這些具體細節的情況下實施。在其他實施例中,為了便於描述這些面貌,習知結構以及設備以方塊圖的形式展示。
本發明揭露一種伺服器機箱之管理系統及管理方法。伺服器機箱可包括一具有一單一主機板(例如:刀鋒伺服器或微軟伺服器)之單一伺服器,或可包括具有多個主機板之多個伺服器。伺服器機箱中之每個伺服器可被與伺服器中之主機板相關之一基板管理控制器所管理。本發明提供一虛擬機箱管理控制器用以縮減(eliminate)使用一分離的(separate)實體機箱管理控制器管理伺服器等級元件之需求。
第1圖係描繪出先前技術中包括一機箱管理控制器150之一系統100的方塊圖。系統100包括複數個主機板120、與每個主機板120有關之一控制器(基板管理控制器)110、機箱 管理控制器150以及至少一機箱等級元件(chassis level component)130。
機箱等級元件130可包括像是風扇、電源供應單元、多種感測器(例如:電壓感測器、電流感測器或溫度感測器)、現場可更換單元(field replaceable unit;FRU)、發光二極體,諸如此類的裝置。
在某些實施例中,控制器係為一基板管理控制器110或可實現本發明所描述功能之其他控制器。基板管理控制器110係為用以管理系統管理軟體及平台硬體間的介面之一控制器。在某些實施例中,每個基板管理控制器110可管理伺服器內的硬體元件(例如:處理器、記憶體、儲存裝置、電源供應單元、風扇、機板(boards),諸如此類的硬體元件)。
機箱管理控制器150係為用以與每個基板管理控制器110進行通訊及用以管理機箱等級元件130之一微控制器。機箱管理控制器150監控且確保系統100內裝置的健康度。每個基板管理控制器110使用一智慧平台管理匯流排連接至機箱管理控制器150。機箱管理控制器150透過一內部整合電路(Inter-Intergated Circuit,簡稱I2C)匯流排及/或一通用目的輸入輸出(GPIO)介面連接至複數個機箱等級元件。
基板管理控制器係為一智慧平台管理介面子系統之一部分,智慧平台管理介面子系統更包括一非揮發性儲存裝置以及其他分配至不同系統模組之衛星控制器。甚至當伺服器斷電或關機時,智慧平台管理介面子系統可獨立操作於一伺服器之外且可以工作。當伺服器當機時,智慧平台管理介面子系 統及一網路介面控制器甚至可操作於待機模式或一低功耗模式。
基板管理控制器使用智慧平台管理介面(IPMI)協定與複數個伺服器元件進行通訊。智慧平台管理介面係用在一獨立的電腦子系統之一組規範,該組規範用以管理且監控一電腦系統的中央處理單元(CPU)、韌體以及作業系統,並且由複數個管理者進行系統頻外管理(out-of-band management)及監控。基板管理控制器可使用任何匯流排介面(例如:系統管理匯流排、RS-232串列匯流排、IIC協定、乙太、智慧平台管理介面協定,LPC匯流排,諸如此類的匯流排介面)連接至複數個伺服器元件(例如:南橋或網路介面控制器)。IIC協定之特色為使用一7位元或一10位元位址空間(address space)的一串列資料線(Serial Data Line)及一串列時脈線(Serial Clock Line)之一多主控(multi-master)、多從控(multi-slave)、單端式(single-ended)、串列計算機(serial computer)的匯流排。系統管理匯流排(SMBus)協定之特徵為衍生自IIC協定之一單端式、雙線式(two-wire)匯流排,且使用IIC硬體及IIC定址(addressing)。智慧平台管理介面匯流排係為一基於IIC串列匯流排用以連接伺服器內之複數個機板。
每個通用目的輸入輸出針腳係為之在一積體電路上沒有具有預先設定目的且沒有被預設使用之一通用針腳。通用目的輸入輸出針腳可被設定為輸入或輸出、致能或禁用。通用目的輸入輸出介面可用以連接多種裝置。
系統100需要一實體裝置(例如:一微處理器)以作 為機箱管理控制器150。這樣一個實體裝置增加系統100的總設備開銷、維持開銷以及複雜度。實體裝置也導致管理機箱等級元件130之一延遲。
第2圖係描繪出用以機箱管理之一第一範例系統200之一方塊圖。第一範例系統200包括複數個主機板220、複數個控制器(基板管理控制器)210,其中每個基板管理控制器210與主機板220中之一者有關,以及至少一機箱等級元件230。
機箱等級元件230可包括像是風扇、電源供應單元、多種感測器(例如:電壓感測器、電流感測器或溫度感測器)、現場可更換單元、發光二極體,諸如此類的裝置。
舉例而言,每個控制器係為一基板管理控制器210或可實現本發明所描述功能之其他控制器。基板管理控制器210係為用以管理系統管理軟體及平台硬體間的介面之一控制器。在某些實施例中,每個基板管理控制器210可管理伺服器內的硬體元件(例如:處理器、記憶體、儲存裝置、電源供應單元、風扇、板,諸如此類的硬體元件)。
基板管理控制器210係透過一第一通訊匯流排互相通訊。基板管理控制器210與機箱等級元件230係透過一第二通訊匯流排互相通訊。在某些實施例中,第一通訊匯流排係為一智慧平台管理匯流排,第二通訊匯流排係為一內部整合電路匯流排。
與第1圖之機箱100不同之處在於第一範例系統200不需要一機箱管理控制器150。相反地,第一範例系統200係利用(leverage)每個基板管理控制器210具有足夠計算能力的 這個事實以進行同第1圖之機箱管理控制器150之操作。因此,除了基板管理控制器210的標準功能之外,第一範例系統200之基板管理控制器210中之一者用以操作為一虛擬機箱管理控制器以進行如第1圖所示之機箱管理控制器150之一或多個功能。
在某些實施例中,第一範例系統200包括一機箱管理控制器。然而,在機箱管理控制器故障時,基板管理控制器210中之一者可做為虛擬機箱管理控制器。
在某些實施例中,一系統管理者(例如:透過頻內網路或是頻外網路之一命令)選擇基板管理控制器210中之一者作為虛擬機箱管理控制器。在某些實施例中,基板管理控制器210中之一者被預選(pre-selected)為一預設的虛擬機箱管理控制器。在某些實施例中,若基板管理控制器210中之一者不可作為虛擬機箱管理控制器,基板管理控制器210中之另一者用以作為虛擬機箱管理控制器。
虛擬機箱管理控制器用以透過第一通訊匯流排與其他基板管理控制器210進行通訊。虛擬機箱管理控制器透過第二通訊匯流排管理機箱等級元件230。虛擬機箱管理控制器監控且確保第一範例系統200內裝置的健康度。在某些實施例中,基板管理控制器210於製造時就預先被設置具有一機箱管理控制器之功能。在某些實施例中,一系統管理者安裝允許基板管理控制器210包括傳統的機箱管理控制器之功能的韌體至基板管理控制器210。
在某些實施例中,機箱等級元件230包括一通用目的輸入輸出擴充器240。通用目的輸入輸出擴充器240致使虛擬 機箱管理控制器使用通用目的輸入輸出介面。虛擬機箱管理控制器可透過內部整合電路匯流排連接至通用目的輸入輸出介面連接至通用目的輸入輸出擴充器240。
第3圖係描繪出用以機箱管理之一第二範例系統300之一方塊圖。第二範例系統300包括一機箱交換器350、複數個主機板320、複數個控制器(基板管理控制器)310、其中每個基板管理控制器310與主機板320中之一者有關,以及至少一機箱等級元件330。
機箱等級元件330可包括像是風扇、電源供應單元、多種感測器(例如:電壓感測器、電流感測器或溫度感測器)、現場可更換單元、發光二極體,諸如此類的裝置。
舉例而言,每個控制器係為一基板管理控制器310或可實現本發明所描述功能之其他控制器。基板管理控制器310係為用以管理系統管理軟體及平台硬體間的介面之一控制器。在某些實施例中,每個基板管理控制器310可管理伺服器內的硬體元件(例如:處理器、記憶體、儲存裝置、電源供應單元、風扇、板,諸如此類的硬體元件)。
基板管理控制器310係透過一第一通訊匯流排互相通訊。基板管理控制器310與機箱等級元件330係透過一第二通訊匯流排互相通訊。在某些實施例中,第一通訊匯流排係為一智慧平台管理匯流排,第二通訊匯流排係為一內部整合電路匯流排。
與第1圖之系統100不同之處在於第二範例系統300不包括一機箱管理控制器150。相反地,除了基板管理控制 器310的標準功能之外,第二範例系統300設置每個基板管理控制器310以進行第1圖之機箱管理控制器150的一或多個功能。機箱交換器350係用以與複數個基板管理控制器交換資料且將機箱等級元件330中之每一者選擇性地連接至基板管理控制器中之一者。
在某些實施例中,機箱交換器350係用以判斷基板管理控制器310中之哪一者連接至每個機箱等級元件。舉例而言,每個基板管理控制器310被指派以連接至機箱等級元件330中之不同組的元件。
在某些實施例中,機箱交換器350係用以根據一優先圖表(priority table)判斷出基板管理控制器310之哪一者連接於至少一機箱等級元件之每一者。
在某些實施例中,機箱交換器350係用以根據機箱等級元件330之每一者的分類類型(classification type)判斷出基板管理控制器310之哪一者連接於至少一機箱等級元件之每一者。
在某些實施例中,機箱等級元件330包括致使一BMC使用通用目的輸入輸出介面之一通用目的輸入輸出擴充器340。通用目的輸入輸出擴充器340致使虛擬機箱管理控制器使用通用目的輸入輸出介面。通用目的輸入輸出擴充器340可使用通用目的輸入輸出針腳將基板管理控制器310連接至多種裝置。
第4圖係根據第2圖之系統描繪出用以機箱管理之一實施方法400。於步驟410中,開啟一機箱之電源。
於步驟420中,判斷機箱管理控制器是否可用於管理機箱。舉例而言,一基板管理控制器可判斷機箱管理控制器是否可用。
於步驟430中,當判斷出機箱管理控制器不可用時,複數個基板管理控制器中之一者用以操作為一虛擬機箱管理控制器,其中每個基板管理控制器與機箱中複數個主機板中之一者有關。
於步驟440中,第一虛擬機箱管理控制器透過一第一通訊匯流排與複數個基板管理控制器之其他基板管理控制器交換資料。
於步驟450中,第一虛擬機箱管理控制器透過一第二通訊匯流排管理至少一機箱等級元件之第一組機箱等級元件。
在某些實施例中,方法400判斷出每個基板管理控制器是否具有虛擬機箱管理控制器之功能。方法400判斷出每個基板管理控制器是否可管理至少一機箱等級元件之第一組機箱等級元件。方法400根據基板管理控制器是否具有虛擬機箱管理控制器之功能以及基板管理控制器是否可管理至少一機箱等級元件之第一組機箱等級元件,從複數個基板管理控制器中選擇複數個基板管理控制器之一者以作為虛擬機箱管理控制器。
在某些實施例中,方法400判斷出一機箱交換器是否可用。當判斷出機箱交換器為可用時,方法400透過機箱交換器選擇性地將機箱等級元件之第一組機箱等級元件連接至 虛擬機箱管理控制器。方法400透過機箱交換器選擇性地將機箱等級元件之第二組機箱等級元件連接至第二虛擬機箱管理控制器。
在某些實施例中,機箱交換器透過第二通訊匯流排連接至至少一機箱等級元件之第一組機箱等級元件、至少一機箱等級元件之第二組機箱等級元件以及複數個基板管理控制器。
在某些實施例中,方法400藉由第二虛擬機箱管理控制器透過第一通訊匯流排與複數個基板管理控制器中之其他基板管理控制器交換資料。方法400藉由第二虛擬機箱管理控制器透過第二通訊匯流排管理至少一機箱等級元件之第二組機箱等級元件。
第5圖為電腦系統500之一實施例的方塊圖。電腦系統500可包括一處理器540、一網路介面550、一管理控制器580、一記憶體520、一儲存單元530、一基本輸入輸出系統510、一北橋560以及一南橋570。
舉例而言,電腦系統500可為一伺服器(例如:一資料中心之一伺服器機箱中之一者)或一個人電腦。處理器(例如:中央處理單元)540為一主機板上之一晶片(chip)以讀取和執行儲存於記憶體520上之程式指令。處理器540可為具有單處理核心的單一CPU、具有多處理核心的單一CPU,或多個CPU。一或多個匯流排(未圖示)在複數個電腦元件(例如:處理器540、記憶體520、儲存單元530和網路介面550)間傳送指令和應用程式資料。
記憶體520包括用以暫時性地或永久性地儲存資料或程式之任意實體裝置(例如:各種形式的隨機存取記憶體(RAM))。儲存單元530包括用在非揮發性資料儲存之任意實體裝置(例如:一硬碟(HDD)或一隨身碟)。儲存單元530具有比記憶體520更大的容量且更經濟的每單位儲存,但儲存單元530具有比記憶體520更低的傳送速率。
基本輸入輸出系統510包括一基本輸入輸出系統(BIOS)或其後繼者(successors)或等效元件(equivalents),例如一可延伸韌體介面(EFI)或一統一可延伸韌體介面(UEFI)。基本輸入輸出系統510包括位於一電腦系統500的主機板(mother board)上之一基本輸入輸出系統晶片,用以儲存一基本輸入輸出系統軟體程式。基本輸入輸出系統510儲存一韌體,此韌體係搭配著為基本輸入輸出系統510所指定的一組配置於電腦系統第一次開機時被執行。基本輸入輸出系統韌體和基本輸入輸出系統配置可被儲存於一非揮發性記憶體(例如:非揮發性隨機存取記憶體)或一唯讀記憶體(例如:快閃記憶體)中。快閃記憶體是可被電性抹除(erased)且重新程式化(reprogram)之一非揮發性電腦儲存媒體(non-volatile computer storage medium)。
每次電腦系統500被啟動時,基本輸入輸出系統510可當作一串程式被讀取與執行。基本輸入輸出系統510可根據一組配置去辨識、初始化與測試存在於電腦系統中的硬體。基本輸入輸出系統510可進行在電腦系統500上的自我檢測(self-test),例如開機自我檢測(Power-on-Self-Test,POST)。自我檢測可測試多種硬體元件(例如:硬碟、光學讀取裝置、冷卻 裝置、記憶體模組、擴充卡等等)之功能。基本輸入輸出系統可定址和分配記憶體520中的一個區域用以儲存一作業系統。然後,基本輸入輸出系統510就可以把電腦系統的控制權交給作業系統。
電腦系統500中的基本輸入輸出系統510可包括一基本輸入輸出系統配置,上述基本輸入輸出系統配置定義基本輸入輸出系統510如何控制在電腦系統500中之多種硬體單元。基本輸入輸出系統配置可判斷電腦系統500中多種硬體單元啟動的順序。基本輸入輸出系統510可提供一個允許設定許多不同參數的介面,並且這些參數不同於基本輸入輸出系統的預設配置。舉例來說,一使用者(例如:系統管理者)可使用基本輸入輸出系統510指定(specify)時刻和匯流排速度,指定那些周邊設備連接至電腦系統,指定監控健康(monitoring of health)(例如:風扇速度和CPU溫度限制)和指定多種其他可影響電腦系統整體效能和使用功率之參數。
管理控制器580可為設置於電腦系統(更廣泛來說為一伺服器)之主機板之一特殊化微控制器(specialized microcontroller)。管理控制器580可管理在系統管理軟體與平台硬體間之介面。設置於電腦系統中之不同型式的感測器可回報參數(例如:溫度、冷卻風扇速度、功率狀態、作業系統的狀態等等)給管理控制器580。管理控制器580可以監控感測器,若任何參數沒有在預設的範圍內,管理控制器580擁有可藉由網路介面550傳送警告訊息給系統管理者的能力,並指出系統的潛在錯誤(failure)。系統管理者也可遠端地與管理控制 器580通訊,進行校正的動作(例如:系統的重新設定(resetting)或冷開機(power cycling))用以回復系統的功能。
北橋560可為設置於主機板上可直接連接至處理器540或可整合至處理器540之一晶片。舉例而言,北橋560與南橋570可組合成一單一的晶片(single die)。北橋560與南橋570管理處理器540與主機板上其他部分之間的通訊。北橋560管理比南橋570之更高效能的工作。北橋560也管理複數個處理器540、記憶體520以及影像控制器(未圖示)間的通訊。舉例而言,北橋560包括一影像控制器。
南橋570可為設置於主機板上連接至北橋560之一晶片,但與北橋560不同的地方在於南橋570無直接連接至處理器540。南橋管理複數個輸入/輸出功能(例如:電腦系統500之通用串列匯流排、音頻、串列、基本輸入輸出系統、串行ATA(SATA)、互連匯流排(Peripheral Component Interconnect bus)、互連延伸匯流排(PCI eXtended(PCI-X)bus)、快速週邊組件互連匯流排(PCI Express bus)、工業標準結構匯流排(ISA bus)、序列周邊介面匯流排(SPI bus)、e-序列周邊介面匯流排(eSPI bus)、系統管理匯流排(SMBus))。南橋570可連接至管理控制器、直接記憶體存取(DMAs)控制器、可程式中斷控制器(PICs)、及即時時脈;或管理控制器、直接記憶體存取(DMAs)控制器、可程式中斷控制器(PICs)、及即時時脈可包括於南橋570內。在某些實施例中,在北橋560集成至處理器540時,南橋570直接連接至處理器540。
多種各種說明性之邏輯區塊、模組、及電路以及 在此所揭露之各種情況可實施在或執行於一般用途處理器、數位訊號處理器(digital signal processor,DSP)、特定應用積體電路(application specific integrated circuit,ASIC)、現場可編程閘列(field programmable gate array,FPGA)或其他可編程邏輯裝置、離散閘(discrete gate)或電晶體邏輯(transistor logic)、離散硬體元件、或任何以上之組合之設計以完成在此文內描述之功能。一般用途處理器可能是微處理器,但也可能是任何常規處理器、控制器、微控制器、或狀態機。處理器可由電腦設備之組合所構成,例如:數位訊號處理器(DSP)及一微電腦之組合、多組微電腦、一組至多組微電腦以及一數位訊號處理器核心、或任何其他類似之配置。
本發明之說明書所揭露之方法和演算法之步驟,可以直接透過執行一處理器直接應用在硬體以及軟體模組或兩者之結合上。軟體模組儲存在隨機存取記憶體(Random Access Memory,RAM)、快閃記憶體(flash memory)、唯讀記憶體(Read-Only Memory,ROM)、可抹除可規化唯讀記憶體(EPROM)、電子抹除式可複寫唯讀記憶體(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、暫存器、硬碟、可攜式應碟、光碟唯讀記憶體(Compact Disc Read-Only Memory,CD-ROM)或在此領域習之技術中任何其它電腦可讀取之儲存媒體格式中。儲存媒體可耦接至一處理器,例如可儲存媒體讀取資訊且寫入資訊至儲存媒體的處理器。在某些實施例中,儲存媒體可與處理器整合在一起。處理器與儲存媒體可設置於一特殊應用積體電路(ASIC)之中。特殊應用積體電路 (ASIC)可設置於一使用者端(user terminal)中。在某些實施例中,儲存媒體可與處理器整合在一起。處理器與儲存媒體可設置成一使用者端(user terminal)中之分離的元件。
在某些設計中,前述的功能可以硬體、軟體、韌體或其組合之方式加以實現。若以軟體的方式實現,前述的功能可儲存於一非易失性電腦可讀取媒體上之一個或多個指令或編碼,或儲存於一非易失性電腦可讀取媒體上之一個或多個指令或編碼。非易失性電腦可讀取媒體包含任何有助於將一電腦程式由一地方傳送至至另一地方的媒體。儲存媒體可為被通用型或專用型電腦所存取之任何可能的媒體。舉例而言,此電腦可讀取媒體包括動態存取記憶體(RAM)、唯讀記憶體(ROM)、電子抹除式可編程唯讀記憶體(EEPROM)、唯讀光碟CDROM或其它光學儲存碟、磁碟儲存裝置或其它其他磁性儲存裝置,或任何可承載或儲存指令型式或資料結構型式之所需程式碼並且可由通用或專用電腦或通用或專用處理器所存取的其它媒體。舉例而言,前述的碟片可為光碟(CD)、雷射碟、光學碟、數位影音光碟(DVD)、軟碟(floppy disk)或藍光光碟,這些碟片係藉由雷射光來重製(reproduce)資料,而磁碟則利用磁性來重製(reproduce)資料。前面揭露之組合亦屬於非易失性電腦可讀取媒體之範圍。
惟以上所述者,僅為本揭露之較佳實施例而已,當不能以此限定本揭露實施之範圍,即大凡依本揭露申請專利範圍及發明說明內容所作之簡單的等效變化與修飾,皆仍屬本揭露專利涵蓋之範圍內。另外,本揭露的任一實施例或申請專 利範圍不須達成本揭露所揭露之全部目的或優點或特點。此外,摘要部分和標題僅是用來輔助專利文件搜尋之用,並非用來限制本揭露之權利範圍。
410、420、430、440、450‧‧‧步驟

Claims (10)

  1. 一種機箱管理系統,包括:複數個主機板,設置於一機箱中;複數個基板管理控制器,上述基板管理控制器之每一者與上述主機板之一者有關;以及至少一機箱等級元件,其中上述基板管理控制器透過一第一通訊匯流排互相連接,上述基板管理控制器與上述至少一機箱等級元件透過一第二通訊匯流排互相連接,上述基板管理控制器中之一者用以操作為上述機箱之一虛擬機箱管理控制器,上述虛擬機箱管理控制器用以透過上述第一通訊匯流排與上述基板管理控制器中之其他的基板管理控制器交換資料且透過上述第二通訊匯流排管理上述至少一機箱等級元件。
  2. 如申請專利範圍第1項所述之機箱管理系統,更包括一機箱管理控制器,其中當上述機箱管理控制器故障時,上述基板管理控制器中之上述一者被操作為上述虛擬機箱管理控制器。
  3. 如申請專利範圍第1項所述之機箱管理系統,其中當判斷出上述基板管理控制器中之上述一者不可被操作為上述虛擬機箱管理控制器時,上述基板管理控制器中之另一者被操作為上述虛擬機箱管理控制器。
  4. 一種機箱管理系統,包括:一機箱交換器;複數個主機板; 複數個基板管理控制器,上述基板管理控制器之每一者與上述主機板之一者有關且耦接至上述機箱交換器,其中上述基板管理控制器透過一第一通訊匯流排互相連接,上述基板管理控制器與上述至少一機箱等級元件透過一第二通訊匯流排互相連接;以及至少一機箱等級元件,透過上述第二通訊匯流排耦接至上述機箱交換器,其中上述機箱交換器用以與上述機板管理控制器中之上述基板管理控制器交換資料且選擇性地將上述至少一機箱等級元件之每一者連接至上述基板管理控制器之一者。
  5. 如申請專利範圍第4項所述之機箱管理系統,其中上述機箱交換器用以判斷出上述基板管理控制器之哪一者連接於上述至少一機箱等級元件之每一者。
  6. 一種機箱管理方法,包括:啟動一機箱;判斷一機箱管理控制器是否可用於管理上述機箱;當判斷出上述機箱管理控制器不可用於管理上述機箱時,將複數個基板管理控制器中之一者操作為上述機箱之一第一虛擬機箱管理控制器,其中上述基板管理控制器之每一者與上述機箱之複數個主機板之每一者有關;透過上述第一虛擬機箱管理控制器藉由一第一通訊匯流排與上述基板管理控制器中之其他的基板管理控制器交換資料;以及透過上述第一虛擬機箱管理控制器藉由一第二通訊匯流 排管理至少一機箱等級元件中之一第一組機箱等級元件。
  7. 如申請專利範圍第6項所述之機箱管理方法,更包括:判斷上述基板管理控制器之每一者是否具有虛擬機箱管理控制器功能;判斷上述基板管理控制器之每一者是否可用以管理上述至少一機箱等級元件中之上述第一組機箱等級元件;以及根據上述基板管理控制器之上述一者是否具有上述虛擬機箱管理控制器功能以及上述基板管理控制器之上述一者是否可用以管理上述至少一機箱等級元件中之上述第一組機箱等級元件,從上述基板管理控制器中選出上述一者作為上述第一虛擬機箱管理控制器。
  8. 如申請專利範圍第6項所述之機箱管理方法,更包括:判斷一機箱交換器是否可用;當判斷出上述機箱交換器為可用時,透過上述機箱交換器選擇性地將上述至少一機箱等級元件之上述第一組機箱等級元件連接至上述第一虛擬機箱管理控制器;透過上述機箱交換器選擇性地將上述至少一機箱等級元件之一第二組機箱等級元件連接至一第二虛擬機箱管理控制器。
  9. 如申請專利範圍第8項所述之機箱管理方法,其中上述機箱交換器透過上述第二通訊匯流排與上述至少一機箱等級元件之上述第一組機箱等級元件、上述至少一機箱等 級元件之上述第二組機箱等級元件以及上述基板管理控制器連接。
  10. 如申請專利範圍第8項所述之機箱管理方法,更包括:透過上述第二虛擬機箱管理控制器藉由上述第一通訊匯流排與上述基板管理控制器中之其他的基板管理控制器交換資料;以及透過上述第二虛擬機箱管理控制器藉由上述第二通訊匯流排管理上述至少一機箱等級元件之上述第二組機箱等級元件。
TW105130119A 2016-06-16 2016-09-19 機箱管理系統及機箱管理方法 TWI631466B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/184,587 US10402207B2 (en) 2016-06-16 2016-06-16 Virtual chassis management controller
US15/184,587 2016-06-16

Publications (2)

Publication Number Publication Date
TW201800952A true TW201800952A (zh) 2018-01-01
TWI631466B TWI631466B (zh) 2018-08-01

Family

ID=58699065

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105130119A TWI631466B (zh) 2016-06-16 2016-09-19 機箱管理系統及機箱管理方法

Country Status (5)

Country Link
US (1) US10402207B2 (zh)
EP (1) EP3261420A1 (zh)
JP (1) JP6515132B2 (zh)
CN (1) CN107526665B (zh)
TW (1) TWI631466B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI704463B (zh) * 2019-03-29 2020-09-11 英業達股份有限公司 伺服器系統與管理方法
TWI750726B (zh) * 2020-07-09 2021-12-21 緯穎科技服務股份有限公司 伺服器裝置及其伺服模組連接辨識方法
TWI830573B (zh) * 2023-01-09 2024-01-21 信驊科技股份有限公司 基板管理控制裝置及其控制方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI604304B (zh) * 2016-03-28 2017-11-01 緯創資通股份有限公司 電子裝置及其檢測方法
CN106250339B (zh) * 2016-07-26 2019-05-07 英业达科技有限公司 控制电路板、微服务器、控制系统及其控制方法
US10298447B2 (en) * 2016-08-08 2019-05-21 American Megatrends, Inc. System and method for accessing real sensors for virtual service processor stack
US10083146B2 (en) * 2016-11-22 2018-09-25 Hewlett Packard Enterprise Development Lp Shared USB ports
US10810085B2 (en) 2017-06-30 2020-10-20 Western Digital Technologies, Inc. Baseboard management controllers for server chassis
US10805264B2 (en) * 2017-06-30 2020-10-13 Western Digital Technologies, Inc. Automatic hostname assignment for microservers
US10613950B2 (en) * 2018-01-05 2020-04-07 Quanta Computer Inc. CMC failover for two-stick canisters in rack design
CN108306964A (zh) * 2018-01-31 2018-07-20 郑州云海信息技术有限公司 服务器节点信息集中显示方法、系统、设备及存储介质
CN108491307A (zh) * 2018-03-14 2018-09-04 郑州云海信息技术有限公司 一种集中管理各节点信息的方法及系统
US20190286590A1 (en) * 2018-03-14 2019-09-19 Quanta Computer Inc. Cpld cache application in a multi-master topology system
CN109032979A (zh) * 2018-06-04 2018-12-18 郑州云海信息技术有限公司 一种bmc间的文件传输方法、装置、设备及存储介质
US10592462B2 (en) * 2018-06-19 2020-03-17 Quanta Computer Inc. Cable detection
US10782754B2 (en) * 2018-09-21 2020-09-22 Quanta Computer Inc. Thermal management via virtual BMC manager
CN109634879A (zh) * 2018-12-17 2019-04-16 郑州云海信息技术有限公司 一种pcie转接板和服务器监控系统
JP6697102B1 (ja) * 2019-01-23 2020-05-20 Necプラットフォームズ株式会社 情報処理装置、情報処理装置の制御方法、及び、情報処理装置の制御プログラム
US11895181B2 (en) * 2020-12-04 2024-02-06 Schneider Electric It Corporation Power optimization of microserver loads
CN117742935A (zh) * 2022-10-21 2024-03-22 超聚变数字技术有限公司 一种服务器中处理器信息的带外查询/配置方法及服务器

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050080887A1 (en) * 2003-10-08 2005-04-14 Chun-Liang Lee Redundant management control arbitration system
JP5459593B2 (ja) 2009-08-17 2014-04-02 日本電気株式会社 サーバ監視システム及びサーバ監視方法
TW201222208A (en) 2010-11-30 2012-06-01 Inventec Corp Server integrate system
TW201222274A (en) * 2010-11-30 2012-06-01 Inventec Corp Computer chassis system
JP5441875B2 (ja) 2010-12-07 2014-03-12 株式会社日立製作所 計算機システム
US8842664B2 (en) 2011-09-27 2014-09-23 Znyx Networks, Inc. Chassis management modules for advanced telecom computing architecture shelves, and methods for using the same
US9935901B2 (en) 2011-12-30 2018-04-03 Dell Products, Lp System and method of enabling a multi-chassis virtual switch for virtual server network provisioning
CN103324495A (zh) 2012-03-23 2013-09-25 鸿富锦精密工业(深圳)有限公司 数据中心服务器开机管理方法及系统
TWI528134B (zh) 2012-12-17 2016-04-01 鴻海精密工業股份有限公司 擋板控制裝置及具有該擋板控制裝置的伺服器機架
US9130824B2 (en) 2013-01-08 2015-09-08 American Megatrends, Inc. Chassis management implementation by management instance on baseboard management controller managing multiple computer nodes
US9990221B2 (en) 2013-03-15 2018-06-05 Oracle International Corporation System and method for providing an infiniband SR-IOV vSwitch architecture for a high performance cloud computing environment
TW201445936A (zh) * 2013-05-17 2014-12-01 Hon Hai Prec Ind Co Ltd 可動態切換主節點的伺服器系統及動態切換主節點的方法
US9257300B2 (en) * 2013-07-09 2016-02-09 Lam Research Corporation Fluorocarbon based aspect-ratio independent etching
US9804980B2 (en) 2013-07-25 2017-10-31 Dell Products, Lp System management through direct communication between system management controllers
CN104375930A (zh) 2013-08-13 2015-02-25 鸿富锦精密工业(深圳)有限公司 固件检测系统及方法
US9619243B2 (en) * 2013-12-19 2017-04-11 American Megatrends, Inc. Synchronous BMC configuration and operation within cluster of BMC
US10097409B2 (en) * 2014-03-01 2018-10-09 Dell Products, Lp System and method for managing multi-tenant chassis environment using virtual private chassis management controllers
JP2015230720A (ja) 2014-06-09 2015-12-21 株式会社日立製作所 計算機システム
US10136558B2 (en) 2014-07-30 2018-11-20 Dell Products L.P. Information handling system thermal management enhanced by estimated energy states
US9804937B2 (en) 2014-09-08 2017-10-31 Quanta Computer Inc. Backup backplane management control in a server rack system
CN104615506A (zh) 2015-02-13 2015-05-13 浪潮电子信息产业股份有限公司 一种基于逻辑控制的bios和bmc备份方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI704463B (zh) * 2019-03-29 2020-09-11 英業達股份有限公司 伺服器系統與管理方法
TWI750726B (zh) * 2020-07-09 2021-12-21 緯穎科技服務股份有限公司 伺服器裝置及其伺服模組連接辨識方法
TWI830573B (zh) * 2023-01-09 2024-01-21 信驊科技股份有限公司 基板管理控制裝置及其控制方法

Also Published As

Publication number Publication date
US10402207B2 (en) 2019-09-03
EP3261420A1 (en) 2017-12-27
US20170364375A1 (en) 2017-12-21
CN107526665A (zh) 2017-12-29
JP6515132B2 (ja) 2019-05-15
JP2017224285A (ja) 2017-12-21
CN107526665B (zh) 2021-04-20
TWI631466B (zh) 2018-08-01

Similar Documents

Publication Publication Date Title
TWI631466B (zh) 機箱管理系統及機箱管理方法
TWI631470B (zh) 透過一管理控制器動態重新配置一系統之至少一週邊匯流排交換器之方法及系統
TWI578138B (zh) 在伺服器機架系統中之備份管理控制的方法以及伺服器機架
TWI571736B (zh) 自動除錯資訊收集之方法及系統
US10031736B2 (en) Automatic system software installation on boot
US9122501B1 (en) System and method for managing multiple bios default configurations
US10127170B2 (en) High density serial over LAN management system
TWI522919B (zh) 自動地配置電腦系統中之基本輸入輸出系統效能設定檔的裝置、方法及非暫態電腦可讀取記錄媒體
US10587935B2 (en) System and method for automatically determining server rack weight
TWI647993B (zh) 控制伺服器機櫃中氣流之系統及方法
TWI735279B (zh) 自動偵測及警示計算裝置組件變更的方法和系統
TWI608357B (zh) 共用匯流排埠之系統及共用匯流排埠之方法
EP3062216A1 (en) Network bios management
US20190026022A1 (en) System and Method to Detect Storage Controller Workloads and to Dynamically Split a Backplane
TWI588659B (zh) 利用通用滑動部件以分享輸入/輸出的系統及方法
TWI605347B (zh) 機動伺服器配置系統
US9794120B2 (en) Managing network configurations in a server system