TW201626134A - 具有多機櫃管理模組的機櫃及其韌體更新方法 - Google Patents

具有多機櫃管理模組的機櫃及其韌體更新方法 Download PDF

Info

Publication number
TW201626134A
TW201626134A TW104100072A TW104100072A TW201626134A TW 201626134 A TW201626134 A TW 201626134A TW 104100072 A TW104100072 A TW 104100072A TW 104100072 A TW104100072 A TW 104100072A TW 201626134 A TW201626134 A TW 201626134A
Authority
TW
Taiwan
Prior art keywords
rmc
switch
cabinet
memory
firmware
Prior art date
Application number
TW104100072A
Other languages
English (en)
Other versions
TWI576682B (zh
Inventor
陳彥佑
徐仕杰
Original Assignee
營邦企業股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 營邦企業股份有限公司 filed Critical 營邦企業股份有限公司
Priority to TW104100072A priority Critical patent/TWI576682B/zh
Priority to FI20155207A priority patent/FI127566B/en
Priority to RU2015116727A priority patent/RU2602378C9/ru
Publication of TW201626134A publication Critical patent/TW201626134A/zh
Application granted granted Critical
Publication of TWI576682B publication Critical patent/TWI576682B/zh

Links

Classifications

    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1433Saving, restoring, recovering or retrying at system level during software upgrading
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/61Installation
    • G06F8/63Image based installation; Cloning; Build to order

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Thermal Sciences (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Stored Programmes (AREA)

Abstract

一種機櫃,具有多個機櫃管理模組,各機櫃管理模組分別包含機櫃管理控制器(Rack Management Controller,RMC)、切換器及記憶體,其中各機櫃管理模組的切換器彼此連接,各記憶體分別儲存有韌體。當RMC接受外部上傳的韌體更新檔及更新命令時,係對切換器發出切換指令,以令切換器切換連接至另一機櫃管理模組的記憶體。當RMC執行韌體更新程序時,係通過切換器的連接以對另一機櫃管理模組的記憶體中的韌體進行更新。通過本發明,可避免RMC在韌體更新失敗後無法正常開機,進而無法對韌體再次進行更新的問題。

Description

具有多機櫃管理模組的機櫃及其韌體更新方法 【0001】
本發明係涉及機櫃,尤其涉及具有多個機櫃管理模組的機櫃,以及該機櫃使用的韌體更新方法。
【0002】
一般來說,一個伺服器機櫃(Rack)中可設置複數台的伺服器,並且還設置有一顆機櫃管理控制器(Rack Management Controller,RMC)。該機櫃的管理人員可以通過該RMC來連接該些伺服器,以 搜集該些伺服器的資訊,並對該些伺服器進行控制。
【0003】
該RMC屬於一種系統單晶片(System on Chip,SoC),本身具備有記憶體,並且需通過韌體的執行來進行開機。因此,與該些伺服器中的中央處理單元(Central Processing Unit,CPU)相同,該機櫃的管理人員需不定期對該RMC的韌體進行更新。
【0004】
一般來說,該RMC可在接收到韌體的更新檔後,自動對所使用的韌體進行更新,然而若在執行更新程序的過程中被意外中斷(例如當機或機櫃電源中斷),或是更新到錯誤的韌體,則在該RMC重新啟動後,將可能無法正常開機。由於在現行技術中,一台機櫃中只配置有單一顆該RMC,因此若該RMC無法正常開機,則會導致該機櫃中的所有伺服器皆無法被正常使用,相當麻煩。
【0005】
再者,由於該RMC在韌體更新失敗後已無法正常開機,因此,該機櫃也就無法在不受外力支援的情況下(如由該管理人員手動進行),對韌體再次進行更新,以排除錯誤狀況。
【0006】
有鑑於此,如何令RMC可在韌體更新失敗後,可以不用借助外力即正常開機,並對更新失敗的韌體再次進行更新,即為本技術領域的從業人員所潛心研究的課題。
【0007】
本發明的主要目的,在於提供一種具有多機櫃管理模組的機櫃及其韌體更新方法,可令機櫃管理模組對其他機櫃管理模組中的韌體進行更新,以避免機櫃管理模組在韌體更新失敗後無法正常開機,進而也無法對韌體再次進行更新的問題。
【0008】
本發明的另一主要目的,在於提供一種具有多機櫃管理模組的機櫃及其韌體更新方法,可由多個機櫃管理模組彼此進行心跳偵測,並於偵測到其他機櫃管理模組運作異常時,提供備援運作方案。
【0009】
為了達成上述之目的,本發明揭露的機櫃 具有多個機櫃管理模組,各機櫃管理模組分別包含機櫃管理控制器(Rack Management Controller,RMC)、切換器及記憶體,其中各機櫃管理模組的切換器彼此連接,各記憶體分別儲存有韌體。當RMC接受外部上傳的韌體更新檔時,係對切換器發出切換指令,以令切換器切換連接至另一機櫃管理模組的記憶體。當RMC執行韌體更新程序時,係通過切換器的連接以對另一機櫃管理模組的記憶體中的韌體進行更新。
【0010】
本發明對照先前技術所能達到的技術功效在於,RMC不會對同一個機櫃管理模組內的韌體進行更新,如此一來,即使更新程序遭到意外中斷而導致更新失敗,RMC也不會有因為韌體異常而無法在重置後正常開機。因此,即使韌體的更新程序失敗,RMC仍然可以在重置後再次對韌體進行更新,直到更新成功為止。如此一來,降低了因韌體更新失敗導致RMC無法正常開機運作,而需管理人員手動進行修複的風險。
【0011】
另,本發明在同一機櫃中提供了多個機櫃管理模組,且令各機櫃管理模組可以互相連接,並對彼此進行心跳偵測(heartbeat detection),如此一來,可在發現其中一機櫃管理模組的運作異常時,由其他機櫃管理模組來提供備援運作方案。藉此,可排除因機櫃管理模組發生錯誤,導致整個機櫃皆無法正常運作的問題。
【0051】
1‧‧‧機櫃
【0052】
2‧‧‧第一機櫃管理控制器模組
【0053】
21‧‧‧第一機櫃管理控制器
【0054】
211‧‧‧第一儲存單元
【0055】
22‧‧‧第一切換器
【0056】
23‧‧‧第一記憶體
【0057】
231‧‧‧第一韌體
【0058】
3‧‧‧第二機櫃管理控制器模組
【0059】
31‧‧‧第二機櫃管理控制器
【0060】
311‧‧‧第二儲存單元
【0061】
32‧‧‧第二切換器
【0062】
33‧‧‧第二記憶體
【0063】
331‧‧‧第二韌體
【0064】
4‧‧‧端點伺服器
【0065】
C1‧‧‧第一切換指令
【0066】
C2‧‧‧第二切換指令
【0067】
F1‧‧‧韌體更新檔
【0068】
L1‧‧‧第一存取通道
【0069】
L2‧‧‧第二存取通道
【0070】
L3‧‧‧第三存取通道
【0071】
I0‧‧‧溝通介面
【0072】
I1‧‧‧第一指令傳輸介面
【0073】
I2‧‧‧第二指令傳輸介面
【0074】
S10~S16‧‧‧取得步驟
【0075】
S20~S30‧‧‧更新步驟
【0076】
S40~S44‧‧‧備援步驟
【0012】
圖1為本發明的第一具體實施例的機櫃示意圖。
【0013】
圖2為本發明的第一具體實施例的連接示意圖。
【0014】
圖3為本發明的第一具體實施例的韌體更新動作示意圖。
【0015】
圖4為本發明的第二具體實施例的韌體更新動作示意圖。
【0016】
圖5為本發明的第一具體實施例的更新檔取得流程圖。
【0017】
圖6為本發明的第一具體實施例的韌體更新流程圖。
【0018】
圖7為本發明的第一具體實施例的備援流程圖。
【0019】
茲就本發明之一較佳實施例,配合圖式,詳細說明如後。
【0020】
首請參閱圖1,為本發明的第一具體實施例的機櫃示意圖。圖1揭露了一機櫃1,該機櫃1具有多個容置槽,可供設置多組的端點伺服器4。該機櫃1中還包含了多組的機櫃管理模組,分別與該些端點伺服器4電性連接,以搜集該些端點伺服器4的資訊,並對該些端點伺服器4進行控制。本實施例中,該多組機櫃管理模組係以一第一機櫃管理模組2與一第二機櫃管理模組3為例,以進行說明,但其數量不以兩組為限。
【0021】
本發明中,每一個該機櫃管理模組皆包含一機櫃管理控制器(Rack Management Controller,RMC)、一切換器及一記憶體,該RMC通過該切換器連接該記憶體,並且該記憶體中儲存有該RMC開機使用的韌體。
【0022】
參閱圖2,為本發明的第一具體實施例的連接示意圖。如圖2所示,上述該第一機櫃管理模組2包含一第一RMC21、一第一切換器22及一第一記憶體23,該第一RMC21連接該第一切換器22,並通過該第一切換器22連接該第一記憶體23。該第一記憶體23中儲存有該第一RMC21使用的一第一韌體231。另,該第二機櫃管理模組3包含一第二RMC31、一第二切換器32及一第二記憶體33,該第二RMC31連接該第二切換器32,並通過該第二切換器32連接該第二記憶體33。該第二記憶體33中儲存有該第二RMC31使用的一第二韌體331。本實施例中,該第一記憶體23與該第二記憶體33是以唯讀記憶體(Read Only Memory,ROM)來實現,但不加以限定。
【0023】
如圖2所示,該第一切換器22係通過一第一存取通道L1連接該第一記憶體23。當該第一RMC21開機時,係藉由該第一切換器22的連接,通過該第一存取通道L1讀取該第一記憶體23,並經由該第一韌體231的執行以完成開機程序。同樣地,當該第二RMC31開機時,係藉由該第二切換器32的連接,通過該第二存取通道L2讀取該第二記憶體33,並經由該第二韌體331的執行以完成該開機程序。
【0024】
本發明中,該多個機櫃管理模組中的切換器係彼此連接,而體現在圖2的實施例中,即該第一切換器22與該第二切換器32彼此連接。更具體而言,本實施例中,該第一切換器22與該第二切換器32係通過一第三存取通道L3進行連接。
【0025】
本發明的主要技術特徵在於,當該第一RMC21要執行韌體的更新程序時,主要係對該第二記憶體33中的該第二韌體331進行更新,而當該第二RMC31要執行韌體的更新程序時,則會對該第一記憶體23中的該第一韌體231進行更新。藉此,該第一RMC21不會因為對該第一韌體231的更新失敗,導致該第一RMC21無法在重置後正常開機運作。同樣地,該第二RMC31也不會因為對該第二韌體331的更新失敗,導致該第二RMC31無法在重置後正常開機運作。
【0026】
更具體而言,該第一RMC21還通過一第一指令傳輸介面I1連接該第一切換器22;該第二RMC31則通過一第二指令傳輸介面I2連接該第二切換器32。當該第一RMC21要執行該更新程序時,係通過該第一指令傳輸介面I1傳輸一切換指令給該第一切換器22。該第一切換器22依據該切換指令進行切換,以通過該第三存取通道L3連接至該第二切換器32,並且再通過該第二存取通道L2連接該第二記憶體33。如此一來,該第一RMC21可依序通過該第一切換器22、該第三存取通道L3、該第二切換器32及該第二存取通道L2讀取該第二記憶體33,進而對該第二韌體331進行該更新程序。
【0027】
同樣地,當該第二RMC31要執行該更新程序時,係通過該第二指令傳輸介面I2傳輸一切換指令給該第二切換器32。該第二切換器32依據該切換指令進行切換,以通過該第三存取通道L3連接至該第一切換器22,並且再通過該第一存取通道L1連接該第一記憶體23。如此一來,該第二RMC31可依序通過該第二切換器32、該第三存取通道L3、該第一切換器22及該第一存取通道L1讀取該第一記憶體23,進而對該第一韌體231進行該更新程序。
【0028】
值得一提的是,本發明中該多個機櫃管理模組中的RMC也可彼此連接,而體現在圖2的實施例中,即該第一RMC21與該第二RMC31彼此連接。更具體而言,該第一RMC21與該第二RMC31係通過一溝通介面I0進行連接。本實施例中,該溝通介面I0可為通用型輸入輸出(General Purpose I/O,GPIO)介面、通用非同步收發傳輸器(Universal Asynchronous Receiver/Transmitter,UART)介面、內部整合電路(Inter-Integrated Circuit,I2 C) 介面、智慧平台管理匯流排(Intelligent Platform Management Bus,IPMB) 介面、區域網路(Local Area Network,LAN) 介面等,但不加以限定。
【0029】
本發明中,該第一RMC21與該第二RMC31可通過該溝通介面I0對彼此進行心跳偵測(heartbeat detection),並且提供備援運作方案。具體而言,各該RMC21、31在經由該溝通介面I0發現另一RMC的心跳異常時,即可通過該溝通介面I0發出指令以強制另一RMC重置(reset),並使自己成為該機櫃1中的主要RMC (active RMC)。如此一來,當該機櫃1中的其中一RMC運作異常時,能夠由另一RMC進行備援運作,待該運作異常的RMC重置完成後,再恢復原本的運作方式。通過上述技術方案,可有效避免當機櫃中只有單一RMC時, 因為RMC發生錯誤而導致整個機櫃中的多個端點伺服器皆無法正常運作的問題。
【0030】
續請參閱圖3,為本發明的第一具體實施例的韌體更新動作示意圖。圖3係用以說明該第一機櫃管理模組2的運作流程。
【0031】
當該第一RMC21開機時,係經由該第一切換器22與該第一存取通道L1讀取該第一記憶體23中的該第一韌體231,並經由該第一韌體231的執行來完成該開機程序。
【0032】
當該第一RMC21於開機狀態下收到外部傳來的一韌體更新檔F1以及一更新命令時,係先通過該第一指令傳輸介面I1發送一第一切換指令C1至該第一切換器22,該第一切換器22依據該第一切換指令C1切換連接至該第二機櫃管理模組3的該第二切換器32。藉以,該第一RMC21可以經由該第一切換器22、該第三存取通道L3、該第二切換器32及該第二存取通道L2存取該第二記憶體33,並且對該第二韌體331進行更新。
【0033】
待更新完成後,該第一RMC21係進行重置,且令該第一切換器22恢復初始設定值(即,通過該第一存取通道L1連接該第一記憶體23)。藉以,該第一RMC21於重置後,仍然會通過該第一記憶體23中的該第一韌體231來完成該開機程序。換句話說,即使上一次執行的該更新程序失敗了,但因該更新程序主要是對該第二韌體331進行更新,因此不會影響該第一RMC21本次的開機動作。
【0034】
值得一提的是,該第一RMC21中可內建有一第一儲存單元211,用以暫存外部傳送的該韌體更新檔F1。當該第一RMC21要對該第二韌體331進行該更新程序時,主要是將該第一儲存單元211中暫存的該韌體更新檔F1燒錄至該第二記憶體33中,以完成該更新程序。本實施例中,該第一儲存單元211主要可為動態存取記憶體(Random Access Memory,RAM)或快閃記憶體(Flash Memory)等,不加以限定。
【0035】
續請參閱圖4,為本發明的第二具體實施例的韌體更新動作示意圖。圖4係用以說明該第二機櫃管理模組3的運作流程。
【0036】
當該第二RMC31開機時,係經由該第二切換器32與該第二存取通道L2讀取該第二記憶體33中的該第二韌體331,並經由該第二韌體331的執行來完成該開機程序。
【0037】
當該第二RMC31收到該韌體更新檔F1以及該更新命令時,係先通過該第二指令傳輸介面I2發送一第二切換指令C2至該第二切換器32,該第二切換器32依據該第二切換指令C2切換連接至該第一機櫃管理模組2的該第一切換器22。藉以,該第二RMC31可以經由該第二切換器32、該第三存取通道L3、該第一切換器22及該第一存取通道L1存取該第一記憶體23,並且對該第一韌體231進行該更新程序。
【0038】
同樣地,該第二RMC31在該更新程序執行完成會進行重置,且令該第二切換器32恢復初始設定值(即,通過該第二存取通道L2連接該第二記憶體33)。藉以,該第二RMC31於重置後,仍然會通過該第二記憶體33中的該第二韌體331來完成該開機程序。相同地,即使上一次對該第一韌體231所執行的該更新程序失敗,也不會影響該第二RMC31本次的開機動作。
【0039】
相同於前述的該第一儲存單元211,該第二RMC31中可內建有一第二儲存單元311,用以暫存該韌體更新檔F1。當該第二RMC31要對該第一韌體231進行該更新程序時,主要是將該第二儲存單元311中暫存的該韌體更新檔F1燒錄至該第一記憶體23中,以完成該更新程序。本實施例中,該第二儲存單元311主要可為RAM或Flash Memory等,不加以限定。
【0040】
如上所述,該第一RMC21對該第二韌體331更新完成後,仍是通過未更新的該第一韌體231進行開機;而該第二RMC31對該第一韌體231更新完成後,仍是通過未更新的該第二韌體331進行開機。因此,在一較佳實施例中,該機櫃1中的多個機櫃管理模組係會同時接收到外部傳送的該韌體更新檔F1與該更新命令,藉以令該多個機櫃管理模組中的韌體可以依序進行更新,藉以保持韌體版本的一致性。然而,上述僅為本發明的較佳具體實施例,但不應以此為限。
【0041】
參閱圖5,為本發明的第一具體實施例的更新檔取得流程圖。如圖5所示,要對該機櫃1中的多個RMC(下面僅以單一個RMC為例進行說明)的韌體進行更新時,主要係令該機櫃1連接一外部的更新工具(例如可為個人電腦或雲端伺服器等,圖未標示)。該更新工具通過介面發出一控制命令至該機櫃1中的RMC(例如通過一智慧平台管理介面(Intelligent Platform Management Interface,IPMI)發出一IPMI命令),藉以令該RMC進入一更新模式(步驟S10)。
【0042】
接著,該RMC由該更新工具接收該韌體更新檔F1(步驟S12)。該RMC將接收的該韌體更新檔F1暫存於內部的儲存單元中(步驟S14),並檢查該韌體更新檔F1是否正確。若該韌體更新檔F1正確,則該RMC可依據暫存的該韌體更新檔F1來執行該更新程序(步驟S16)。如上所述,前述實施例中的該第一RMC21與該第二RMC31皆可依據上述的步驟S10至步驟S16,以開始執行該更新程序。
【0043】
參閱圖6,為本發明的第一具體實施例的韌體更新流程圖。本發明中的韌體更新流程,主要係運用在內部設置有至少兩組機櫃管理模組的機櫃之中。首先,由該機櫃1中的其中一組機櫃管理模組中的RMC(例如該第一機櫃管理模組2中的該第一RMC21)接收前述的該更新命令(步驟S20),接著,該RMC發出該切換指令至同一個機櫃管理模組中的切換器(例如該第一切換器22),以令該切換器切換連接至另一個機櫃管理模組的記憶體(例如該第二機櫃管理模組3中的該第二記憶體33)(步驟S22)。
【0044】
待該切換器切換完成後,該RMC依據內建的儲存單元中暫存的該韌體更新檔F1,對另一個機櫃管理模組的該記憶體中的韌體進行該更新程序(步驟S24)。於該更新程序執行完成後,該RMC進行重置,並令同一個該機櫃管理模組中的該切換器恢復初始設定值(步驟S26),其中,該切換器的初始設定值係連接至同一個機櫃管理模組中的該記憶體。
【0045】
於步驟S24中執行該更新程序的該RMC重置完成後,係通過同一個機櫃管理模組中的該切換器,連接至同一個機櫃管理模組中的該記憶體,並通過該記憶體中的韌體的執行來完成該開機程序(步驟S28)。最後,該RMC判斷前次執行的該更新程序是否成功(步驟S30)。若更新失敗,則回到步驟S22,並重新對另一個機櫃管理模組中的韌體再次進行更新。反之,若更新成功,則該RMC結束本次的更新程序。
【0046】
通過本發明的更新方法,可避免RMC在更新韌體失敗後,無法在重置後正常開機的問題。
【0047】
參閱圖7,為本發明的第一具體實施例的備援流程圖。本發明中的備援流程,主要係運用在內部設置有至少兩組機櫃管理模組的機櫃之中。首先,該機櫃1中的至少兩組機櫃管理模組中的RMC,係通過該溝通介面I0彼此連接,並通過該溝通介面I0對彼此進行心跳偵測(步驟S40)。
【0048】
於進行心跳偵測的同時,各該RMC分別判斷另一個RMC的心跳是否異常(步驟S42)。若另一個RMC的心跳沒有異常,則重新執行該步驟S40,以保持對另一個RMC的心跳偵測。
【0049】
反之,若發現另一個RMC的心跳異常,則心跳正常的RMC通過該溝通介面I0發出指令,以強制心跳異常的RMC重置,並令自己成為該機櫃1中的主要RMC(步驟S44)。通過此備援運作方案,可以在該機櫃1中的其中一RMC運作異常時,暫時由另一RMC進行備援運作,並且待運作異常的RMC重置完成後,再恢復原本的運作方式。如此一來,可有效避免 因為RMC發生錯誤而導致整個該機櫃1中的多個該端點伺服器4皆無法正常運作的問題。
【0050】
以上所述僅為本發明之較佳具體實例,非因此即侷限本發明之專利範圍,故舉凡運用本發明內容所為之等效變化,均同理皆包含於本發明之範圍內,合予陳明。
2‧‧‧第一機櫃管理控制器模組
21‧‧‧第一機櫃管理控制器
211‧‧‧第一儲存單元
22‧‧‧第一切換器
23‧‧‧第一記憶體
231‧‧‧第一韌體
3‧‧‧第二機櫃管理控制器模組
31‧‧‧第二機櫃管理控制器
311‧‧‧第二儲存單元
32‧‧‧第二切換器
33‧‧‧第二記憶體
331‧‧‧第二韌體
L1‧‧‧第一存取通道
L2‧‧‧第二存取通道
L3‧‧‧第三存取通道
I0‧‧‧溝通介面
I1‧‧‧第一指令傳輸介面
L2‧‧‧第二指令傳輸介面

Claims (10)

  1. 【第1項】
    一種具有多機櫃管理模組的機櫃,包括:
    複數容置槽;
    複數端點伺服器,分別設置於該複數容置槽中;及
    二機櫃管理模組,電性連接該複數端點伺服器,各該機櫃管理模組分別具有一機櫃管理控制器(Rack Management Controller,RMC)、一切換器及一記憶體,其中該RMC通過該切換器連接該記憶體,該記憶體儲存有該RMC開機使用的一韌體;
    其中,當其中一個該機櫃管理制模組接收一韌體更新檔時,該RMC對同一個該機櫃管理模組中的該切換器發出一切換指令,令該切換器切換連接至另一個該機櫃管理模組的該記憶體,並且該RMC依據該韌體更新檔,對另一個該機櫃管理模組的該記憶體中的該韌體進行一更新程序。
  2. 【第2項】
    如請求項1所述的機櫃,其中該二機櫃管理模組包括一第一機櫃管理模組與一第二機櫃管理模組,該第一機櫃管理模組包括一第一RMC、一第一切換器及一第一記憶體,該第一切換器通過一第一存取通道連接該第一記憶體,並且該第一記憶體儲存有該第一RMC使用的一第一韌體;該第二機櫃管理模組包括一第二RMC、一第二切換器及一第二記憶體,該第二切換器通過一第二存取通道連接該第二記憶體,並且該第二記憶體儲存有該第二RMC使用的一第二韌體。
  3. 【第3項】
    如請求項2所述的機櫃,其中該第一切換器與該第二切換器通過一第三存取通道連接,當該第一RMC執行該更新程序時,令該第一切換器切換連接至該第二切換器,藉以依序通過該第一切換器、該第三存取通道、該第二切換器及該第二存取通道存取該第二機櫃管理模組中的該第二記憶體;當該第二RMC執行該更新程序時,令該第二切換器切換連接至該第一切換器,藉以依序通過該第二切換器、該第三存取通道、該第一切換器及該第一存取通道存取該第一機櫃管理模組中的該第一記憶體。
  4. 【第4項】
    如請求項1所述的機櫃,其中各該RMC分別通過一指令傳輸介面連接同一個該機櫃管理模組中的該切換器,並通過該指令傳輸介面傳輸該切換指令,以令同一個該機櫃管理模組中的該切換器切換連接至另一個該機櫃管理模組中的該記憶體。
  5. 【第5項】
    如請求項1所述的機櫃,其中各該RMC分別具有一儲存單元,暫存外部傳送的該韌體更新檔,該RMC執行該更新程序時,係將暫存於該儲存單元中的該韌體更新檔燒錄至另一個該機櫃管理模組的該記憶體中,以完成該更新程序。
  6. 【第6項】
    如請求項1所述的機櫃,其中各該RMC通過一溝通介面互相連接,並通過該溝通介面彼此進行心跳偵測,其中該溝通介面為 通用型輸入輸出(General Purpose I/O,GPIO)介面、通用非同步收發傳輸器(Universal Asynchronous Receiver/Transmitter,UART)介面、內部整合電路(Inter-Integrated Circuit,I2 C) 介面、智慧平台管理匯流排(Intelligent Platform Management Bus,IPMB) 介面或區域網路(Local Area Network,LAN) 介面。
  7. 【第7項】
    一種請求項1所述的機櫃使用的韌體更新方法,包括:
    a)接收該韌體更新檔;
    b)發出該切換指令至同一個該機櫃管理模組中的該切換器,以令該切換器切換連接至另一個該機櫃管理模組中的該記憶體;
    c)依據該韌體更新檔對另一個該機櫃管理模組的該記憶體中的該韌體進行該更新程序;
    d)執行該更新程序的該RMC進行重置,並令同一個該機櫃管理模組中的該切換器恢復初始設定值,其中該初始設定值係連接同一個該機櫃管理模組中的該記憶體;及
    e)該RMC重置完成後,通過同一個該機櫃管理模組的該記憶體中的該韌體執行一開機程序。
  8. 【第8項】
    如請求項7所述的韌體更新方法,其中步驟a包括下列步驟:
    a01)接收該韌體更新檔及一更新命令;
    a02)進入一更新模式;及
    a03)將該韌體更新檔暫存於該RMC的一儲存單元中。
  9. 【第9項】
    如請求項7所述的韌體更新方法,其中更包括下列步驟:
    f)步驟e後,判斷該更新程序是否成功;及
    g)承步驟f,若該更新程序失敗,重新執行該步驟b至該步驟e。
  10. 【第10項】
    如請求項7所述的韌體更新方法,其中更包括下列步驟:
    h)各該RMC通過一溝通介面進行心跳偵測;
    i)判斷另一個RMC是否心跳異常;及
    j)於另一個RMC心跳異常時,由心跳正常的RMC發出指令,強制心跳異常的RMC進行重置,並令心跳正常的RMC成為該機櫃中的主要RMC。
TW104100072A 2015-01-05 2015-01-05 具有多機櫃管理模組的機櫃及其韌體更新方法 TWI576682B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW104100072A TWI576682B (zh) 2015-01-05 2015-01-05 具有多機櫃管理模組的機櫃及其韌體更新方法
FI20155207A FI127566B (en) 2015-01-05 2015-03-24 RACK WITH SEVERAL RACK MANAGEMENT MODULE AND HARDWARE UPDATE METHOD
RU2015116727A RU2602378C9 (ru) 2015-01-05 2015-04-30 Стойка с множеством модулей управления стойкой и способ обновления встроенного программного обеспечения, используемого для стойки

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW104100072A TWI576682B (zh) 2015-01-05 2015-01-05 具有多機櫃管理模組的機櫃及其韌體更新方法

Publications (2)

Publication Number Publication Date
TW201626134A true TW201626134A (zh) 2016-07-16
TWI576682B TWI576682B (zh) 2017-04-01

Family

ID=56590387

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104100072A TWI576682B (zh) 2015-01-05 2015-01-05 具有多機櫃管理模組的機櫃及其韌體更新方法

Country Status (3)

Country Link
FI (1) FI127566B (zh)
RU (1) RU2602378C9 (zh)
TW (1) TWI576682B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI655582B (zh) * 2017-09-12 2019-04-01 神雲科技股份有限公司 具有雙韌體儲存空間之伺服器及其韌體更新方法
TWI726434B (zh) * 2019-10-03 2021-05-01 神雲科技股份有限公司 排除管理引擎運作異常的控制方法
CN113687998A (zh) * 2020-05-19 2021-11-23 佛山市顺德区顺达电脑厂有限公司 排除管理引擎运作异常的控制方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10489136B2 (en) * 2017-04-27 2019-11-26 Quanta Computer Inc. Automatic firmware and custom setting provision for server device
RU2697745C1 (ru) * 2018-04-18 2019-08-19 ЭйАйСи ИНК. Интеллектуальная стойка и применяемый в ней способ управления ip-адресами
RU2710288C1 (ru) * 2019-04-09 2019-12-25 ЭйАйСи ИНК. Способ удаленного сброса ненормального состояния стоек, применяемых в дата-центре
RU2711469C1 (ru) * 2019-04-09 2020-01-17 ЭйАйСи ИНК. Способ удаленного сброса ненормального состояния стоек, применяемых в дата-центре
RU2709677C1 (ru) * 2019-04-09 2019-12-19 ЭйАйСи ИНК. Способ удаленного сброса ненормального состояния стоек, применяемых в дата-центре

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7222339B2 (en) * 2003-06-13 2007-05-22 Intel Corporation Method for distributed update of firmware across a clustered platform infrastructure
US7849454B2 (en) * 2006-01-13 2010-12-07 Dell Products L.P. Automatic firmware corruption recovery and update
TWI326408B (en) * 2006-11-15 2010-06-21 Inventec Corp Method of updating an image file
RU2389058C2 (ru) * 2008-06-07 2010-05-10 Открытое акционерное общество "Т-Платформы" Серверная платформа
US9547575B2 (en) * 2011-08-30 2017-01-17 Amazon Technologies, Inc. Managing host computing devices
TWI462691B (zh) * 2011-12-26 2014-11-21 Inventec Corp 伺服器機櫃及其管理方法
TW201345362A (zh) * 2012-04-26 2013-11-01 Acer Inc 機櫃系統管理裝置及方法
CN103793238A (zh) * 2012-10-31 2014-05-14 英业达科技有限公司 机柜与其同时更新多个基本输入输出系统的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI655582B (zh) * 2017-09-12 2019-04-01 神雲科技股份有限公司 具有雙韌體儲存空間之伺服器及其韌體更新方法
TWI726434B (zh) * 2019-10-03 2021-05-01 神雲科技股份有限公司 排除管理引擎運作異常的控制方法
CN113687998A (zh) * 2020-05-19 2021-11-23 佛山市顺德区顺达电脑厂有限公司 排除管理引擎运作异常的控制方法

Also Published As

Publication number Publication date
FI20155207A (fi) 2016-07-06
RU2602378C9 (ru) 2017-01-31
TWI576682B (zh) 2017-04-01
FI127566B (en) 2018-09-14
RU2602378C1 (ru) 2016-11-20

Similar Documents

Publication Publication Date Title
TWI576682B (zh) 具有多機櫃管理模組的機櫃及其韌體更新方法
US8707290B2 (en) Firmware update in an information handling system employing redundant management modules
JP5564956B2 (ja) 情報処理装置及び情報処理装置のファームウェア更新方法
US10866623B2 (en) Information handling system and method to detect and recover from no power/no post failures
TWI633487B (zh) 自動回復基本輸入輸出系統映像檔的方法及電腦系統
US20160306623A1 (en) Control module of node and firmware updating method for the control module
US10698679B2 (en) Server with double-firmware storage space and firmware update method therefor
US10789141B2 (en) Information processing device and information processing method
US20150331754A1 (en) Boot recovery system
US10609133B2 (en) Method and device for establishing communication connection
US9904561B2 (en) Computer system and method for setting BIOS
US20130117518A1 (en) System controller, information processing system and method of saving and restoring data in the information processing system
US11314665B2 (en) Information processing system, information processing device, BIOS updating method for information processing device, and BIOS updating program for information processing device
EP2648095A2 (en) Control method of computer, computer and computer system
US11010086B2 (en) Data synchronization method and out-of-band management device
US9385920B1 (en) Rack having multiple rack management modules and firmware updating method for the same
TWI547873B (zh) 端點伺服器的控制模組及其韌體更新方法
CN105843336B (zh) 具有多机柜管理模块的机柜及其韧体更新方法
CN109684153B (zh) 具有双韧体储存空间的服务器及其韧体更新方法
US20200314172A1 (en) Server system and management method thereto
CN111158963A (zh) 一种服务器固件冗余启动方法和服务器
US9436536B2 (en) Memory dump method, information processing apparatus, and non-transitory computer-readable storage medium
JP2013125493A (ja) コンピュータシステム、待機電力削減方法、及びプログラム
US9529581B2 (en) Circuit and method for writing program codes of basic input/output system
US9853774B2 (en) System and method for restoring a status of an apparatus controlled by multiple commands

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees