TWI512603B - 電子裝置及其資料回置方法 - Google Patents

電子裝置及其資料回置方法 Download PDF

Info

Publication number
TWI512603B
TWI512603B TW102130228A TW102130228A TWI512603B TW I512603 B TWI512603 B TW I512603B TW 102130228 A TW102130228 A TW 102130228A TW 102130228 A TW102130228 A TW 102130228A TW I512603 B TWI512603 B TW I512603B
Authority
TW
Taiwan
Prior art keywords
management module
chassis management
storage medium
static storage
chassis
Prior art date
Application number
TW102130228A
Other languages
English (en)
Other versions
TW201508622A (zh
Inventor
Chris Hsieh
Aven Liao
Vincent Hm Chao
Naiyu Cheng
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Priority to TW102130228A priority Critical patent/TWI512603B/zh
Priority to US14/465,248 priority patent/US9594641B2/en
Priority to US14/522,848 priority patent/US20150058542A1/en
Publication of TW201508622A publication Critical patent/TW201508622A/zh
Application granted granted Critical
Publication of TWI512603B publication Critical patent/TWI512603B/zh

Links

Classifications

    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/14Mounting supporting structure in casing or on frame or rack
    • H05K7/1485Servers; Data center rooms, e.g. 19-inch computer racks
    • H05K7/1488Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures
    • H05K7/1494Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures having hardware for monitoring blades, e.g. keyboards, displays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3044Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is the mechanical casing of the computing system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/14Mounting supporting structure in casing or on frame or rack
    • H05K7/1485Servers; Data center rooms, e.g. 19-inch computer racks
    • H05K7/1498Resource management, Optimisation arrangements, e.g. configuration, identification, tracking, physical location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/72Details relating to flash memory management
    • G06F2212/7207Details relating to flash memory management management of metadata or control data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Mathematical Physics (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Description

電子裝置及其資料回置方法
本發明大體而言係關於電腦系統的領域,且特別是有關於一種陣列組成的電子裝置。
當前很多型式的電子裝置是以陣列的方式來組成。例如但不限於一刀鋒伺服器系統(blade server system),可包括複數個刀鋒伺服器(blade server),以一個接一個的陣列形式排列而形成。刀鋒伺服器系統一般具有一個完整的機箱(Chassis),以集中及統一的方式,來提供種種電源、運算、通訊、及散熱等功能,係為一種高密度系統。
一般而言,為數眾多的刀鋒伺服器(計算節點)配置於在機箱的前方,藉此提升使用者及管理者的操作便利性。而機箱管理模組(Chassis Management Module,CMM)、風扇、電源等等則配置於在機箱的後方。考慮到可維護性(Serviceability),對刀鋒伺服器、風扇、電源、機箱管理模組而言,一般採用熱插拔(Hot Swap)設計。在此設計中,常使用中間平板(Middle Plane Board,MPB),以利於支援刀鋒伺服器、風扇、電源、機箱管理模組等等的熱插拔功能。
中間平板透過連接器電性連接至各元件,可傳輸電源訊號、控制高速訊號、以及低速訊號等等。中間平板一般具有一非揮發性記憶體,可例如但不限於為一快閃唯讀記憶體(Flash ROM),一電子可抹除可程式化唯讀記憶體(Electrically Erasable Programmable Read Only Memory, EEPROM)等等。非揮發性記憶體內所儲存可為不可擦除碼,可例如但不限於重要產品資料(Vital Product Data,VPD),例如包括關於控制、製造、及零組件的資訊。典型VPD包含如零組件號碼(Part Number)、序號(Serial Number)、產品類型號碼(Product Model Number)、產品版本、維修等級及其它特定的資訊等等。或者,重要產品資料也可包含使用者定義的資訊。在使用者更替機箱管理模組後,中間平板之非揮發性記憶體中的VPD資料可透過系統取得,進而供維修人員或研發人員進行資料分析。
非揮發性記憶體為一主動元件(active component),主動元件係指電子電路中具有增益的電子元件,當獲得能量供給時,可以進行放大、振盪等主動機能。如熟悉相關技藝者所知,電路板所使用的主動元件通常容易損壞,可靠率較低,造成電路板的壽命大幅減少。
如其名稱所示,中間平板位於刀鋒系統的中央部位,從機箱的前方或機箱的後方均不易維修,通常需要移去機箱,拆解刀鋒伺服器系統內組件,才能對中間平板進行維修或抽換。再者,當中間平板損壞時,存在讀取中間平板之非揮發性記憶體內資料的困難及不便。換言之,對於習知中間平板而言,其可維護性並不佳,特別是上述所使用的非揮發性記憶體或其它主動元件,因為中間平板的使用壽命較短,造成技術支援的許多問題。因此如何發展出一種高可維護性及高可靠度的陣列組成的電子裝置,實為一大挑戰。
本發明提供一陣列組成的電子裝置之相關技術,具有高可維護性及高可靠度,對於使用者而言,為一使用者友善的解決方案。
在一個闡釋性實施例中,提供一種電子裝置,該電子裝置可包括:一機箱;一中間電路板,配置於該機箱中,該中間電路板包括一第一側;一伺服器,電耦合於該中間電路板;一機箱管理模組,以可取出及 插入的方式,電耦合於該中間電路板之該第一側,該機箱管理模組儲存該機箱中組件相關之資料;以及一外部靜態儲存媒體,以可取出及插入的方式,電耦合於該機箱管理模組;其中回應於該外部靜態儲存媒體電耦合於該機箱管理模組及該機箱管理模組電耦合於該中間電路板,該機箱中組件相關之該資料的一更動被儲存於該外部靜態儲存媒體中。
該第一側可包括一第一中間電路板插槽,該機箱管理模組以可熱插拔的方式而電耦合於該中間電路板之該第一中間電路板插槽。該一機箱管理模組可包括一機箱管理模組插槽,該外部靜態儲存媒體以可熱插拔的方式而電耦合於該機箱管理模組插槽。
該中間電路板更可包括一第二側,該第一側與該一第二側可相對配置,該伺服器以可取出及插入的方式,電耦合於該中間電路板之該第一側或該第二側。
該第二側可包括一第二中間電路板插槽,該伺服器以可熱插拔的方式電耦合於該中間電路板之該第二中間電路板插槽。
該第一側可包括一第三中間電路板插槽,該伺服器以可熱插拔的方式電耦合於該中間電路板之該第三中間電路板插槽。
該機箱管理模組可包括一控制器及一非揮發性記憶體,該機箱中組件相關之該資料的該更動可藉由該控制器被儲存於該外部靜態儲存媒體中。
該外部靜態儲存媒體可從該機箱管理模組取出並插入一第二機箱管理模組,回應於該第二機箱管理模組電耦合於該中間電路板,藉由該控制器,該外部靜態儲存媒體內的資料被寫入該非揮發性記憶體的相對應部分,進行資料回置的動作。
該伺服器可包括一管理模組,該機箱管理模組可由該伺服器的管理模組擷取該伺服器的工作狀態並依據該工作狀態,對該伺服器進行監控及管理。
在其他闡釋性實施例中,提供一種用於一電子裝置之資料回置方法。該電子裝置包括一機箱,一中間電路板,一電耦合於該中間電路板的伺服器,一以可取出及插入的方式而電耦合於該中間電路板的第一機箱管理模組,一以可取出及插入的方式而電耦合於該第一機箱管理模組的第一外部靜態儲存媒體,該第一機箱管理模組包括一控制器及一非揮發性記憶體。該方法可包括:插入該第一外部靜態儲存媒體至該第一機箱管理模組以進行電耦合;插入該第一機箱管理模組至該中間電路板以進行電耦合;藉由該第一機箱管理模組,檢查該第一外部靜態儲存媒體是否正常操作;以及回應於該第一外部靜態儲存媒體為正常操作,藉由該控制器,該第一外部靜態儲存媒體內的資料被寫入該非揮發性記憶體的相對應部分以進行資料回置。
該資料回置方法更可包含:檢查該第一機箱管理模組是否為正常操作;以及回應於該第一機箱管理模組非為正常操作,從該第一機箱管理模組拔出該第一外部靜態儲存媒體並將該第一外部靜態儲存媒體插入至一正常操作的第二機箱管理模組,該第二機箱管理模組之一控制器將該第一外部靜態儲存媒體內的資料回置到第二機箱管理模組內。
該資料回置方法更可包含:回應於該第一外部靜態儲存媒體非為正常操作,該第一機箱管理模組發出該第一外部靜態儲存媒體為非正常操作的一訊息。
該資料回置方法更可包含:回應於該第一外部靜態儲存媒體為非正常操作的該訊息;從該第一機箱管理模組取出該第一外部靜態儲存媒體;以及將可正常操作的一第二外部靜態儲存媒體插入該第一機箱管理模組。
回應於插入該第一外部靜態儲存媒體至該第一機箱管理模組以進行電耦合及插入該第一機箱管理模組至該中間電路板以進行電耦合,該機箱之一組件相關資料的一更動可被儲存於該第一外部靜態儲存媒 體中。
使用者檢查該第一機箱管理模組是否為正常操作係可藉由該第一機箱管理模組之一指示燈的指示而知。
本說明書中所提及的特色、優點、或類似表達方式並不表示,可以本發明實現的所有特色及優點應在本發明之任何單一的具體實施例內。而是應明白,有關特色及優點的表達方式是指結合具體實施例所述的特定特色、優點、或特性係包含在本發明的至少一具體實施例內。因此,本說明書中對於特色及優點、及類似表達方式的論述與相同具體實施例有關,但亦非必要。
此外,可以任何合適的方式,在一或多個具體實施例中結合本發明所述特色、優點、及特性。相關技術者應明白,在沒有特定具體實施例之一或多個特定特色或優點的情況下,亦可實施本發明。在其他例子中應明白,特定具體實施例中的其他特色及優點可能未在本發明的所有具體實施例中出現。
參考以下說明及隨附申請專利範圍或利用如下文所提之本發明的實施方式,即可更加明瞭本發明的這些特色及優點。
100‧‧‧電子裝置
104‧‧‧伺服器
108‧‧‧電源供應單元
112‧‧‧風扇
116‧‧‧機箱管理模組
120‧‧‧外部靜態儲存媒體
124‧‧‧中間平板
128‧‧‧機箱
132‧‧‧管理模組
204‧‧‧控制器
208‧‧‧非揮發性記憶體
212‧‧‧受保護區域
216‧‧‧可快閃區域
220‧‧‧插槽
300‧‧‧面板
304‧‧‧電源指示燈
308‧‧‧心跳指示燈
312‧‧‧定位指示燈
316‧‧‧檢查指示燈
320‧‧‧乙太網路埠活動指示燈
324‧‧‧乙太網路埠鏈路指示燈
328‧‧‧MINI USB
404、408、412、416、420、424‧‧‧區域
456、460‧‧‧界面
500‧‧‧方法
504、508、512、516、520、524、528、532、536‧‧‧步驟
為了立即瞭解本發明的優點,請參考如附圖所示的特定具體實施例,詳細說明上文簡短敘述的本發明。在瞭解這些圖示僅描繪本發明的典型具體實施例並因此不將其視為限制本發明範疇的情況下,參考附圖以額外的明確性及細節來說明本發明,圖式中:第一圖揭示根據本發明一實施例之一電子裝置的架構方塊圖。
第二圖揭示根據本發明一實施例之一機箱管理模組的配置方塊圖。
第三圖根據本發明一實施例,例示一機箱管理模組的配置。
第四圖根據本發明一實施例,例示外部靜態儲存媒體及非揮發性記憶體間的資料備份及資料回置。
第五圖揭示根據本發明一實施例之一資料回置方法的流程圖。
本說明書中「一具體實施例」或類似表達方式的引用是指結合該具體實施例所述的特定特色、結構、或特性係包括在本發明的至少一具體實施例中。因此,在本說明書中,「在一具體實施例中」及類似表達方式之用語的出現未必指相同的具體實施例。
熟此技藝者當知,本發明可實施為電腦裝置、方法或作為電腦程式產品之電腦可讀媒體。因此,本發明可以實施為各種形式,例如完全的硬體實施例、完全的軟體實施例(包含韌體、常駐軟體、微程式碼等),或者亦可實施為軟體與硬體的實施形式,在以下會被稱為「電路」、「模組」或「系統」。此外,本發明亦可以任何有形的媒體形式實施為電腦程式產品,其具有電腦可使用程式碼儲存於其上。
一個或更多個電腦可使用或可讀取媒體的組合都可以利用。舉例來說,電腦可使用或可讀取媒體可以是(但並不限於)電子的、磁的、光學的、電磁的、紅外線的或半導體的系統、裝置、設備或傳播媒體。更具體的電腦可讀取媒體實施例可以包括下列所示(非限定的例示):由一個或多個連接線所組成的電氣連接、可攜式的電腦磁片、硬碟機、隨機存取記憶體(RAM)、唯讀記憶體(ROM)、可抹除程式化唯讀記憶體(EPROM或快閃記憶體)、光纖、可攜式光碟片(CD-ROM)、光學儲存裝置、傳輸媒體(例如網際網路(Internet)或內部網路(intranet)之基礎連接)、或磁儲存裝置。需注意的是,電腦可使用或可讀取媒體更可以為紙張或任何可用於將程式列印於 其上而使得該程式可以再度被電子化之適當媒體,例如藉由光學掃描該紙張或其他媒體,然後再編譯、解譯或其他合適的必要處理方式,然後可再度被儲存於電腦記憶體中。在本文中,電腦可使用或可讀取媒體可以是任何用於保持、儲存、傳送、傳播或傳輸程式碼的媒體,以供與其相連接的指令執行系統、裝置或設備來處理。電腦可使用媒體可包括其中儲存有電腦可使用程式碼的傳播資料訊號,不論是以基頻(baseband)或是部分載波的型態。電腦可使用程式碼之傳輸可以使用任何適體的媒體,包括(但並不限於)無線、有線、光纖纜線、射頻(RF)等。
用於執行本發明操作的電腦程式碼可以使用一種或多種程式語言的組合來撰寫,包括物件導向程式語言(例如Java、Smalltalk、C++或其他類似者)以及傳統程序程式語言(例如C程式語言或其他類似的程式語言)。程式碼可以獨立軟體套件的形式完整的於使用者的電腦上執行或部分於使用者的電腦上執行,部分於使用者電腦而部分於遠端電腦,或完整的於遠端電腦。
於以下本發明的相關敘述會參照依據本發明具體實施例之電腦裝置、方法及電腦程式產品之流程圖及/或方塊圖來進行說明。當可理解每一個流程圖及/或方塊圖中的每一個方塊,以及流程圖及/或方塊圖中方塊的任何組合,可以使用電腦程式指令來實施。這些電腦程式指令可供通用型電腦或特殊電腦的處理器或其他可程式化資料處理裝置所組成的機器來執行,而指令經由電腦或其他可程式化資料處理裝置處理以便實施流程圖及/或方塊圖中所說明之功能或操作。
這些電腦程式指令亦可被儲存在電腦可讀取媒體上,以便指示電腦或其他可程式化資料處理裝置來進行特定的功能,而這些儲存在電腦可讀取媒體上的指令構成一製成品,其內包括之指令可實施流程圖及/或方塊圖中所說明之功能或操作。
電腦程式指令亦可被載入到電腦上或其他可程式化資料處 理裝置,以便於電腦或其他可程式化裝置上進行一系統操作步驟,而於該電腦或其他可程式化裝置上執行該指令時產生電腦實施程序以達成流程圖及/或方塊圖中所說明之功能或操作。
下文以第一圖開始參照附圖,說明根據本發明一實施例之電子裝置100的硬體架構方塊圖。電子裝置100包含複數伺服器104、電源供應單元(Power Supply Unit)108、風扇112、機箱管理模組116、外部靜態儲存媒體(External Static Memory Device)120、中間平板124、及機箱128。
電子裝置100並未限制為某一種特別的形式,而且複數伺服器104亦可是不同種類的裝置。在本發明一較佳實施例中,電子裝置100可例如但不限於刀鋒伺服器系統;且每個伺服器104可例如但不限於刀鋒伺服器,電耦合至中間平板124。伺服器104之數目亦可視實際應用而定。伺服器104可依不同之資料型態與處理方式,與機箱管理模組116進行資料傳輸及處理。
各伺服器104電耦合至中間平板124,中間平板124一般為一電路板,其兩側配置連接器,各組件可以熱插拔的方式電耦合至中間平板124。根據本發明一實施例,刀鋒伺服器104及其它組件透過具有高密度接腳設計之連接器電耦合至中間平板124。上述接腳可用以傳輸通用序列匯流排(Universal Serial Bus,USB)訊號、高速訊號、低速訊號、以及電源訊號等等。各伺服器104可配置於電子裝置100之中間平板124的前方。考慮到可維護性,每個伺服器104可以支持熱插拔功能。
根據本發明一實施例,伺服器104可包含一管理模組132,例如但不限於智慧管理模組(Integrated Management Module,IMM)或一基板管理控制器(BMC)。管理模組132藉由個別的界面來管理伺服器104,例如但不限於電源管理、系統狀態偵測、事件過濾、電源管理、事件發生記錄、及系統回復控制等等。
於本發明之一實施例中,管理模組132包含微處理器與記憶 體(未示於圖中),例如為整合在伺服器104上主機板(未示於圖中)的基板管理控制器,可參考Maxim公司的VSC452基板管理控制器或是ServerEngines公司的SE-SM4210-P01基板管理控制器,而進一步修改或延伸。基板管理控制器可根據其對應的伺服器104上設置的感測器,獲取包含如溫度參數、電壓參數、功率消耗參數或其排列組合的工作狀態,以掌控伺服器104即時的運作資訊及系統狀況。
經由中間平板124,機箱管理模組116可由各伺服器104的基板管理控制器132擷取各伺服器104的工作狀態。換言之,機箱管理模組116可與伺服器104的基板管理控制器132溝通並由基板管理控制器132獲得工作狀態。機箱管理模組116接收各伺服器104之工作狀態後,可進一步依據該工作狀態,對各伺服器104可進行監控及管理。
以類似的方式,機箱管理模組116的控管同樣可適用於電子裝置100的其他組件。舉例而言,機箱管理模組116可以根據工作狀態對風扇112進行控制及管理。於本發明之一實施例中,機箱管理模組116藉由通訊埠(未示於圖中)與風扇112之基板管理控制器(未示於圖中)溝通並控制其轉速。基板管理控制器擷取風扇112之即時運行轉速,並回報給機箱管理模組116,使機箱管理模組116獲取如伺服器104內部溫度或其他位置溫度之工作狀態後,基於風扇112之轉速進行即時的調整。
於本發明之另一實施例中,管理模組132可例如一智慧管理模組。智慧管理模組基本上組成類似於基板管理控制器,可包括一伺服器104之智慧管理模組韌體(IMM firmware,未示於圖中),但係用以取代基板管理控制器,其將服務處理器功能,超級I/O,視頻控制器和遠端能力整合至資訊伺服器104之主機版上晶片(未示於圖中)。另一方面,智慧管理模組韌體為執行上述功能的指令和常式。在本發明一實施例中,管理模組132可參考如IBMTM 產品中使用的iMM控制器。於本發明之另一實施例中,依據實際的需要,管理模組132可更包括一遠端控制程式(未示於圖中)、以及一智 慧平台管理介面(Intelligent Platform Management Interface,IPMI,未示於圖中)公用程式等等。於本發明之另一實施例中,刀鋒伺服器系統100更可包括用以傳輸伺服器104處理後資料之光纖模組(未示於圖中)、用以進行RJ45網路訊號傳輸之開關伺服器(未示於圖中)、顯示刀鋒伺服器系統100內各組件狀況之顯示器(未示於圖中)。上述各組件,單獨觀之均為此領域中的習知技藝,應為熟此技藝領域者所習知,在此不再贅述。同時電子裝置100之組件的相關動作及細節在後面段落有詳細的解說。
電源108、風扇112、機箱管理模組116、或是某些伺服器104等等可配置於電子裝置100之中間平板124的後方。考慮到可維護性,上述各組件(電源108、風扇112、機箱管理模組116、或是某些伺服器電等等)耦合於中間平板124且每個組件可以支持熱插拔功能。
外部靜態儲存媒體120可例如但不限於一通用序列匯流排隨身碟(USB key),可以在其上存儲複數筆資料。通用序列匯流排隨身碟120係以可取出及插入的方式,電耦合至機箱管理模組116並進行通訊,該通訊可透過機箱管理模組116之外部埠而進行。機箱管理模組116之非揮發性記憶體208所儲存的資料及/或更動可藉以備份於外部靜態儲存媒體120。外部靜態儲存媒體120所儲存的資料亦可藉以回置(Roll Back)於機箱管理模組116之非揮發性記憶體208。上述資料備份及資料回置的相關細節及動作在後面段落有詳細的解說。除了序列匯流排隨身碟,外部靜態儲存媒體120更可包括為具有支援機箱管理模組116之介面之儲存媒體,像是SD記憶卡(Secure Digital Memory Card)、支援服務供給介面(Service Provider Interface,SPI)或其他儲存裝置介面之裝置等等。
現參看第二圖,其中描述機箱管理模組116的配置方塊圖。機箱管理模組116也可稱為機箱支援裝置,可使用以配置和管理機箱128中所安裝的組件。機箱管理模組116至少具有一控制器204及一非揮發性記憶體208。非揮發性記憶體208可例如但不限於一電子可抹除可程式化唯讀記 憶體、一快閃記憶體等等。再者,非揮發性記憶體208包括受保護區域212及可快閃區域216。受保護區域212內所儲存的為不可擦除碼,可例如但不限於重要產品資料,諸如關於製造及零組件的不可更改資訊,而可快閃區域216內所儲存為使用者設定(User Setting)及藉由控制器204所接收的事件紀錄(Event Log)、機箱組態(Chassis Configuration)、系統控制設定(System Control Setting)、風扇/電源供應單元失效資訊(Fan/PSU Fail Information)等等。同時機箱管理模組116之各組件的相關細節及動作在後面段落有詳細的解說。
第三圖為根據本發明之另一實施例,揭露機箱管理模組116的配置示意圖。如前述,機箱管理模組116可以處理大量的資料以對機箱128中的組件進行配置和管理。機箱管理模組116具有一面板300,面板300上配置各種指示燈及埠,例如但不限於一電源指示燈(Power LED)304、一心跳指示燈(Heartbeat LED)308、一定位指示燈(locator LED)312、一檢查指示燈(CHK LED)316、一乙太網路埠活動指示燈(Ethernet port activity LED)320、一乙太網路埠鏈路指示燈(Ethernet port link LED)324、及一MINI USB 328。上述各指示燈用於指示各種預定義狀態,應為熟此技藝領域者所習知,在此不再贅述。
機箱管理模組116上更包括至少一個插槽220,可例如但不限於一USB插槽,外部靜態儲存媒體120以可熱插拔的方式連接至機箱管理模組116。舉例來說,外部靜態儲存媒體120具有一USB插頭(未示於圖中),可與機箱管理模組116之USB插槽220連接,因此外部靜態儲存媒體120係以可熱插拔的方式電耦合至機箱管理模組116,亦可以熱插拔的方式將外部靜態儲存媒體120從機箱管理模組116移去。
第四圖例示外部靜態儲存媒體120及非揮發性記憶體208(包括受保護區域212及可快閃區域216)間的資料備份及資料回置的相關技術。於本發明之另一實施例中,非揮發性記憶體208為一32Kbytes的EEPROM, 具有多個資料區域。區域404可例如儲存機箱管理模組(CMM)現場可更換單元(FRU)相關資料(例如料號等等),區域408可例如儲存了系統(SYS)現場可更換單元(FRU)相關資料(例如料號等等),區域404及區域408係屬於受保護區域212。區域412可例如儲存電源預算(Power Budget)相關資料,區域416可例如相關於系統事件紀錄(System Event Log,SEL)檔案中儲存事件紀錄,區域420可例如為保留(Reserve)區域,424區域可例如為冗餘(Redundancy)保留區域,區域412、區域416、區域420、及區域424係屬於可快閃區域216。區域420及區域424均可依實際需求儲存各種使用者設定及各種事件紀錄。於本發明之一實施例中,外部靜態儲存媒體120與控制器204的界面456可例如使用USB 1.1,控制器204與非揮發性記憶體208的界面460可例如使用內部積體電路(Inter Integrated Circuit,I2C)匯流排。
外部靜態儲存媒體120內儲存複數筆資料(資料1、資料2、資料3...資料n),當非揮發性記憶體(EEPROM)208內的資料有更改時,例如使用者設定的改變或事件紀錄的產生,可以將更改或更新的資料,藉由控制器204的動作,備份至外部靜態儲存媒體120內的複數筆資料中。
有多種方法可將非揮發性記憶體208內的資料備份至外部靜態儲存媒體120,於本發明之實施例中,可例如但不限於即時備份(Immediate backup),此種方式在每次有異動都會以最快的速度備份起來;或是定期備份(Routine backup),此種方式以定期的方式,藉由使用者對預設網頁進行設定,可以決定備份資料的種類及數量;或是一般的手動備份(Manual backup)。於本發明之定期備份的實施例中,因為其係週期性地執行備份,如果用完了所有可用記錄空間,備份的動作將回到記錄空間的頂部,繼續進行備份。然而上述各種備份為此領域中的習知技藝,在此不再贅述。
另一方面,在外部靜態儲存媒體120插入機箱管理模組116,且在機箱管理模組116插入中間平板124後,可根據外部靜態儲存媒體120所儲存的資料,對於非揮發性記憶體208進行資料回置的動作。於本發明之一 實施例中,藉由控制器204的動作,外部靜態儲存媒體120內的複數筆資料可以寫入非揮發性記憶體208的相對應部分,以達成資料回置的目的。
如果上述資料備份的動作未完成,外部靜態儲存媒體120內儲存的資料不完整,控制器204將會使用外部靜態儲存媒體120之上一版本的儲存資料以進行資料回置並在系統事件紀錄(System Event Log,SEL)檔案中儲存事件紀錄。
值得注意的是,在電子裝置100出廠時,其相關的外部靜態儲存媒體120僅在受保護區域212上儲存出廠資料。於本發明之一實施例中,僅在區域404儲存機箱管理模組現場可更換單元相關出廠資料,及在區域408儲存系統現場可更換單元相關出廠資料(區域404及區域408係屬於受保護區域212)。第四圖中區域412、區域416、區域420、及區域424未儲存任何資料。然在使用電子裝置100一段時間後,各種使用者設定及各種事件紀錄會依據實際狀況紀錄於可快閃區域216內。而藉由上述之資料備份方法(即時備份、定期備份、手動備份等等),各種使用者設定及各種事件紀錄的更新資料則會備份到外部靜態儲存媒體120中。後續因為種種原因(例如原機箱管理模組116損壞)而要更換新的機箱管理模組116時,使用者僅須要從舊的機箱管理模組116中拔出外部靜態儲存媒體120並將外部靜態儲存媒體120插入另一新的機箱管理模組116,機箱管理模組116之控制器204自動將外部靜態儲存媒體120內的資料回置到新的機箱管理模組116內。
以下配合第一圖至第四圖所示之架構及第五圖所示之流程圖說明一本發明實施例之用於電子裝置100之資料回置方法。第五圖係在本發明一較佳實施例中,關於電子裝置100的資料回置方法500。方法500的步驟可包括:
步驟504:使外部靜態儲存媒體120電耦合(可例如以熱插拔的方式)至機箱管理模組116,且使機箱管理模組116電耦合(可例如以熱插拔的方式)至中間平板124。此時機箱管理模組116取得外部靜態儲存媒體120 內的資料,可藉以得知系統環境及使用者設定。於本發明之另一實施例中,機箱管理模組116首先讀取保護區域212內一段碼,如果順利讀取,表示合乎安全機制,機箱管理模組116可進一步取得外部靜態儲存媒體120內所有的資料。
步驟508:機箱管理模組116檢查外部靜態儲存媒體120是否為正常操作,例如但不限於檢查外部靜態儲存媒體120之初始狀態是否為健康狀態,或是外部靜態儲存媒體120是否存在。如果非正常操作,則前進至步驟512,如果正常操作,則前進至步驟520。
步驟512:機箱管理模組116將外部靜態儲存媒體120為非正常操作的訊息通知使用者。於本發明之一實施例中,如果機箱管理模組116無法寫入/讀取外部靜態儲存媒體120或是機箱管理模組116無法偵測到外部靜態儲存媒體120的存在,則點亮相機箱管理模組116之面板上之檢查指示燈(CHK LED)316(顏色可例如為黃色),來顯示外部靜態儲存媒體120為故障或無法正常操作的訊息,同時將此故障或無法正常操作之事件紀錄寫入非揮發性記憶體208之可快閃區域216中。
步驟516:使用者替換故障的外部靜態儲存媒體120,並前進至步驟504,重覆步驟504及後續的動作。
步驟520:基於外部靜態儲存媒體120的正常操作,外部靜態儲存媒體120內的資料自動回置至機箱管理模組116之非揮發性記憶體208。
步驟524:電子裝置100進行系統正常運作。
步驟528:使用者檢查機箱管理模組116是否為正常操作,如果非正常操作,則前進至步驟532,如果正常操作,則前進至步驟524。於本發明之一實施例中,心跳指示燈(Heartbeat LED)308(顏色可例如為綠色)停止閃爍,即指示機箱管理模組116為非正常操作。於本發明之另一實施例中,機箱管理模組116有一網路孔(未示於圖中),當遠端鏈結(link)沒有回應時,視為機箱管理模組116為非正常操作(例如但不限於故障或設定有誤)。
步驟532:當機箱管理模組116為非正常操作時,使用者從中間平板124拔出機箱管理模組116。
步驟536:使用者從機箱管理模組116拔出外部靜態儲存媒體120並將外部靜態儲存媒體120插入另一新的機箱管理模組116,機箱管理模組116之控制器204自動將外部靜態儲存媒體120內的資料回置到新的機箱管理模組116內。然後前進至步驟504,重覆步驟504及後續的動作。
在後續的步驟中,可例如典型的系統動作,進入待機狀態。電子裝置100的其他基本架構與組件可參見一般的個人電腦或伺服器,例如IBM公司的Blade Center或其他類似裝置,與本發明無關的細節將省略不予描述。
根據本發明,中間平板124不具主動元件,係為一個純粹的被動元件電路板,有更好的可靠性和更長的使用壽命。因為中間平板124的使用壽命大幅增加,更換中間平板124及尋求維修人員的支援的場合因而減少。
另一方面,根據本發明所揭之資料備份及資料回置技術,使用者可依實際的需求,選擇不同的資料備份方法,將重要產品資料、各種使用者設定、各種事件紀錄等等資料備份到外部靜態儲存媒體120中。使用者可以確定外部靜態儲存媒體120中所儲存的資料為最即時且最新(Up-to-date)的資料。是以將此外部靜態儲存媒體120插入任何其他機箱管理模組116中,藉由本發明之資料回置,即時且最新的資料會回置至該其他機箱管理模組116之非揮發性記憶體208中。
再者,外部靜態儲存媒體120具有易於攜帶的優勢,更可以在任何一台計算機上經由適當的軟體以讀取其中的資料。對於機箱層面的資料,易於進行備份及轉移。同時在更換機箱管理模組時,舊的機箱管理模組中的資料可以方便地恢復/回置到新的機箱管理模組,並不須要額外的設定步驟。
在不脫離本發明精神或必要特性的情況下,可以其他特定形式來體現本發明。應將所述具體實施例各方面僅視為解說性而非限制性。因此,本發明的範疇如隨附申請專利範圍所示而非如前述說明所示。所有落在申請專利範圍之等效意義及範圍內的變更應視為落在申請專利範圍的範疇內。
100‧‧‧電子裝置
104‧‧‧伺服器
108‧‧‧電源供應單元
112‧‧‧風扇
116‧‧‧機箱管理模組
120‧‧‧外部靜態儲存媒體
124‧‧‧中間平板
128‧‧‧機箱
132‧‧‧管理模組

Claims (17)

  1. 一種電子裝置,包括:一機箱;一中間電路板,配置於該機箱中,該中間電路板包括一第一側;一伺服器,電耦合於該中間電路板;一機箱管理模組,以可取出及插入的方式,電耦合於該中間電路板之該第一側,該機箱管理模組儲存該機箱中組件相關之資料;以及一外部靜態儲存媒體,以可取出及插入的方式,電耦合於該機箱管理模組;其中回應於該外部靜態儲存媒體電耦合於該機箱管理模組及該機箱管理模組電耦合於該中間電路板,該機箱中組件相關之該資料的一更動被儲存於該外部靜態儲存媒體中。
  2. 如請求項第1項所述之電子裝置,其中該第一側包括一第一中間電路板插槽,該機箱管理模組以可熱插拔的方式而電耦合於該中間電路板之該第一中間電路板插槽;其中該機箱管理模組包括一機箱管理模組插槽,該外部靜態儲存媒體以可熱插拔的方式而電耦合於該機箱管理模組插槽。
  3. 如請求項第1項所述之電子裝置,其中該中間電路板更包括一第二側,該第一側與該一第二側相對配置,該伺服器以可取出及插入的方式,電耦合於該中間電路板之該第一側或該第二側。
  4. 如請求項第3項所述之電子裝置,其中該第二側包括一第二中間電路板插槽,該伺服器以可熱插拔的方式電耦合於該中間電路板之該第二中間電路板插槽。
  5. 如請求項第3項所述之電子裝置,其中該第一側包括一第三中間電路板插槽,該伺服器以可熱插拔的方式電耦合於該中間電路板之該第三中間電路板插槽。
  6. 如請求項第1項所述之電子裝置,其中該機箱管理模組包括一控制器及一非揮發性記憶體,該機箱中組件相關之該資料的該更動藉由該控制器被儲存於該外部靜態儲存媒體中。
  7. 如請求項第6項所述之電子裝置,其中該外部靜態儲存媒體可從該機箱管理模組取出並插入一第二機箱管理模組,回應於該第二機箱管理模組電耦合於該中間電路板,藉由該控制器,該外部靜態儲存媒體內的資料被寫入該非揮發性記憶體的相對應部分,進行資料回置的動作。
  8. 如請求項第6項所述之電子裝置,其中該伺服器包括一管理模組,該機箱管理模組由該伺服器的管理模組擷取該伺服器的工作狀態並依據該工作狀態,對該伺服器進行監控及管理。
  9. 如請求項第8項所述之電子裝置,其中該管理模組包括一基板管理控制器(BMC)或一智慧管理模組(IMM)。
  10. 如請求項第1項所述之電子裝置,其中該非揮發性記憶體包括一儲存不可擦除碼之受保護區域,儲存重要產品資料,及一可快閃區域,儲存使用者設定及事件紀錄。
  11. 如請求項第1項所述之電子裝置,其中該電子裝置包括一刀鋒伺服器系統;該伺服器包括一刀鋒伺服器。
  12. 一種用於一電子裝置之資料回置方法,該電子裝置包括一機箱,一中間電路板,一電耦合於該中間電路板的伺服器,一以可取出及插入的方式而電耦合於該中間電路板的第一機箱管理模組,一以可取出及插入的方式而電耦合於該第一機箱管理模組的第一外部靜態儲存媒體,該第一機箱管理模組包括一控制器及一非揮發性記憶體,該方法包括:插入該第一外部靜態儲存媒體至該第一機箱管理模組以進行電耦合;插入該第一機箱管理模組至該中間電路板以進行電耦合;藉由該第一機箱管理模組,檢查該第一外部靜態儲存媒體是否正常操作;以及回應於該第一外部靜態儲存媒體為正常操作,藉由該控制器,該第一外部靜態儲存媒體內的資料被寫入該非揮發性記憶體的相對應部分以進行資料回置。
  13. 如請求項第12項所述之方法,更包含:檢查該第一機箱管理模組是否為正常操作;以及回應於該第一機箱管理模組非為正常操作,從該第一機箱管理模組拔出該第一外部靜態儲存媒體並將該第一外部靜態儲存媒體插入至一正常操作的第二機箱管理模組,該第二機箱管理模組之一控制器將該第一外部靜態儲存媒體內的資料回置到第二機箱管理模組內。
  14. 請求項第13項所述之方法,其中一使用者檢查該第一機箱管理模組是否為正常操作係藉由該第一機箱管理模組之一指示燈的指示而知。
  15. 如請求項第12項所述之方法,更包含:回應於該第一外部靜態儲存媒體非為正常操作,該第一機箱管理模組 發出該第一外部靜態儲存媒體為非正常操作的一訊息。
  16. 如請求項第12項所述之方法,更包含:回應於該第一外部靜態儲存媒體為非正常操作的該訊息;從該第一機箱管理模組取出該第一外部靜態儲存媒體;以及將可正常操作的一第二外部靜態儲存媒體插入該第一機箱管理模組。
  17. 如請求項第12項所述之方法,其中回應於插入該第一外部靜態儲存媒體至該第一機箱管理模組以進行電耦合及插入該第一機箱管理模組至該中間電路板以進行電耦合,該機箱之一組件相關資料的一更動被儲存於該第一外部靜態儲存媒體中。
TW102130228A 2013-08-23 2013-08-23 電子裝置及其資料回置方法 TWI512603B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW102130228A TWI512603B (zh) 2013-08-23 2013-08-23 電子裝置及其資料回置方法
US14/465,248 US9594641B2 (en) 2013-08-23 2014-08-21 Techniques for updating memory of a chassis management module
US14/522,848 US20150058542A1 (en) 2013-08-23 2014-10-24 Updating techniques for memory of a chassis management module

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW102130228A TWI512603B (zh) 2013-08-23 2013-08-23 電子裝置及其資料回置方法

Publications (2)

Publication Number Publication Date
TW201508622A TW201508622A (zh) 2015-03-01
TWI512603B true TWI512603B (zh) 2015-12-11

Family

ID=52481438

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102130228A TWI512603B (zh) 2013-08-23 2013-08-23 電子裝置及其資料回置方法

Country Status (2)

Country Link
US (2) US9594641B2 (zh)
TW (1) TWI512603B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102014112943B4 (de) * 2014-09-09 2018-03-08 Fujitsu Ltd. Modulares Computersystem und Servermodul
US10157115B2 (en) * 2015-09-23 2018-12-18 Cloud Network Technology Singapore Pte. Ltd. Detection system and method for baseboard management controller
US10319211B2 (en) 2015-11-11 2019-06-11 Hewlett Packard Enterprise Development Lp Visible indication of a port as configured to management functionality
US10216682B2 (en) * 2016-06-15 2019-02-26 Epro Gmbh Configuration distribution
EP3367206B1 (en) 2016-12-30 2019-09-25 Huawei Technologies Co., Ltd. Server management method and server
US10582636B2 (en) * 2017-08-07 2020-03-03 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Server having a dual-mode serial bus port enabling selective access to a baseboard management controller
JPWO2020003379A1 (ja) * 2018-06-26 2020-07-27 日立ジョンソンコントロールズ空調株式会社 保守システム、保守用基板およびデータ書込方法
CN109116963B (zh) * 2018-07-26 2022-02-08 英业达科技有限公司 周期性事件记录方法
TWI689811B (zh) * 2018-08-01 2020-04-01 英業達股份有限公司 週期性事件紀錄方法
US11533821B2 (en) * 2019-11-15 2022-12-20 Dell Products, L.P. Pallet interface for data center and rack information handling systems
US11782810B2 (en) * 2019-11-22 2023-10-10 Dell Products, L.P. Systems and methods for automated field replacement component configuration
US11910558B2 (en) * 2021-04-13 2024-02-20 Dell Products L.P. Chassis management controller monitored overcurrent protection for modular information handling systems

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200825760A (en) * 2006-12-07 2008-06-16 Inventec Corp System management protection device for server
TW200949546A (en) * 2008-05-21 2009-12-01 Ibm Device for controlling status light of a blade server system
US20130094348A1 (en) * 2011-07-07 2013-04-18 International Business Machines Corporation Switch fabric management

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6820180B2 (en) * 2002-04-04 2004-11-16 International Business Machines Corporation Apparatus and method of cascading backup logical volume mirrors
JP4725719B2 (ja) 2005-03-28 2011-07-13 日本電気株式会社 ブレードサーバシステムおよびその管理方法
TW200638753A (en) 2005-04-19 2006-11-01 Asustek Comp Inc Display system and method for controlling rotation angle therefore
JP5052193B2 (ja) 2007-04-17 2012-10-17 株式会社日立製作所 記憶制御装置および記憶制御方法
US20090177808A1 (en) * 2008-01-03 2009-07-09 Samsung Electronics Co. Ltd. Apparatus and methods supporting device triggered disengagement of a hot-swappable serial device by a host system
TW201024958A (en) 2008-12-26 2010-07-01 Acer Inc Electronic device with a display and method for adjusting an angle of elevation of the display
CN103279260A (zh) 2013-04-10 2013-09-04 苏州三星电子电脑有限公司 方向自适应显示系统及其调整方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200825760A (en) * 2006-12-07 2008-06-16 Inventec Corp System management protection device for server
TW200949546A (en) * 2008-05-21 2009-12-01 Ibm Device for controlling status light of a blade server system
US20130094348A1 (en) * 2011-07-07 2013-04-18 International Business Machines Corporation Switch fabric management

Also Published As

Publication number Publication date
US20150058538A1 (en) 2015-02-26
TW201508622A (zh) 2015-03-01
US9594641B2 (en) 2017-03-14
US20150058542A1 (en) 2015-02-26

Similar Documents

Publication Publication Date Title
TWI512603B (zh) 電子裝置及其資料回置方法
US9372769B2 (en) Server and inspecting method thereof
US9804937B2 (en) Backup backplane management control in a server rack system
CN104899055A (zh) 一种基于bios控制的me更新系统及其更新方法
CN111324192A (zh) 一种系统板卡电源检测方法、装置、设备及存储介质
TWI512490B (zh) 擷取控制台訊息的系統及其方法及非暫態電腦可讀媒體
US20150365781A1 (en) Server systems
CN102331959A (zh) 伺服器系统
TWI791913B (zh) 經由邊帶介面恢復場域可程式閘陣列韌體之系統及方法
US20220019561A1 (en) Event-based generation of context-aware telemetry reports
CN111858178B (zh) 一种电源启动类型的判断方法、装置、设备及可读介质
JP2007018034A (ja) 制御装置及び制御方法
TWI611290B (zh) 伺服器機櫃監控方法
US20170364368A1 (en) Setting method of accessing system parameters and server using the same
US6954358B2 (en) Computer assembly
TWI687790B (zh) 可偵測熱插拔次數之電子系統
US11659695B2 (en) Telemetry system supporting identification of data center zones
JP5223688B2 (ja) 無停電電源装置の管理装置および管理方法
CN210109722U (zh) 一种高密度塔式12盘位nas存储服务器
CN110457252B (zh) 一种usb接口飞行参数远程传输方法及传输系统
TWI494754B (zh) 伺服器監控裝置和其操作方法
TW201333664A (zh) 環境資料紀錄技術
US20240027277A1 (en) Systems and methods for effective reading of multiple temperature sensors on memory modules
CN114356824B (zh) vpx刀片节点、状态监测方法、装置及存储介质
US20240070092A1 (en) Input/output expansion emulation with a programmable device