TW201525863A - 伺服器與伺服器檢測方法 - Google Patents

伺服器與伺服器檢測方法 Download PDF

Info

Publication number
TW201525863A
TW201525863A TW102146583A TW102146583A TW201525863A TW 201525863 A TW201525863 A TW 201525863A TW 102146583 A TW102146583 A TW 102146583A TW 102146583 A TW102146583 A TW 102146583A TW 201525863 A TW201525863 A TW 201525863A
Authority
TW
Taiwan
Prior art keywords
hardware configuration
configuration message
server
stored
output system
Prior art date
Application number
TW102146583A
Other languages
English (en)
Inventor
Wei Huang
zhong-ying Qu
Lai Kong
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to TW102146583A priority Critical patent/TW201525863A/zh
Publication of TW201525863A publication Critical patent/TW201525863A/zh

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本發明提供一種伺服器檢測方法。伺服器開機。該伺服器的一基本輸入輸出系統開始運作並執行開機自我檢測,以產生一目前硬體配置訊息。該基本輸入輸出系統透過該伺服器的一基板管理控制器自該伺服器的一現場可更換部件取得一預存硬體配置訊息,該現場可更換部件耦接該基板管理控制器。該基本輸入輸出系統判斷該目前硬體配置訊息與該預存硬體配置訊息是否相符。

Description

伺服器與伺服器檢測方法
本發明係關於伺服技術,特別係關於一種伺服器及其開機檢測方法。
伺服器開機時,其基本輸入輸出系統(basic input/output system,簡稱BIOS)會執行開機自我檢測(power-on self-test簡稱POST),旨在初始化主機板上各項元件,為作業系統提供起碼的運作環境。一般而言,基本輸入輸出系統會停用(disable)無法正常初始化的元件,並將開機自我檢測的部分結果以SMBIOS(System Management BIOS)格式記錄。進入作業系統後,管理者如欲查看主機板資訊,在本地端需執行能解析(parse)SMBIOS的公用程式(utility),在遠端則尚需先行登入,實務上相當不便且沒效率。再者,SMBIOS並不包含為伺服器所接硬碟(hard disk drive,簡稱HDD)或快捷週邊元件互連(Peripheral Component Interconnect Express,簡稱PCIe)擴展卡(expansion card或adapter)等等所設的資料結構,管理者利用作業系統下其他應用軟體方能識別這些硬體。
鑒於上述問題,本發明旨在提供一種伺服器及其檢測方法,以高效方便地提供伺服器的硬體配置監看與管理。
本發明提供一種伺服器檢測方法,其步驟包含:伺服器開機;伺服器的基本輸入輸出系統開始運作並執行開機自我檢測,以產生目前硬體配置訊息;基本輸入輸出系統透過伺服器的基板管理控制器(baseboard management controller,簡稱BMC)自伺服器的現場可更換部件(field-replaceable unit,簡稱FRU)取得預存硬體配置訊息;以及基本輸入輸出系統判斷目前與預存硬體配置訊息是否相符。基板管理控制器用以使伺服器開機且耦接基板管理控制器。在一實施例中,目前與預存硬體配置訊息皆符合一自定義格式。
在一實施例中,現場可更換部件預留有一個儲存區塊,而預存硬體配置訊息係儲存於此儲存區塊。
在一實施例中,所述伺服器檢測方法更包含基本輸入輸出系統判斷現場可更換部件有無儲存預存硬體配置訊息。當現場可更換部件未儲存預存硬體配置訊息時,基本輸入輸出系統透過基板管理控制器將目前硬體配置訊息儲存至前述儲存區塊。
在一實施例中,當目前與預存硬體配置訊息有至少一不相符事項時,基本輸入輸出系統透過基板管理控制器將目前硬體配置訊息儲存至前述儲存區塊。在一實施例中, 儲存目前硬體配置訊息指的是於前述儲存區塊對應自定義格式以目前硬體配置訊息取代預存硬體配置訊息。在一實施例中,基本輸入輸出系統更用以透過基板管理控制器將不相符事項記錄於一個事件誌。
在一實施例中,所述伺服器具有中央處理器和非揮發性的(non-volatile)唯讀記憶體(read-only memory),其中後者具有用以使中央處理器運行基本輸入輸出系統的程式碼。
在一實施例中,目前與預存硬體配置訊息包含伺服器的處理器、記憶體和硬碟的資訊。
本發明亦提供一種伺服器,包含基板管理控制器、現場可更換部件和基本輸入輸出系統。基板管理控制器用以使伺服器開機。現場可更換部件耦接基板管理控制器,用以儲存預存硬體配置訊息。基本輸入輸出系統用以執行伺服器的開機自我檢測以產生目前硬體配置訊息,用以透過基板管理控制器自現場可更換部件取得預存硬體配置訊息,以及用以判斷目前與預存硬體配置訊息是否相符。在一實施例中,目前與預存硬體配置訊息皆符合一自定義格式。
在一實施例中,現場可更換部件預留有一個儲存區塊,而預存硬體配置訊息係儲存於此儲存區塊。
在一實施例中,基本輸入輸出系統更用以判斷現場可更換部件有無儲存預存硬體配置訊息。當現場可更換部 件未儲存預存硬體配置訊息時,基本輸入輸出系統透過基板管理控制器將目前硬體配置訊息儲存至前述儲存區塊。
在一實施例中,當目前與預存硬體配置訊息有至少一不相符事項時,基本輸入輸出系統透過基板管理控制器將目前硬體配置訊息儲存至前述儲存區塊。在一實施例中,儲存目前硬體配置訊息指的是於前述儲存區塊對應自定義格式以目前硬體配置訊息取代預存硬體配置訊息。在一實施例中,基本輸入輸出系統更用以透過基板管理控制器將不相符事項記錄於一個事件誌。
在一實施例中,本發明提供的伺服器更包含中央處理器和非揮發性的唯讀記憶體,其中後者具有用以使中央處理器運行基本輸入輸出系統的程式碼。
在一實施例中,目前與預存硬體配置訊息包含伺服器的處理器、記憶體和硬碟的資訊。
綜上所述,在本發明提供之伺服器與伺服器檢測方法中,基本輸入輸出系統比較目前與預存硬體配置訊息,可直觀地判斷伺服器硬體配置是否發生變化或異常,便於高效率地進行伺服器的硬體配置監看與管理。
以上關於本發明內容之說明及以下關於實施方式之說明係用以示範與解釋本發明之精神與原理,並且提供本發明申請專利範圍更進一步之解釋。
1‧‧‧伺服器
10‧‧‧基本輸入輸出系統
12‧‧‧基板管理控制器
14‧‧‧現場可更換部件
第1圖係本發明一實施例中伺服器的高階方塊圖。
第2圖係本發明一實施例中伺服器檢測方法的流程圖。
以下於實施方式中敘述本發明之詳細特徵及優點,其內容足以使任何熟習相關技藝者了解本發明之技術內容並據以實施,且依據本說明書所揭露之內容、申請專利範圍及圖式,任何熟習相關技藝者可輕易理解與本發明相關之目的及優點。以下之實施例係進一步說明本發明之面向,但非以任何面向限制本發明之範疇。
請參見第1圖。第1圖係本發明一實施例中伺服器的高階方塊圖。如第1圖所示,伺服器1包含基本輸入輸出系統10、基板管理控制器12和現場可更換部件14,其中基板管理控制器12耦接現場可更換部件14。為方便說明,實務上伺服器1可能尚包含的中央處理器、主要為中央處理器所用的揮發性的隨機存取記憶體(random-access memory,簡稱RAM,如DIMM〔dual in-line memory module〕)、散熱模組、電源供應器、硬碟、磁碟陣列(如RAID〔redundant array of independent disks〕)卡以及對前述諸硬體的感測器等等未繪示於第1圖中。
一般而言,基板管理控制器12係伺服器1的智慧平臺管理介面(Intelligent Platform Management Interface, 簡稱IPMI)的一部分。作為IPMI的處理核心,基板管理控制器12監視伺服器1內多處感測器,以掌握和自動回報伺服器1內的溫度和電源穩定性等運作狀況。基板管理控制器12更可控制伺服器1的開啟與關閉。現場可更換部件14可以是快閃記憶體(flash memory)或其他類型的電氣可抹除可編程唯讀記憶體(electrically erasable programmable read-only memory,簡稱EEPROM)等非揮發性的儲存元件,以I2C(Inter-Integrated Circuit)或SPI(Serial Peripheral Interface)等匯流排耦接基板管理控制器12。
基本輸入輸出系統10的運作涉及中央處理器、揮發性隨機存取記憶體和一個專用的唯讀記憶體。基本輸入輸出系統10的原始程式碼存放於此唯讀記憶體,伺服器1開機時中央處理器執行此原始程式碼即形成基本輸入輸出系統10以進行開機自我檢測。一般而言,基本輸入輸出系統10可視為一個伺服器1開機後開始運作的功能區塊。基本輸入輸出系統10可以但不限於以低針數(Low Pin Count,簡稱LPC)匯流排耦接基板管理控制器12。
伺服器1的開機自我檢測舉例而言包括基本輸入輸出系統10停用中央處理器內建自我檢測(built-in self-test)後發現故障的核心,偵測和初始化揮發性隨機存取記憶體並停用故障的模組,掃描主機板所連接的週邊硬體並相應分配資源,以及依據前述步驟的結果蒐集伺服器1內各 硬體的相關資訊,例如數量、健康程度、廠牌、型號、出廠日期等等。本說明書中以硬體配置訊息統稱這些資訊。
請配合第1圖參見第2圖。第2圖係本發明一實施例中伺服器檢測方法的流程圖。如第2圖所示,於步驟S201中,伺服器1開機。於步驟S203中,基本輸入輸出系統10開始運作並執行開機自我檢測,以產生目前的硬體配置訊息,其詳情如前段所述。產生的硬體配置訊息可暫存於伺服器1的揮發性隨機存取記憶體中。於步驟S205和S207中,基本輸入輸出系統10透過基板管理控制器12判斷現場可更換部件14中有無是否存有預存的硬體配置訊息並嘗試透過基板管理控制器12自現場可更換部件14取得預存的硬體配置訊息。預存硬體配置訊息可以是伺服器1先前某次開機時產生的(在該次開機當時的)目前硬體配置訊息,或由外部直接寫入現場可更換部件14,譬如管理者期望的伺服器1硬體配置。預存硬體配置訊息是否和目前硬體配置訊息相符需要藉基本輸入輸出系統10驗證(詳見步驟S209);若相符說明兩者記錄的伺服器1的硬體配置相同。具體而言,於步驟S205中,依據基板管理控制器12的反應,基本輸入輸出系統10判斷現場可更換部件14中是不是已經儲存了一份硬體配置訊息。若結果是否定的,則意味著伺服器1是首次開機,之前從未執行過開機自我檢測,或現場可更換部件14中的預存硬體配置訊息人為或是不可預期地損壞或消失了。在此情形 下,基本輸入輸出系統10可直接於步驟S213中透過基板管理控制器12將目前硬體配置訊息儲存至現場可更換部件14。於步驟S205中,如果結果是肯定的,則於步驟S207中基本輸入輸出系統10透過基板管理控制器12自現場可更換部件14取得預存硬體配置訊息,並於步驟S209中判斷目前與預存硬體配置訊息有無不相符事項,例如伺服器1的硬體配置有變動或部分硬體出現問題而被停用。一般而言,步驟S209指的是基本輸入輸出系統10按位元(bitwise)比較代表目前與預存硬體配置訊息的兩組位元串(bit string)。若兩者相符,則基本輸入輸出系統10可結束檢測,準備將伺服器1交由作業系統運行。若兩者有任一處不同,則在一實施例中,基本輸入輸出系統10將此相異處於步驟S211中留存備考。實務上,基板管理控制器12的感測器事件誌(sensor event log,簡稱SEL,又作system error log等)可以用來儲存步驟S209比較出的不相符事項。最後,基本輸入輸出系統10可執行步驟S213及後續開機流程。
在一實施例中,前段所謂「自現場可更換部件14取得」或「儲存至現場可更換部件14」指的是藉助基板管理控制器12對現場可更換部件14中某個預留的區塊進行操作。這個區塊專供儲存硬體配置訊息,且硬體配置訊息需符合管理者定義的格式。步驟S213中將目前硬體配置訊息儲存至此區塊指的是以符合前述格式的目前硬體配置訊息在區塊 中對應地覆蓋亦符合前述格式的預存硬體配置訊息。
格式可自定義除在管理上具彈性,也提供對硬體配置訊息某種程度的防竊保障。換句話說,對於不知道自定義格式為何的竊取者,硬體配置訊息只是一串無法解析、沒有意義的位元。當然,伺服器1也可以預設有某種參考格式,如下第1表所示:
舉例而言,其中中央處理器的辨識符可以是「Intel Xeon Processor E5-2440」,包含製造商和型號,不足10位元組的部 分則以格式中定義的某個位元串填滿。無號(unsigned)代表不存在負值。(隨機存取)記憶體和硬碟的總容量可以十億位元組(gigabyte)為單位,以節省在預留區塊中所佔的長度。PCIe擴展卡的類別碼(class code)係用以在主機板上分辨同樣使用同樣介面的不同硬體。第1表中有些項(entry)是可以重複的,例如當有多顆硬碟時,可能就會有多筆「硬碟-辨識符」;當有多張擴展卡時,可能就會有多組PCIe擴展卡的參數。凡本發明所屬領域具通常知識者應可自由定義格式,並據以產生和解析硬體配置訊息。
綜上所述,本發明以基本輸入輸出系統為主體,透過基板管理控制器存取目前與預存硬體配置訊息,依據比較結果以前者取代後者,並選擇性地仍透過基板管理控制器留存比較結果(如兩者間呈現的硬體數量變化和錯誤),從而提高伺服器硬體配置監看和管理的效率和方便性。硬體配置訊息的自定義格式具有彈性,可容納SMBIOS未能涵蓋的硬體,亦貢獻了對其中資訊的一層混淆(obfuscation)。
雖然本發明以前述之實施例揭露如上,然其並非用以限定本發明。在不脫離本發明之精神和範圍內所為之更動與潤飾,均屬本發明之專利保護範圍。關於本發明所界定之保護範圍請參考所附之申請專利範圍。

Claims (10)

  1. 一種伺服器檢測方法,包含:一伺服器開機;該伺服器的一基本輸入輸出系統開始運作並執行該伺服器的開機自我檢測,以產生一目前硬體配置訊息;該基本輸入輸出系統透過該伺服器的一基板管理控制器自該伺服器的一現場可更換部件取得一預存硬體配置訊息,該基板管理控制器用以使該伺服器開機,該現場可更換部件耦接該基板管理控制器;以及該基本輸入輸出系統判斷該目前硬體配置訊息與該預存硬體配置訊息是否相符。
  2. 如請求項1所述的伺服器檢測方法,其中該現場可更換部件預留有一儲存區塊,且該預存硬體配置訊息係儲存於該儲存區塊。
  3. 如請求項2所述的伺服器檢測方法,更包含:該基本輸入輸出系統判斷該現場可更換部件有無儲存該預存硬體配置訊息;其中當該現場可更換部件未儲存該預存硬體配置訊息時,該基本輸入輸出系統透過該基板管理控制器將該目前硬體配置訊息儲存至該儲存區塊。
  4. 如請求項2所述的伺服器檢測方法,其中當該目前硬體配置訊息與該預存硬體配置訊息有至少一不相符事項時,該 基本輸入輸出系統透過該基板管理控制器將該目前硬體配置訊息儲存至該儲存區塊,使該目前硬體配置訊息覆蓋掉該預存硬體配置訊息。
  5. 如請求項1所述的伺服器檢測方法,更包含當該目前硬體配置訊息與該預存硬體配置訊息有至少一不相符事項時,該基本輸入輸出系統透過該基板管理控制器將該不相符事項記錄於一事件誌。
  6. 一種伺服器,包含:一基板管理控制器,用以使該伺服器開機;一現場可更換部件,耦接該基板管理控制器,用以儲存一預存硬體配置訊息;以及一基本輸入輸出系統,用以執行該伺服器的開機自我檢測以產生一目前硬體配置訊息,並且判斷該目前硬體配置訊息與該預存硬體配置訊息是否相符,該預存硬體配置訊息係該基本輸入輸出系統透過該基板管理控制器自該現場可更換部件取得。
  7. 如請求項6所述的伺服器,其中該現場可更換部件預留有一儲存區塊,且該預存硬體配置訊息係儲存於該儲存區塊。
  8. 如請求項7所述的伺服器,其中該基本輸入輸出系統更用以判斷該現場可更換部件有無儲存該預存硬體配置訊息,且當該現場可更換部件未儲存該預存硬體配置訊息 時,該基本輸入輸出系統透過該基板管理控制器將該目前硬體配置訊息儲存至該儲存區塊。
  9. 如請求項7所述的伺服器,其中當該目前硬體配置訊息與該預存硬體配置訊息有至少一不相符事項時,該基本輸入輸出系統透過該基板管理控制器將該目前硬體配置訊息儲存至該儲存區塊,使該目前硬體配置訊息覆蓋掉該預存硬體配置訊息。
  10. 如請求項6所述的伺服器,其中當該目前硬體配置訊息與該預存硬體配置訊息有至少一不相符事項時,該基本輸入輸出系統更用以透過該基板管理控制器將該不相符事項記錄於一事件誌。
TW102146583A 2013-12-17 2013-12-17 伺服器與伺服器檢測方法 TW201525863A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW102146583A TW201525863A (zh) 2013-12-17 2013-12-17 伺服器與伺服器檢測方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW102146583A TW201525863A (zh) 2013-12-17 2013-12-17 伺服器與伺服器檢測方法

Publications (1)

Publication Number Publication Date
TW201525863A true TW201525863A (zh) 2015-07-01

Family

ID=54197696

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102146583A TW201525863A (zh) 2013-12-17 2013-12-17 伺服器與伺服器檢測方法

Country Status (1)

Country Link
TW (1) TW201525863A (zh)

Similar Documents

Publication Publication Date Title
US9122501B1 (en) System and method for managing multiple bios default configurations
TWI627527B (zh) 基板管理控制器的回復方法及基板管理控制器
TWI631466B (zh) 機箱管理系統及機箱管理方法
US9372769B2 (en) Server and inspecting method thereof
TWI578233B (zh) 統一韌體管理系統、非揮發電腦可讀取媒體以及統一韌體管理方法
US6496790B1 (en) Management of sensors in computer systems
CN105404366B (zh) 在服务器机架系统中的备份管理控制的方法及服务器机架
TWI571800B (zh) 電腦開機之方法與電腦系統
CN107045448A (zh) 远程地启动部署程序的方法与服务器
US20150149753A1 (en) Server and inspecting method thereof
CN105938450A (zh) 自动除错信息收集的方法及系统
TWI735279B (zh) 自動偵測及警示計算裝置組件變更的方法和系統
US10587935B2 (en) System and method for automatically determining server rack weight
US9311208B2 (en) System and method for generating field replaceable unit information files
US10997516B2 (en) Systems and methods for predicting persistent memory device degradation based on operational parameters
US20140310816A1 (en) Method to Prevent Operating System Digital Product Key Activation Failures
US11640377B2 (en) Event-based generation of context-aware telemetry reports
TWI553490B (zh) 遠端系統配置管理方法、遠端系統配置管理系統及非暫態電腦可讀式儲存多媒體
CN107957923B (zh) 一种内存诊断方法和装置
CN115129520A (zh) 计算机系统、计算机服务器及其启动方法
US20080201572A1 (en) Method and system for uniformizing product data embedded in a computer platform
TWI832173B (zh) 快閃記憶體監控系統、方法及其電腦系統
TW201525863A (zh) 伺服器與伺服器檢測方法
CN116700801A (zh) 配置信息的管理方法、装置及服务器
TW201523246A (zh) 伺服器與伺服器檢測方法