TW201944239A - 伺服器及自動檢修基板管理控制器的方法 - Google Patents

伺服器及自動檢修基板管理控制器的方法

Info

Publication number
TW201944239A
TW201944239A TW107112539A TW107112539A TW201944239A TW 201944239 A TW201944239 A TW 201944239A TW 107112539 A TW107112539 A TW 107112539A TW 107112539 A TW107112539 A TW 107112539A TW 201944239 A TW201944239 A TW 201944239A
Authority
TW
Taiwan
Prior art keywords
management controller
control chipset
substrate management
determines
count value
Prior art date
Application number
TW107112539A
Other languages
English (en)
Other versions
TWI668567B (zh
Inventor
丁偉雄
Original Assignee
神雲科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 神雲科技股份有限公司 filed Critical 神雲科技股份有限公司
Priority to TW107112539A priority Critical patent/TWI668567B/zh
Application granted granted Critical
Publication of TWI668567B publication Critical patent/TWI668567B/zh
Publication of TW201944239A publication Critical patent/TW201944239A/zh

Links

Abstract

一種伺服器,包含一基板管理控制器、一記憶模組,及一控制晶片組,該控制晶片組回應於一基本輸入輸出系統程式之執行,進行一開機自我檢測,並於進行該開機自我檢測時,傳送一詢問指令至該基板管理控制器,且判定是否接收到一來自該基板管理控制器且回應於該詢問指令的回覆指令。當該控制晶片組判定出無接收到該回覆指令時,該控制晶片組將一計數值加一,並判定該計數值是否大於一預設值,當該控制晶片組判定出該計數值大於該預設值時,該控制晶片組使該基板管理控制器所儲存的一第一映像檔更新為一第二映像檔。

Description

伺服器及自動檢修基板管理控制器的方法
本發明是有關於一種自動檢修的方法,特別是指一種伺服器及自動檢修基板管理控制器的方法。
現有的基板管理控制器(Baseboard Management Controller,BMC)適用於伺服器,並支援智慧平台管理介面(Intelligent Platform Management Interface,IPMI)的工業標準,用來監控伺服器主機板上之硬體設備的狀態,如環境溫度、風扇轉速、供電情況等。然而,若該基板管理控制器發生異常,如系統功能崩潰或硬體問題,則該基板管理控制器即無法達成監控伺服器主機板上之硬體設備的功能。
現有技術雖可藉由一控制晶片組執行一基本輸入輸出系統程式來偵測該基板管理控制器是否發生異常,並在該控制晶片組偵測出該基板管理控制器發生異常時,傳送一重置指令至該基板管理控制器,以重置該基板管理控制器,藉此來達到自動檢修的效果。然而,在某些情況下,即便重置該基板管理控制器仍無法使該基板管理控制器恢復正常運作,此時,便需要派遣人力對該基板管理控制器進行檢修,因而造成人力成本及時間的耗費。
因此,本發明的目的,即在提供一種節省檢修基板管理控制器所需耗費之人力成本與時間的自動檢修基板管理控制器的方法。
於是,本發明自動檢修基板管理控制器的方法,藉由一控制晶片組執行一基本輸入輸出系統程式來實施,該控制晶片組電連接一儲存有一第一映像檔的基板管理控制器,以及一記憶模組,該記憶模組儲存有一相關於該基板管理控制器之第二映像檔,該自動檢修基板管理控制器的方法包含以下步驟:
(A)該控制晶片組進行一開機自我檢測;
(B) 該控制晶片組傳送一詢問指令至該基板管理控制器;
(C)該控制晶片組判定是否接收到一來自該基板管理控制器且回應於該詢問指令的回覆指令;
(D)當該控制晶片組判定出無接收到該回覆指令時,該控制晶片組將一計數值加一,並判定該計數值是否大於一預設值;及
(E)當該控制晶片組判定出該計數值大於該預設值時,該控制晶片組使該基板管理控制器所儲存的第一映像檔更新為該第二映像檔。
本發明的另一目的,即在提供一種節省檢修基板管理控制器所需耗費之人力成本與時間的伺服器。
於是,本發明伺服器包含一基板管理控制器、一記憶模組,及一電連接該基板管理控制器及該記憶模組的控制晶片組。
該基板管理控制器儲存有一第一映像檔。
該記憶模組儲存有一相關於該基板管理控制器的第二映像檔。
該控制晶片組回應於一基本輸入輸出系統程式之執行,進行一開機自我檢測,並於進行該開機自我檢測時,傳送一詢問指令至該基板管理控制器,且判定是否接收到一來自該基板管理控制器且回應於該詢問指令的回覆指令,當該控制晶片組判定出無接收到該回覆指令時,該控制晶片組將一計數值加一,並判定該計數值是否大於一預設值,當該控制晶片組判定出該計數值大於該預設值時,該控制晶片組使該基板管理控制器所儲存的第一映像檔更新為該第二映像檔。
本發明的功效在於:藉由該控制晶片組執行該基本輸入輸出單元以判定是否接收到一來自該基板管理控制器且回應於該詢問指令的回覆指令,當該控制晶片組判定出無接收到該回覆指令時,且判定出該計數值大於該預設值時,即代表透過重置該基板管理控制器仍無法使該基板管理控制器恢復正常運作,此時,該控制晶片組將該基板管理控制器所儲存的第一映像檔更新為該第二映像檔,藉此達到自動檢修的效果,而能節省人力並且縮短檢修時間。
參閱圖1,本發明伺服器的實施例包含一基板管理控制器1(Baseboard Management Controller,BMC)、一第一記憶模組23、一第二記憶模組24,及一電連接該基板管理控制器1、該第一記憶模組23與該第二記憶模組24的控制晶片組3。
該基板管理控制器1儲存有一第一映像檔11,該第一映像檔11為一程式,用以執行該基板管理控制器1的功能,包括監控伺服器主機板上之硬體設備的狀態,如環境溫度、風扇轉速、供電情況等等。當該基板管理控制器1接收到一來自該控制晶片組3的重置指令時,該基板管理控制器1即會重新啟動。
該第一記憶模組232儲存有一基本輸入輸出系統(Basic Input/Output System,簡稱BIOS)程式,該第二記憶模組24儲存有一相關於該基板管理控制器1的第二映像檔22。在本實施例中,該第一記憶模組23例如為一唯讀記憶體(Read Only Memory,簡稱ROM),該第二記憶模組24可為一USB記憶體、M.2的硬碟(M.2 HDD)或一PXE 伺服器等的外部儲存裝置,但不限於此。
該控制晶片組3包含一平台路徑控制器31(Platform Controller Hub,簡稱PCH)及一中央處理單元32(Central Processing Unit,簡稱CPU)。在該伺服器上電啟動後,該控制晶片組3執行該基本輸入輸出系統程式21以啟動伺服器硬體及周邊裝置,執行開機自我檢測(Power On Self Test,簡稱POST)。
參閱圖1、圖2與圖3,以下將配合本發明自動檢修基板管理控制器1的方法之實施例來說明該基板管理控制器1、該第一記憶模組23、該第二記憶模組24及該控制晶片組3各元件間之作動。
在步驟201中,該控制晶片組3回應於該基本輸入輸出系統程式21之執行,進行一開機自我檢測(POST)。
在步驟202中,該控制晶片組3回應於該基本輸入輸出系統程式21之執行,傳送一詢問指令至該基板管理控制器1。
在步驟203中,該控制晶片組3回應於該基本輸入輸出系統程式21之執行,判定是否接收到一來自該基板管理控制器1且回應於該詢問指令的回覆指令。當該控制晶片組3判定出無接收到該回覆指令時,流程進行步驟204;當該控制晶片組3判定出接收到該回覆指令時,流程進行步驟209。
在步驟204中,該控制晶片組3回應於該基本輸入輸出系統程式21之執行,將一計數值加一並判定該計數值是否大於一預設值。當該控制晶片組3判定出該計數值大於該預設值時,流程進行步驟205;當該控制晶片組3判定出該計數值小於等於該預設值時,流程進行步驟207。值得特別說明的是,實施上,該計數值例如可被設置為該基本輸入輸出系統程式21中所包含的一參數,且初始時該參數被預設為0。
在步驟205中,該控制晶片組3回應於該基本輸入輸出系統程式21之執行,初始化該計數值(使其歸零)並使該基板管理控制器1所儲存的第一映像檔11更新為該第二映像檔22。因此,藉由該控制晶片組3判定該計數值是否大於該預設值,當該計數值大於該預設值時,表示透過多次重置該基板管理控制器1後仍無法使該基板管理控制器1恢復正常運作,該控制晶片組3即令該基板管理控制器1自動更新運行於該基板管理控制器1中之映像檔,以達成自動檢修的效果。值得一提的是,該控制晶片組3係透過一基板管理控制器軟體工具(BMC tool)來更新該基板管理控制器1的映像檔。值得一提的是,在本實施例中,該伺服器除了包含該第二記憶模組24外,還可包含其他的外部儲存裝置,當該控制晶片組3判定出該計數值大於該預設值時,該控制晶片組3會先自所有外部儲存裝置搜尋出儲存有該第二映像檔22的第二記憶模組24,接著,該控制晶片組3才使該基板管理控制器1所儲存的第一映像檔11更新為儲存於所搜尋出之第二記憶模組24中的該第二映像檔22。
接續在步驟205後,在步驟206中,該基板管理控制器1重新啟動,流程繼續執行步驟202。值得一提的是,在該基板管理控制器1完成該第一映像檔11之更新後(亦即,該第一映像檔11已更新為該第二映像檔22),該基板管理控制器1即會重新啟動。
在步驟207中,該控制晶片組3回應於該基本輸入輸出系統程式21之執行,傳送一重置指令至該基板管理控制器1,以致該基板管理控制器1重新啟動。值得一提的是,該重置指令係為一IPMI指令。
接續在步驟207後,在步驟208中,該基板管理控制器1重新啟動,流程繼續執行步驟202。
在步驟209中,該控制晶片組3回應於該基本輸入輸出系統程式21之執行,計數一預設時間並判定是否完成該開機自我檢測。當該控制晶片組3判定出尚未完成該開機自我檢測時,流程進行步驟202,也就是說,該控制晶片組3會在該開機自我檢測的過程中,每間隔該預設時間,週期性的重複發出該詢問指令,以確認該基板管理控制器11是否仍正常運作(亦即,保持為存活狀態);當該控制晶片組3判定出已完成該開機自我檢測時,流程進行步驟210。
在步驟210中,該控制晶片組3回應於該基本輸入輸出系統程式21之執行,初始化該計數值並移交系統控制權予作業系統。
值得特別說明的是,本發明自動檢修基板管理控制器1的方法之實施例中的步驟201~205、步驟207及步驟209~210皆是藉由該控制晶片組3執行該基本輸入輸出系統程式21來實行,換言之上述步驟係被編程(programming)在該基本輸入輸出系統程式21中。
綜上所述,本發明自動檢修基板管理控制器的方法,藉由該控制晶片組3於該開機自我檢測的過程間,週期性的重複發出該詢問指令,以確認該基板管理控制器1是否仍保持為存活狀態。當未接收到該基板管理控制器1的回覆指令時,該控制晶片組3即判定該計數值是否大於該預設值,以確認透過多次地重置該基板管理控制器1是否仍無法使該基板管理控制器1恢復正常運作,當該計數值大於該預設值時,該控制晶片組3使該基板管理控制器1所儲存的第一映像檔11更新為該第二映像檔22,藉此達到自動檢修的效果,從而能節省人力並且縮短檢修時間,故確實能達成本發明的目的。
惟以上所述者,僅為本發明的實施例而已,當不能以此限定本發明實施的範圍,凡是依本發明申請專利範圍及專利說明書內容所作的簡單的等效變化與修飾,皆仍屬本發明專利涵蓋的範圍內。
1‧‧‧基板管理控制器
11‧‧‧第一映像檔
23‧‧‧第一記憶模組
24‧‧‧第二記憶模組
21‧‧‧基本輸入輸出系統程式
22‧‧‧第二映像檔
3‧‧‧控制晶片組
31‧‧‧平台路徑控制器
32‧‧‧中央處理單元
201~210‧‧‧步驟
本發明的其他的特徵及功效,將於參照圖式的實施方式中清楚地呈現,其中: 圖1是一方塊圖,說明本發明伺服器之實施例;及 圖2是一流程圖,說明本發明自動檢修基板管理控制器的方法之實施例。

Claims (10)

  1. 一種自動檢修基板管理控制器的方法,藉由一控制晶片組執行一基本輸入輸出系統程式來實施,該控制晶片組電連接一儲存有一第一映像檔的基板管理控制器,以及一記憶模組,該記憶模組儲存有一相關於該基板管理控制器之第二映像檔,該自動檢修基板管理控制器的方法包含以下步驟: (A)該控制晶片組進行一開機自我檢測; (B) 該控制晶片組傳送一詢問指令至該基板管理控制器; (C)該控制晶片組判定是否接收到一來自該基板管理控制器且回應於該詢問指令的回覆指令; (D)當該控制晶片組判定出無接收到該回覆指令時,該控制晶片組將一計數值加一,並判定該計數值是否大於一預設值;及 (E)當該控制晶片組判定出該計數值大於該預設值時,該控制晶片組使該基板管理控制器所儲存的第一映像檔更新為該第二映像檔。
  2. 如請求項1所述的自動檢修基板管理控制器的方法,在步驟(D)後,還包含一步驟(F),當該控制晶片組判定出該計數值小於等於該預設值時,該控制晶片組傳送一重置指令至該基板管理控制器,以致該基板管理控制器重新啟動,並重複執行步驟(B)至步驟(C)。
  3. 如請求項1所述的自動檢修基板管理控制器的方法,在步驟(C)後,還包含以下步驟: (F)當該控制晶片組判定出接收到該回覆指令時,該控制晶片組計數一預設時間,並判定是否完成該開機自我檢測;及 (G)當該控制晶片組判定出尚未完成該開機自我檢測時,該控制晶片組繼續進行該開機自我檢測,並重複執行步驟(B)至步驟(C)。
  4. 如請求項3所述的自動檢修基板管理控制器的方法,在步驟(F)後,還包含一步驟: (H)當該控制晶片組判定出已完成該開機自我檢測時,該控制晶片組初始化該計數值。
  5. 如請求項1所述的自動檢修基板管理控制器的方法,其中,在步驟(E)中,當該控制晶片組判定出該計數值大於該預設值時,該控制晶片組還初始化該計數值。
  6. 如請求項1所述的自動檢修基板管理控制器的方法,其中,步驟(E)包含以下子步驟: (E-1) 當該控制晶片組判定出該計數值大於該預設值時,該控制晶片組搜尋出儲存有該第二映像檔的記憶模組;及 (E-2) 該控制晶片組使該基板管理控制器所儲存的第一映像檔更新為儲存於所搜尋出之記憶模組中的該第二映像檔。
  7. 一種伺服器,包含: 一基板管理控制器,儲存有一第一映像檔; 一記憶模組,儲存有一相關於該基板管理控制器的第二映像檔;及 一控制晶片組,電連接該基板管理控制器及該記憶模組,該控制晶片組回應於一基本輸入輸出系統程式之執行,進行一開機自我檢測,並於進行該開機自我檢測時,傳送一詢問指令至該基板管理控制器,且判定是否接收到一來自該基板管理控制器且回應於該詢問指令的回覆指令,當該控制晶片組判定出無接收到該回覆指令時,該控制晶片組將一計數值加一,並判定該計數值是否大於一預設值,當該控制晶片組判定出該計數值大於該預設值時,該控制晶片組使該基板管理控制器所儲存的第一映像檔更新為該第二映像檔。
  8. 如請求項7所述的伺服器,其中,當該控制晶片組判定出該計數值小於等於該預設值時,該控制晶片組傳送一重置指令至該基板管理控制器,以致該基板管理控制器重新啟動,該控制晶片組重複地傳送另一詢問指令至該基板管理控制器,且判定是否接收到另一來自該基板管理控制器且回應於該另一詢問指令的回覆指令。
  9. 如請求項7所述的伺服器,其中,當該控制晶片組判定出接收到該回覆指令時,該控制晶片組計數一預設時間,並判定是否完成該開機自我檢測,當該控制晶片組判定出尚未完成該開機自我檢測時,該控制晶片組繼續進行該開機自我檢測,並重複地傳送另一詢問指令至該基板管理控制器,且判定是否接收到另一來自該基板管理控制器且回應於該另一詢問指令的回覆指令。
  10. 如請求項7所述的伺服器,其中,當該控制晶片組判定出該計數值大於該預設值時,該控制晶片組還初始化該計數值。
TW107112539A 2018-04-12 2018-04-12 伺服器及自動檢修基板管理控制器的方法 TWI668567B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW107112539A TWI668567B (zh) 2018-04-12 2018-04-12 伺服器及自動檢修基板管理控制器的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW107112539A TWI668567B (zh) 2018-04-12 2018-04-12 伺服器及自動檢修基板管理控制器的方法

Publications (2)

Publication Number Publication Date
TWI668567B TWI668567B (zh) 2019-08-11
TW201944239A true TW201944239A (zh) 2019-11-16

Family

ID=68316493

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107112539A TWI668567B (zh) 2018-04-12 2018-04-12 伺服器及自動檢修基板管理控制器的方法

Country Status (1)

Country Link
TW (1) TWI668567B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11126518B1 (en) 2020-03-16 2021-09-21 Quanta Computer Inc. Method and system for optimal boot path for a network device
TWI760839B (zh) * 2020-09-04 2022-04-11 宇瞻科技股份有限公司 系統還原機制之建立方法及系統啟動與還原方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI742430B (zh) * 2019-09-17 2021-10-11 神雲科技股份有限公司 自動回復基板管理控制器之韌體的方法
TWI709036B (zh) * 2019-10-03 2020-11-01 神雲科技股份有限公司 回復基本輸入輸出系統組態參數的方法及伺服系統
CN113687843B (zh) * 2020-05-18 2024-04-19 佛山市顺德区顺达电脑厂有限公司 自动回复基板管理控制器之韧体的方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6219828B1 (en) * 1998-09-30 2001-04-17 International Business Machines Corporation Method for using two copies of open firmware for self debug capability
TWI411959B (zh) * 2008-03-21 2013-10-11 Asustek Comp Inc 具雙開機程式碼區之電腦系統及其啟動方法
TWI497279B (zh) * 2013-06-26 2015-08-21 Inventec Corp 除錯裝置及除錯方法
TWI602121B (zh) * 2015-07-30 2017-10-11 神雲科技股份有限公司 更新伺服器映像檔的技術
TWI595364B (zh) * 2015-08-18 2017-08-11 神雲科技股份有限公司 自動修復映像檔的方法及伺服器系統
TWI598729B (zh) * 2015-10-16 2017-09-11 神雲科技股份有限公司 伺服器及自動檢修基板管理控制器的方法
TWI611289B (zh) * 2015-10-23 2018-01-11 神雲科技股份有限公司 伺服器及其偵錯方法
US10127032B2 (en) * 2015-11-05 2018-11-13 Quanta Computer Inc. System and method for unified firmware management

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11126518B1 (en) 2020-03-16 2021-09-21 Quanta Computer Inc. Method and system for optimal boot path for a network device
TWI754317B (zh) * 2020-03-16 2022-02-01 廣達電腦股份有限公司 用於網路裝置之最佳啟動路徑之方法和系統
TWI760839B (zh) * 2020-09-04 2022-04-11 宇瞻科技股份有限公司 系統還原機制之建立方法及系統啟動與還原方法

Also Published As

Publication number Publication date
TWI668567B (zh) 2019-08-11

Similar Documents

Publication Publication Date Title
TWI668567B (zh) 伺服器及自動檢修基板管理控制器的方法
CN107122321B (zh) 硬件修复方法、硬件修复系统以及计算机可读取存储装置
WO2022198972A1 (zh) 一种服务器启动过程中的故障定位方法、系统及装置
TWI584196B (zh) 基本輸入輸出系統回復管理系統、電腦程式產品 以及基本輸入輸出系統回復方法
TWI571736B (zh) 自動除錯資訊收集之方法及系統
TWI578233B (zh) 統一韌體管理系統、非揮發電腦可讀取媒體以及統一韌體管理方法
US9240924B2 (en) Out-of band replicating bios setting data across computers
US9910664B2 (en) System and method of online firmware update for baseboard management controller (BMC) devices
JP2016058083A (ja) 複数のbiosデフォルト設定を管理するシステムと方法
TW201610849A (zh) 自動地配置電腦系統中之基本輸入輸出系統效能設定檔的裝置、方法及非暫態電腦可讀取記錄媒體
US10146626B2 (en) Detecting and handling an expansion card fault during system initialization
TWI598729B (zh) 伺服器及自動檢修基板管理控制器的方法
TW201512831A (zh) 電腦開機啟動偵測系統及方法
US10459742B2 (en) System and method for operating system initiated firmware update via UEFI applications
US10474517B2 (en) Techniques of storing operational states of processes at particular memory locations of an embedded-system device
CN111338698A (zh) 一种bios准确引导服务器启动的方法及系统
TWI553490B (zh) 遠端系統配置管理方法、遠端系統配置管理系統及非暫態電腦可讀式儲存多媒體
TW201734779A (zh) 通知開機階段的方法及伺服器系統
CN110471800B (zh) 服务器及自动检修基板管理控制器的方法
CN117289963A (zh) 在线更新服务器平台服务固件的目标区域的方法及设备
TW201430702A (zh) 韌體更新方法及系統
TWI537721B (zh) 基板管理控制系統及其方法
TWI554876B (zh) 節點置換處理方法與使用其之伺服器系統
CN111078452A (zh) 一种bmc固件镜像恢复方法与装置
TWI726434B (zh) 排除管理引擎運作異常的控制方法