TW201541351A - 自動恢復韌體系統、電子裝置及方法 - Google Patents

自動恢復韌體系統、電子裝置及方法 Download PDF

Info

Publication number
TW201541351A
TW201541351A TW103115287A TW103115287A TW201541351A TW 201541351 A TW201541351 A TW 201541351A TW 103115287 A TW103115287 A TW 103115287A TW 103115287 A TW103115287 A TW 103115287A TW 201541351 A TW201541351 A TW 201541351A
Authority
TW
Taiwan
Prior art keywords
flash memory
management controller
initialization
firmware
module
Prior art date
Application number
TW103115287A
Other languages
English (en)
Inventor
Chien-Chi Lin
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Priority to TW103115287A priority Critical patent/TW201541351A/zh
Publication of TW201541351A publication Critical patent/TW201541351A/zh

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)

Abstract

本發明提供一種自動恢復韌體系統、電子裝置及方法。該系統包括:初始化模組,用於控制基板管理控制器調用快閃記憶體單元中的其中一個快閃記憶體資源庫中的BMC韌體進行初始化;判斷模組,用於判斷該基板管理控制器是否初始化成功;異常處理模組,用於在初始化失敗時控制基板管理控制器從一隨機選擇的另一快閃記憶體資源庫中調用BMC韌體進行初始化;偵測模組,用於在初始化成功時隨機設定下一個用於該基板管理控制器初始化的快閃記憶體資料庫。本發明可以實現伺服器等電子裝置中BMC韌體啟動異常後自動恢復及延長快閃記憶體存儲裝置的壽命。

Description

自動恢復韌體系統、電子裝置及方法
本發明涉及伺服器領域,特別涉及一種自動恢復韌體(Firmware)系統、電子裝置及方法。
在BMC(Baseboard Management Controller,基板管理器)等傳統韌體一些應用上,大多將BMC的核心程式存放在在flash memory(快閃記憶體)或ROM等非揮發型存儲裝置上,以確保電子裝置,例如伺服器每次斷電後下次再開啟時能將BMC的韌體程式解壓縮到存儲裝置上再次執行。然而,一般情況下,flash memory及ROM等存儲裝置具有一定的讀寫次數,當存儲裝置發生問題時,伺服器上的BMC韌體程式就沒辦法正常運作,導致伺服器失去BMC所提供的監控及溫度控管的保護功能,甚至有可能造成系統更大的損壞。現有技術當中,當存儲裝置發生問題時,必須要使用人力手動的方式去做排除,因而在大型伺服器管理方面,必須要付出不少的人力資源。
有鑒於此,有必要提供一種自動恢復韌體的系統及方法以解決基板管理控制器韌體啟動異常後自動恢復及延長快閃記憶體存儲裝置壽命的問題。
一種自動恢復韌體系統,該系統運行在一電子裝置中,該電子裝置包括存儲單元、快閃記憶體單元和基板管理控制器,該快閃記憶體單元包括多個呈環狀連接的快閃記憶體資源庫,該每一個快閃記憶體資源庫中都存儲有相同的BMC韌體,該系統包括:
一初始化模組,用於控制基板管理控制器調用快閃記憶體單元中一個預設的快閃記憶體資源庫中的BMC韌體進行初始化;
一判斷模組,用於判斷該基板管理控制器是否初始化成功;
一異常處理模組,用於在判斷模組判斷基板管理控制器初始化失敗時控制基板管理控制器從一隨機選擇的另一快閃記憶體資源庫中調用BMC韌體進行初始化;以及
一偵測設定模組,用於在確定判斷模組中基板管理控制器初始化成功時隨機設定下一次用於該基板管理控制器初始化的快閃記憶體資料庫。
一種自動恢復韌體電子裝置,包括存儲單元、基板管理控制器一級處理單元,該自動恢復韌體電子裝置還包括:
快閃記憶體單元,包括多個呈環狀連接的快閃記憶體資源庫,該每一個快閃記憶體資源庫中都存儲有相同的BMC韌體;
該處理單元包括:
一初始化模組,用於控制基板管理控制器調用快閃記憶體單元中一個預設的快閃記憶體資源庫中的BMC韌體進行初始化;
一判斷模組,用於判斷該基板管理控制器是否初始化成功;
一異常處理模組,用於在判斷模組判斷基板管理控制器初始化失敗時控制基板管理控制器從一隨機選擇的另一快閃記憶體資源庫中調用BMC韌體進行初始化;以及
一偵測設定模組,用於在確定判斷模組中基板管理控制器初始化成功時隨機設定下一次用於該基板管理控制器初始化的快閃記憶體資料庫。
一種自動恢復韌體方法,該方法應用於一自動恢復韌體電子裝置中,其中,該方法包括步驟:
控制基板管理控制器調用快閃記憶體單元中的其中一個快閃記憶體資源庫中的BMC韌體進行初始化;
判斷該基板管理控制器是否初始化成功;
在確定判斷模組中基板管理控制器初始化失敗時控制基板管理控制器從一隨機選擇的另一快閃記憶體資源庫中調用BMC韌體進行初始化;
在確定判斷模組中基板管理控制器初始化成功時隨機設定下一個用於該基板管理控制器初始化的快閃記憶體資料庫。
本發明一種自動恢復韌體系統和方法,在確定該韌體程式運行異常後控制基板管理控制器從一隨機選擇的另一快閃記憶體資源庫中調用BMC韌體進行初始化,提高了基板管理控制器運行韌體時的容錯能力,在確定韌體程式運行成功時,控制基板管理控制器隨機設定下一次用於該基板管理控制器初始化的快閃記憶體資料庫,實現了快閃記憶體單元中各快閃記憶體資源庫讀寫次數平均分配,從而達到延長快閃記憶體存儲裝置壽命的目的。
圖1為本發明一實施方式中運行自動恢復韌體系統的電子裝置的模組架構圖。
圖2為圖1中快閃記憶體單元的結構圖。
圖3為圖1中所示該自動恢復韌體系統的功能模組圖。
圖4為本發明一實施方式自動恢復韌體方法流程圖。
下面結合附圖,對本發明中的自動恢復韌體系統和方法作進一步的詳細描述。
請參考圖1,為本發明運行有自動恢復韌體系統200的電子裝置100的模組架構圖。該系統200運行在一自動恢復韌體的電子裝置100中,該電子裝置100包括存儲單元10、處理單元20、看門狗計時器30、快閃記憶體單元50以及基板管理控制器(BMC)60。該系統200存儲於該存儲單元10中,並能夠被該處理單元20調用執行。該存儲單元10可包括記憶體、硬碟、軟碟、快閃記憶體、EEPROM中的一個或多個。該電子裝置100可為平板電腦、手機、筆記型電腦、臺式電腦以及伺服器等。
請一併參考圖2,為圖1中快閃記憶體單元50的結構圖,該快閃記憶體單元50包括多個呈環狀連接的快閃記憶體資源庫55。其中,每一個快閃記憶體資源庫55為一個獨立的存儲塊,該每一個快閃記憶體資源庫55中都存儲有相同的BMC韌體。
該基板管理控制器60用於調用某一快閃記憶體資源庫55中的BMC韌體而進行初始化。該看門狗計時器30用於在該基板管理控制器60調用BMC韌體進行初始化時開始計時,該基板管理控制器60在調用BMC韌體進行初始化成功後,清除該看門狗計時器30的計時時間。當該基板管理控制器60在調用BMC韌體進行初始化失敗後,不能清除該看門狗計時器30的計時時間,而使得看門狗計時器30在到達計時時間後產生一觸發信號。一般,若該基板管理控制器60能夠初始化成功,該基板管理控制器60的初始化時間小於該看門狗計時器30的計時時間。
請參考圖3,為圖1中所示該自動恢復韌體系統200的功能模組圖。該系統200包括一初始化模組21、一判斷模組22、一異常處理模組23和一偵測設定模組24。該系統200各功能模組均為軟體程式,並被該處理單元20調用執行。在其他實施方式中,該系統200的各功能模組為固化在處理單元20中的程式。
該初始化模組21用於控制基板管理控制器60調用快閃記憶體單元50中的一個預設的快閃記憶體資源庫55中的BMC韌體進行初始化。本實施方式中,初始化模組21控制將該快閃記憶體資源庫55中的韌體存儲至該存儲單元10中,然後控制該基板管理控制器60調用該存儲單元10中的BMC韌體進行初始化。
該判斷模組22用於判斷該基板管理控制器60是否初始化成功,並在確定該基板管理控制器60初始化成功時產生一第一信號,該判斷模組22並在確定該基板管理控制器60初始化失敗時產生一第二信號。其中,該判斷模組22用於在基板管理控制器60初始化開始到經過看門狗計時器30的計時時間後,判斷是否接收到看門狗計時器30的觸發信號,若接收到該觸發信號,確定該基板管理控制器60初始化失敗,若未收到觸發信號時,確定基板管理控制器60初始化成功。
該異常處理模組23接收到判斷模組22發送的第二信號時,用於控制基板管理控制器60從一隨機選擇的另一快閃記憶體資源庫55中調用BMC韌體進行初始化,同時將此次基板管理控制器60啟動異常資訊記錄在所述存儲單元10中。本實施方式中,該啟動異常資訊包括出錯的快閃記憶體資料庫55的資訊。
顯然,該判斷模組22在該控制基板管理控制器60從另一快閃記憶體資源庫55中調用BMC韌體進行初始化時,同樣執行前述的功能。
該偵測設定模組24在接收到該判斷模組22發送的第一信號時,隨機設定下一個用於該基板管理控制器60初始化的快閃記憶體資料庫55,從而在伺服器100下一次啟動時,該基板管理控制器60調用快閃記憶體單元50中設定的快閃記憶體資源庫55中的BMC韌體進行初始化。在本實施方式中,該偵測設定模組24在接收到該判斷模組22發送的第一信號時,還查詢該存儲單元10中是否存儲有出錯的快閃記憶體資料庫55的資訊,如果有,則該偵測設定模組24將當前初始化成功的快閃記憶體資料庫55中的BMC韌體複製到該出錯的快閃記憶體資料庫55並替換該出錯的快閃記憶體資料庫55中的BMC韌體。
請參考圖4,為本發明一種自動恢復韌體方法流程圖,該方法運行在上述的自動恢復韌體系統200中,該方法包括步驟:
S401:該初始化模組21控制基板管理控制器60調用快閃記憶體單元50中的一個預設的快閃記憶體資源庫55中的BMC韌體進行初始化。其中,初始化模組21控制將該快閃記憶體資源庫55中的韌體存儲至該存儲單元10中,然後控制該基板管理控制器60調用該存儲單元10中的BMC韌體進行初始化。
S402:該判斷模組22判斷該基板管理控制器60是否初始化成功。其中,在確定該基板管理控制器60初始化成功時產生一第一信號,並進入步驟S404,在確定該基板管理控制器60初始化失敗時產生一第二信號並進入步驟S403。
S403:該偵測設定模組24控制基板管理控制器60從一隨機選擇的另一快閃記憶體資源庫55中調用BMC韌體進行初始化。
S404:隨機設定下一個用於該基板管理控制器60初始化的快閃記憶體資料庫55。
其中,在步驟S403後,還包括步驟:將此次啟動異常資訊記錄在所述存儲單元10中。
其中,在步驟S404後,還包括步驟:查詢該存儲單元中是否存儲有出錯的快閃記憶體資料庫55的資訊,如果有,則該偵測設定模組24將當前初始化成功的快閃記憶體資料庫55中的BMC韌體複製到該出錯的快閃記憶體資料庫55並替換該出錯的快閃記憶體資料庫55中的BMC韌體。
以上實施例僅用以說明本發明的技術方案而非限制,儘管參照較佳實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解,可以對本發明的技術方案進行等同替換,而不脫離本發明技術方案的精神和範圍。
200‧‧‧自動恢復韌體系統
100‧‧‧自動恢復韌體電子裝置
10‧‧‧存儲單元
20‧‧‧處理單元
30‧‧‧看門狗計時器
50‧‧‧快閃記憶體單元
55‧‧‧快閃記憶體資源庫
60‧‧‧基板管理控制器
21‧‧‧初始化模組
22‧‧‧判斷模組
23‧‧‧異常處理模組
24‧‧‧偵測設定模組
S401‧‧‧控制基板管理控制器調用快閃記憶體單元中的一個預設的快閃記憶體資源庫中的BMC韌體進行初始化
S402‧‧‧判斷該基板管理控制器是否初始化成功
S403‧‧‧控制基板管理控制器從一隨機選擇的另一快閃記憶體資源庫中調用BMC韌體進行初始化
S404‧‧‧隨機設定下一個用於該基板管理控制器初始化的快閃記憶體資料庫

Claims (9)

  1. 一種自動恢復韌體系統,該系統運行在一電子裝置中,該電子裝置包括存儲單元、快閃記憶體單元和基板管理控制器,該快閃記憶體單元包括多個的快閃記憶體資源庫,該每一個快閃記憶體資源庫中都存儲有相同的BMC韌體,其改良在於,該系統包括:
    一初始化模組,用於控制基板管理控制器調用快閃記憶體單元中一個預設的快閃記憶體資源庫中的BMC韌體進行初始化;
    一判斷模組,用於判斷該基板管理控制器是否初始化成功;
    一異常處理模組,用於在判斷模組判斷基板管理控制器初始化失敗時控制基板管理控制器從一隨機選擇的另一快閃記憶體資源庫中調用BMC韌體進行初始化;以及
    一偵測設定模組,用於在確定判斷模組中基板管理控制器初始化成功時隨機設定下一次用於該基板管理控制器初始化的快閃記憶體資料庫。
  2. 如申請專利範圍第1項所述的自動恢復韌體系統,其中,該異常處理模組還用於在判斷模組判斷基板管理控制器初始化失敗時,將此次基板管理控制器啟動異常資訊記錄在所述存儲單元中,該偵測設定模組還用於在基板管理控制器初始化成功時,查詢該存儲單元中是否存儲有出錯的快閃記憶體資料庫的資訊,如果有,則該偵測設定模組將當前初始化成功的快閃記憶體資料庫中的BMC韌體複製到該出錯的快閃記憶體資料庫並替換該出錯的快閃記憶體資料庫中的BMC程式。
  3. 一種自動恢復韌體電子裝置,包括存儲單元、基板管理控制器及處理單元,其改良在於,該自動恢復韌體電子裝置還包括:
    快閃記憶體單元,包括多個呈環狀連接的快閃記憶體資源庫,該每一個快閃記憶體資源庫中都存儲有相同的BMC韌體;
    該處理單元包括:
    一初始化模組,用於控制基板管理控制器調用快閃記憶體單元中一個預設的快閃記憶體資源庫中的BMC韌體進行初始化;
    一判斷模組,用於判斷該基板管理控制器是否初始化成功;
    一異常處理模組,用於在判斷模組判斷基板管理控制器初始化失敗時控制基板管理控制器從一隨機選擇的另一快閃記憶體資源庫中調用BMC韌體進行初始化;以及
    一偵測設定模組,用於在確定判斷模組中基板管理控制器初始化成功時隨機設定下一次用於該基板管理控制器初始化的快閃記憶體資料庫。
  4. 如申請專利範圍第3項所述的自動恢復韌體電子裝置,其中,該異常處理模組還用於在判斷模組判斷基板管理控制器初始化失敗時,將此次基板管理控制器啟動異常資訊記錄在所述存儲單元中,該偵測設定模組還用於查詢該存儲單元中是否存儲有出錯的快閃記憶體資料庫的資訊,如果有,則該偵測設定模組將當前初始化成功的快閃記憶體資料庫中的BMC韌體複製到該出錯的快閃記憶體資料庫並替換該出錯的快閃記憶體資料庫中的BMC資訊。
  5. 如申請專利範圍第4項所述的自動恢復韌體電子裝置,其中,該自動恢復韌體電子裝置還包括一看門狗計時器,用於在基板管理控制器調用BMC韌體初始化時開始計時,並在計時到達計時時間後產生一觸發信號,該判斷模組在接收到看門狗計時器的觸發信號時確定該基板管理控制器初始化失敗,該判斷模組並在基板管理控制器初始化開始,經過該看門狗計時器的計時時間後未收到觸發信號時,確定基板管理控制器初始化成功。
  6. 一種自動恢復韌體方法,該方法應用於一自動恢復韌體電子裝置中,其中,該方法包括步驟:
    控制基板管理控制器調用快閃記憶體單元中的其中一個快閃記憶體資源庫中的BMC韌體進行初始化;
    判斷該基板管理控制器是否初始化成功;
    在確定判斷模組中基板管理控制器初始化失敗時控制基板管理控制器從一隨機選擇的另一快閃記憶體資源庫中調用BMC韌體進行初始化;
    在確定判斷模組中基板管理控制器初始化成功時隨機設定下一個用於該基板管理控制器初始化的快閃記憶體資料庫。
  7. 如申請專利範圍第6項所述的自動恢復韌體方法,其中,在步驟“在確定判斷模組中基板管理控制器初始化失敗時控制基板管理控制器從一隨機選擇的另一快閃記憶體資源庫中調用BMC韌體進行初始化”後還包括步驟:
    將此次基板管理控制器啟動異常資訊記錄在所述存儲單元中。
  8. 如申請專利範圍第7項所述的自動恢復韌體方法,其中,在步驟“在確定判斷模組中基板管理控制器初始化成功時隨機設定下一個用於該基板管理控制器初始化的快閃記憶體資料庫”後還包括步驟:
    查詢該存儲單元中是否存儲有出錯的快閃記憶體資料庫的資訊,如果有,則該偵測設定模組將當前初始化成功的快閃記憶體資料庫中的BMC韌體複製到該出錯的快閃記憶體資料庫並替換該出錯的快閃記憶體資料庫中的BMC韌體。
  9. 如申請專利範圍第6項所述的自動恢復韌體方法,其中,該步驟“判斷該基板管理控制器是否初始化成功”包括:
    在接收到看門狗計時器的觸發信號時確定該基板管理控制器初始化失敗;以及
    在經過該看門狗計時器的計時時間後未收到觸發信號時,確定基板管理控制器初始化成功。
TW103115287A 2014-04-29 2014-04-29 自動恢復韌體系統、電子裝置及方法 TW201541351A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW103115287A TW201541351A (zh) 2014-04-29 2014-04-29 自動恢復韌體系統、電子裝置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW103115287A TW201541351A (zh) 2014-04-29 2014-04-29 自動恢復韌體系統、電子裝置及方法

Publications (1)

Publication Number Publication Date
TW201541351A true TW201541351A (zh) 2015-11-01

Family

ID=55220512

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103115287A TW201541351A (zh) 2014-04-29 2014-04-29 自動恢復韌體系統、電子裝置及方法

Country Status (1)

Country Link
TW (1) TW201541351A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160306623A1 (en) * 2015-04-16 2016-10-20 Aic Inc. Control module of node and firmware updating method for the control module

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160306623A1 (en) * 2015-04-16 2016-10-20 Aic Inc. Control module of node and firmware updating method for the control module

Similar Documents

Publication Publication Date Title
US10353779B2 (en) Systems and methods for detection of firmware image corruption and initiation of recovery
US8719497B1 (en) Using device spoofing to improve recovery time in a continuous data protection environment
US20170046152A1 (en) Firmware update
WO2015103917A1 (zh) 无线路由设备管理方法和装置
US11360847B2 (en) Memory scrub system
US9141464B2 (en) Computing device and method for processing system events of computing device
WO2018095107A1 (zh) 一种bios程序的异常处理方法及装置
CN107656705B (zh) 一种计算机存储介质和一种数据迁移方法、装置及系统
WO2015176433A1 (zh) 一种基于分区表的硬盘修复方法及装置
TWI706274B (zh) 容許透過復原代理器進行作業系統修復的運算裝置與非暫態電腦可讀儲存媒體
TW201828071A (zh) 開關裝置及偵測積體電路匯流排之方法
US9703937B2 (en) Method to prevent operating system digital product key activation failures
US20140013428A1 (en) Apparatus and method for managing operation of a mobile device
TW202131170A (zh) 韌體損壞恢復技術
US20030182527A1 (en) Write Protection State Change Initiation Sequence
US20120144245A1 (en) Computing device and method for detecting pci system errors in the computing device
US20060206764A1 (en) Memory reliability detection system and method
US20080209254A1 (en) Method and system for error recovery of a hardware device
US11552840B2 (en) Intention-based device component tracking system
TW201516665A (zh) 伺服器之系統錯誤資訊偵測系統及方法
US11010250B2 (en) Memory device failure recovery system
TW201541351A (zh) 自動恢復韌體系統、電子裝置及方法
WO2023279875A1 (zh) Bootloader启动流程的监控方法、装置、嵌入式设备及存储介质
TW201508768A (zh) 電子設備
CN113835971A (zh) 一种服务器背板异常点灯的监测方法及相关组件