TW201525682A - 系統事件日誌記錄系統及方法 - Google Patents

系統事件日誌記錄系統及方法 Download PDF

Info

Publication number
TW201525682A
TW201525682A TW102148428A TW102148428A TW201525682A TW 201525682 A TW201525682 A TW 201525682A TW 102148428 A TW102148428 A TW 102148428A TW 102148428 A TW102148428 A TW 102148428A TW 201525682 A TW201525682 A TW 201525682A
Authority
TW
Taiwan
Prior art keywords
server
storage unit
storage device
system event
full
Prior art date
Application number
TW102148428A
Other languages
English (en)
Inventor
Shih-Yu Lee
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Priority to TW102148428A priority Critical patent/TW201525682A/zh
Publication of TW201525682A publication Critical patent/TW201525682A/zh

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本發明提供一種系統事件日誌記錄系統和方法。該方法應用於一伺服器系統中的第一伺服器中,該方法包括:在偵測到生成新的系統事件日誌時,判斷第一伺服器的存儲單元是否已經被占滿;若確定該存儲單元已經被占滿,則獲取該存儲單元中存儲的作為備份存儲裝置的伺服器對應的識別字,偵測這些識別字對應的伺服器中存儲單元是否被占滿,並確定存儲單元沒有被占滿的伺服器;在存儲單元沒有被占滿的伺服器中選擇一個伺服器作為暫存裝置;將主板管理控制器新生成的系統事件日誌通過通信單元發送至該被確定暫存裝置的伺服器的存儲單元中進行存儲。

Description

系統事件日誌記錄系統及方法
本發明涉及資訊處理系統,尤其涉及一種系統事件日誌記錄系統及方法。
一般而言,伺服器中的主板管理控制器(Baseboard Management Controller,BMC)在會在伺服器系統產生錯誤時,將錯誤事件的內容等相關資訊記錄為一系統事件日誌(System Event Log,SEL)並存儲至非易失性記憶體(Non-Volatile Random Access Memory,NVRAM),以供使用者後續瞭解伺服器系統的運行狀況。
然而,伺服器開/關機時會產生多筆系統事件日誌。由於非易失性記憶體存在空間大小的限制,只能存儲一定數量的系統事件日誌,倘若非易失性記憶體的空間已經存儲滿,就無法再繼續存儲新的系統事件日誌。
有鑒於此,有必要提供一種系統事件日誌記錄系統及方法,以解決上述問題。
本發明的系統事件日誌記錄系統,應用於一伺服器系統中的一第一伺服器內,該第一伺服器與該伺服器系統中的其他伺服器之間通過通信單元互相通信,其中,該伺服器系統中的每個伺服器均對應一唯一識別字,該第一伺服器包括一主板管理控制器,用於監測該第一伺服器在開關機過程中是否產生異常事件,並根據異常事件的內容生成若干系統事件日誌,並將該系統事件日誌存儲至存儲單元中。該系統事件日誌記錄系統包括:判斷模組,用於在偵測到第一伺服器中的該主板管理控制器生成新的系統事件日誌時,判斷該第一伺服器的存儲單元是否已經被占滿;檢測模組,用於在判斷模組確定該第一伺服器中的存儲單元被占滿時,獲取預先存儲在該存儲單元中的作為備份存儲裝置的伺服器對應的識別字,並偵測存儲的識別字對應的伺服器中的存儲單元是否被占滿,並在確認的存儲單元沒有被占滿的伺服器中選擇一個伺服器作為暫存裝置;以及控制模組,用於將該主板管理控制器新生成的系統事件日誌通過通信單元發送至被確定為暫存裝置的伺服器的存儲單元中進行存儲。
一種系統事件日誌記錄方法,運行於一系統事件日誌記錄系統,該系統應用於一伺服器系統中的第一伺服器內,該第一伺服器與該伺服器系統中的其他伺服器通過通信單元進行通信,該第一伺服器包括一主板管理控制器,用於監測該第一伺服器在開關機過程中是否產生異常事件並根據異常事件的內容生成若干系統事件日誌,並將系統事件日誌存儲至存儲單元中。該方法包括:在偵測到該主板管理控制器生成新的系統事件日誌時,判斷該第一伺服器的存儲單元是否已經被占滿;若確定該存儲單元已經被占滿,則獲取該存儲單元中存儲的作為備份存儲裝置的伺服器對應的識別字,偵測這些識別字對應的伺服器中存儲單元是否被占滿,並確定存儲單元沒有被占滿的伺服器;在存儲單元沒有被占滿的伺服器中選擇一個伺服器作為暫存裝置;將主板管理控制器新生成的系統事件日誌通過通信單元發送至該被確定暫存裝置的伺服器的存儲單元中進行存儲。
本發明中的系統事件日誌記錄系統及方法,能夠使得在伺服器的存儲單元不能再繼續寫入系統事件日誌後,將該主板管理控制器新產生的系統事件日誌轉存至其他伺服器的存儲單元中,待該存儲單元被清空後再將該緩存模組的系統事件日誌寫入該存儲單元,從而有利於避免該存儲單元在存儲空間被占滿後不能繼續存儲系統事件日誌的問題。
圖1為本發明一實施方式中伺服器系統的功能模組示意圖。
圖2為本發明中系統事件日誌存儲方法流程圖。
下面結合附圖,對本發明中的系統事件日誌記錄系統及方法作進一步的詳細描述。
圖1為本發明一較佳實施方式中伺服器系統100的功能模組示意圖。該伺服器系統100中包括多個互相通信的伺服器200,其中,每台伺服器200均對應一唯一的識別字。在本實施方式中,每台伺服器200對應的唯一識別字可以是本機的固定IP位址,也可以是每台伺服器200的CPU序列號、記憶體條序列號等硬體識別碼。該系統事件日誌記錄系統300應用於每一台伺服器200中。
該伺服器系統100中每台伺服器的結構均相同,故下面僅以其中一台伺服器200a為例進行說明。該伺服器200a包括一主板管理控制器10(Baseboard Management Controller, BMC)、存儲單元20以及通信單元30。
該主板管理控制器10用於監測該伺服器200a在運行過程中是否產生異常事件並根據異常事件的內容生成若干系統事件日誌(System Event Log, SEL)。在本實施方式中,所述異常事件包括但並不局限於該伺服器1的實體記憶體、虛擬記憶體使用率占空比、CPU風扇轉速、CPU溫度、硬碟單位時間內吞吐量、硬碟剩餘空間、電源溫度和電源輸出電壓等專案發生的異常情況。
該存儲單元20用於存儲該主板管理控制器10生成的該些系統事件日誌。該存儲單元20中還存儲有作為該伺服器200a的備份存儲裝置的其他伺服器200對應的識別字,其中,該作為備份存儲裝置的其他伺服器200為該伺服器系統100中與該伺服器200a進行通信的伺服器200中的一台或多台。在本實施方式中,該作為備份存儲裝置的伺服器200可以是用戶通過該伺服器200a中的輸入單元(圖未示)進行手動輸入設置的,也可以是預先默認設置的。該在本實施方式中,該存儲單元20為非易失性記憶體(Non-Volatile Random Access Memory, NVRAM)。
該通信單元30用於與該伺服器系統100中的其他伺服器200進行通信。在本實施方式中,該通信單元30與其他伺服器200通過有線或無線的方式進行網路通信外,還可以通過智慧平臺管理匯流排(Intelligent Platform Management BUS, IPMB)等方式進行通信。
在本實施方式中,該系統事件日誌記錄系統300運行於該主板管理控制器10中,為該主板管理控制器10內部的程式。在其他實施方式中,該系統事件日誌記錄系統300存儲於一移動存儲裝置中,如移動硬碟、U盤中,其為一自動運行程式,用於當該移動存儲裝置連接至該伺服器200a後自動運行,使得該系統事件日誌記錄系統300中各個功能模組執行相應的功能。
在本實施方式中,該系統事件日誌記錄系統300包括判斷模組301、檢測模組302以及控制模組303。
該判斷模組301用於在偵測到該主板管理控制器10生成新的系統事件日誌時,判斷該存儲單元20是否已經被占滿。其中,該存儲單元20被占滿後不能繼續存儲新的系統時間日誌。
該控制模組303用於在該判斷模組301確定該存儲單元20沒有被占滿,將該主板管理控制器10新生成的系統事件日誌存儲至該存儲單元20中。
該檢測模組302用於在該判斷模組301確定該存儲單元20被占滿時,獲取該存儲單元20中存儲的作為備份存儲裝置的伺服器200對應的識別字,偵測這些識別字對應的伺服器200中存儲單元是否被占滿,確定沒有被占滿的伺服器200,並在存儲單元沒有被占滿的伺服器200中選擇一個作為暫存裝置。
在本實施方式中,該檢測模組302偵測作為備份存儲裝置的伺服器200的存儲單元是否被占滿的方法為:該檢測模組302生成一個包含有作為備份存儲裝置的伺服器200對應的識別字以及請求查看作為備份存儲裝置的伺服器200中的存儲單元是否被占滿請求的請求資訊;將該請求資訊發送至每個作為備份存儲裝置的伺服器200中,使得作為備份裝置的伺服器200接收到該請求資訊後,確認存儲單元是否被占滿,並將該確認結果回傳給該伺服器200a,其中該結果中包含有該伺服器200的識別字;該檢測模組302接收到作為備份存儲裝置的伺服器200回傳的結果後,確認這些作為備份存儲裝置的伺服器200中存儲單元沒有被占滿的伺服器200;然後在這些存儲單元沒有被占滿的伺服器200中選擇一個作為暫存裝置。在本實施方式中,該檢測模組302可以在這些確認存儲單元沒有被占滿的伺服器200中隨機選擇一個作為暫存裝置。在其他實施方式中,該存儲單元20中存儲的作為備份存儲裝置的伺服器200也可以按照一預定的順序進行排列,例如當識別字中含有數位時,按照該數位的大小順序對該作為備份存儲裝置的伺服器200進行排列,該檢測模組302在這些確認存儲單元沒有被占滿的伺服器200中選擇一個排在第一位或者最後一位的伺服器200作為暫存裝置。在其他實施方式中,該檢測模組302還可以按照伺服器200對應的識別字在存儲單元20中排列的順序依次向該識別字對應的伺服器200發送該請求資訊,當前一個識別字對應的伺服器200的存儲單元被占滿時,再向後一個識別字對應的伺服器200發送該請求資訊,直至找到存儲單元沒有被占滿的伺服器200,並將該伺服器200作為暫存裝置。
該控制模組303還用於在伺服器200a中的存儲單元20被占滿時,將主板管理控制器10新生成的系統事件日誌通過通信單元30發送至該被確定暫存裝置的伺服器200的存儲單元中進行存儲。
從而,在本實施方式中,在該伺服器200a本身的存儲單元20被占滿後,通過將該新生成的系統事件日誌存儲在其他伺服器200的存儲單元中,可以保證該新生成的系統事件日誌被存儲。
在本實施方式中,該控制模組303還回應用戶的操作清除該伺服器200a中的存儲單元20先前存儲的所有系統事件日誌。
該控制模組303還用於在清除伺服器200a的存儲單元20中先前存儲的系統事件日誌後,生成一回傳請求資訊並將該回傳請求資訊發送至該作為暫存裝置的伺服器200,使得該被作為暫存裝置的伺服器200接收到該回傳請求資訊後,將該伺服器200a暫存在該作為暫存裝置的伺服器200中的系統事件日誌回傳至該伺服器200a中,該控制模組303還將該回傳的系統事件日誌存儲至該伺服器200a的存儲單元中。
請參閱圖2,一種系統事件日誌記錄方法,應用於伺服器系統中的伺服器中,該伺服器系統中的伺服器之間能夠互相通信。該系統時間日誌記錄方法包括如下步驟:
步驟S201:該判斷模組301用於在偵測到該主板管理控制器10生成新的系統事件日誌時,判斷該伺服器200a的存儲單元20是否已經被占滿。若未占滿,則執行步驟S202;若已經被占滿,則執行步驟S203。
步驟S202:該控制模組303將該主板管理控制器10新生成的系統事件日誌存儲至該存儲單元20中。
步驟S203: 該檢測模組302獲取該存儲單元20中存儲的作為備份存儲裝置的伺服器200對應的識別字,並偵測這些識別字對應的伺服器200中存儲單元沒有被占滿的伺服器200。
步驟S204:該檢測模組302在存儲單元沒有被占滿的伺服器200中選擇一個伺服器200作為暫存裝置。
步驟S205:該控制模組303將主板管理控制器10新生成的系統事件日誌通過通信單元30發送至該被確定暫存裝置的伺服器200的存儲單元中進行存儲。
步驟S206:該控制模組303還回應用戶的操作而清除該伺服器200a中的存儲單元20先前存儲的所有系統事件日誌,並在將該該伺服器200a中的存儲單元20先前存儲的所有系統事件日誌清除後生成一回傳請求資訊並將該回傳請求資訊發送至該作為暫存裝置的伺服器200,使得該被作為暫存裝置的伺服器200接收到該回傳請求資訊後,將暫存在該作為暫存裝置的伺服器200中的系統事件日誌回傳至該伺服器200a中。
步驟S207:該控制模組303將該回傳的系統事件日誌存儲至該伺服器200a的存儲單元中。
儘管對本發明的優選實施方式進行了說明和描述,但是本領域的技術人員將領悟到,可以作出各種不同的變化和改進,這些都不超出本發明的真正範圍。因此期望,本發明並不局限於所公開的作為實現本發明所設想的最佳模式的具體實施方式,本發明包括的所有實施方式都有所附權利要求書的保護範圍內。
100‧‧‧伺服器系統
200、200a‧‧‧伺服器
10‧‧‧主板管理控制器
20‧‧‧存儲單元
30‧‧‧通信單元
300‧‧‧系統事件日誌記錄系統
301‧‧‧判斷模組
302‧‧‧檢測模組
303‧‧‧控制模組
100‧‧‧伺服器系統
200、200a‧‧‧伺服器
10‧‧‧主板管理控制器
20‧‧‧存儲單元
30‧‧‧通信單元
300‧‧‧系統事件日誌記錄系統
301‧‧‧判斷模組
302‧‧‧檢測模組
303‧‧‧控制模組

Claims (12)

  1. 一種系統事件日誌記錄系統,應用於一伺服器系統中的一第一伺服器內,該第一伺服器與該伺服器系統中的其他伺服器之間通過通信單元互相通信,其中,該伺服器系統中的每個伺服器均對應一唯一識別字,該第一伺服器包括一主板管理控制器,用於監測該第一伺服器在開關機過程中是否產生異常事件,並根據異常事件的內容生成若干系統事件日誌,並將該系統事件日誌存儲至存儲單元中,其改良在於,該系統事件日誌記錄系統包括:
    判斷模組,用於在偵測到第一伺服器中的該主板管理控制器生成新的系統事件日誌時,判斷該第一伺服器的存儲單元是否已經被占滿;
    檢測模組,用於在判斷模組確定該第一伺服器中的存儲單元被占滿時,獲取預先存儲在該存儲單元中的作為備份存儲裝置的伺服器對應的識別字,並偵測存儲的識別字對應的伺服器中的存儲單元是否被占滿,並在確認的存儲單元沒有被占滿的伺服器中選擇一個伺服器作為暫存裝置;以及
    控制模組,用於將該主板管理控制器新生成的系統事件日誌通過通信單元發送至被確定為暫存裝置的伺服器的存儲單元中進行存儲。
  2. 如申請專利範圍第1項所述之系統事件日誌記錄系統,其中,該控制模組還用於回應用戶的操作而清除該第一伺服器中的存儲單元先前存儲的所有系統事件日誌,並在將該第一伺服器中的存儲單元中先前存儲的所有系統事件日誌清除後,生成一回傳請求資訊並通過通信單元將該回傳請求資訊發送至該被作為暫存裝置的伺服器,使得該被作為暫存裝置的伺服器接收到該回傳請求資訊後,將暫存在該被作為暫存裝置的伺服器中的系統事件日誌回傳至該第一伺服器中,然後該控制模組將該回傳的系統事件日誌存儲至該第一伺服器的存儲單元中。
  3. 如申請專利範圍第1項所述之系統事件日誌記錄系統,其中,該控制模組還用於在該判斷模組確定該第一伺服器的存儲單元沒有被占滿時,將該主板管理控制器新生成的系統事件日誌存儲至該存儲單元中。
  4. 如申請專利範圍第1項所述之系統事件日誌記錄系統,其中,該檢測模組偵測作為備份存儲裝置的伺服器的存儲單元是否被占滿的方法為:該檢測模組生成一個包含有作為備份存儲裝置的伺服器對應的識別字以及請求查看作為備份存儲裝置的伺服器中的存儲單元是否被占滿請求的請求資訊;通過通信單元將該請求資訊發送至每個作為備份存儲裝置的伺服器中,使得作為備份裝置的伺服器接收到該請求資訊後,確認存儲單元是否被占滿並將確認結果回傳給該第一伺服器,其中該結果中包含有該作為備份存儲裝置的伺服器的識別字;該檢測模組接收到作為備份存儲裝置的伺服器回傳的結果後,確認這些作為備份存儲裝置的伺服器中存儲單元沒有被占滿的伺服器,然後在這些存儲單元沒有被占滿的伺服器中選擇一個作為暫存裝置。
  5. 如申請專利範圍第4項所述之系統事件日誌記錄系統,其中,該檢測模組在這些確認存儲單元沒有被占滿的伺服器中隨機選擇一個作為暫存裝置。
  6. 如申請專利範圍第4項所述之系統事件日誌記錄系統,其中,該存儲單元中存儲的作為備份存儲裝置的伺服器按照一預定的順序進行排列,該檢測模組在這些確認存儲單元沒有被占滿的伺服器中選擇排在第一位的伺服器作為暫存裝置。
  7. 如申請專利範圍第1項所述之系統事件日誌記錄系統,其中,該存儲單元中存儲的作為備份存儲裝置的伺服器按照一預定的順序進行排列,該檢測模組按照伺服器對應的識別字在存儲單元中排列的順序依次向該識別字對應的伺服器發送該請求資訊,當前一個識別字對應的伺服器確認存儲單元被占滿時,再向後一個識別字對應的伺服器發送請求資訊,直至找到存儲單元沒有被占滿的伺服器,並將該伺服器作為暫存裝置。
  8. 如申請專利範圍第1項所述之系統事件日誌記錄系統,其中,該系統事件日誌記錄系統運行於該主板管理控制器內部。
  9. 如申請專利範圍第1項所述之系統事件日誌記錄系統,其中,該系統事件日誌記錄系統存儲於一移動存儲裝置中,其為一自動運行程式,當該移動存儲裝置連接至該伺服器後自動運行。
  10. 一種系統事件日誌記錄方法,運行於一系統事件日誌記錄系統,該系統應用於一伺服器系統中的第一伺服器內,該第一伺服器與該伺服器系統中的其他伺服器通過通信單元進行通信,該第一伺服器包括一主板管理控制器,用於監測該第一伺服器在開關機過程中是否產生異常事件並根據異常事件的內容生成若干系統事件日誌,並將系統事件日誌存儲至存儲單元中,其中,該方法包括:
    在偵測到該主板管理控制器生成新的系統事件日誌時,判斷該第一伺服器的存儲單元是否已經被占滿;
    若確定該存儲單元已經被占滿,則獲取該存儲單元中存儲的作為備份存儲裝置的伺服器對應的識別字,偵測這些識別字對應的伺服器中存儲單元是否被占滿,並確定存儲單元沒有被占滿的伺服器;
    在存儲單元沒有被占滿的伺服器中選擇一個伺服器作為暫存裝置;
    將主板管理控制器新生成的系統事件日誌通過通信單元發送至該被確定暫存裝置的伺服器的存儲單元中進行存儲。
  11. 如申請專利範圍第10項所述之系統事件日誌記錄方法,其中,該方法還包括:
    回應用戶的操作而清除該第一伺服器的存儲單元中先前存儲的所有系統事件日誌;
    在將該第一伺服器的存儲單元中先前存儲的所有系統事件日誌清除後,生成一回傳請求資訊並將該回傳請求資訊發送至該作為暫存裝置的伺服器,使得該被作為暫存裝置的伺服器接收到該回傳請求資訊後,將暫存在該作為暫存裝置的伺服器中的系統事件日誌回傳至該第一伺服器;以及
    將該回傳的系統事件日誌存儲至該第一伺服器的存儲單元中。
  12. 如申請專利範圍第10項所述之系統事件日誌記錄方法,其中,偵測作為備份存儲裝置的伺服器的存儲單元是否被占滿的方法為:生成一個包含有作為備份存儲裝置的伺服器對應的識別字以及請求查看作為備份存儲裝置的伺服器中的存儲單元是否被占滿請求的請求資訊;通過通信單元將該請求資訊發送至每個作為備份存儲裝置的伺服器中,使得作為備份裝置的伺服器接收到該請求資訊後,確認存儲單元是否被占滿並將確認結果回傳給該第一伺服器,其中該結果中包含有該作為備份存儲裝置的伺服器的識別字;接收到作為備份存儲裝置的伺服器回傳的結果後,確認這些作為備份存儲裝置的伺服器中存儲單元沒有被占滿的伺服器,然後在這些存儲單元沒有被占滿的伺服器中選擇一個作為暫存裝置。
TW102148428A 2013-12-26 2013-12-26 系統事件日誌記錄系統及方法 TW201525682A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW102148428A TW201525682A (zh) 2013-12-26 2013-12-26 系統事件日誌記錄系統及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW102148428A TW201525682A (zh) 2013-12-26 2013-12-26 系統事件日誌記錄系統及方法

Publications (1)

Publication Number Publication Date
TW201525682A true TW201525682A (zh) 2015-07-01

Family

ID=54197634

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102148428A TW201525682A (zh) 2013-12-26 2013-12-26 系統事件日誌記錄系統及方法

Country Status (1)

Country Link
TW (1) TW201525682A (zh)

Similar Documents

Publication Publication Date Title
JP5370897B2 (ja) リモート・ダイレクト・ストレージ・アクセス
TWI684864B (zh) 管理輸入輸出可虛擬化儲存裝置中之功能級重置
US9875094B2 (en) Microcode upgrade in a storage system
US20140201356A1 (en) Monitoring system of managing cloud-based hosts and monitoring method using for the same
US9588542B2 (en) Rack server system and method for automatically managing rack configuration information
US9983647B2 (en) Battery management system
TW201828071A (zh) 開關裝置及偵測積體電路匯流排之方法
TW201616371A (zh) 擷取控制台訊息的系統及其方法及非暫態電腦可讀媒體
TW201506613A (zh) 固件檢測系統及方法
CN113287094A (zh) 以容错性进行存储器组件的测试
CN106055435A (zh) 在部署时验证存储介质
CN114868117A (zh) 通过控制总线进行的对等存储设备消息传送
JP2015148861A (ja) 情報処理システム及びプログラム管理方法
US20140372745A1 (en) Booting a server using a remote read-only memory image
TWI553490B (zh) 遠端系統配置管理方法、遠端系統配置管理系統及非暫態電腦可讀式儲存多媒體
US10896046B2 (en) Management processor using code from peripheral device
US20180004268A1 (en) Information processing system, information processing apparatus, location identification method, and non-transitory computer-readable storage medium
US11126486B2 (en) Prediction of power shutdown and outage incidents
TW201523277A (zh) 伺服器系統與節點偵測方法
TW201525682A (zh) 系統事件日誌記錄系統及方法
TW201335754A (zh) 具有資料同步存儲功能的電子裝置及方法
TW201440478A (zh) Ip位址自動分配方法及系統
TW201327144A (zh) 雲端伺服系統的管理方法
US11971771B2 (en) Peer storage device messaging for power management
CN104753698A (zh) 系统事件日志记录系统及方法