TWI587128B - 用於電腦裝置的錯誤狀態資料自動提供方法 - Google Patents

用於電腦裝置的錯誤狀態資料自動提供方法 Download PDF

Info

Publication number
TWI587128B
TWI587128B TW105114515A TW105114515A TWI587128B TW I587128 B TWI587128 B TW I587128B TW 105114515 A TW105114515 A TW 105114515A TW 105114515 A TW105114515 A TW 105114515A TW I587128 B TWI587128 B TW I587128B
Authority
TW
Taiwan
Prior art keywords
status data
error status
error
control system
management control
Prior art date
Application number
TW105114515A
Other languages
English (en)
Other versions
TW201740272A (zh
Inventor
郭明義
Original Assignee
神雲科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 神雲科技股份有限公司 filed Critical 神雲科技股份有限公司
Priority to TW105114515A priority Critical patent/TWI587128B/zh
Priority to US15/437,755 priority patent/US10498592B2/en
Application granted granted Critical
Publication of TWI587128B publication Critical patent/TWI587128B/zh
Publication of TW201740272A publication Critical patent/TW201740272A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • G06F11/3082Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved by aggregating or compressing the monitored data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Debugging And Monitoring (AREA)

Description

用於電腦裝置的錯誤狀態資料自動提供方法
本發明是有關於電腦裝置的錯誤狀態資料,特別是指一種用於電腦裝置的錯誤狀態資料自動提供方法。
目前作為伺服器使用的一電腦裝置通常包括一基板管理控制系統(baseboard management control system),該基板管理控制系統被用來提供該電腦裝置的錯誤狀態資料,以協助管理者管控此電腦裝置。
管理者須時常利用一管理端傳送一對於該基板管理控制系統所儲存的錯誤狀態資料之請求至該基板管理控制系統,以獲得該電腦裝置的錯誤狀態資料。該基板管理控制系統係被動地因應該管理端之請求而傳送該錯誤狀態資料至該管理端,當管理者利用該管理端傳送該請求的時間週期越長,則管理者即無法及時地查看該錯誤狀態資料,以及時地修復該電腦裝置。
因此,本發明之目的,即在提供一種自動提供錯誤狀態資料的錯誤狀態資料自動提供方法。
於是,本發明錯誤狀態資料自動提供方法,藉由一電腦裝置所包括的一基板管理控制系統來實施,該電腦裝置還包括一電連接該基板管理控制系統的中央處理單元,該錯誤狀態資料自動提供方法包含以下步驟。
(A)讀取該中央處理單所儲存且與該電腦裝置相關的錯誤狀態資料;(B)判定該錯誤狀態資料是否含有多個特定錯誤的至少一者;及(C)當判定出該錯誤狀態資料含有該至少一特定錯誤時,經由一通訊網路將該錯誤狀態資料傳送至一經由該通訊網路連接該基板管理控制系統的管理端。
本發明之功效在於:藉由該基板管理控制系統判定該錯誤狀態資料是否含有該至少一特定錯誤,並在判定出該錯誤狀態資料含有該至少一特定錯誤時,將該錯誤狀態資料傳送至該管理端,藉此,該錯誤狀態資料可自動地傳送至該管理端,而非被動地因應該管理端之請求而傳送至該管理端。
1‧‧‧電腦裝置
11‧‧‧基板管理控制系統
111‧‧‧非揮發性記憶模組
112‧‧‧通訊模組
113‧‧‧處理模組
12‧‧‧中央處理單元
13‧‧‧記憶單元
14‧‧‧週邊元件互連單元
2‧‧‧管理端
100‧‧‧通訊網路
31~34‧‧‧步驟
本發明之其他的特徵及功效,將於參照圖式的實施方式中清楚地呈現,其中:圖1是一方塊圖,說明執行本發明錯誤狀態資料自動提供方法之實施例的一電腦裝置所包括的一基板管理控制系統電連接該電腦裝置所包括的一中央處理單元,並經由一通訊網路連接一管理端;及圖2是一流程圖,說明本發明錯誤狀態資料自動提供方法之實施例。
參閱圖1,本發明錯誤狀態資料自動提供方法之實施例,藉由一電腦裝置1所包括的一基板管理控制系統11來實施。該基板管理控制系統11經由一通訊網路100連接一管理端2。該電腦裝置1還包括一電連接該基板管理控制系統11的中央處理單元12、一電連接該中央處理單元12的記憶單元13,及一電連接該中央處理單元12的週邊元件互連(Peripheral Component Interconnect,簡稱PCI)單元14。在本實施例中,該電腦裝置1例如為一伺服器,且該基板管理控制系統11例如包括一非揮發性記憶模組111、一連接該通訊網路100的通訊模組112、及一電連接該非 揮發性記憶模組111與該通訊模組112的處理模組113,且該中央處理單元12例如為一Intel公司所生產的處理器,且該週邊元件互連單元14例如為一使用PCI之硬體。該管理端2例如為一系統日誌伺服器(System Log Server)
參閱圖1與圖2,本發明錯誤狀態資料自動提供方法之實施例包含以下步驟。
在步驟31中,該基板管理控制系統11的處理模組113經由一平台環境控制介面(Platform Environmental Control Interface,簡稱PECI)讀取該中央處理單元12之內部暫存器(圖未示)中所儲存的錯誤狀態資料,其中該錯誤狀態資料與該電腦裝置1相關。在本實施例中,該錯誤狀態資料包含機器檢查架構錯誤狀態資料。
在步驟32中,該基板管理控制系統11的處理模組113判定該錯誤狀態資料是否含有多個特定錯誤的至少一者。該等特定錯誤包含相關於該中央處理單元12的異常狀態、相關於該記憶單元13的錯誤,及相關於該週邊元件互連單元14的錯誤之錯誤種類的其中至少一者。當判定出該錯誤狀態資料含有該至少一特定錯誤時,流程進行至步驟33。否則,流程進行至步驟34。
在步驟33中,該基板管理控制系統11的處理模組113壓縮該錯誤狀態資料、相關於該基板管理控制系統11的基板管理控 制系統識別資料,及指示出該基板管理控制系統11讀取到該錯誤狀態資料之讀取時間的讀取時間資料,以產生一包括該錯誤狀態資料、該基板管理控制系統識別資料,及該讀取時間資料的壓縮檔,且儲存該壓縮檔於該非揮發性記憶模組111,並經由該通訊網路100傳送該壓縮檔至該管理端2。在本實施例中,該基板管理控制系統11的處理模組113將先前已儲存於該非揮發性記憶模組111之先前壓縮的壓縮檔更新為目前壓縮的該壓縮檔,以儲存目前壓縮的該壓縮檔。在該基板管理控制系統11的處理模組113傳送該壓縮檔至該管理端2後,流程繼續執行步驟31。
在步驟34中,該基板管理控制系統11的處理模組113計數一預設時間期間後,繼續執行步驟31。
當該基板管理控制系統11的處理模組113判定出該錯誤狀態資料不含有該至少一特定錯誤時,該基板管理控制系統11的處理模組113計數該預設時間期間如,3秒後,即會重覆步驟31~步驟33一次或重覆步驟31、步驟32及步驟34一次,當該基板管理控制系統11的處理模組113判定出該錯誤狀態資料含有該至少一特定錯誤時,該基板管理控制系統11的處理模組113即會經由該通訊網路100傳送該壓縮檔至該管理端2,並重覆步驟31~步驟33一次或重覆步驟31、步驟32及步驟34一次,藉此,管理者即可及時地查看該錯誤狀態資料,以及時地修復該電腦裝置1。
值得一提的是,該管理端2可用於接收來自多台電腦裝置之基板管理控制系統且分別對應於該等電腦裝置的多筆錯誤狀態資料,因此,該管理端2所接收到的每一壓縮檔除了包括錯誤狀態資料之外,還包括對應於該錯誤狀態資料的基板管理控制系統識別資料,以使得管理者可得知該錯誤狀態資料與該電腦裝置1之基板管理控制系統11的對應關係。此外,該管理端2所接收到的每一壓縮檔更包括對應該錯誤狀態資料的讀取時間資料,藉此,管理者可得知該基板管理控制系統11讀取到含有該至少一特定錯誤之該錯誤狀態資料的讀取時間,而該讀取時間資料所指示出的讀取時間近似於該電腦裝置1發生異常的時間。然而,在本發明的其他實施例中,該基板管理控制系統11的處理模組113亦可傳送僅包括該錯誤狀態資料的壓縮檔至該管理端2,並不以此為限。
綜上所述,本發明錯誤狀態資料自動提供方法,藉由該基板管理控制系統11判定該錯誤狀態資料是否含有該至少一特定錯誤,並在判定出該錯誤狀態資料含有該至少一特定錯誤時,自動將該錯誤狀態資料傳送至該管理端2,藉此,管理者不須時時刻刻地利用該管理端2傳送對於該基板管理控制系統11所儲存的該錯誤狀態資料之一請求至該基板管理控制系統11。此外,該基板管理控制系統11判定該錯誤狀態資料是否含有該至少一特定錯誤的次數越頻繁,該管理端2即可及時地接收到含有該至少一特定錯誤的 錯誤狀態資料,以使得管理者可及時地修復該電腦裝置1,故確實能達成本發明之目的。
惟以上所述者,僅為本發明之實施例而已,當不能以此限定本發明實施之範圍,凡是依本發明申請專利範圍及專利說明書內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。
31~34‧‧‧步驟

Claims (8)

  1. 一種錯誤狀態資料自動提供方法,藉由一電腦裝置所包括的一基板管理控制系統來實施,該電腦裝置還包括一電連接該基板管理控制系統的中央處理單元,該錯誤狀態資料自動提供方法包含以下步驟:(A)讀取該中央處理單元所儲存且與該電腦裝置相關的錯誤狀態資料;(B)判定該錯誤狀態資料是否含有多個特定錯誤的至少一者;及(C)當判定出該錯誤狀態資料含有該至少一特定錯誤時,經由一通訊網路將該錯誤狀態資料傳送至一經由該通訊網路連接該基板管理控制系統的管理端。
  2. 如請求項1所述的錯誤狀態資料自動提供方法,其中,在步驟(C)中,當判定出該錯誤狀態資料含有該至少一特定錯誤時,該基板管理控制系統還儲存該錯誤狀態資料。
  3. 如請求項2所述的錯誤狀態資料自動提供方法,其中,在步驟(C)中,當判定出該錯誤狀態資料含有該至少一特定錯誤時,該基板管理控制系統壓縮該錯誤狀態資料以產生一包括該錯誤狀態資料的壓縮檔,且儲存該壓縮檔,並傳送該壓縮檔至該管理端。
  4. 如請求項1所述的錯誤狀態資料自動提供方法,其中,在步驟(C)中,當判定出該錯誤狀態資料含有該至少一特定錯誤時,該基板管理控制系統還傳送相關於該基板管理控 制系統的基板管理控制系統識別資料,及指示出該錯誤狀態資料之讀取時間的讀取時間資料至該管理端。
  5. 如請求項4所述的錯誤狀態資料自動提供方法,其中,在步驟(C)中,當判定出該錯誤狀態資料含有該至少一特定錯誤時,該基板管理控制系統壓縮該錯誤狀態資料、該基板管理控制系統識別資料,及該讀取時間資料以產生一包括該錯誤狀態資料、該基板管理控制系統識別資料,及該讀取時間資料的壓縮檔,且儲存該壓縮檔,並傳送該壓縮檔至該管理端。
  6. 如請求項1所述的錯誤狀態資料自動提供方法,其中,在步驟(A)中,該錯誤狀態資料包含機器檢查架構錯誤狀態(Machine Check Architecture error status)資料,在步驟(B)中,該等特定錯誤包含相關於該中央處理單元的異常狀態、相關於該電腦裝置之一記憶單元的錯誤,及相關於該電腦裝置之一週邊元件互連單元的錯誤之錯誤種類的其中至少一者。
  7. 如請求項1所述的錯誤狀態資料自動提供方法,在步驟(B)之後,還包含一步驟(D),當判定出該錯誤狀態資料不含該至少一特定錯誤時,該基板管理控制系統計數一預設時間期間後,重複步驟(A)至步驟(B)一次。
  8. 如請求項1所述的錯誤狀態資料提供方法,在步驟(C)之後還包含一步驟(E),重覆步驟(A)至步驟(B)一次。
TW105114515A 2016-05-11 2016-05-11 用於電腦裝置的錯誤狀態資料自動提供方法 TWI587128B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW105114515A TWI587128B (zh) 2016-05-11 2016-05-11 用於電腦裝置的錯誤狀態資料自動提供方法
US15/437,755 US10498592B2 (en) 2016-05-11 2017-02-21 Method and baseboard management control system for automatically providing error status data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW105114515A TWI587128B (zh) 2016-05-11 2016-05-11 用於電腦裝置的錯誤狀態資料自動提供方法

Publications (2)

Publication Number Publication Date
TWI587128B true TWI587128B (zh) 2017-06-11
TW201740272A TW201740272A (zh) 2017-11-16

Family

ID=59688290

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105114515A TWI587128B (zh) 2016-05-11 2016-05-11 用於電腦裝置的錯誤狀態資料自動提供方法

Country Status (2)

Country Link
US (1) US10498592B2 (zh)
TW (1) TWI587128B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100192029A1 (en) * 2009-01-29 2010-07-29 Dell Products L.P. Systems and Methods for Logging Correctable Memory Errors
TW201118564A (en) * 2009-11-18 2011-06-01 Aten Int Co Ltd Server management system and method thereof
TW201505400A (zh) * 2013-07-26 2015-02-01 Inventec Corp 伺服器系統和其資料傳送方法
TW201516665A (zh) * 2013-08-30 2015-05-01 Hon Hai Prec Ind Co Ltd 伺服器之系統錯誤資訊偵測系統及方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6170067B1 (en) * 1997-05-13 2001-01-02 Micron Technology, Inc. System for automatically reporting a system failure in a server
US7124329B2 (en) * 2003-09-26 2006-10-17 International Business Machines Corporation Implementing memory failure analysis in a data processing system
US20080125984A1 (en) * 2006-09-25 2008-05-29 Veselin Skendzic Spatially Assisted Fault Reporting Method, System and Apparatus
US20090144699A1 (en) * 2007-11-30 2009-06-04 Anton Fendt Log file analysis and evaluation tool
US8024609B2 (en) * 2009-06-03 2011-09-20 International Business Machines Corporation Failure analysis based on time-varying failure rates
CN102467440A (zh) * 2010-11-09 2012-05-23 鸿富锦精密工业(深圳)有限公司 内存错误检测系统及方法
TW201417536A (zh) * 2012-10-24 2014-05-01 Hon Hai Prec Ind Co Ltd 伺服器自動管理方法及系統
US9680712B2 (en) * 2014-07-01 2017-06-13 American Megatrends, Inc. Hardware management and control of computer components through physical layout diagrams
US9489274B2 (en) * 2014-12-17 2016-11-08 American Megatrends, Inc. System and method for performing efficient failover and virtual machine (VM) migration in virtual desktop infrastructure (VDI)
US9954727B2 (en) * 2015-03-06 2018-04-24 Quanta Computer Inc. Automatic debug information collection
US10333771B2 (en) * 2015-10-14 2019-06-25 Quanta Computer Inc. Diagnostic monitoring techniques for server systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100192029A1 (en) * 2009-01-29 2010-07-29 Dell Products L.P. Systems and Methods for Logging Correctable Memory Errors
TW201118564A (en) * 2009-11-18 2011-06-01 Aten Int Co Ltd Server management system and method thereof
TW201505400A (zh) * 2013-07-26 2015-02-01 Inventec Corp 伺服器系統和其資料傳送方法
TW201516665A (zh) * 2013-08-30 2015-05-01 Hon Hai Prec Ind Co Ltd 伺服器之系統錯誤資訊偵測系統及方法

Also Published As

Publication number Publication date
US10498592B2 (en) 2019-12-03
TW201740272A (zh) 2017-11-16
US20170331675A1 (en) 2017-11-16

Similar Documents

Publication Publication Date Title
US9710255B1 (en) Updating system of firmware of complex programmable logic device and updating method thereof
TW201709081A (zh) 自動修復映像檔的方法及伺服器系統
US9588542B2 (en) Rack server system and method for automatically managing rack configuration information
CN105281937B (zh) 服务器、服务管理系统及服务管理方法
US9888084B2 (en) Automatic network domain diagnostic repair and mapping
CN108880897A (zh) 服务器的验收方法、装置、计算机设备及存储介质
CN106547645B (zh) 自动修复映像档的方法及服务器系统
US20130198362A1 (en) System for Identifying a Server to be Decommissioned
KR20160023873A (ko) 하드웨어 관리 통신 프로토콜
CN111586022A (zh) 防火墙开墙验证方法、电子装置、计算机设备及存储介质
CN107181606B (zh) 用于控制网络节点的方法和装置
CN105357267A (zh) 一种获取服务器信息的方法、装置及系统
CN107430391B (zh) 管理系统
TWI587128B (zh) 用於電腦裝置的錯誤狀態資料自動提供方法
CN110096414A (zh) 一种服务器监控方法、装置、设备及介质
TWI497319B (zh) 基板管理控制器的更新方法
CN115454896A (zh) 基于smbus的ssd mctp控制消息验证方法、装置、计算机设备及存储介质
CN105321058B (zh) 用于查找设备的方法和终端以及待查找设备
CN113032054A (zh) 一种服务执行方法、装置、存储介质及电子装置
CN110096412A (zh) 一种服务器监控方法、装置、设备及介质
WO2018121353A1 (zh) 数据通路的测试方法、测试服务器及测试系统
TWI602054B (zh) 用於電腦裝置的錯誤狀態資料提供方法
US20180232331A1 (en) Server system, fabric card and method for allocating ip address
CN109039770A (zh) 一种服务器cmc的刷新方法、装置及相关设备
CN109271188A (zh) 一种cpld升级方法及相关装置