TWI587128B - 用於電腦裝置的錯誤狀態資料自動提供方法 - Google Patents
用於電腦裝置的錯誤狀態資料自動提供方法 Download PDFInfo
- Publication number
- TWI587128B TWI587128B TW105114515A TW105114515A TWI587128B TW I587128 B TWI587128 B TW I587128B TW 105114515 A TW105114515 A TW 105114515A TW 105114515 A TW105114515 A TW 105114515A TW I587128 B TWI587128 B TW I587128B
- Authority
- TW
- Taiwan
- Prior art keywords
- status data
- error status
- error
- control system
- management control
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
- G06F11/3072—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
- G06F11/3082—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved by aggregating or compressing the monitored data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/06—Generation of reports
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Debugging And Monitoring (AREA)
Description
本發明是有關於電腦裝置的錯誤狀態資料,特別是指一種用於電腦裝置的錯誤狀態資料自動提供方法。
目前作為伺服器使用的一電腦裝置通常包括一基板管理控制系統(baseboard management control system),該基板管理控制系統被用來提供該電腦裝置的錯誤狀態資料,以協助管理者管控此電腦裝置。
管理者須時常利用一管理端傳送一對於該基板管理控制系統所儲存的錯誤狀態資料之請求至該基板管理控制系統,以獲得該電腦裝置的錯誤狀態資料。該基板管理控制系統係被動地因應該管理端之請求而傳送該錯誤狀態資料至該管理端,當管理者利用該管理端傳送該請求的時間週期越長,則管理者即無法及時地查看該錯誤狀態資料,以及時地修復該電腦裝置。
因此,本發明之目的,即在提供一種自動提供錯誤狀態資料的錯誤狀態資料自動提供方法。
於是,本發明錯誤狀態資料自動提供方法,藉由一電腦裝置所包括的一基板管理控制系統來實施,該電腦裝置還包括一電連接該基板管理控制系統的中央處理單元,該錯誤狀態資料自動提供方法包含以下步驟。
(A)讀取該中央處理單所儲存且與該電腦裝置相關的錯誤狀態資料;(B)判定該錯誤狀態資料是否含有多個特定錯誤的至少一者;及(C)當判定出該錯誤狀態資料含有該至少一特定錯誤時,經由一通訊網路將該錯誤狀態資料傳送至一經由該通訊網路連接該基板管理控制系統的管理端。
本發明之功效在於:藉由該基板管理控制系統判定該錯誤狀態資料是否含有該至少一特定錯誤,並在判定出該錯誤狀態資料含有該至少一特定錯誤時,將該錯誤狀態資料傳送至該管理端,藉此,該錯誤狀態資料可自動地傳送至該管理端,而非被動地因應該管理端之請求而傳送至該管理端。
1‧‧‧電腦裝置
11‧‧‧基板管理控制系統
111‧‧‧非揮發性記憶模組
112‧‧‧通訊模組
113‧‧‧處理模組
12‧‧‧中央處理單元
13‧‧‧記憶單元
14‧‧‧週邊元件互連單元
2‧‧‧管理端
100‧‧‧通訊網路
31~34‧‧‧步驟
本發明之其他的特徵及功效,將於參照圖式的實施方式中清楚地呈現,其中:圖1是一方塊圖,說明執行本發明錯誤狀態資料自動提供方法之實施例的一電腦裝置所包括的一基板管理控制系統電連接該電腦裝置所包括的一中央處理單元,並經由一通訊網路連接一管理端;及圖2是一流程圖,說明本發明錯誤狀態資料自動提供方法之實施例。
參閱圖1,本發明錯誤狀態資料自動提供方法之實施例,藉由一電腦裝置1所包括的一基板管理控制系統11來實施。該基板管理控制系統11經由一通訊網路100連接一管理端2。該電腦裝置1還包括一電連接該基板管理控制系統11的中央處理單元12、一電連接該中央處理單元12的記憶單元13,及一電連接該中央處理單元12的週邊元件互連(Peripheral Component Interconnect,簡稱PCI)單元14。在本實施例中,該電腦裝置1例如為一伺服器,且該基板管理控制系統11例如包括一非揮發性記憶模組111、一連接該通訊網路100的通訊模組112、及一電連接該非
揮發性記憶模組111與該通訊模組112的處理模組113,且該中央處理單元12例如為一Intel公司所生產的處理器,且該週邊元件互連單元14例如為一使用PCI之硬體。該管理端2例如為一系統日誌伺服器(System Log Server)
參閱圖1與圖2,本發明錯誤狀態資料自動提供方法之實施例包含以下步驟。
在步驟31中,該基板管理控制系統11的處理模組113經由一平台環境控制介面(Platform Environmental Control Interface,簡稱PECI)讀取該中央處理單元12之內部暫存器(圖未示)中所儲存的錯誤狀態資料,其中該錯誤狀態資料與該電腦裝置1相關。在本實施例中,該錯誤狀態資料包含機器檢查架構錯誤狀態資料。
在步驟32中,該基板管理控制系統11的處理模組113判定該錯誤狀態資料是否含有多個特定錯誤的至少一者。該等特定錯誤包含相關於該中央處理單元12的異常狀態、相關於該記憶單元13的錯誤,及相關於該週邊元件互連單元14的錯誤之錯誤種類的其中至少一者。當判定出該錯誤狀態資料含有該至少一特定錯誤時,流程進行至步驟33。否則,流程進行至步驟34。
在步驟33中,該基板管理控制系統11的處理模組113壓縮該錯誤狀態資料、相關於該基板管理控制系統11的基板管理控
制系統識別資料,及指示出該基板管理控制系統11讀取到該錯誤狀態資料之讀取時間的讀取時間資料,以產生一包括該錯誤狀態資料、該基板管理控制系統識別資料,及該讀取時間資料的壓縮檔,且儲存該壓縮檔於該非揮發性記憶模組111,並經由該通訊網路100傳送該壓縮檔至該管理端2。在本實施例中,該基板管理控制系統11的處理模組113將先前已儲存於該非揮發性記憶模組111之先前壓縮的壓縮檔更新為目前壓縮的該壓縮檔,以儲存目前壓縮的該壓縮檔。在該基板管理控制系統11的處理模組113傳送該壓縮檔至該管理端2後,流程繼續執行步驟31。
在步驟34中,該基板管理控制系統11的處理模組113計數一預設時間期間後,繼續執行步驟31。
當該基板管理控制系統11的處理模組113判定出該錯誤狀態資料不含有該至少一特定錯誤時,該基板管理控制系統11的處理模組113計數該預設時間期間如,3秒後,即會重覆步驟31~步驟33一次或重覆步驟31、步驟32及步驟34一次,當該基板管理控制系統11的處理模組113判定出該錯誤狀態資料含有該至少一特定錯誤時,該基板管理控制系統11的處理模組113即會經由該通訊網路100傳送該壓縮檔至該管理端2,並重覆步驟31~步驟33一次或重覆步驟31、步驟32及步驟34一次,藉此,管理者即可及時地查看該錯誤狀態資料,以及時地修復該電腦裝置1。
值得一提的是,該管理端2可用於接收來自多台電腦裝置之基板管理控制系統且分別對應於該等電腦裝置的多筆錯誤狀態資料,因此,該管理端2所接收到的每一壓縮檔除了包括錯誤狀態資料之外,還包括對應於該錯誤狀態資料的基板管理控制系統識別資料,以使得管理者可得知該錯誤狀態資料與該電腦裝置1之基板管理控制系統11的對應關係。此外,該管理端2所接收到的每一壓縮檔更包括對應該錯誤狀態資料的讀取時間資料,藉此,管理者可得知該基板管理控制系統11讀取到含有該至少一特定錯誤之該錯誤狀態資料的讀取時間,而該讀取時間資料所指示出的讀取時間近似於該電腦裝置1發生異常的時間。然而,在本發明的其他實施例中,該基板管理控制系統11的處理模組113亦可傳送僅包括該錯誤狀態資料的壓縮檔至該管理端2,並不以此為限。
綜上所述,本發明錯誤狀態資料自動提供方法,藉由該基板管理控制系統11判定該錯誤狀態資料是否含有該至少一特定錯誤,並在判定出該錯誤狀態資料含有該至少一特定錯誤時,自動將該錯誤狀態資料傳送至該管理端2,藉此,管理者不須時時刻刻地利用該管理端2傳送對於該基板管理控制系統11所儲存的該錯誤狀態資料之一請求至該基板管理控制系統11。此外,該基板管理控制系統11判定該錯誤狀態資料是否含有該至少一特定錯誤的次數越頻繁,該管理端2即可及時地接收到含有該至少一特定錯誤的
錯誤狀態資料,以使得管理者可及時地修復該電腦裝置1,故確實能達成本發明之目的。
惟以上所述者,僅為本發明之實施例而已,當不能以此限定本發明實施之範圍,凡是依本發明申請專利範圍及專利說明書內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。
31~34‧‧‧步驟
Claims (8)
- 一種錯誤狀態資料自動提供方法,藉由一電腦裝置所包括的一基板管理控制系統來實施,該電腦裝置還包括一電連接該基板管理控制系統的中央處理單元,該錯誤狀態資料自動提供方法包含以下步驟:(A)讀取該中央處理單元所儲存且與該電腦裝置相關的錯誤狀態資料;(B)判定該錯誤狀態資料是否含有多個特定錯誤的至少一者;及(C)當判定出該錯誤狀態資料含有該至少一特定錯誤時,經由一通訊網路將該錯誤狀態資料傳送至一經由該通訊網路連接該基板管理控制系統的管理端。
- 如請求項1所述的錯誤狀態資料自動提供方法,其中,在步驟(C)中,當判定出該錯誤狀態資料含有該至少一特定錯誤時,該基板管理控制系統還儲存該錯誤狀態資料。
- 如請求項2所述的錯誤狀態資料自動提供方法,其中,在步驟(C)中,當判定出該錯誤狀態資料含有該至少一特定錯誤時,該基板管理控制系統壓縮該錯誤狀態資料以產生一包括該錯誤狀態資料的壓縮檔,且儲存該壓縮檔,並傳送該壓縮檔至該管理端。
- 如請求項1所述的錯誤狀態資料自動提供方法,其中,在步驟(C)中,當判定出該錯誤狀態資料含有該至少一特定錯誤時,該基板管理控制系統還傳送相關於該基板管理控 制系統的基板管理控制系統識別資料,及指示出該錯誤狀態資料之讀取時間的讀取時間資料至該管理端。
- 如請求項4所述的錯誤狀態資料自動提供方法,其中,在步驟(C)中,當判定出該錯誤狀態資料含有該至少一特定錯誤時,該基板管理控制系統壓縮該錯誤狀態資料、該基板管理控制系統識別資料,及該讀取時間資料以產生一包括該錯誤狀態資料、該基板管理控制系統識別資料,及該讀取時間資料的壓縮檔,且儲存該壓縮檔,並傳送該壓縮檔至該管理端。
- 如請求項1所述的錯誤狀態資料自動提供方法,其中,在步驟(A)中,該錯誤狀態資料包含機器檢查架構錯誤狀態(Machine Check Architecture error status)資料,在步驟(B)中,該等特定錯誤包含相關於該中央處理單元的異常狀態、相關於該電腦裝置之一記憶單元的錯誤,及相關於該電腦裝置之一週邊元件互連單元的錯誤之錯誤種類的其中至少一者。
- 如請求項1所述的錯誤狀態資料自動提供方法,在步驟(B)之後,還包含一步驟(D),當判定出該錯誤狀態資料不含該至少一特定錯誤時,該基板管理控制系統計數一預設時間期間後,重複步驟(A)至步驟(B)一次。
- 如請求項1所述的錯誤狀態資料提供方法,在步驟(C)之後還包含一步驟(E),重覆步驟(A)至步驟(B)一次。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW105114515A TWI587128B (zh) | 2016-05-11 | 2016-05-11 | 用於電腦裝置的錯誤狀態資料自動提供方法 |
US15/437,755 US10498592B2 (en) | 2016-05-11 | 2017-02-21 | Method and baseboard management control system for automatically providing error status data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW105114515A TWI587128B (zh) | 2016-05-11 | 2016-05-11 | 用於電腦裝置的錯誤狀態資料自動提供方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI587128B true TWI587128B (zh) | 2017-06-11 |
TW201740272A TW201740272A (zh) | 2017-11-16 |
Family
ID=59688290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105114515A TWI587128B (zh) | 2016-05-11 | 2016-05-11 | 用於電腦裝置的錯誤狀態資料自動提供方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10498592B2 (zh) |
TW (1) | TWI587128B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100192029A1 (en) * | 2009-01-29 | 2010-07-29 | Dell Products L.P. | Systems and Methods for Logging Correctable Memory Errors |
TW201118564A (en) * | 2009-11-18 | 2011-06-01 | Aten Int Co Ltd | Server management system and method thereof |
TW201505400A (zh) * | 2013-07-26 | 2015-02-01 | Inventec Corp | 伺服器系統和其資料傳送方法 |
TW201516665A (zh) * | 2013-08-30 | 2015-05-01 | Hon Hai Prec Ind Co Ltd | 伺服器之系統錯誤資訊偵測系統及方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6170067B1 (en) * | 1997-05-13 | 2001-01-02 | Micron Technology, Inc. | System for automatically reporting a system failure in a server |
US7124329B2 (en) * | 2003-09-26 | 2006-10-17 | International Business Machines Corporation | Implementing memory failure analysis in a data processing system |
US20080125984A1 (en) * | 2006-09-25 | 2008-05-29 | Veselin Skendzic | Spatially Assisted Fault Reporting Method, System and Apparatus |
US20090144699A1 (en) * | 2007-11-30 | 2009-06-04 | Anton Fendt | Log file analysis and evaluation tool |
US8024609B2 (en) * | 2009-06-03 | 2011-09-20 | International Business Machines Corporation | Failure analysis based on time-varying failure rates |
CN102467440A (zh) * | 2010-11-09 | 2012-05-23 | 鸿富锦精密工业(深圳)有限公司 | 内存错误检测系统及方法 |
TW201417536A (zh) * | 2012-10-24 | 2014-05-01 | Hon Hai Prec Ind Co Ltd | 伺服器自動管理方法及系統 |
US9680712B2 (en) * | 2014-07-01 | 2017-06-13 | American Megatrends, Inc. | Hardware management and control of computer components through physical layout diagrams |
US9489274B2 (en) * | 2014-12-17 | 2016-11-08 | American Megatrends, Inc. | System and method for performing efficient failover and virtual machine (VM) migration in virtual desktop infrastructure (VDI) |
US9954727B2 (en) * | 2015-03-06 | 2018-04-24 | Quanta Computer Inc. | Automatic debug information collection |
US10333771B2 (en) * | 2015-10-14 | 2019-06-25 | Quanta Computer Inc. | Diagnostic monitoring techniques for server systems |
-
2016
- 2016-05-11 TW TW105114515A patent/TWI587128B/zh active
-
2017
- 2017-02-21 US US15/437,755 patent/US10498592B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100192029A1 (en) * | 2009-01-29 | 2010-07-29 | Dell Products L.P. | Systems and Methods for Logging Correctable Memory Errors |
TW201118564A (en) * | 2009-11-18 | 2011-06-01 | Aten Int Co Ltd | Server management system and method thereof |
TW201505400A (zh) * | 2013-07-26 | 2015-02-01 | Inventec Corp | 伺服器系統和其資料傳送方法 |
TW201516665A (zh) * | 2013-08-30 | 2015-05-01 | Hon Hai Prec Ind Co Ltd | 伺服器之系統錯誤資訊偵測系統及方法 |
Also Published As
Publication number | Publication date |
---|---|
TW201740272A (zh) | 2017-11-16 |
US10498592B2 (en) | 2019-12-03 |
US20170331675A1 (en) | 2017-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9710255B1 (en) | Updating system of firmware of complex programmable logic device and updating method thereof | |
TW201709081A (zh) | 自動修復映像檔的方法及伺服器系統 | |
CN108768730B (zh) | 用于操作智能网卡的方法和装置 | |
CN105281937B (zh) | 服务器、服务管理系统及服务管理方法 | |
US9888084B2 (en) | Automatic network domain diagnostic repair and mapping | |
US20140074261A1 (en) | Rack server system and method for automatically managing rack configuration information | |
CN108880897A (zh) | 服务器的验收方法、装置、计算机设备及存储介质 | |
CN109656767A (zh) | 一种cpld状态信息的获取方法、系统及相关组件 | |
CN106547645A (zh) | 自动修复映像档的方法及服务器系统 | |
KR20160023873A (ko) | 하드웨어 관리 통신 프로토콜 | |
CN111586022A (zh) | 防火墙开墙验证方法、电子装置、计算机设备及存储介质 | |
CN107181606B (zh) | 用于控制网络节点的方法和装置 | |
CN105357267A (zh) | 一种获取服务器信息的方法、装置及系统 | |
CN107430391B (zh) | 管理系统 | |
TWI587128B (zh) | 用於電腦裝置的錯誤狀態資料自動提供方法 | |
CN111124828B (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN110096414A (zh) | 一种服务器监控方法、装置、设备及介质 | |
TWI497319B (zh) | 基板管理控制器的更新方法 | |
CN115454896A (zh) | 基于smbus的ssd mctp控制消息验证方法、装置、计算机设备及存储介质 | |
CN105321058B (zh) | 用于查找设备的方法和终端以及待查找设备 | |
CN113032054A (zh) | 一种服务执行方法、装置、存储介质及电子装置 | |
CN110096412A (zh) | 一种服务器监控方法、装置、设备及介质 | |
WO2018121353A1 (zh) | 数据通路的测试方法、测试服务器及测试系统 | |
TWI602054B (zh) | 用於電腦裝置的錯誤狀態資料提供方法 | |
US20180232331A1 (en) | Server system, fabric card and method for allocating ip address |