TWI758866B - 系統單晶片產品的嚴重錯誤提供方法及嚴重錯誤識別方法 - Google Patents

系統單晶片產品的嚴重錯誤提供方法及嚴重錯誤識別方法 Download PDF

Info

Publication number
TWI758866B
TWI758866B TW109131915A TW109131915A TWI758866B TW I758866 B TWI758866 B TW I758866B TW 109131915 A TW109131915 A TW 109131915A TW 109131915 A TW109131915 A TW 109131915A TW I758866 B TWI758866 B TW I758866B
Authority
TW
Taiwan
Prior art keywords
error
interface
register
value
programmable logic
Prior art date
Application number
TW109131915A
Other languages
English (en)
Other versions
TW202213097A (zh
Inventor
譚先樂
曲忠英
呂金星
王彥庚
Original Assignee
英業達股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 英業達股份有限公司 filed Critical 英業達股份有限公司
Priority to TW109131915A priority Critical patent/TWI758866B/zh
Application granted granted Critical
Publication of TWI758866B publication Critical patent/TWI758866B/zh
Publication of TW202213097A publication Critical patent/TW202213097A/zh

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本發明提供系統單晶片產品的嚴重錯誤提供方法與嚴重錯誤識別方法。其中,系統單晶片產品包括處理器,系統單晶片產品的嚴重錯誤提供方法包括:在發生嚴重錯誤時,將所述嚴重錯誤所對應的所述處理器的預設介面的介面值設為與所述嚴重錯誤相對應的預設值,將所述預設值轉換為外部伺服器可訪問的暫存器資料,以供所述外部伺服器在獲取所述暫存器資料時能根據所述預設值識別所述系統單晶片產品所發生的嚴重錯誤。通過本發明,即便系統單晶片產品不支持基板管理控制器,主板用戶仍然可以通過帶外的方式得到此產品發生錯誤的原因。

Description

系統單晶片產品的嚴重錯誤提供方法及嚴重錯誤識別方法
本發明涉及系統單晶片產品技術領域,特別是涉及系統單晶片產品的嚴重錯誤提供方法與嚴重錯誤識別方法。
目前,系統單晶片產品(即SOC產品)本身不支持基板管理控制器(Baseboard Management Controller, 簡稱BMC),導致系統單晶片產品在發生嚴重錯誤(Fatal Error)時帶外無法感知,用戶無法對系統單晶片產品發生錯誤時的問題進行監督和處理。
鑒於以上所述現有技術的缺點,本發明的目的在於提供系統單晶片產品的嚴重錯誤提供方法與嚴重錯誤識別方法,用於解決現有技術中的以上不足。
為實現上述目的及其他相關目的,本發明提供一種系統單晶片產品的嚴重錯誤提供方法,所述系統單晶片產品包括處理器,所述方法包括:在發生嚴重錯誤時,將所述嚴重錯誤所對應的所述處理器的預設介面的介面值設為與所述嚴重錯誤相對應的預設值;將所述預設值轉換為外部伺服器可訪問的暫存器資料,以供所述外部伺服器在獲取所述暫存器資料時能根據所述預設值識別所述系統單晶片產品所發生的嚴重錯誤。
在本發明一實施例中,所述系統單晶片產品包括基本輸入輸出系統,所述預設介面包括通用輸入輸出介面和串行通用輸入輸出介面;所述嚴重錯誤包括內部錯誤和不可糾正錯誤;其中,若發生的所述嚴重錯誤為所述內部錯誤,則所述通用輸入輸出介面被置起;若發生的所述嚴重錯誤為所述不可糾正錯誤,所述基本輸入輸出系統根據所述不可糾正錯誤解析錯誤的類型,並根據所述類型設置所述串行通用輸入輸出介面的介面值。
在本發明一實施例中,所述系統單晶片產品包括複雜可程式邏輯裝置,所述複雜可程式邏輯裝置包括錯誤狀態暫存器,所述方法還包括:所述複雜可程式邏輯裝置輪詢所述通用輸入輸出介面,在所述通用輸入輸出介面被置起時設置所述通用輸入輸出介面的介面值;所述複雜可程式邏輯裝置將所述通用輸入輸出介面的介面值和所述串行通用輸入輸出介面的介面值儲存於所述錯誤狀態暫存器。
在本發明一實施例中,所述錯誤狀態暫存器包括:當前錯誤狀態暫存器和先前錯誤狀態暫存器,所述通用輸入輸出介面的介面值和所述串行通用輸入輸出介面的介面值儲存於所述當前錯誤狀態暫存器,所述方法還包括:若所述系統單晶片產品在發生所述嚴重錯誤後發生重啟,則所述複雜可程式邏輯裝置將所述當前錯誤狀態暫存器的資料複製到所述先前錯誤狀態暫存器中並清除所述當前錯誤狀態暫存器的資料。
在本發明一實施例中,所述方法還包括:所述複雜可程式邏輯裝置將所述錯誤狀態暫存器的資料轉換為I2C訊號。
在本發明一實施例中,所述方法還包括:所述複雜可程式邏輯裝置接收由所述外部伺服器發送的清除命令;所述複雜可程式邏輯裝置清除所述錯誤狀態暫存器的資料。
為實現上述目的及其他相關目的,本發明提供一種系統單晶片產品的嚴重錯誤識別方法,應用於伺服器,包括:獲取所述系統單晶片產品的處理器的預設介面的介面值;將與所述介面值所對應的嚴重錯誤作為所述系統單晶片產品所發生的嚴重錯誤,並予以記錄。
在本發明一實施例中,所述預設介面包括:通用輸入輸出介面和串行通用輸入輸出介面;所述伺服器包括基板管理控制器,所述系統單晶片產品包括複雜可程式邏輯裝置;所述方法還包括:所述基板管理控制器輪詢所述複雜可程式邏輯裝置的I2C訊號,以根據所述I2C訊號從所述複雜可程式邏輯裝置的錯誤狀態暫存器中獲得所述通用輸入輸出介面的介面值及所述串行通用輸入輸出介面的介面值,並予以記錄。
在本發明一實施例中,所述錯誤狀態暫存器包括:當前錯誤暫存器和先前錯誤暫存器;所述方法還包括:當所述系統單晶片產品因發生嚴重錯誤而重啟,所述當前錯誤暫存器中的資料被複製至所述先前錯誤暫存器中,所述基板管理控制器則從所述先前錯誤暫存器中獲得所述預設介面的介面值;反之,則從所述當前錯誤暫存器中獲得所述預設介面的介面值。
在本發明一實施例中,所述方法還包括:將識別出的嚴重錯誤翻譯成用戶語言,並予以顯示;發送清除命令至所述系統單晶片產品,以使所述系統單晶片產品清除對所述嚴重錯誤的記錄資料。
如上所述,本發明的系統單晶片產品的嚴重錯誤提供方法與嚴重錯誤識別方法,具有以下有益效果:
1、在系統單晶片產品不支持基板管理控制器時,伺服器主板的用戶仍然可以通過基板管理控制器帶外的方式得到該系統單晶片產品發生錯誤的原因;
2、當系統單晶片產品因為嚴重錯誤導致重啟後,複雜可程式邏輯裝置通過先前錯誤暫存器PES(Previous Error Status)仍然能記錄到該系統單晶片產品上次重啟的錯誤,從而伺服器主板的基板管理控制器可以抓到上次重啟的原因;
3、本發明的方法擴展性強,可記錄多種類型的錯誤。
以下通過特定的具體實例說明本發明的實施方式,本領域技術人員可由本說明書所揭露的內容輕易地瞭解本發明的其他優點與功效。本發明還可以通過另外不同的具體實施方式加以實施或應用,本說明書中的各項細節也可以基於不同觀點與應用,在沒有背離本發明的精神下進行各種修飾或改變。需說明的是,在不衝突的情況下,以下實施例及實施例中的特徵可以相互組合。
需要說明的是,以下實施例中所提供的圖示僅以示意方式說明本發明的基本構想,遂圖示中僅顯示與本發明中有關的組件而非按照實際實施時的組件數目、形狀及尺寸繪製,其實際實施時各組件的型態、數量及比例可為一種隨意的改變,且其組件佈局型態也可能更為複雜。
鑒於現有技術中,系統單晶片產品本身不支持基板管理控制器,導致系統單晶片產品在發生嚴重錯誤時帶外無法感知,用戶無法對系統單晶片產品發生錯誤時的問題進行監督和處理,本發明提出系統單晶片產品的嚴重錯誤提供方法與嚴重錯誤識別方法,從而解決現有技術中的不足。
圖1顯示為本發明的系統單晶片產品的嚴重錯誤提供方法與嚴重錯誤識別方法於一實施例的應用場景示意圖。所述系統單晶片產品至少包括處理器CPU,以及分別與之連接的複雜可程式邏輯裝置CPLD、基本輸入輸出系統BIOS。需要說明的是,基本輸入輸出系統BIOS可通過集成南橋PCH與處理器CPU相連,本發明對此不做限制。
複雜可程式邏輯裝置CPLD包括錯誤狀態暫存器(Error Stats Register, 簡稱ESR)。較佳的,所述錯誤狀態暫存器又包括當前錯誤狀態暫存器(Current Error Status, 簡稱CES)和先前錯誤狀態暫存器(Previous Error Status, 簡稱PES)。
系統單晶片產品本身不支持基板管理控制器,伺服器具有基板管理控制器。系統單晶片產品以插卡的形式插在伺服器主板的PCIE插槽上。本發明如此設計的目的是讓伺服器主板用戶能通過伺服器的基板管理控制器獲取系統單晶片產品的複雜可程式邏輯裝置中的錯誤狀態暫存器的資料,從而根據這些資料與各種錯誤之間的預設對應關係來識別出該系統單晶片產品所發生的錯誤。
如圖2所示,本實施例提供一種系統單晶片產品的嚴重錯誤提供方法,由圖1所示的系統單晶片產品負責執行,所述方法包括以下步驟:
S21:在發生嚴重錯誤時,將所述嚴重錯誤所對應的所述處理器的預設介面的介面值設為與所述嚴重錯誤相對應的預設值;
S22:將所述預設值轉換為外部伺服器可訪問的暫存器資料,以供所述外部伺服器在獲取所述暫存器資料時能根據所述預設值識別所述系統單晶片產品所發生的嚴重錯誤。
詳細而言,所述預設介面包括通用輸入輸出介面(General-purpose input/output Port, 簡稱GPIO介面)和串行通用輸入輸出介面(Serial General Purpose Input/Output Port, 簡稱SGPIO)。所述嚴重錯誤包括內部錯誤(Internal Error, 簡稱IERR)和不可糾正錯誤(Uncorrected Errors, 簡稱UCE)。
若系統單晶片產品發生的嚴重錯誤為所述不可糾正錯誤,所述系統單晶片產品的基本輸入輸出系統會根據所述不可糾正錯誤解析錯誤的類型,設置所述串行通用輸入輸出介面的介面值。若系統單晶片產品發生的嚴重錯誤為所述內部錯誤,則所述系統單晶片產品的處理器的通用輸入輸出介面被置起(如由原始高位1到持續變至低位0)。具體地,所述系統單晶片產品的複雜可程式邏輯裝置輪詢所述通用輸入輸出介面,在所述通用輸入輸出介面被置起時設置所述通用輸入輸出介面的介面值,並將所述通用輸入輸出介面的介面值和所述串行通用輸入輸出介面的介面值儲存於所述系統單晶片產品的錯誤狀態暫存器。
在一實施例中,進一步地,所述通用輸入輸出介面的介面值和所述串行通用輸入輸出介面的介面值儲存於所述當前錯誤狀態暫存器。若所述系統單晶片產品在發生所述嚴重錯誤後發生重啟,所述複雜可程式邏輯裝置則將所述當前錯誤狀態暫存器的資料複製到所述先前錯誤狀態暫存器中,並清除所述當前錯誤狀態暫存器的資料。較佳的,所述複雜可程式邏輯裝置在接收由外部伺服器發送的清除命令時,清除所述錯誤狀態暫存器的資料。
在一實施例中,進一步地,所述複雜可程式邏輯裝置將所述錯誤狀態暫存器的資料轉換為I2C訊號,從而便於伺服器通過I2C輪詢該系統單晶片產品的錯誤狀態暫存器的資料來識別該系統單晶片產品所發生的錯誤。
如圖3所示,本實施例提供一種系統單晶片產品的嚴重錯誤識別方法,由如圖1所示的伺服器負責執行,包括以下步驟:
S31:獲取所述系統單晶片產品的處理器的預設介面的介面值;
S32:將與所述介面值所對應的嚴重錯誤作為所述系統單晶片產品所發生的嚴重錯誤,並予以記錄。
詳細而言,所述系統單晶片產品的處理器的預設介面包括:通用輸入輸出介面和串行通用輸入輸出介面。所述系統單晶片產品的複雜可程式邏輯裝置將錯誤狀態暫存器的資料轉換為I2C訊號,伺服器的基板管理控制器輪詢所述系統單晶片產品的複雜可程式邏輯裝置的I2C訊號,從而根據所述I2C訊號從所述複雜可程式邏輯裝置的錯誤狀態暫存器中獲得所述通用輸入輸出介面的介面值及所述串行通用輸入輸出介面的介面值,並予以記錄。
於一實施例中,當所述系統單晶片產品因發生嚴重錯誤而重啟,所述系統單晶片產品的當前錯誤暫存器中的資料被複製至所述系統單晶片產品的先前錯誤暫存器中,所述伺服器的基板管理控制器則從所述系統單晶片產品的先前錯誤暫存器中獲得所述預設介面的介面值;若所述系統單晶片產品未因發生嚴重錯誤而重啟,所述系統單晶片產品的當前錯誤暫存器中的資料未被複製至所述系統單晶片產品的先前錯誤暫存器中,所述伺服器的基板管理控制器則從所述當前錯誤暫存器中獲得所述預設介面的介面值。
於一實施例中,伺服器將識別出的嚴重錯誤翻譯成用戶語言,並予以顯示。較佳的,在識別出系統單晶片產品所發生的嚴重錯誤後,伺服器發送清除命令至所述系統單晶片產品,以使所述系統單晶片產品清除對所述嚴重錯誤的記錄資料。
以下結合圖1和圖4對本發明的系統單晶片產品的嚴重錯誤提供方法與嚴重錯誤識別方法做詳細介紹。
系統單晶片產品在發生嚴重錯誤時,若發生的錯誤是IERR,由於其BIOS無法處理,故只能由其CPLD處理;若發生的錯誤是UCE,則由其BIOS負責處理。
IERR發生時,系統單晶片產品的CPU的GPIO介面被置起,CPLD輪詢到此GPIO介面由原高位持續變低後,通過I2C模組將此GPIO介面的值轉換成伺服器主板BMC可輪詢的預設值,並存入ESR的CES。
UCE發生時,系統單晶片產品的BIOS向CPLD輸出錯誤類型,並根據錯誤的具體類型設置CPU的SGPIO介面的值,CPLD通過SGPIO模組去輪詢此SGPIO介面的值,然後通過I2C模組將此SGPIO介面的值轉換成伺服器主板BMC可輪詢的預設值,並存入ESR的CES。ESR預先被定義,比如:0~3bit位為CES,4~7bit位為PES。在ESR的8個bit位中,第0或4位被置起,則表示發生了IERR,第1或5位被置起,則表示發生了UCE0,第2或6位被置起,則表示發生了UCE1,第3或7位被置起,則表示發生了UCE2。於此,UCE0~UCE2代表3種不同具體類型的UCE錯誤,具體類型包括但不限於:多位錯誤檢查和糾正(Error Correcting Code , 簡稱ECC)記憶體錯誤、普通資料奇偶校檢錯誤(Parity Error, 簡稱PERR)、系統錯誤(System Error, 簡稱SERR)。
CPLD將GPIO介面和SGPIO介面的預設值轉成I2C訊號,讓BMC可以輪詢到。
若系統單晶片產品因發生嚴重錯誤而重啟,所述系統單晶片產品的CES中的資料會被複製至到PES中,此時,伺服器的BMC則從該PES中獲得GPIO介面、SGPIO介面的介面值;反之,伺服器的BMC則從CES中獲得GPIO介面、SGPIO介面的介面值。
BMC通過I2C輪詢系統單晶片產品的ESR中GPIO介面值和SGPIO介面值,若輪詢到GPIO介面被置起,則根據GPIO介面的預設值識別出該系統單晶片產品發生的IERR,若輪詢到SGPIO介面被置起,則根據SGPIO介面的預設值識別出該系統單晶片產品發生的錯誤類型,如UCE0、UCE1或UCE2。BMC將從ESR中獲取的介面值資料記錄至日誌文件中,並通知用戶該系統單晶片產品發生何種錯誤。
隨後,BMC向系統單晶片產品發命令清除記錄在其CPLD的嚴重錯誤的記錄資料。
綜上,本發明的系統單晶片產品的嚴重錯誤提供方法與嚴重錯誤識別方法,即便系統單晶片產品不支持基板管理控制器,主板用戶仍然可以通過帶外的方式得到此產品發生錯誤的原因,有效克服了現有技術中的種種缺點而具高度產業利用價值。
上述實施例僅例示性說明本發明的原理及其功效,而非用於限制本發明。任何熟悉此技術的人士皆可在不違背本發明的精神及範疇下,對上述實施例進行修飾或改變。因此,舉凡所屬技術領域中具有通常知識者在未脫離本發明所揭示的精神與技術思想下所完成的一切等效修飾或改變,仍應由本發明的請求項所涵蓋。
S21~S22、S31~S32:步驟 CPU:處理器 BIOS:基本輸入輸出系統 CPLD:複雜可程式邏輯裝置 ESR:錯誤狀態暫存器 CES:當前錯誤狀態暫存器 PES:先前錯誤狀態暫存器 BMC:基板管理控制器
圖1顯示為本發明一實施例中的應用場景示意圖。 圖2顯示為本發明一實施例中的SOC產品的嚴重錯誤提供方法的流程圖。 圖3顯示為本發明一實施例中的SOC產品的嚴重錯誤識別方法的流程圖。 圖4顯示為本發明一實施例中的SOC產品的嚴重錯誤提供與識別方法的流程圖。
CPU:處理器
BIOS:基本輸入輸出系統
CPLD:複雜可程式邏輯裝置
ESR:錯誤狀態暫存器
CES:當前錯誤狀態暫存器
PES:先前錯誤狀態暫存器
BMC:基板管理控制器

Claims (10)

  1. 一種系統單晶片產品的嚴重錯誤提供方法,所述系統單晶片產品包括處理器,所述方法包括: 在發生嚴重錯誤時,將所述嚴重錯誤所對應的所述處理器的預設介面的介面值設為與所述嚴重錯誤相對應的預設值; 將所述預設值轉換為外部伺服器可訪問的暫存器資料,以供所述外部伺服器在獲取所述暫存器資料時能根據所述預設值識別所述系統單晶片產品所發生的嚴重錯誤。
  2. 根據請求項1所述的系統單晶片產品的嚴重錯誤提供方法,所述系統單晶片產品包括基本輸入輸出系統,所述預設介面包括通用輸入輸出介面和串行通用輸入輸出介面;所述嚴重錯誤包括內部錯誤和不可糾正錯誤;其中, 若發生的所述嚴重錯誤為所述內部錯誤,則所述通用輸入輸出介面被置起; 若發生的所述嚴重錯誤為所述不可糾正錯誤,所述基本輸入輸出系統根據所述不可糾正錯誤解析錯誤的類型,並根據所述類型設置所述串行通用輸入輸出介面的介面值。
  3. 根據請求項2所述的系統單晶片產品的嚴重錯誤提供方法,所述系統單晶片產品包括複雜可程式邏輯裝置,所述複雜可程式邏輯裝置包括錯誤狀態暫存器,所述方法還包括: 所述複雜可程式邏輯裝置輪詢所述通用輸入輸出介面,在所述通用輸入輸出介面被置起時設置所述通用輸入輸出介面的介面值; 所述複雜可程式邏輯裝置將所述通用輸入輸出介面的介面值和所述串行通用輸入輸出介面的介面值儲存於所述錯誤狀態暫存器。
  4. 根據請求項3所述的系統單晶片產品的嚴重錯誤提供方法,所述錯誤狀態暫存器包括:當前錯誤狀態暫存器和先前錯誤狀態暫存器,所述通用輸入輸出介面的介面值和所述串行通用輸入輸出介面的介面值儲存於所述當前錯誤狀態暫存器,所述方法還包括: 若所述系統單晶片產品在發生所述嚴重錯誤後發生重啟,則所述複雜可程式邏輯裝置將所述當前錯誤狀態暫存器的資料複製到所述先前錯誤狀態暫存器中並清除所述當前錯誤狀態暫存器的資料。
  5. 根據請求項3所述的系統單晶片產品的嚴重錯誤提供方法,所述方法還包括: 所述複雜可程式邏輯裝置將所述錯誤狀態暫存器的資料轉換為I2C訊號。
  6. 根據請求項3所述的系統單晶片產品的嚴重錯誤提供方法,所述方法還包括: 所述複雜可程式邏輯裝置接收由所述外部伺服器發送的清除命令; 所述複雜可程式邏輯裝置清除所述錯誤狀態暫存器的資料。
  7. 一種系統單晶片產品的嚴重錯誤識別方法,應用於伺服器,包括: 獲取所述系統單晶片產品的處理器的預設介面的介面值; 將與所述介面值所對應的嚴重錯誤作為所述系統單晶片產品所發生的嚴重錯誤,並予以記錄。
  8. 根據請求項7所述的系統單晶片產品的嚴重錯誤識別方法,所述預設介面包括:通用輸入輸出介面和串行通用輸入輸出介面;所述伺服器包括基板管理控制器,所述系統單晶片產品包括複雜可程式邏輯裝置;所述方法還包括: 所述基板管理控制器輪詢所述複雜可程式邏輯裝置的I2C訊號,以根據所述I2C訊號從所述複雜可程式邏輯裝置的錯誤狀態暫存器中獲得所述通用輸入輸出介面的介面值及所述串行通用輸入輸出介面的介面值,並予以記錄。
  9. 根據請求項8所述的系統單晶片產品的嚴重錯誤識別方法,所述錯誤狀態暫存器包括:當前錯誤暫存器和先前錯誤暫存器;所述方法還包括: 當所述系統單晶片產品因發生嚴重錯誤而重啟,所述當前錯誤暫存器中的資料被複製至所述先前錯誤暫存器中,所述基板管理控制器則從所述先前錯誤暫存器中獲得所述預設介面的介面值; 反之,則從所述當前錯誤暫存器中獲得所述預設介面的介面值。
  10. 根據請求項7所述的系統單晶片產品的嚴重錯誤識別方法,還包括: 將識別出的嚴重錯誤翻譯成用戶語言,並予以顯示; 發送清除命令至所述系統單晶片產品,以使所述系統單晶片產品清除對所述嚴重錯誤的記錄資料。
TW109131915A 2020-09-16 2020-09-16 系統單晶片產品的嚴重錯誤提供方法及嚴重錯誤識別方法 TWI758866B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW109131915A TWI758866B (zh) 2020-09-16 2020-09-16 系統單晶片產品的嚴重錯誤提供方法及嚴重錯誤識別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109131915A TWI758866B (zh) 2020-09-16 2020-09-16 系統單晶片產品的嚴重錯誤提供方法及嚴重錯誤識別方法

Publications (2)

Publication Number Publication Date
TWI758866B true TWI758866B (zh) 2022-03-21
TW202213097A TW202213097A (zh) 2022-04-01

Family

ID=81710753

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109131915A TWI758866B (zh) 2020-09-16 2020-09-16 系統單晶片產品的嚴重錯誤提供方法及嚴重錯誤識別方法

Country Status (1)

Country Link
TW (1) TWI758866B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200511003A (en) * 2003-09-02 2005-03-16 Acer Inc Real time monitoring device for host and the monitoring method therefor
US20150067412A1 (en) * 2011-09-29 2015-03-05 Intel Corporation Providing Error Handling Support To Legacy Devices
TW201544951A (zh) * 2014-05-16 2015-12-01 Inventec Corp 伺服器
TW201805824A (zh) * 2016-08-09 2018-02-16 華為技術有限公司 系統晶片和處理設備
US20180241835A1 (en) * 2017-02-21 2018-08-23 Experian Health, Inc. Monitoring highly distributed computer systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200511003A (en) * 2003-09-02 2005-03-16 Acer Inc Real time monitoring device for host and the monitoring method therefor
US20150067412A1 (en) * 2011-09-29 2015-03-05 Intel Corporation Providing Error Handling Support To Legacy Devices
TW201544951A (zh) * 2014-05-16 2015-12-01 Inventec Corp 伺服器
TW201805824A (zh) * 2016-08-09 2018-02-16 華為技術有限公司 系統晶片和處理設備
US20180241835A1 (en) * 2017-02-21 2018-08-23 Experian Health, Inc. Monitoring highly distributed computer systems

Also Published As

Publication number Publication date
TW202213097A (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
TWI229796B (en) Method and system to implement a system event log for system manageability
KR101842568B1 (ko) 트랜잭션 버퍼링된 메모리에서의 초기 식별
JP5142138B2 (ja) メモリ・システム内の障害メモリ要素を識別する方法及びメモリ・システム
US20090150721A1 (en) Utilizing A Potentially Unreliable Memory Module For Memory Mirroring In A Computing System
TWI620061B (zh) 伺服器的偵錯裝置及其偵錯方法
US11294749B2 (en) Techniques to collect crash data for a computing system
CN108572843A (zh) 基于单个微控制器的多个计算节点管理
WO2019056475A1 (zh) 测试任务自动化管理方法、装置、设备及存储介质
CN115934389A (zh) 用于错误报告和处理的系统和方法
US10514972B2 (en) Embedding forensic and triage data in memory dumps
WO2019105335A1 (zh) 存储设备及存储设备的元件管理方法
TW201305813A (zh) 電腦系統及其診斷方法
TWI758866B (zh) 系統單晶片產品的嚴重錯誤提供方法及嚴重錯誤識別方法
CN109117299B (zh) 服务器的侦错装置及其侦错方法
WO2022110405A1 (zh) 基于区块链的链上存储方法、装置、终端设备及介质
US11449383B2 (en) Methods for providing and identifying fatal error information for system-on-chip product
JP4299634B2 (ja) 情報処理装置及び情報処理装置の時計異常検出プログラム
US11249872B1 (en) Governor circuit for system-on-chip
TW202324103A (zh) 收集用於除錯及分析之運行時間資訊
US10846162B2 (en) Secure forking of error telemetry data to independent processing units
Carvalho et al. Enhancing I2C robustness to soft errors
CN104572423A (zh) 调试系统及其调试装置和方法
TWI758867B (zh) 基於gpnv的基本輸入輸出系統錯誤訊息記錄方法、系統及終端
JP2002288049A (ja) Pciバス不良個所切り離し方法およびそのプログラム
WO2024139423A1 (zh) 故障检测方法及计算机设备