TWI701594B - 遠端硬體診斷系統與診斷方法 - Google Patents

遠端硬體診斷系統與診斷方法 Download PDF

Info

Publication number
TWI701594B
TWI701594B TW107143679A TW107143679A TWI701594B TW I701594 B TWI701594 B TW I701594B TW 107143679 A TW107143679 A TW 107143679A TW 107143679 A TW107143679 A TW 107143679A TW I701594 B TWI701594 B TW I701594B
Authority
TW
Taiwan
Prior art keywords
command
diagnostic
remote
candidate
management device
Prior art date
Application number
TW107143679A
Other languages
English (en)
Other versions
TW202022599A (zh
Inventor
張兆偉
范文強
吳善恆
Original Assignee
英業達股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 英業達股份有限公司 filed Critical 英業達股份有限公司
Priority to TW107143679A priority Critical patent/TWI701594B/zh
Publication of TW202022599A publication Critical patent/TW202022599A/zh
Application granted granted Critical
Publication of TWI701594B publication Critical patent/TWI701594B/zh

Links

Images

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一種遠端硬體診斷方法,以具有多個候選指令的遠端管理裝置接收使用者指令,並產生觸發指令,並據以觸發伺服器的基板管理控制器。以被觸發的基板管理控制器傳送執行指令至基本輸入/輸出系統,以基本輸入/輸出系統的開機程序碼執行診斷程序,並據以產生診斷訊息。於基本輸入/輸出系統完成診斷程序後,以基本輸入/輸出系統傳送診斷訊息至基板管理控制器,並以基板管理控制器儲存診斷訊息。於基板管理控制器儲存診斷訊息後,基板管理控制器傳送回饋指令至遠端管理裝置,以及於遠端管理裝置接收回饋指令後產生回饋訊息。

Description

遠端硬體診斷系統與診斷方法
本發明係關於一種具有硬體診斷功能的系統及診斷方法,特別是一種由遠端執行硬體診斷的系統及方法。
現今因科技需求,電腦已廣泛運用在各領域中,簡單的架構如個人電腦(PC),複雜的架構如伺服器系統(server system),藉由其整合軟硬體與網路資源的特點,可有效率地完成許多複雜的工作。其中伺服器系統(server system)因架構複雜,當發生故障時往往需要很多時間處理,尤其在開機過程中故障,或是因嚴重故障而無法開機,不但相關的服務因此中斷,其他風險(例如檔案遺失、硬體毀損、修復成本昂貴等)更難以估計。
伺服器系統的問題排除一般先以遠端檢測優先,遠端檢測雖然較現場檢測相對容易執行,但需要有伺服器系統故障前的詳細運作記錄,才能有效率的找出問題,且需要在伺服器可以開機並連上網路的情形下才能執行。另外,遠端檢測需要一定的時間才能完成,同時也會影響使用者的工作進度。
因此,目前尚需要一種遠端硬體診斷系統與診斷方法,在使用者每次開機時自動對電腦做診斷並詳細記錄,如果系統在開機過程中故障,也能自動儲存故障前的診斷記錄,以供技術人員遠端排除問題。並且能針對不同的需求選擇診斷等級,避免浪費多餘的時間與電腦資源。
本發明在於提供一種具有遠端硬體診斷系統與診斷方法,以記錄並儲存每次開機時的硬體狀態,以供日後技術人員遠端排除問題時使用。
依據本發明一實施例的遠端硬體診斷方法,於一遠端管理裝置接收一使用者指令時,從該些候選指令中擇一產生及輸出該觸發指令,並據以觸發一伺服器的一基板管理控制器;以被觸發的該基板管理控制器傳送一執行指令至一基本輸入/輸出系統;於該基本輸入/輸出系統接收該執行指令後,以該基本輸入/輸出系統的一開機程序碼執行一診斷程序,並據以產生一診斷訊息;於該基本輸入/輸出系統完成該診斷程序後,以該基本輸入/輸出系統傳送該診斷訊息至該基板管理控制器;以接收該診斷訊息的該基板管理控制器儲存該診斷訊息;於該基板管理控制器儲存該診斷訊息後,該基板管理控制器傳送一回饋指令至該遠端管理裝置;以及於該遠端管理裝置接收該回饋指令後,該遠端管理裝置產生一回饋訊息。
依據本發明一實施例的遠端硬體診斷系統,包括一伺服器與一遠端管理裝置,其中該伺服器包括:一基板管理控制器,用於接收一觸發指令並產生一執行指令,以及接收和儲存一診斷訊息,並產生一回饋指令;一基本輸入/輸出系統,電性連結於該基板管理控制器,該基本輸入/輸出系統儲存有一開機程序碼,該伺服器於執行該開機程序碼時,根據該執行指令,據以執行一診斷程序,並產生該診斷訊息。另一方面,該遠端管理裝置係透過一網路與該伺服器通訊連結,並具有多個候選指令;該遠端管理裝置於接收一使用者指令時從該些候選指令中擇一產生及輸出該觸發指令,並於接收該回饋指令後產生一回饋訊息。。
以上之關於本揭露內容之說明及以下之實施方式之說明係用以示範與解釋本發明之精神與原理,並且提供本發明之專利申請範圍更進一步之解釋。
以下在實施方式中詳細敘述本發明之詳細特徵以及優點,其內容足以使任何熟習相關技藝者了解本發明之技術內容並據以實施,且根據本說明書所揭露之內容、申請專利範圍及圖式,任何熟習相關技藝者可輕易地理解本發明相關之目的及優點。以下之實施例係進一步詳細說明本發明之觀點,但非以任何觀點限制本發明之範疇。
請參考圖1,圖1為依據本發明一實施例的遠端硬體診斷系統的架構圖。該遠端硬體診斷系統包含一伺服器1與一遠端管理裝置2。該伺服器1可以是任一種具運算功能的裝置,例如為伺服器(server),並且包含一基板管理控制器11、一基本輸入/輸出系統13以及一序列埠15。該遠端管理裝置2包含一管理介面21,並透過一網路3與該伺服器1通訊連結,以便於遠端管理該伺服器1。透過上述各元件,可使該伺服器1在開機時執行一診斷程序,以檢測並記錄各硬體的狀態;該遠端管理裝置2可遠端地取得該伺服器1的該診斷程序的相關資訊。上述各元件的功能與連結關係,將於接續的段落詳細說明。
為詳細說明該伺服器1的元件,請繼續參考圖1。該基板管理控制器11可為BMC (baseboard management controller),用於接收一觸發指令並產生一執行指令,在診斷程序結束後接收一診斷訊息,並根據該診斷訊息產生一回饋指令。基本輸入/輸出系統13可為一基本輸入/輸出系統晶片(Basic Input / Output System Chipset,BIOS Chipset),電性連結於基板管理控制器11,並儲存有一開機程序碼131。基本輸入/輸出系統13在接收該執行指令後,當伺服器1執行該開機程序碼131,並據以執行診斷程序,並據以產生診斷訊息。另外,在基本輸入/輸出系統13與基板管理控制器11之間包含一序列埠15(serial port),基本輸入/輸出系統13透過序列埠15將診斷訊息傳送至基板管理控制器11,該基板管理控制器11接收並儲存該診斷訊息,以供日後排除問題使用。
為詳細說明遠端管理裝置2的元件,請繼續參考圖1。當伺服器1發生異常而無法開機時,技術人員可透過遠端管理裝置2的產生一使用者指令,以觸發伺服器1執行診斷程序。詳細來說,遠端管理裝置2具有多個候選指令,技術人員可藉由從遠端管理裝置2產生該使用者指令,從該些候選指令中擇一產生一觸發指令,以觸發伺服器1執行診斷程序。另外,在診斷程序完成後,遠端管理裝置2可接收一回饋指令,並據以產生一回饋訊息,以告知技術人員該診斷程序的相關資訊。當伺服器1完成診斷程序,並將診斷訊息儲存於基板管理控制器11後,遠端管理裝置2的管理介面 21可選擇性地產生一使用者指令,透過此使用者指令,遠端管理裝置2可取得儲存於伺服器1的基板管理控制器11的診斷訊息。需注意的是,於此,該使用者指令可以是伺服器1的網際網路協定位址(Internet Protocol Address,IP)。因此,操作遠端管理裝置 2的技術人員可藉由此機制遠端地取得診斷訊息,並根據該診斷訊息的內容,協助使用者做問題排除。
另外,如果伺服器1因故障而無法完成完整的開機程序,導致基本輸入/輸出系統13僅能完成部分的診斷程序並產生對應的診斷訊息,該些診斷訊息還是能儲存於基板管理控制器11,並藉由遠端管理裝置2的管理介面21發送使用者指令,使該遠端管理裝置2取得上述的診斷訊息。另一方面,由於該診斷訊息係儲存於基板管理控制器11,且基板管理控制器11的運作乃是獨立於伺服器1的中央處理器(CPU)及作業系統(OS),故縱使伺服器1因嚴重故障而無法開機,遠端管理裝置2一樣能透過管理介面21發送使用者指令,並據以取得先前儲存於基板管理控制器11的診斷訊息。
請參考圖2,圖2為依據本發明一實施例的遠端硬體診斷方法的流程圖。於步驟S11:以具有多個候選指令的該遠端管理裝置2接收使用者指令;其中該使用者指令係用於從該些候選指令中,擇一產生及輸出該觸發指令。於該遠端管理裝置2產生及輸出該觸發指令後,請參考步驟S13:以遠端管理裝置2產生觸發指令,並據以觸發伺服器1的該基板管理控制器11;其中該觸發指令係透過網路3,被傳送至伺服器1的基板管理控制器11。於該基本輸入/輸出系統13接收到該觸發指令後,請參考步驟S15:以被觸發的基板管理控制器11傳送執行指令至基本輸入/輸出系統13;其中該執行指令係透過序列埠15被傳送。接續,請參考步驟S17:以基本輸入/輸出系統13的開機程序碼131執行診斷程序,並據以產生診斷訊息;其中該診斷訊息係記錄本次開機時,該伺服器1的硬體狀態。於該基本輸入/輸出系統13產生該診斷訊息後,請參考步驟S19:以該基本輸入/輸出系統13傳送該診斷訊息至該基板管理控制器11,並且於步驟S21中:以接收該診斷訊息該基板管理控制器11儲存該診斷訊息,以便日後遠端管理裝置2據以執行遠端硬體診斷。此外,於該基板管理控制器11儲存該診斷訊息後,請參考步驟S22:以該遠端管理裝置2透過該管理介面21傳送使用者指令取得該診斷訊息;其中該遠端管理裝置2可透過網路3與伺服器1通訊連結,因此技術人員可透過該遠端管理裝置2的該管理介面,取得儲存於伺服器的基板管理控制器11的該診斷訊息,以協助用戶做問題排除。因此,診斷訊息的內容可以程式語言的形式表現,以便相關的技術人員能據以精確地排除問題。另外,於該基板管理控制器11儲存該診斷訊息後,請參考步驟S23:該基板管理控制器11傳送該回饋指令至該遠端管理裝置 2,其中該回饋指令關聯於該診斷訊息,且可用於通知該遠端管理裝置 2已完成本次診斷程序。於步驟S25:該遠端管理裝置 2產生該回饋訊息,該回饋訊息乃是該遠端管理裝置 2根據該回饋指令而產生,以通知伺服器1的使用者本次診斷結果。因此,回饋訊息的內容可以大眾熟知的表達形式呈現,以便不具相關技術背景的使用者也能自行閱讀或是做初步的問題排除。另一方面,回饋訊息亦可用於通知遠端管理裝置2:該伺服器1已完成一次診斷程序,並透過該回饋訊息得知本次診斷程序的初步資訊。
在上述的實施例中,執行步驟S11的目的在於供操作遠端管理裝置2的技術人員,可視需求選擇適當的診斷內容,進而縮短診斷程序的執行時間,並降低診斷程序所可能產生的硬體損耗。以下係列舉一實例以更清楚地說明步驟S11的實現方式,惟步驟S11並不因此而受限。請參考圖1與圖3,圖3為依據本發明上述實施例的遠端硬體診斷方法針對步驟S11的部分流程圖。依據前面段落所描述的遠端管理裝置2,該些候選指令關聯於多個相異的診斷範圍;該遠端管理裝置2在接收使用者指令後,由該些候選指令之中擇一產生該觸發指令。上述的多個候選指令包含:一第一候選指令、一第二候選指令與一第三候選指令;其中第一候選指令所關聯的診斷範圍係一內存初始化代碼(memory reference code, MRC),該第二候選指令所關聯的該診斷範圍係該內存初始化代碼與一微軟保留分區(Microsoft reserved partition, MSR),該第三候選指令所關聯的該診斷範圍係該內存初始化代碼、該微軟保留分區與一快捷外設互聯標準(peripheral component interconnect express, PCIE)。簡單來說,上述的第一候選指令、第二候選指令與第三候選指令對應於三種不同的診斷範圍,而該些診斷範圍又可以輕度診斷、中度診斷與重度診斷做區分。其中,輕度診斷係針對內存初始化代碼(MRC)執行診斷程序,中度診斷的診斷範圍則包含輕度診斷並加上微軟保留分區(MSR),重度診斷的診斷範圍則包含中度診斷以及快捷外設互聯標準(PCIE)。因此,技術人員可依照實際需求,選擇合適的診斷範圍,以增加開機效率並節省硬體資源。本發明雖揭示三個候選指令對應三種不同的診斷範圍,但此診斷方法的主旨係依據不同的診斷範圍,對該診斷程序再加以區分;因此,本發明不因候選指令的數量或診斷範圍的改變而受限。
為詳細說明,請繼續參考圖3。步驟S11已於前述段落說明,於本段落不另外詳述。步驟S111至S113描述不同的候選指令對應於不同的診斷範圍。步驟S111:該第一候選指令所關聯的該診斷範圍係該內存初始化代碼,其中該內存初始化代碼又稱為MRC (memory reference code)。步驟S112: 該第二候選指令所關聯的該診斷範圍係該內存初始化代碼與該微軟保留分區,其中該微軟保留分區又稱為MSR (Microsoft reserved partition) 。S113: 該第三候選指令所關聯的該診斷範圍係該內存初始化代碼、該微軟保留分區和該快捷外設互聯標準,其中該快捷外設互聯標準又稱為PCIE (peripheral component interconnect express)。詳細來說,當遠端管理裝置2選擇第一候選指令並據以發出觸發指令時,基板管理控制器11依據該觸發指令產生一執行指令,使基本輸入/輸出系統13依據與第一候選指令所對應的診斷範圍執行診斷程序;接續的步驟則與前述實施例相同,於本段落不另外詳述。以此類推,當遠端管理裝置2選擇第二候選指令或第三候選指令並據以發出觸發指令,基本輸入/輸出系統13也可依據與上述候選指令相對應的診斷範圍,執行該診斷程序。
本發明所揭示的一種遠端硬體診斷系統與診斷方法,在使用者每次開機時可自動對電腦做診斷並詳細記錄,如果系統在開機過程中故障,也能自動儲存故障前的診斷記錄,以供技術人員遠端排除問題。另外,此診斷系統與方法也能針對不同的需求,選擇不同的診斷範圍,避免浪費多餘的時間與硬體資源。
雖然本發明以前述之實施例揭露如上,然其並非用以限定本發明。在不脫離本發明之精神和範圍內,所為之更動與潤飾,均屬本發明之專利保護範圍。關於本發明所界定之保護範圍請參考所附之申請專利範圍。
1                      伺服器 2                      遠端管理裝置 3                      網路 11                    基板管理控制器 13                    基本輸入/輸出系統 15                    序列埠 21                    管理介面 131                 開機程序碼
圖1為依據本發明一實施例的遠端硬體診斷系統的架構圖。 圖2為依據本發明一實施例的遠端硬體診斷方法的流程圖。 圖3為依據本發明一實施例的遠端硬體診斷方法的部分流程圖。

Claims (10)

  1. 一種遠端硬體診斷方法,包括:於一遠端管理裝置接收一使用者指令時,從多個候選指令中擇一產生及輸出一觸發指令,並據以觸發一伺服器的一基板管理控制器;以被觸發的該基板管理控制器傳送一執行指令至一基本輸入/輸出系統;於該基本輸入/輸出系統接收該執行指令後,以該基本輸入/輸出系統的一開機程序碼執行一診斷程序,並據以產生一診斷訊息;於該基本輸入/輸出系統完成該診斷程序後,以該基本輸入/輸出系統傳送該診斷訊息至該基板管理控制器;以接收該診斷訊息的該基板管理控制器儲存該診斷訊息;於該基板管理控制器儲存該診斷訊息後,該基板管理控制器傳送一回饋指令至該遠端管理裝置;以及於該遠端管理裝置接收該回饋指令後,該遠端管理裝置產生一回饋訊息。
  2. 如請求項1所述之遠端硬體診斷方法,其中該些候選指令分別關聯於相異的多個診斷範圍,且以具有該些候選指令的該遠端管理裝置產生該觸發指令包含:以該遠端管理裝置由該些候選指令之中擇一做為該觸發指令。
  3. 如請求項2所述之遠端硬體診斷方法,其中該些候選指令包含一第一候選指令、一第二候選指令與一第三候選指令,該第一候選指令所關聯的該診斷範圍係一內存初始化代碼,該第二候選指令所關聯的該診斷範圍係該內存初始化代碼與一微軟保留分區,該第三候選指令所關聯的該診斷範圍係該內存初始化代碼、該微軟保留分區和一快捷外設互聯標準。
  4. 如請求項1所述之遠端硬體診斷方法,其中以接收該診斷訊息的該基板管理控制器儲存該診斷訊息後,該遠端硬體診斷方法更包括:以與該基板管理控制器通訊連結的該遠端管理裝置透過一管理介面傳送該使用者指令至該基板管理控制器,以取得該診斷訊息。
  5. 如請求項1所述之遠端硬體診斷方法,更包括:於該遠端管理裝置產生該回饋訊息後,以該遠端管理裝置傳送該回饋訊息至該伺服器,其中該伺服器通訊連結於該遠端管理裝置。
  6. 一種遠端硬體診斷系統,包括:一伺服器,包括:一基板管理控制器,用於接收一觸發指令並產生一執行指令,以及接收和儲存一診斷訊息,並產生一回饋指令;以及一基本輸入/輸出系統,電性連結於該基板管理控制器,該基本輸入/輸出系統儲存有一開機程序碼,該伺服器於執行該開機程序碼時,根據該執行指令,據以執行一診斷程序,並產生該診斷訊息;以及一遠端管理裝置,透過一網路與該伺服器通訊連結,該遠端管理裝置係具有多個候選指令,該遠端管理裝置於接收一使用者指令時從該些候選指令中擇一產生及輸出該觸發指令,並於接收該回饋指令後產生一回饋訊息。
  7. 如請求項6所述的遠端硬體診斷系統,其中該些候選指令關聯於多個相異的診斷範圍。
  8. 如請求項7所述的遠端硬體診斷系統,其中該些候選指令包括一第一候選指令、一第二候選指令與一第三候選指令,該第一候選指令所關聯的該診斷範圍係一內存初始化代碼,該第二候選指令所關聯的該診斷範圍係該內存初始化代碼與一微軟保留分區,該第三候選指令所關聯的該診斷範圍係該內存初始化代碼、該微軟保留分區與一快捷外設互聯標準。
  9. 如請求項6所述的遠端硬體診斷系統,其中該遠端管理裝置更包含一管理介面,該管理介面在該基板管理控制器接收該診斷訊息後,產生該使用者指令。
  10. 如請求項9所述的遠端硬體診斷系統,其中該使用者指令係被傳送至該基板管理控制器,以取得儲存於該基板管理控制器上的該診斷訊息。
TW107143679A 2018-12-05 2018-12-05 遠端硬體診斷系統與診斷方法 TWI701594B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW107143679A TWI701594B (zh) 2018-12-05 2018-12-05 遠端硬體診斷系統與診斷方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW107143679A TWI701594B (zh) 2018-12-05 2018-12-05 遠端硬體診斷系統與診斷方法

Publications (2)

Publication Number Publication Date
TW202022599A TW202022599A (zh) 2020-06-16
TWI701594B true TWI701594B (zh) 2020-08-11

Family

ID=72175873

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107143679A TWI701594B (zh) 2018-12-05 2018-12-05 遠端硬體診斷系統與診斷方法

Country Status (1)

Country Link
TW (1) TWI701594B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201200986A (en) * 2010-06-30 2012-01-01 Hon Hai Prec Ind Co Ltd Server time synchronization system
TW201516666A (zh) * 2013-09-11 2015-05-01 Hon Hai Prec Ind Co Ltd 電腦狀態監控系統
CN104850485A (zh) * 2015-05-25 2015-08-19 深圳国鑫恒宇技术有限公司 一种基于bmc远程诊断服务器开机故障的方法及系统
TW201715396A (zh) * 2015-10-23 2017-05-01 神雲科技股份有限公司 伺服器及其偵錯方法
TWI618380B (zh) * 2015-10-14 2018-03-11 廣達電腦股份有限公司 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體
CN107957923A (zh) * 2016-10-14 2018-04-24 华为技术有限公司 一种内存诊断方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201200986A (en) * 2010-06-30 2012-01-01 Hon Hai Prec Ind Co Ltd Server time synchronization system
TW201516666A (zh) * 2013-09-11 2015-05-01 Hon Hai Prec Ind Co Ltd 電腦狀態監控系統
CN104850485A (zh) * 2015-05-25 2015-08-19 深圳国鑫恒宇技术有限公司 一种基于bmc远程诊断服务器开机故障的方法及系统
TWI618380B (zh) * 2015-10-14 2018-03-11 廣達電腦股份有限公司 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體
TW201715396A (zh) * 2015-10-23 2017-05-01 神雲科技股份有限公司 伺服器及其偵錯方法
CN107957923A (zh) * 2016-10-14 2018-04-24 华为技术有限公司 一种内存诊断方法和装置

Also Published As

Publication number Publication date
TW202022599A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
TWI616758B (zh) 遠端多電腦切換技術之儲存裝置、系統及方法
US10127032B2 (en) System and method for unified firmware management
US8671393B2 (en) Collaborative software debugging in a distributed system with client-specific dynamic breakpoints
TWI229796B (en) Method and system to implement a system event log for system manageability
JP2021503639A5 (zh)
US20070011507A1 (en) System and method for remote system support
US20170031694A1 (en) System and method for remote system configuration managment
US9712382B2 (en) Retrieving console messages after device failure
US10725890B1 (en) Program testing service
US20120102459A1 (en) Collaborative Software Debugging In A Distributed System With Stacked Event Group Management
US9298568B2 (en) Method and apparatus for device driver state storage during diagnostic phase
TWI553490B (zh) 遠端系統配置管理方法、遠端系統配置管理系統及非暫態電腦可讀式儲存多媒體
US10229033B2 (en) System, method and apparatus for debugging of reactive applications
TWI701594B (zh) 遠端硬體診斷系統與診斷方法
US11113166B2 (en) Monitoring system and method with baseboard management controller
CN114564334B (zh) 一种mrpc数据处理方法、系统及相关组件
CN109491826B (zh) 远程硬件诊断系统与诊断方法
WO2019169582A1 (zh) 处理中断的方法和装置
TWI704460B (zh) 叢集式系統中維持記憶體共享方法
JP4208494B2 (ja) ネットワークサーバへの負荷テストシステム
WO1992006057A1 (fr) Systeme servant a commander l'emission d'instructions d'entree/sortie dans un systeme de traitement de donnees
TWI715005B (zh) 用於監控基板管理控制器之常駐程序的方法
TWI298137B (zh)
WO2024066857A1 (zh) 一种电子设备、处理器、数据传输方法及装置
TW202343269A (zh) 連接埠的設定方法