TWI453583B - 電腦系統及其診斷方法 - Google Patents

電腦系統及其診斷方法 Download PDF

Info

Publication number
TWI453583B
TWI453583B TW100126233A TW100126233A TWI453583B TW I453583 B TWI453583 B TW I453583B TW 100126233 A TW100126233 A TW 100126233A TW 100126233 A TW100126233 A TW 100126233A TW I453583 B TWI453583 B TW I453583B
Authority
TW
Taiwan
Prior art keywords
diagnostic message
controller
system management
management bus
diagnostic
Prior art date
Application number
TW100126233A
Other languages
English (en)
Other versions
TW201305813A (zh
Inventor
Le Sheng Chou
Wei Yu Chien
Original Assignee
Quanta Comp Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Comp Inc filed Critical Quanta Comp Inc
Priority to TW100126233A priority Critical patent/TWI453583B/zh
Priority to CN201110228266.8A priority patent/CN102902613B/zh
Priority to US13/364,351 priority patent/US8826078B2/en
Publication of TW201305813A publication Critical patent/TW201305813A/zh
Application granted granted Critical
Publication of TWI453583B publication Critical patent/TWI453583B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2294Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by remote test
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2284Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by power-on test, e.g. power-on self test [POST]

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Selective Calling Equipment (AREA)
  • Debugging And Monitoring (AREA)

Description

電腦系統及其診斷方法
本發明是有關於一種電腦,且特別是有關於一種電腦系統及其診斷方法。
請參照第1圖,第1圖繪示係為機架式伺服器之示意圖。在傳統機架式伺服器(Rack Server)1的設計上,為了方便維護人員能了解每一部伺服器的開機程序是否完整與完成,伺服器主機板11多半會被設計出各種型態的除錯診斷裝置。而最簡易型的是依賴伺服器主機板11上的傳統I/O埠80H所提供的開機自我檢測(Power On Self Test,POST)除錯診斷訊息。
伺服器主機板11藉由八個發光二極體111,顯示出目前基本輸入輸出系統(BIOS)對伺服器主機板111上各類硬體初始化的階段,或是在開機過程中被偵測出的軟/硬體錯誤。進而提供給維護人員對伺服器上進一步的維護參考。
然而,目前一般的機架式伺服器1多半搭載超過40部以上的伺服器,維護人員不但無法全覽所有伺服器的開機狀態,還必須並採逐台逐台的方式一一檢查除錯診斷訊息,有時甚至還要考慮機架式伺服器1之上端伺服器的高度而踩上高階梯來維護,實為不便且廢時。
本發明係有關於一種電腦系統及其診斷方法。
根據本發明,提出一種電腦系統。電腦系統包括系統管理匯流排切換器、伺服器及遠端管理控制器(Remote Management Controller,RMC)。各伺服器包括診斷訊息埠(Diagnostic Message Port)、基本輸入輸出系統(BIOS)及邏輯電路。基本輸入輸出系統(BIOS),係輸出診斷訊息(Diagnostic Message)至診斷訊息埠。邏輯電路擷取診斷訊息。遠端管理控制器包括系統管理匯流排(System Management Bus,SMBus)主控制器。系統管理匯流排主控制器根據一請求控制系統管理匯流排切換器將系統管理匯流排主控制器電性連接至與對應之邏輯電路,邏輯電路根據請求回應診斷訊息至系統管理匯流排主控制器。
根據本發明,提出一種電腦系統之診斷方法。電腦系統包括伺服器、遠端管理控制器(Remote Management Controller,RMC)及系統管理匯流排(System Management Bus,SMBus)切換器,各伺服器包括診斷訊息埠(Diagnostic Message Port)、基本輸入輸出系統及邏輯電路,遠端管理控制器包括系統管理匯流排(System Management Bus,SMBus)主控制器。診斷方法包括:基本輸入輸出系統輸出診斷訊息(Diagnostic Message)至診斷訊息埠;邏輯電路擷取診斷訊息;系統管理匯流排主控制器根據一請求控制系統管理匯流排切換器將系統管理匯流排主控制器電性連接至與對應之邏輯電路;以及邏輯電路根據請求回應診斷訊息至系統管理匯流排主控制器。
為了對本發明之上述及其他方面有更佳的瞭解,下文特舉較佳實施例,並配合所附圖式,作詳細說明如下:
請同時參照第2圖至第5圖,第2圖繪示係為依照本發明之電腦系統之示意圖,第3圖繪示係為伺服器之示意圖,第4圖繪示係為邏輯電路之示意圖,第5圖繪示係為遠端管理控制器之示意圖。電腦系統2包括伺服器21(1)~21(n)、遠端管理控制器(Remote Management Controller,RMC)22及系統管理匯流排(System Management Bus,SMBus)切換器23。其中,n係大於1之正整數,且伺服器21(1)~21(n)例如為機架式伺服器。伺服器21(1)~21(n)各包括診斷訊息埠(Diagnostic Message Port)211、基本輸入輸出系統212、邏輯電路213及低腳位數(Low Pin Count,LPC)匯流排214。低腳位數匯流排214用以連接邏輯電路213及診斷訊息埠211。基本輸入輸出系統212係輸出診斷訊息(Diagnostic Message)至診斷訊息埠211,而邏輯電路213自診斷訊息埠211擷取診斷訊息。其中診斷訊息埠211例如為I/O埠80H,而診斷訊息係由基本輸入輸出系統212執行開機自我檢測(Power On Self Test,POST)所產生。
邏輯電路213進一步包括內部暫存器(Internal Buffer)2131、通用輸入輸出(General Purpose I/O,GPIO)邏輯2132及系統管理匯流排從控制器(SMBus slave controller)2133。通用輸入輸出(General Purpose I/O,GPIO)邏輯將診斷訊息儲存至內部暫存器2131。系統管理匯流排從控制器2133根據請求於內部暫存器2131中找出對應之診斷訊息並輸出診斷訊息至系統管理匯流排主控制器221。
遠端管理控制器22包括系統管理匯流排(System Management Bus,SMBus)主控制器221及診斷訊息中心224。診斷訊息中心係輸出請求至系統管理匯流排主控制器221,且系統管理匯流排主控制器221輸出診斷訊息至診斷訊息中心224。診斷訊息中心224包括顯示裝置222及網路控制器223,且顯示裝置222及網路控制器223係耦接至系統管理匯流排主控制器221。系統管理匯流排主控制器221例如係根據顯示裝置222或網路控制器223所產生之請求控制系統管理匯流排切換器23將系統管理匯流排主控制器221電性連接至與對應之邏輯電路213,邏輯電路213根據請求回應診斷訊息至系統管理匯流排主控制器221。
此外,網路控制器223能進一步經網路24耦接至遠端伺服器25。如此一來,管理人員能從遠端來瞭解伺服器21(1)~21(n)之開機程序是否完整或完成,更可透過遠端管理裝置即時地得知伺服器21(1)~21(n)的狀態及故障原因,進而降低維護時間並大幅提高管理效能。
請同時參照第2圖至第6圖,第6圖繪示係為依照本發明之診斷方法之流程圖。診斷方法能應用於前述電腦系統2,且包括如下步驟:首先如步驟61所示,基本輸入輸出系統212執行開機自我檢測以輸出診斷訊息至診斷訊息埠211。接著如步驟62所示,通用輸入輸出邏輯2132自診斷訊息埠211擷取診斷訊息並將診斷訊息儲存至內部暫存器2131。跟著如步驟63所示,診斷訊息中心224輸出請求至系統管理匯流排主控制器221。請求例如係由顯示裝置222或網路控制器223所產生。
然後如步驟64所示,系統管理匯流排主控制器221根據請求控制系統管理匯流排切換器23將系統管理匯流排主控制器221電性連接至對應之系統管理匯流排從控制器2133。接著如步驟65所示,系統管理匯流排切換器23將請求傳送至對應之系統管理匯流排從控制器2133。跟著如步驟66所示,系統管理匯流排從控制器2133根據請求於內部暫存器2131中找出與請求對應之診斷訊息並輸出至系統管理匯流排主控制器221。然後如步驟67所示,系統管理匯流排主控制器221輸出診斷訊息至診斷訊息中心224。
請參照第7圖,第7圖繪示係為基本輸入輸出系統之開機流程圖。前述基本輸入輸出系統之開機流程包括如下步驟:首先如步驟71所示,於伺服器21(1)~21(n)電源開啟後,基本輸入輸出系統212傳送開機自我檢測起始碼至診斷訊息埠211。接著執行步驟72,對伺服器21(1)~21(n)之各項硬體進行初始化。需說明的是,伺服器21(1)~21(n)之各項硬體包括中央處理器、記憶體、硬碟或網路卡等等,所以步驟72會重複地被執行直到各項硬體皆初始化完畢。步驟72進一步包括步驟721至725。如步驟721所示,基本輸入輸出系統212傳送開機自我程序碼至診斷訊息埠211。接著如步驟722所示,開始進行初始化直到程序結束。跟著如步驟723所示,基本輸入輸出系統212判斷是否產生錯誤碼。若產生錯誤碼則如步驟724所示,基本輸入輸出系統212將錯誤碼傳送至診斷訊息埠211。然後如步驟73所示,基本輸入輸出系統212傳送開機自我檢測結束碼至診斷訊息埠211。
請參照第8圖,第8圖繪示係為遠端管理控制器之開機流程圖。首先如步驟81所示,遠端管理控制器22接收顯示裝置222或網路控制器223所產生之請求。接著如步驟82所示,遠端管理控制器22根據請求識別出所欲連接的伺服器,並控制系統管理匯流排切換器23將遠端管理控制器22電性連接至對應之伺服器。
接著如步驟83所示,遠端管理控制器22判斷是否發生錯誤。若未發生錯誤,遠端管理控制器22將診斷訊息傳送至邏輯電路213。接著如步驟85所示,遠端管理控制器22等待邏輯電路213回覆診斷訊息。若發生錯誤,則如步驟86所示,遞減一計數值。接著如步驟87所示,遠端管理控制器22判斷計數值是否為0。若計數值不為0,則重複執行步驟82。相反地,若計數值為0,則如步驟88所示,遠端管理控制器22記錄診斷訊息讀取發生錯誤。
請參照第9圖,第9圖繪示係為邏輯電路之開機流程圖。首先如步驟91所示,通用輸入輸出(General Purpose I/O,GPIO)邏輯2132經低腳位數匯流排214自診斷訊號埠211擷取診斷訊息。接著如步驟92所示,通用輸入輸出邏輯2132儲存診斷訊息至內部暫存器2131。跟著如步驟93所示,等待接收請求。然後如步驟94所示,系統管理匯流排從控制器2133接收請求。接著如步驟95所示,回應診斷訊息至系統管理匯流排從控制器2133。跟著如步驟96所示,判斷是否發生錯誤。若發生錯誤,則如步驟97所示,遞減一計數值。接著如步驟98所示,判斷計數值是否為0。若計數值不為0,則重複執行步驟95。相反地,若計數值為0,則重複執行步驟93。
綜上所述,雖然本發明已以較佳實施例揭露如上,然其並非用以限定本發明。本發明所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾。因此,本發明之保護範圍當視後附之申請專利範圍所界定者為準。
1...傳統機架式伺服器
2...電腦系統
11...伺服器主機板
21(1)~21(n)...伺服器
22...遠端管理控制器
23...系統管理匯流排切換器
24...網路
25...遠端伺服器
61~67、71~73、81~88、91~98、721~724...步驟
111...發光二極體
211...診斷訊息埠
212...基本輸入輸出系統
213...邏輯電路
214...低腳位數匯流排
221...系統管理匯流排主控制器
222...顯示裝置
223...網路控制器
224...診斷訊息中心
2131...內部暫存器
2132...通用輸入輸出邏輯
2133...系統管理匯流排從控制器
第1圖繪示係為機架式伺服器之示意圖。
第2圖繪示係為依照本發明之電腦系統之示意圖。
第3圖繪示係為伺服器之示意圖。
第4圖繪示係為邏輯電路之示意圖。
第5圖繪示係為遠端管理控制器之示意圖。
第6圖繪示係為依照本發明之診斷方法之流程圖。
第7圖繪示係為基本輸入輸出系統之開機流程圖。
第8圖繪示係為遠端管理控制器之開機流程圖。
第9圖繪示係為邏輯電路之開機流程圖。
61~67...步驟

Claims (12)

  1. 一種電腦系統,包括:一系統管理匯流排(System Management Bus,SMBus)切換器;複數個伺服器,各該些伺服器包括:一診斷訊息埠(Diagnostic Message Port);一基本輸入輸出系統(BIOS),係輸出一診斷訊息(Diagnostic Message)至該診斷訊息埠;及一邏輯電路,係擷取該診斷訊息;以及一遠端管理控制器(Remote Management Controller,RMC),包括:一系統管理匯流排(System Management Bus,SMBus)主控制器,該系統管理匯流排主控制器根據一請求控制該系統管理匯流排切換器將該系統管理匯流排主控制器電性連接至與對應之該邏輯電路,該邏輯電路根據該請求回應該診斷訊息至該系統管理匯流排主控制器。
  2. 如申請專利範圍第1項所述之電腦系統,其中該邏輯電路包括:一內部暫存器(Internal Buffer);一通用輸入輸出(General Purpose I/O,GPIO)邏輯,用以將該診斷訊息儲存至該內部暫存器;以及一系統管理匯流排從控制器(SMBus slave controller),係根據該請求於該內部暫存器中找出對應之該診斷訊息並輸出該診斷訊息至該系統管理匯流排主控制器。
  3. 如申請專利範圍第2項所述之電腦系統,其中該遠端管理控制器更包括:一診斷訊息中心,係輸出該請求至該系統管理匯流排主控制器,該系統管理匯流排主控制器輸出該診斷訊息至該診斷訊息中心。
  4. 如申請專利範圍第3項所述之電腦系統,其中該診斷訊息中心包括:一顯示裝置,係耦接至該系統管理匯流排主控制器;以及一網路控制器,係耦接至該系統管理匯流排主控制器。
  5. 如申請專利範圍第4項所述之電腦系統,其中該網路控制器係經網路耦接至一遠端伺服器。
  6. 如申請專利範圍第1項所述之電腦系統,其中各該些伺服器更包括:一低腳位數(Low Pin Count,LPC)匯流排,用以連接該邏輯電路及該診斷訊息埠。
  7. 一種電腦系統之診斷方法,該電腦系統包括複數個伺服器、一遠端管理控制器(Remote Management Controller,RMC)及一系統管理匯流排(System Management Bus,SMBus)切換器,各該些伺服器包括一診斷訊息埠(Diagnostic Message Port)、一基本輸入輸出系統及一邏輯電路,該遠端管理控制器包括一系統管理匯流排(System Management Bus,SMBus)主控制器,該診斷方法包括:該基本輸入輸出系統輸出一診斷訊息(Diagnostic Message)至該診斷訊息埠;該邏輯電路擷取該診斷訊息;該系統管理匯流排主控制器根據一請求控制該系統管理匯流排切換器將該系統管理匯流排主控制器電性連接至與對應之該邏輯電路;以及該邏輯電路根據該請求回應該診斷訊息至該系統管理匯流排主控制器。
  8. 如申請專利範圍第7項所述之診斷方法,其中該邏輯電路包括:一內部暫存器(Internal Buffer);一通用輸入輸出(General Purpose I/O,GPIO)邏輯,用以將該診斷訊息儲存至該內部暫存器;以及一系統管理匯流排從控制器(SMBus slave controller),係根據該請求於該內部暫存器中找出對應之該診斷訊息並輸出該診斷訊息至該系統管理匯流排主控制器。
  9. 如申請專利範圍第8項所述之診斷方法,其中該遠端管理控制器更包括:一診斷訊息中心,係輸出該請求至該系統管理匯流排主控制器,該系統管理匯流排主控制器輸出該診斷訊息至該診斷訊息中心。
  10. 如申請專利範圍第9項所述之診斷方法,其中該診斷訊息中心包括:一顯示裝置,係耦接至該系統管理匯流排主控制器;以及一網路控制器,係耦接至該系統管理匯流排主控制器。
  11. 如申請專利範圍第10項所述之診斷方法,其中該網路控制器係經網路耦接至一遠端伺服器。
  12. 如申請專利範圍第7項所述之診斷方法,其中各該些伺服器更包括:一低腳位數(Low Pin Count,LPC)匯流排,用以連接該邏輯電路及該診斷訊息埠。
TW100126233A 2011-07-25 2011-07-25 電腦系統及其診斷方法 TWI453583B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW100126233A TWI453583B (zh) 2011-07-25 2011-07-25 電腦系統及其診斷方法
CN201110228266.8A CN102902613B (zh) 2011-07-25 2011-08-10 计算机系统及其诊断方法
US13/364,351 US8826078B2 (en) 2011-07-25 2012-02-02 Computer system and diagnostic method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW100126233A TWI453583B (zh) 2011-07-25 2011-07-25 電腦系統及其診斷方法

Publications (2)

Publication Number Publication Date
TW201305813A TW201305813A (zh) 2013-02-01
TWI453583B true TWI453583B (zh) 2014-09-21

Family

ID=47574859

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100126233A TWI453583B (zh) 2011-07-25 2011-07-25 電腦系統及其診斷方法

Country Status (3)

Country Link
US (1) US8826078B2 (zh)
CN (1) CN102902613B (zh)
TW (1) TWI453583B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793020B (zh) * 2012-10-31 2017-08-04 英业达科技有限公司 机柜式服务器
CN104035788B (zh) * 2013-03-04 2017-06-27 联想(北京)有限公司 一种进程信息显示方法及电子设备
US10404523B2 (en) * 2015-03-09 2019-09-03 Vapor IO Inc. Data center management with rack-controllers
US10257268B2 (en) 2015-03-09 2019-04-09 Vapor IO Inc. Distributed peer-to-peer data center management
US9936605B2 (en) * 2015-11-30 2018-04-03 Quanta Computer Inc. Controlling air flow in a server rack
US10475677B2 (en) * 2017-08-22 2019-11-12 Globalfoundries Inc. Parallel test structure
CN112579178B (zh) * 2019-09-29 2022-04-05 佛山市顺德区顺达电脑厂有限公司 开机程序除错系统及其主机与方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070294436A1 (en) * 2006-06-15 2007-12-20 Ming-Feng Chen Apparatus and method for scanning slave addresses of smbus slave devices
TW201104430A (en) * 2009-07-29 2011-02-01 Aten Int Co Ltd KVM switch system and signal processing method thereof
TWM400016U (en) * 2010-05-14 2011-03-11 Dediprog Technology Co Ltd Intelligent computer diagnostic system and diagnostic card for computer debugging

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6163849A (en) * 1997-05-13 2000-12-19 Micron Electronics, Inc. Method of powering up or powering down a server to a maintenance state
US6338150B1 (en) * 1997-05-13 2002-01-08 Micron Technology, Inc. Diagnostic and managing distributed processor system
US6772376B1 (en) * 2000-11-02 2004-08-03 Dell Products L.P. System and method for reporting detected errors in a computer system
US7058860B2 (en) * 2001-06-29 2006-06-06 Hewlett-Packard Development Company, L.P. System and method of automatic parameter collection and problem solution generation for computer storage devices
US20050084097A1 (en) * 2003-10-16 2005-04-21 Tien-Shin Ho Apparatus and method for calculatingtkip sbox value
CN100343817C (zh) * 2003-11-14 2007-10-17 广达电脑股份有限公司 远端伺服器监控装置、监控方法和监控系统
US20090204667A1 (en) * 2008-02-13 2009-08-13 Osvaldo Diaz User-Initiated Computer Support Using Out-Of-Band Network
US8335891B2 (en) * 2009-07-14 2012-12-18 Hewlett-Packard Development Company, L.P. Method and system for configuring a storage array
CN102081564A (zh) * 2009-11-26 2011-06-01 英业达股份有限公司 系统除错的方法及具有除错功能的系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070294436A1 (en) * 2006-06-15 2007-12-20 Ming-Feng Chen Apparatus and method for scanning slave addresses of smbus slave devices
TW201104430A (en) * 2009-07-29 2011-02-01 Aten Int Co Ltd KVM switch system and signal processing method thereof
TWM400016U (en) * 2010-05-14 2011-03-11 Dediprog Technology Co Ltd Intelligent computer diagnostic system and diagnostic card for computer debugging

Also Published As

Publication number Publication date
US8826078B2 (en) 2014-09-02
US20130031411A1 (en) 2013-01-31
CN102902613B (zh) 2015-09-30
TW201305813A (zh) 2013-02-01
CN102902613A (zh) 2013-01-30

Similar Documents

Publication Publication Date Title
TWI453583B (zh) 電腦系統及其診斷方法
US10127032B2 (en) System and method for unified firmware management
CN106648958B (zh) 基本输入输出系统回复管理系统及其方法以及程序产品
TWI571736B (zh) 自動除錯資訊收集之方法及系統
CN105700969B (zh) 服务器系统
US10698788B2 (en) Method for monitoring server, and monitoring device and monitoring system using the same
US8538720B2 (en) Cold boot test system and method for electronic devices
CN107656856B (zh) 一种基于cpld的系统状态显示方法及装置
CN110162435B (zh) 一种服务器pxe启动测试方法、系统、终端及存储介质
TW201109913A (en) Main system board error-detecting system and its pluggable error-detecting board
US20120137027A1 (en) System and method for monitoring input/output port status of peripheral devices
TWI576706B (zh) 用於早期啟動階段之方法及相關裝置
TWI761668B (zh) 具自我檢測的電腦系統及其偵錯方法
TWI611289B (zh) 伺服器及其偵錯方法
TW201715331A (zh) 伺服器及自動檢修基板管理控制器的方法
US11308002B2 (en) Systems and methods for detecting expected user intervention across multiple blades during a keyboard, video, and mouse (KVM) session
TW201734779A (zh) 通知開機階段的方法及伺服器系統
TW201527965A (zh) Bios調試偵測系統及方法
CN117149555A (zh) 基于服务器功耗的测试管理方法、装置、设备及介质
CN102053888A (zh) 运算装置的自我检测方法与系统
TWI697768B (zh) 重置基板管理控制器的控制方法
TWI675293B (zh) 主機開機檢測方法及其系統
TWI546662B (zh) Module of computerized debug card and its control system
CN107450894B (zh) 通知开机阶段的方法及服务器系统
TW201115331A (en) Self testing method and system for computing apparatus