CN102902613A - 计算机系统及其诊断方法 - Google Patents

计算机系统及其诊断方法 Download PDF

Info

Publication number
CN102902613A
CN102902613A CN2011102282668A CN201110228266A CN102902613A CN 102902613 A CN102902613 A CN 102902613A CN 2011102282668 A CN2011102282668 A CN 2011102282668A CN 201110228266 A CN201110228266 A CN 201110228266A CN 102902613 A CN102902613 A CN 102902613A
Authority
CN
China
Prior art keywords
management bus
system management
master controller
message diagnosis
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011102282668A
Other languages
English (en)
Other versions
CN102902613B (zh
Inventor
周乐生
钱威宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Publication of CN102902613A publication Critical patent/CN102902613A/zh
Application granted granted Critical
Publication of CN102902613B publication Critical patent/CN102902613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2294Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by remote test
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2284Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by power-on test, e.g. power-on self test [POST]

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Selective Calling Equipment (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一种计算机系统及其诊断方法。计算机系统包括系统管理总线切换器、伺服器及远端管理控制器。各伺服器包括诊断讯息端口、基本输入输出系统及逻辑电路。基本输入输出系统输出诊断讯息至诊断讯息端口。逻辑电路撷取诊断讯息。远端管理控制器包括系统管理总线主控制器。系统管理总线主控制器根据一请求控制系统管理总线切换器将系统管理总线主控制器电性连接至与对应的逻辑电路,逻辑电路根据请求回应诊断讯息至系统管理总线主控制器。

Description

计算机系统及其诊断方法
技术领域
本发明涉及一种计算机,特别是涉及一种计算机系统及其诊断方法。
背景技术
请参照图1,图1示出了机架式伺服器的示意图。在传统机架式伺服器(Rack Server)1的设计上,为了方便维护人员能了解每一部伺服器的开机程序是否完整与完成,伺服器主机板11多半会被设计出各种型态的除错诊断装置。而最简易型的是依赖伺服器主机板11上的传统I/O端口80H所提供的开机自我检测(Power On Self Test,POST)除错诊断讯息。
伺服器主机板11藉由八个发光二极管111,显示出目前基本输入输出系统(BIOS)对伺服器主机板111上各类硬件初始化的阶段,或是在开机过程中被检测出的软/硬件错误。进而提供给维护人员对伺服器上进一步的维护参考。
然而,目前一般的机架式伺服器1多半搭载超过40部以上的伺服器,维护人员不但无法全览所有伺服器的开机状态,还必须并采逐台逐台的方式一一检查除错诊断讯息,有时甚至还要考虑机架式伺服器1的上端伺服器的高度而踩上高阶梯来维护,实为不便且费时。
发明内容
本发明是有关于一种计算机系统及其诊断方法。
根据本发明,提出一种计算机系统。计算机系统包括系统管理总线切换器、伺服器及远端管理控制器(Remote Management Controller,RMC)。各伺服器包括诊断讯息端口(Diagnostic Message Port)、基本输入输出系统(BIOS)及逻辑电路。基本输入输出系统(BIOS),是输出诊断讯息(Diagnostic Message)至诊断讯息端口。逻辑电路撷取诊断讯息。远端管理控制器包括系统管理总线(System Management Bus,SMBus)主控制器。系统管理总线主控制器根据一请求控制系统管理总线切换器将系统管理总线主控制器电性连接至与对应的逻辑电路,逻辑电路根据请求回应诊断讯息至系统管理总线主控制器。
根据本发明,提出一种计算机系统的诊断方法。计算机系统包括伺服器、远端管理控制器(Remote Management Controller,RMC)及系统管理总线(System Management Bus,SMBus)切换器,各伺服器包括诊断讯息端口(Diagnostic Message Port)、基本输入输出系统及逻辑电路,远端管理控制器包括系统管理总线(System Management Bus,SMBus)主控制器。诊断方法包括:基本输入输出系统输出诊断讯息(Diagnostic Message)至诊断讯息端口;逻辑电路撷取诊断讯息;系统管理总线主控制器根据一请求控制系统管理总线切换器将系统管理总线主控制器电性连接至与对应的逻辑电路;以及逻辑电路根据请求回应诊断讯息至系统管理总线主控制器。
为了对本发明的上述及其他方面有更佳的了解,下文特举较佳实施例,并结合附图详细说明如下。
附图说明
图1示出了机架式伺服器的示意图。
图2示出了依照本发明的计算机系统的示意图。
图3示出了伺服器的示意图。
图4示出了逻辑电路的示意图。
图5示出了远端管理控制器的示意图。
图6示出了依照本发明的诊断方法的流程图。
图7示出了基本输入输出系统的开机流程图。
图8示出了远端管理控制器的开机流程图。
图9示出了逻辑电路的开机流程图。
附图符号说明
1:传统机架式伺服器
2:计算机系统
11:伺服器主机板
21(1)~21(n):伺服器
22:远端管理控制器
23:系统管理总线切换器
24:网络
25:远端伺服器
61~67、71~73、81~88、91~98、721~724:步骤
111:发光二极管
211:诊断讯息端口
212:基本输入输出系统
213:逻辑电路
214:低脚位数总线
221:系统管理总线主控制器
222:显示装置
223:网络控制器
224:诊断讯息中心
2131:内部缓存器
2132:通用输入输出逻辑
2133:系统管理总线从控制器
具体实施方式
请同时参照图2至图5,图2示出了依照本发明的计算机系统的示意图,图3示出了伺服器的示意图,图4示出了逻辑电路的示意图,图5示出了远端管理控制器的示意图。计算机系统2包括伺服器21(1)~21(n)、远端管理控制器(Remote Management Controller,RMC)22及系统管理总线(SystemManagement Bus,SMBus)切换器23。其中,n是大于1的正整数,且伺服器21(1)~21(n)例如为机架式伺服器。伺服器21(1)~21(n)各包括诊断讯息端口(Diagnostic Message Port)211、基本输入输出系统212、逻辑电路213及低脚位数(Low Pin Count,LPC)总线214。低脚位数总线214用以连接逻辑电路213及诊断讯息端口211。基本输入输出系统212输出诊断讯息(Diagnostic Message)至诊断讯息端口211,而逻辑电路213自诊断讯息端口211撷取诊断讯息。其中诊断讯息端口211例如为I/O端口80H,而诊断讯息是由基本输入输出系统212执行开机自我检测(Power On Self Test,POST)所产生。
逻辑电路213进一步包括内部缓存器(Internal Buffer)2131、通用输入输出(General Purpose I/O,GPIO)逻辑2132及系统管理总线从控制器(SMBus slave controller)2133。通用输入输出(General Purpose I/O,GPIO)逻辑将诊断讯息储存至内部缓存器2131。系统管理总线从控制器2133根据请求于内部缓存器2131中找出对应的诊断讯息并输出诊断讯息至系统管理总线主控制器221。
远端管理控制器22包括系统管理总线(System Management Bus,SMBus)主控制器221及诊断讯息中心224。诊断讯息中心输出请求至系统管理总线主控制器221,且系统管理总线主控制器221输出诊断讯息至诊断讯息中心224。诊断讯息中心224包括显示装置222及网络控制器223,且显示装置222及网络控制器223耦接至系统管理总线主控制器221。系统管理总线主控制器221例如根据显示装置222或网络控制器223所产生的请求控制系统管理总线切换器23将系统管理总线主控制器221电性连接至与对应的逻辑电路213,逻辑电路213根据请求回应诊断讯息至系统管理总线主控制器221。
此外,网络控制器223能进一步经网络24耦接至远端伺服器25。如此一来,管理人员能从远端来了解伺服器21(1)~21(n)的开机程序是否完整或完成,还可通过远端管理装置即时地得知伺服器21(1)~21(n)的状态及故障原因,进而降低维护时间并大幅提高管理效能。
请同时参照图2至图6,图6示出了依照本发明的诊断方法的流程图。诊断方法能应用于前述计算机系统2,且包括如下步骤:首先如步骤61所示,基本输入输出系统212执行开机自我检测以输出诊断讯息至诊断讯息端口211。接着如步骤62所示,通用输入输出逻辑2132自诊断讯息端口211撷取诊断讯息并将诊断讯息储存至内部缓存器2131。跟着如步骤63所示,诊断讯息中心224输出请求至系统管理总线主控制器221。请求例如是由显示装置222或网络控制器223所产生。
然后如步骤64所示,系统管理总线主控制器221根据请求控制系统管理总线切换器23将系统管理总线主控制器221电性连接至对应的系统管理总线从控制器2133。接着如步骤65所示,系统管理总线切换器23将请求传送至对应的系统管理总线从控制器2133。跟着如步骤66所示,系统管理总线从控制器2133根据请求于内部缓存器2131中找出与请求对应的诊断讯息并输出至系统管理总线主控制器221。然后如步骤67所示,系统管理总线主控制器221输出诊断讯息至诊断讯息中心224。
请参照图7,图7示出了基本输入输出系统的开机流程图。前述基本输入输出系统的开机流程包括如下步骤:首先如步骤71所示,于伺服器21(1)~21(n)电源开启后,基本输入输出系统212传送开机自我检测起始码至诊断讯息端口211。接着执行步骤72,对伺服器21(1)~21(n)的各项硬件进行初始化。需说明的是,伺服器21(1)~21(n)的各项硬件包括中央处理器、存储器、硬盘或网络卡等等,所以步骤72会重复地被执行直到各项硬件皆初始化完毕。步骤72进一步包括步骤721至725。如步骤721所示,基本输入输出系统212传送开机自我程序码至诊断讯息端口211。接着如步骤722所示,开始进行初始化直到程序结束。跟着如步骤723所示,基本输入输出系统212判断是否产生错误码。若产生错误码则如步骤724所示,基本输入输出系统212将错误码传送至诊断讯息端口211。然后如步骤73所示,基本输入输出系统212传送开机自我检测结束码至诊断讯息端口211。
请参照图8,图8示出了远端管理控制器的开机流程图。首先如步骤81所示,远端管理控制器22接收显示装置222或网络控制器223所产生的请求。接着如步骤82所示,远端管理控制器22根据请求识别出所欲连接的伺服器,并控制系统管理总线切换器23将远端管理控制器22电性连接至对应的伺服器。
接着如步骤83所示,远端管理控制器22判断是否发生错误。若未发生错误,远端管理控制器22将诊断讯息传送至逻辑电路213。接着如步骤85所示,远端管理控制器22等待逻辑电路213回复诊断讯息。若发生错误,则如步骤86所示,递减一计数值。接着如步骤87所示,远端管理控制器22判断计数值是否为0。若计数值不为0,则重复执行步骤82。相反地,若计数值为0,则如步骤88所示,远端管理控制器22记录诊断讯息读取发生错误。
请参照图9,图9示出了逻辑电路的开机流程图。首先如步骤91所示,通用输入输出(General Purpose I/O,GPIO)逻辑2132经低脚位数总线214自诊断讯号端口211撷取诊断讯息。接着如步骤92所示,通用输入输出逻辑2132储存诊断讯息至内部缓存器2131。跟着如步骤93所示,等待接收请求。然后如步骤94所示,系统管理总线从控制器2133接收请求。接着如步骤95所示,回应诊断讯息至系统管理总线从控制器2133。跟着如步骤96所示,判断是否发生错误。若发生错误,则如步骤97所示,递减一计数值。接着如步骤98所示,判断计数值是否为0。若计数值不为0,则重复执行步骤95。相反地,若计数值为0,则重复执行步骤93。
综上所述,虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明。本领域的技术人员,在不脱离本发明的精神和范围的前提下,可作各种的更动与润饰。因此,本发明的保护范围是以本发明的权利要求为准。

Claims (12)

1.一种计算机系统,包括:
一系统管理总线切换器;
多个伺服器,该各个伺服器包括:
一诊断讯息端口;
一基本输入输出系统,输出一诊断讯息至该诊断讯息端口;及
一逻辑电路,撷取该诊断讯息;以及
一远端管理控制器,包括:
一系统管理总线主控制器,该系统管理总线主控制器根据一请求控制该系统管理总线切换器将该系统管理总线主控制器电性连接至与对应的该逻辑电路,该逻辑电路根据该请求回应该诊断讯息至该系统管理总线主控制器。
2.如权利要求1所述的计算机系统,其中该逻辑电路包括:
一内部缓存器;
一通用输入输出逻辑,用以将该诊断讯息储存至该内部缓存器;以及
一系统管理总线从控制器,根据该请求于该内部缓存器中找出对应的该诊断讯息并输出该诊断讯息至该系统管理总线主控制器。
3.如权利要求2所述的计算机系统,其中该远端管理控制器还包括:
一诊断讯息中心,输出该请求至该系统管理总线主控制器,该系统管理总线主控制器输出该诊断讯息至该诊断讯息中心。
4.如权利要求3所述的计算机系统,其中该诊断讯息中心包括:
一显示装置,耦接至该系统管理总线主控制器;以及
一网络控制器,耦接至该系统管理总线主控制器。
5.如权利要求4所述的计算机系统,其中该网络控制器经网络耦接至一远端伺服器。
6.如权利要求1所述的计算机系统,其中该各个伺服器还包括:
一低脚位数总线,用以连接该逻辑电路及该诊断讯息端口。
7.一种计算机系统的诊断方法,该计算机系统包括多个伺服器、一远端管理控制器及一系统管理总线切换器,该各个伺服器包括一诊断讯息端口、一基本输入输出系统及一逻辑电路,该远端管理控制器包括一系统管理总线主控制器,该诊断方法包括:
该基本输入输出系统输出一诊断讯息至该诊断讯息端口;
该逻辑电路撷取该诊断讯息;
该系统管理总线主控制器根据一请求控制该系统管理总线切换器将该系统管理总线主控制器电性连接至与对应的该逻辑电路;以及
该逻辑电路根据该请求回应该诊断讯息至该系统管理总线主控制器。
8.如权利要求7所述的诊断方法,其中该逻辑电路包括:
一内部缓存器;
一通用输入输出逻辑,用以将该诊断讯息储存至该内部缓存器;以及
一系统管理总线从控制器,根据该请求于该内部缓存器中找出对应的该诊断讯息并输出该诊断讯息至该系统管理总线主控制器。
9.如权利要求8所述的诊断方法,其中该远端管理控制器还包括:
一诊断讯息中心,输出该请求至该系统管理总线主控制器,该系统管理总线主控制器输出该诊断讯息至该诊断讯息中心。
10.如权利要求9所述的诊断方法,其中该诊断讯息中心包括:
一显示装置,耦接至该系统管理总线主控制器;以及
一网络控制器,耦接至该系统管理总线主控制器。
11.如权利要求10所述的诊断方法,其中该网络控制器经网络耦接至一远端伺服器。
12.如权利要求7所述的诊断方法,其中该各个伺服器还包括:
一低脚位数总线,用以连接该逻辑电路及该诊断讯息端口。
CN201110228266.8A 2011-07-25 2011-08-10 计算机系统及其诊断方法 Active CN102902613B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW100126233A TWI453583B (zh) 2011-07-25 2011-07-25 電腦系統及其診斷方法
TW100126233 2011-07-25

Publications (2)

Publication Number Publication Date
CN102902613A true CN102902613A (zh) 2013-01-30
CN102902613B CN102902613B (zh) 2015-09-30

Family

ID=47574859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110228266.8A Active CN102902613B (zh) 2011-07-25 2011-08-10 计算机系统及其诊断方法

Country Status (3)

Country Link
US (1) US8826078B2 (zh)
CN (1) CN102902613B (zh)
TW (1) TWI453583B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035788A (zh) * 2013-03-04 2014-09-10 联想(北京)有限公司 一种进程信息显示方法及电子设备

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793020B (zh) * 2012-10-31 2017-08-04 英业达科技有限公司 机柜式服务器
US10257268B2 (en) 2015-03-09 2019-04-09 Vapor IO Inc. Distributed peer-to-peer data center management
US10404523B2 (en) * 2015-03-09 2019-09-03 Vapor IO Inc. Data center management with rack-controllers
US9936605B2 (en) * 2015-11-30 2018-04-03 Quanta Computer Inc. Controlling air flow in a server rack
US10475677B2 (en) * 2017-08-22 2019-11-12 Globalfoundries Inc. Parallel test structure
CN112579178B (zh) * 2019-09-29 2022-04-05 佛山市顺德区顺达电脑厂有限公司 开机程序除错系统及其主机与方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1617104A (zh) * 2003-11-14 2005-05-18 广达电脑股份有限公司 远端伺服器监控装置
CN1702630A (zh) * 2003-10-16 2005-11-30 广达电脑股份有限公司 除错端口数据的解码系统与方法
TW201104430A (en) * 2009-07-29 2011-02-01 Aten Int Co Ltd KVM switch system and signal processing method thereof
TWM400016U (en) * 2010-05-14 2011-03-11 Dediprog Technology Co Ltd Intelligent computer diagnostic system and diagnostic card for computer debugging
CN102081564A (zh) * 2009-11-26 2011-06-01 英业达股份有限公司 系统除错的方法及具有除错功能的系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6338150B1 (en) * 1997-05-13 2002-01-08 Micron Technology, Inc. Diagnostic and managing distributed processor system
US6163849A (en) * 1997-05-13 2000-12-19 Micron Electronics, Inc. Method of powering up or powering down a server to a maintenance state
US6772376B1 (en) * 2000-11-02 2004-08-03 Dell Products L.P. System and method for reporting detected errors in a computer system
US7058860B2 (en) * 2001-06-29 2006-06-06 Hewlett-Packard Development Company, L.P. System and method of automatic parameter collection and problem solution generation for computer storage devices
TWI329806B (en) * 2006-06-15 2010-09-01 Mitac Int Corp Apparatus and method for scanning slave addresses of smbus slave devices
US20090204667A1 (en) * 2008-02-13 2009-08-13 Osvaldo Diaz User-Initiated Computer Support Using Out-Of-Band Network
US8335891B2 (en) * 2009-07-14 2012-12-18 Hewlett-Packard Development Company, L.P. Method and system for configuring a storage array

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1702630A (zh) * 2003-10-16 2005-11-30 广达电脑股份有限公司 除错端口数据的解码系统与方法
CN1617104A (zh) * 2003-11-14 2005-05-18 广达电脑股份有限公司 远端伺服器监控装置
TW201104430A (en) * 2009-07-29 2011-02-01 Aten Int Co Ltd KVM switch system and signal processing method thereof
CN102081564A (zh) * 2009-11-26 2011-06-01 英业达股份有限公司 系统除错的方法及具有除错功能的系统
TWM400016U (en) * 2010-05-14 2011-03-11 Dediprog Technology Co Ltd Intelligent computer diagnostic system and diagnostic card for computer debugging

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035788A (zh) * 2013-03-04 2014-09-10 联想(北京)有限公司 一种进程信息显示方法及电子设备
CN104035788B (zh) * 2013-03-04 2017-06-27 联想(北京)有限公司 一种进程信息显示方法及电子设备

Also Published As

Publication number Publication date
US8826078B2 (en) 2014-09-02
TWI453583B (zh) 2014-09-21
US20130031411A1 (en) 2013-01-31
TW201305813A (zh) 2013-02-01
CN102902613B (zh) 2015-09-30

Similar Documents

Publication Publication Date Title
CN102902613B (zh) 计算机系统及其诊断方法
US9934187B2 (en) Hot-pluggable computing system
CN102937932B (zh) 集成异构测试工具的自动化测试装置及方法
CN106603265A (zh) 管理方法、服务控制器装置以及非暂态计算机可读介质
CN103138971A (zh) 服务器机柜系统
TWI576706B (zh) 用於早期啟動階段之方法及相關裝置
US20150058482A1 (en) System insight display
US20120137027A1 (en) System and method for monitoring input/output port status of peripheral devices
CN102479141A (zh) 监控上电自检信息的处理系统
CN107861422A (zh) 一种提高服务器主板电源稳定性的系统
CN110674034A (zh) 一种健康检查方法、装置及电子设备和存储介质
CN103019905A (zh) 一种基板管理控制器及其数据处理方法
CN104678982A (zh) 使用独立控制模块进行测试的测试装置及其方法
CN107544883B (zh) 服务器的诊断装置、系统和方法
CN103178977A (zh) 计算机系统及计算机系统的开机管理方法
CN109710479A (zh) 一种处理方法及第一设备、第二设备
CN100550771C (zh) 实现远程加载单板固件的方法和系统
CN106815088A (zh) 服务器及其侦错方法
CN102541705B (zh) 计算机的测试方法和工装板
CN102255766A (zh) 服务器系统
CN116627729A (zh) 外接线缆、外接线缆在位检测装置、开机自检方法及系统
US20130138852A1 (en) Electronic device with baseboard management controller
CN101377753A (zh) 配件测试装置及配件测试方法
CN102053888A (zh) 运算装置的自我检测方法与系统
CN112003727A (zh) 一种多节点服务器电源测试方法、系统、终端及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant