CN103473167A - 服务器的故障显示方法及装置 - Google Patents

服务器的故障显示方法及装置 Download PDF

Info

Publication number
CN103473167A
CN103473167A CN2013104098220A CN201310409822A CN103473167A CN 103473167 A CN103473167 A CN 103473167A CN 2013104098220 A CN2013104098220 A CN 2013104098220A CN 201310409822 A CN201310409822 A CN 201310409822A CN 103473167 A CN103473167 A CN 103473167A
Authority
CN
China
Prior art keywords
charactron
trouble spot
fault
information
shows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013104098220A
Other languages
English (en)
Other versions
CN103473167B (zh
Inventor
程龙飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310409822.0A priority Critical patent/CN103473167B/zh
Publication of CN103473167A publication Critical patent/CN103473167A/zh
Application granted granted Critical
Publication of CN103473167B publication Critical patent/CN103473167B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明公开了一种服务器的故障显示方法及装置,该方法包括:基本管理控制器控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;所述基本管理控制器控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息。通过上述方式,本发明能够在服务器存在故障点时,控制诊断面板自动显示故障点的故障类型、故障位置或故障位置与故障代码。

Description

服务器的故障显示方法及装置
技术领域
本发明涉及服务器技术领域,特别是涉及一种服务器的故障显示方法及装置。
背景技术
光诊断面板在高端服务器领域的应用越来越广泛,并且随着客户对总体拥有成本(TCO,Total Cost of Ownership)指标的要求越来越高,低成本、多功能、高可靠性的光诊断面板对提升服务器供应商的高性能服务器产品的竞争力具有至关重要的作用。
目前业界主要有两种诊断服务器的光诊断面板,一种是IBM提供的光诊断面板,其主要组成部分有LED灯、数码管和复位按钮等,当服务器有多个故障点时,通过按面板上的复位按钮切换显示不同的故障点;另一种是DELL提供的光诊断面板,其光诊断面板上带滚动显示屏,通过滚动显示屏显示服务器的故障点。
本申请的发明人在长期的研发中发现,IBM提供的光诊断面板不能显示故障点的故障代码,DELL提供的光诊断面板不能显示故障位置,即上述两种光诊断面板对服务器的故障点的显示都不方便。
发明内容
本发明主要解决的技术问题是提供一种服务器的故障显示方法及装置,能够在服务器存在故障点时,控制诊断面板自动显示故障点的故障类型、故障位置或故障位置与故障代码。
第一方面,本发明提供一种服务器的故障显示方法,包括:基本管理控制器控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;所述基本管理控制器控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息。
在第一方面的第一种可能的实现方式中,所述基本管理控制器控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息的步骤,包括:所述基本管理控制器控制所述诊断面板与所述服务器系统故障点的故障类型对应的故障指示单元显示两种不同的信号,以使得所述故障指示单元在显示所有故障点的故障类型时,突出显示其中一个所述故障点。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述基本管理控制器控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息的步骤,包括:在突出显示其中一个所述故障点的时间内,所述基本管理控制器控制所述诊断面板的数码管显示所述故障点的故障位置信息,或分别先后显示所述故障点的故障位置信息和故障代码信息。
在第一方面的第三种可能的实现方式中,所述方法还包括:所述基本管理控制器控制所述诊断面板的数码管显示所述服务器系统的80码信息或服务器系统的总功耗信息。
结合第一方面、第一方面的第一种、第二种以及第三种任一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述方法还包括:在所述数码管显示信息时,所述基本管理控制器控制所述数码管下方的显示类型指示单元显示信号,以便于指示所述数码管显示的类型。
结合第一方面、第一方面的第一种、第二种以及第三种任一种可能的实现方式,在第一方面的第五种可能的实现方式中,所述数码管是两位的数码管。
结合第一方面的第五种可能的实现方式,在第一方面的第六种可能的实现方式中,所述基本管理控制器控制所述诊断面板的数码管显示所述服务器系统的总功耗信息的步骤,包括:所述基本管理控制器控制所述诊断面板的数码管分别先后显示总功耗数值中前面两位数值和后面两位数值。
结合第一方面、第一方面的第一种、第二种以及第三种任一种可能的实现方式,在第一方面的第七种可能的实现方式中,所述方法还包括:若所述服务器系统存在故障点,则所述基本管理控制器控制声光报警器启动。
第二方面,本发明提供一种服务器的故障显示装置,所述装置包括:第一控制模块和第二控制模块;所述第一控制模块用于控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;所述第二控制模块用于控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息。
在第二方面的第一种可能的实现方式中,所述第一控制模块具体用于控制所述诊断面板与所述服务器系统故障点的故障类型对应的故障指示单元显示两种不同的信号,以使得所述故障指示单元在显示所有故障点的故障类型时,突出显示其中一个所述故障点。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述第二控制模块具体用于在突出显示其中一个所述故障点的时间内,控制所述诊断面板的数码管显示所述故障点的故障位置信息,或分别先后显示所述故障点的故障位置信息和故障代码信息。
在第二方面的第三种可能的实现方式中,所述装置还包括第三控制模块,所述第三控制模块用于控制所述诊断面板的数码管显示所述服务器系统的80码信息或服务器系统的总功耗信息。
结合第二方面、第二方面的第一种、第二种以及第三种任一种可能的实现方式,在第二方面的第四种可能的实现方式中,所述装置还包括第四控制模块,所述第四控制模块用于在所述数码管显示信息时,控制所述数码管下方的显示类型指示单元显示信号,以便于指示所述数码管显示的类型。
结合第二方面、第二方面的第一种、第二种以及第三种任一种可能的实现方式,在第二方面的第五种可能的实现方式中,所述数码管是两位的数码管。
结合第二方面的第五种可能的实现方式,在第二方面的第六种可能的实现方式中,所述第三控制模块还用于控制所述诊断面板的数码管分别先后显示总功耗数值中前面两位数值和后面两位数值。
结合第二方面、第二方面的第一种、第二种以及第三种任一种可能的实现方式,在第二方面的第七种可能的实现方式中,所述装置还包括第五控制模块,所述第五控制模块用于在所述服务器系统存在故障点时,控制声光报警器启动。
本发明的有益效果是:区别于现有技术的情况,本发明由于通过控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息,因而能够在服务器存在故障点时,控制诊断面板自动显示故障点的故障类型、故障位置或故障位置与故障代码。
附图说明
图1是本发明服务器的故障显示方法一实施方式的流程图;
图2是本发明服务器的故障显示方法另一实施方式的流程图;
图3是本发明服务器的故障显示方法又一实施方式的流程图;
图4是本发明服务器的故障显示方法在实际中的一个应用流程图;
图5是图4中服务器系统的结构示意图;
图6是图4中服务器主板与诊断面板的连接示意图;
图7是本发明服务器的故障显示装置一实施方式的结构示意图;
图8是本发明服务器的诊断装置另一实施方式的结构示意图;
图9是本发明服务器的诊断装置又一实施方式的结构示意图。
具体实施方式
下面结合附图和实施方式对本发明进行详细说明。
参阅图1,图1是本发明服务器的故障显示方法一实施方式的流程图,包括:
步骤S101:基本管理控制器控制诊断面板的故障指示单元显示服务器系统故障点的故障类型信息。
基本管理控制器(BMC,Baseboard Management Controller)的主要功能是自动监视平台系统管理事件,把发生的事件记录在非易失的系统事件日志中。BMC记录的事件类型包括温度超标、电压超标、风扇故障和机箱入侵等。在监视过程中,BMC管理非易失传感器数据记录存储库,从该库中可以检索出系统运行时的信息。
诊断面板用于显示服务器系统的故障点的故障信息。故障类型是指服务器具体的故障点,例如主板、扩展板(如硬盘背板、电源背板等)、中央处理器CPU、内存、硬盘、电源、风扇等。故障指示单元可以让操作人员知道服务器发生故障的故障点具体是什么故障类型。例如故障指示单元可以是故障发光二极管LED指示灯。服务器系统故障点的故障类型信息,举例如下:
板Board故障LED指示灯:表明主板、扩展板(硬盘背板、电源背板、PCIE Riser卡)故障;
CPU故障LED指示灯:表明CPU故障或未正确安装或不匹配;
内存MEM故障LED指示灯:表明内存故障或配置错误;
硬盘HDD故障LED指示灯:表明硬盘故障;
电源PS故障LED指示灯:表明电源内部故障或无输入或电源风扇故障;
风扇FAN故障LED指示灯:表明风扇故障或被拔掉;
外设部件互连标准E故障PCIE故障LED指示灯:表明PCIE总线或PCIE卡故障;
独立磁盘冗余阵列RAID故障LED指示灯:表明RAID卡故障。
例如,当服务器故障点的故障类型是CPU、内存以及硬盘时,基本管理控制器控制诊断面板的CPU故障LED指示灯、内存故障LED指示灯以及硬盘故障LED指示灯以灯亮的形式分别显示服务器系统故障点的故障类型信息,三个对应的指示灯亮,表明服务器故障点的故障类型是CPU、内存以及硬盘。
步骤S102:基本管理控制器控制诊断面板的数码管显示故障点的故障位置信息或分别先后显示故障点的故障位置信息和故障代码信息。
在需要显示故障点的故障位置时,基本管理控制器控制诊断面板的数码管显示故障点的故障位置信息,在需要显示故障点的故障位置和故障代码时,基本管理控制器控制诊断面板的数码管分别先后显示故障点的故障位置信息和故障代码信息。
例如,当服务器故障点的故障类型是CPU、内存以及硬盘时,CPU需要显示故障位置信息和故障代码信息,内存需要显示故障位置信息,故障点的故障类型CPU、内存以及硬盘显示的先后顺序不做限制,以CPU、内存以及硬盘的顺序为例,则基本管理控制器控制诊断面板的CPU故障LED指示灯亮,同时控制数码管先显示CPU的故障位置信息,然后显示CPU的故障代码信息;接着控制诊断面板的内存故障LED指示灯亮,同时控制数码管显示内存的故障位置信息;最后控制诊断面板的硬盘故障LED指示灯亮。基本管理控制器通过控制诊断面板的故障指示单元和数码管,从而既能显示服务器系统故障点的故障类型信息,又能显示所述故障点的故障位置信息或所述故障点的故障位置信息和故障代码信息。
本发明实施方式由于通过控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息,因而能够在服务器存在故障点时,控制诊断面板自动显示故障点的故障类型、故障位置或故障位置与故障代码。
参阅图2,图2是本发明服务器的故障显示方法另一实施方式的流程图,该流程包括:
步骤S201:基本管理控制器控制诊断面板与服务器系统故障点的故障类型对应的故障指示单元显示两种不同的信号,以使得故障指示单元在显示所有故障点的故障类型时,突出显示其中一个故障点。
基本管理控制器控制诊断面板与服务器系统故障点的故障类型对应的故障指示单元显示两种不同的信号,这样做的目的有两个,一方面,可以显示服务器所有故障点的故障类型,另一方面,可以突出显示其中一个故障点。
步骤S202:在突出显示其中一个故障点的时间内,基本管理控制器控制诊断面板的数码管显示故障点的故障位置信息,或分别先后显示故障点的故障位置信息和故障代码信息。
由于基本管理控制器控制诊断面板的数码管显示故障点的故障位置信息,或分别先后显示故障点的故障位置信息和故障代码信息,是在突出显示其中一个故障点的时间内进行显示的,因此,可以明确地知道当前数码管显示的故障点的故障位置信息或分别先后显示故障点的故障位置信息和故障代码信息,是突出显示的其中一个故障点的相关信息。
例如,当服务器故障点的故障类型是CPU、内存以及硬盘时,CPU需要显示故障位置信息和故障代码信息,内存需要显示故障位置信息,故障点的故障类型CPU、内存以及硬盘显示的先后顺序不做限制,以CPU、内存以及硬盘的顺序为例,基本管理控制器控制诊断面板的CPU故障LED指示灯闪,其它的内存故障LED指示灯和硬盘故障LED指示灯同时亮,控制数码管先显示CPU的故障位置信息,然后显示CPU的故障代码信息;然后控制诊断面板的内存故障LED指示灯闪,其它的CPU故障LED指示灯和硬盘故障LED指示灯同时亮,控制数码管显示内存的故障位置信息;最后控制诊断面板的硬盘故障LED指示灯闪,其它的CPU故障LED指示灯和内存故障LED指示灯同时亮。
通过本发明实施方式,一方面可以显示服务器所有故障点的故障类型,另一方面可以显示相关故障点的故障位置或故障位置和故障代码。
参阅图3,图3是本发明服务器的故障显示方法又一实施方式的流程图,该流程包括:
步骤S301:在服务器处于系统上电自检POST阶段时,基本管理控制器控制诊断面板的数码管显示服务器系统的80码信息,同时控制数码管下方的80码指示单元显示信号,以便于指示数码管显示的是80码。
系统上电自检(POST,Power On Self Test)是基本输入输出系统(BIOS,Basic Input Output System)设置的一个功能,计算机接通电源后,系统首先由POST程序来对内部各个设备进行检查,通常完整的POST自检将包括CPU、640K基本内存(640K BASE MEMORY)、1MB以上扩展内存(EXTEND MEMORY)、ROM(READ-ONLY MEMORY,只读存储器)、主板、CMOS存储器、串口、并口、显卡、软盘子系统、硬盘子系统、键盘进行测试。
BIOS是一组固化到计算机内主板上一个ROM芯片上的程序,它保存着计算机最重要的基本输入输出的程序、系统设置信息、开机后自检程序和系统自启动程序,其主要功能是为计算机提供最底层的、最直接的硬件设置和控制。
服务器系统的80码是指服务器系统在启动时,以16进制表示的用以指示当前系统运行状况的代码,例如,01表示处理器测试1,处理器状态核实,如果测试失败,循环是无限的;02表示确定诊断的类型(正常或者制造);07表示处理器测试2,处理器寄存器状态核实。
在服务器处于系统上电自检POST阶段时,控制诊断面板的数码管显示服务器系统的80码信息,同时控制数码管下方的80码指示单元显示信号,以便于指示数码管显示的是80码。
步骤S302:在POST阶段结束后,判断服务器系统是否有故障点。
步骤S303:在POST阶段结束后,若服务器系统没有故障点,则控制诊断面板的数码管显示服务器系统的总功耗信息,同时控制数码管下方的总功耗指示单元显示信号,以便于指示数码管显示的是系统的总功耗。
当POST阶段结束后,BMC检查系统是否有故障点,如果检查发现系统没有故障点,则控制诊断面板的数码管显示服务器系统的总功耗信息。显示服务器系统的总功耗,可以方便地知道系统目前的运行状态,服务器的负载压力是否过大,是否处于安全的范围;在生产环节,根据服务器系统的总功耗可以及时地发现潜在的风险;在使用环节,即对用户来说可以直接地知道系统的总功耗,而不用再单独进行测试。
其中,数码管是两位的数码管。数码管是一种半导体发光器件,其基本单元是发光二极管。数码管按能显示多少个“8”可分为1位、2位、3位、4位、5位、6位、7位等数码管。本实施方式中,数码管是两位数码管,此时,两位数码管显示大于两位的数值的方法如下所述。
此时,步骤S303具体包括:基本管理控制器控制诊断面板的数码管分别先后显示总功耗数值中前面两位数值和后面两位数值。
在实际应用中,步骤S303具体的实现过程可以是:
A.控制诊断面板的数码管处于显示总功耗数值中前面两位数值的第一显示状态,并使第一显示状态保持第四预定时间。
B.第四预定时间结束后,控制诊断面板的数码管处于不显示信号的第二显示状态,并使第二显示状态保持第五预定时间。
C.在第五预定时间结束后,控制诊断面板的数码管处于显示总功耗数值中后面两位数值的第三显示状态,并使第三显示状态保持第六预定时间。
例如:如果系统的总功耗为1217W,通过只有两位的数码管显示有四位数值的方法是:第一显示状态,数码管显示前面两位数值“12”,保持3秒,第二显示状态,数码管熄灭,保持0.5秒,第三显示状态,数码管显示后面两位数值“17”,保持1秒,这样就可以很容易明白哪两位是高位哪两位是低位。
步骤S304:若服务器系统存在故障点,则基本管理控制器控制声光报警器启动。
控制声光报警器启动,是为了方便操作人员快速找到存在故障点的服务器。
步骤S305:基本管理控制器控制诊断面板与服务器系统故障点的故障类型对应的故障指示单元显示两种不同的信号,以使得故障指示单元在显示所有故障点的故障类型时,突出显示其中一个故障点。
步骤S306:在突出显示其中一个故障点的时间内,基本管理控制器控制诊断面板的数码管显示故障点的故障位置信息,同时控制数码管下方的故障位置指示单元显示信号,以便于指示数码管显示的是故障位置,或分别先后显示故障点的故障位置信息和故障代码信息,同时分别先后控制数码管下方的故障位置指示单元和故障代码指示单元显示信号,以便于指示数码管显示的是故障位置与故障代码。
例如,当服务器故障点的故障类型是CPU、内存以及硬盘时,CPU需要显示故障位置信息和故障代码信息,内存需要显示故障位置信息,故障点的故障类型CPU、内存以及硬盘显示的先后顺序不做限制,以CPU、内存以及硬盘的顺序为例,基本管理控制器控制诊断面板的CPU故障LED指示灯闪,其它的内存故障LED指示灯和硬盘故障LED指示灯同时亮,控制数码管先显示CPU的故障位置信息,同时数码管下方的故障位置指示灯亮,然后显示CPU的故障代码信息,同时数码管下方的故障代码指示灯亮;然后控制诊断面板的内存故障LED指示灯闪,其它的CPU故障LED指示灯和硬盘故障LED指示灯同时亮,控制数码管显示内存的故障位置信息,同时数码管下方的故障位置指示灯亮;最后控制诊断面板的硬盘故障LED指示灯闪,其它的CPU故障LED指示灯和内存故障LED指示灯同时亮。
在实际应用中,上述步骤S305和步骤S306的实现过程可以是:
a:获取服务器的故障点的数量n,其中,n是不包含零的自然数。
b:控制诊断面板处于对应服务器的第m个故障点的第一指示状态,其中,m是不包含零且小于等于n的自然数,第一指示状态是指诊断面板上对应第m个故障点的故障指示单元显示第一信号,n个故障点的剩余故障点的故障指示单元显示第二信号,并使对应服务器的第m个故障点的第一指示状态保持第一预定时间。
c:在使对应服务器的第m个故障点的第一指示状态保持第一预定时间之后,控制诊断面板对应下一个故障点的故障指示单元显示第一信号,回到上一步不断循环,直到所有故障点的故障指示单元都已经显示第一信号即可结束。
d:若需要指示第m个故障点的故障位置信息,则控制诊断面板还处于对应服务器的第m个故障点的第二指示状态,其中,第二指示状态是指诊断面板的数码管指示第m个故障点的故障位置,同时数码管下方的故障位置指示单元显示信号,并使对应服务器的第m个故障点的第二指示状态保持第二预定时间,第二预定时间小于或等于第一预定时间。
第二预定时间小于或等于第一预定时间,可以保证诊断面板的数码管指示第m个故障点的故障位置信息时,是在突出显示第m个故障点的时间范围内。
e:若需要指示第m个故障点的故障代码信息,则控制诊断面板还处于对应服务器的第m个故障点的第三指示状态,其中,第三指示状态是指诊断面板的数码管指示第m个故障点的故障代码,同时数码管下方的故障代码指示单元显示信号,并使对应服务器的第m个故障点的第三指示状态保持第三预定时间,第二预定时间加上第三预定时间小于或等于第一预定时间。
第二预定时间加上第三预定时间小于或等于第一预定时间,可以保证诊断面板的数码管分别先后指示第m个故障点的故障位置信息和故障代码信息时,是在突出显示第m个故障点的时间范围内。
例如,如果是三个故障点,故障类型分别是内存、CPU以及硬盘,故障指示单元是故障LED指示灯,第一信号是灯闪烁,第二信号是灯亮,第一预定时间在需要显示故障位置和故障代码时是15秒,在不需要显示故障位置和故障代码时是5秒,第二预定时间是5秒,第三预定时间是5秒,CPU需要显示的故障位置是5,数码管下方的故障位置指示单元是标识为NUM的指示灯,CPU需要显示的故障代码是0201,数码管下方的故障代码指示单元是标识为CODE的指示灯,那么,第一个故障点是内存,诊断面板处于对应内存的第一指示状态是:内存LED指示灯闪烁,CPU和硬盘LED指示灯亮,这种状态保持5秒,第二个故障点是CPU,诊断面板处于对应CPU的第一指示状态是:CPU的LED指示灯闪烁,内存和硬盘LED指示灯亮,这种状态保持15秒,同时,诊断面板处于对应CPU的第二指示状态是:数码管指示CPU的故障位置5,NUM的指示灯亮,这种状态保持5秒,然后诊断面板处于对应CPU的第三指示状态是:数码管指示CPU的故障代码0201,CODE的指示灯亮,这种状态保持5秒,第三个故障点是硬盘,诊断面板处于对应硬盘的第一指示状态是:硬盘LED指示灯闪烁,内存和CPU的LED指示灯亮,这种状态保持5秒。
其中,通过数码管显示故障代码的方法与通过数码管显示系统的总功耗的方法一样,具体的显示方法可以参见通过数码管显示系统的总功耗的方法。
需要说明的是,在实际应用中,可以根据具体情况对本实施方式中的步骤进行增减,在此不再赘叙。
本发明实施方式由于通过控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息,因而能够在服务器存在故障点时,控制诊断面板自动显示故障点的故障类型、故障位置或故障位置与故障代码。另外,POST阶段和POST阶段后数码管可以分别显示服务器系统的80码信息和服务器系统的总功耗信息。
本实施方式在实际中的一个应用流程具体请参见图4,包括如下步骤:
步骤S1:在服务器处于POST阶段时,BMC控制数码管显示80码;如果服务器系统在POST阶段发生故障,可以在诊断面板直接读出80码的状态,同时数码管下方的“80PORT”灯亮,方便问题定位和故障诊断。
步骤S2:BMC对服务器进行故障检查。
步骤S3:BMC判断服务器系统是否存在故障点;如果没有故障点,进入步骤S4,如果存在故障点,进入步骤S5。
步骤S4:BMC控制数码管显示服务器系统的总功耗,同时PWR灯(总功耗指示单元)亮(显示信号)。然后进入步骤S2。
步骤S5:BMC控制声光报警器打开(启动)。
步骤S6:BMC判断服务器存在一个故障点还是两个以上的故障点;如果是一个故障点,进入步骤S7,如果是两个以上的故障点,进入步骤S14。
步骤S7:点亮故障点对应的LED灯(即故障指示单元,第一信号是亮,第二信号无)。操作人员通过LED灯确定故障类型。
步骤S8:BMC判断该故障点是否需要显示具体的故障位置。如果需要显示具体的故障位置,进入步骤S9,通常是电源、CPU、内存、硬盘、风扇需要显示具体的故障位置。如果不需要显示具体的故障位置,进入步骤S2,即可以固定预定的时间周期,每到一个预定的时间周期,BMC对服务器进行故障检查。
步骤S9:BMC控制数码管显示故障位置同时点亮NUM灯(第二指示状态)。
步骤S10:延时5秒(第二预定时间)。
步骤S11:BMC判断该故障点是否需要显示故障代码。如果需要,进入步骤S12,如果不需要,进入步骤S2。
步骤S12:BMC控制数码管显示故障代码同时点亮CODE灯(第三指示状态)。
步骤S13:延时5秒(第三预定时间)。
步骤S14:BMC判断服务器的故障点的数量n,并对故障点进行编号1至n。
步骤S15:定义参数m等于1。
步骤S16:BMC控制第m个故障点对应的灯(故障指示单元)闪(第一信号),它的剩余故障点长亮(第二信号)。
步骤S17:BMC判断该第m个故障点是否需要显示具体的故障位置。如果需要,进入步骤S18,如果不需要,进入步骤S23。
步骤S18:BMC控制数码管显示故障位置同时点亮NUM灯(第二指示状态)。
步骤S19:延时5秒(第二预定时间)。
步骤S20:BMC判断该第m个故障点是否需要显示故障代码。如果需要,进入步骤S21,如果不需要,进入步骤S23。
步骤S21:BMC控制数码管显示故障代码同时点亮CODE灯(第三指示状态)。
步骤S22:延时5秒(第三预定时间)。
步骤S23:延时5秒。
步骤S24:使m等于m加1,即m=m+1。
步骤S25:BMC判断m是否等于n加1,如果是,进入步骤S2,如果不是进入步骤S16。
需要说明的是:
第一,整个系统由面板(由串并转换电路、数码管刷新电路、声光报警装置和数码管组成,如图5所示)、后台程序、故障检测等几个部分构成。
第二,BIOS在启动过程中对CPU、内存等故障进行检测,发现故障上报到BMC。
第三,BMC定期扫描被管理对象,及时检测故障状态。
第四,LED灯状态展示方式采取由后台触发点灯方式。后台程序是一个独立的常驻进程;后台程序启动一个线程,每间隔一段时间主动扫描一下硬件的当前状态,如果发现异常则通过I2C或IPMI将点灯信号传输至诊断面板来点相应指示灯。服务器主板与诊断面板的连接示意图请参见图6。
诊断面板主要包括以下部件:
①数码管:主要用于显示80码、系统总功耗、故障位置和故障代码。
②数码管下方的显示类型灯:
80PORT:数码管显示80码时80PORT灯亮。
NUM:数码管显示故障位置时NUM灯亮。
CODE:数码管显示故障代码时CODE灯亮。
PWR:数码管显示服务器系统总功耗时PWR灯亮。
③故障点LED指示灯:
Board灯:主板、扩展板(硬盘背板、电源背板、PCIE Riser卡)故障。
CPU灯:CPU故障或未正确安装或不匹配。
MEM灯:内存故障或配置错误。
HDD灯:硬盘故障。
PS灯:电源内部故障或无输入或电源风扇故障。
FAN灯:风扇故障或被拔掉。
PCIE灯:PCIE总线或PCIE卡故障。
RAID灯:RAID卡故障。
VRM灯:CPU、BMC单板、硬盘背板、网卡的DC-DC电压整流模块故障。
LINK灯:线缆连接错误,如:SAS线缆插错、硬盘背板与主板的信号线连接错误等
TEMP灯:CPU、内存、环境温度过高。
OTHER灯:除上述指示灯所指示的故障以外的故障。
参阅图7,图7是本发明服务器的故障显示装置一实施方式的结构示意图,该装置包括:第一控制模块101和第二控制模块102。
需要说明的是,本实施方式的装置可以执行图1至图3中的步骤。
第一控制模块101用于控制诊断面板的故障指示单元显示服务器系统故障点的故障类型信息。
基本管理控制器(BMC,Baseboard Management Controller)的主要功能是自动监视平台系统管理事件,把发生的事件记录在非易失的系统事件日志中。BMC记录的事件类型包括温度超标、电压超标、风扇故障和机箱入侵等。在监视过程中,BMC管理非易失传感器数据记录存储库,从该库中可以检索出系统运行时的信息。
诊断面板用于显示服务器系统的故障点的故障信息。故障类型是指服务器具体的故障点,例如主板、扩展板(如硬盘背板、电源背板等)、CPU、内存、硬盘、电源、风扇等。故障指示单元可以让操作人员知道服务器发生故障的故障点具体是什么故障类型。例如故障指示单元可以是故障LED指示灯。服务器系统故障点的故障类型信息,举例如下:
Board故障LED指示灯:表明主板、扩展板(硬盘背板、电源背板、PCIE Riser卡)故障;
CPU故障LED指示灯:表明CPU故障或未正确安装或不匹配;
MEM故障LED指示灯:表明内存故障或配置错误;
HDD故障LED指示灯:表明硬盘故障;
PS故障LED指示灯:表明电源内部故障或无输入或电源风扇故障;
FAN故障LED指示灯:表明风扇故障或被拔掉;
PCIE故障LED指示灯:表明PCIE总线或PCIE卡故障;
RAID故障LED指示灯:表明RAID卡故障。
例如,当服务器故障点的故障类型是CPU、内存以及硬盘时,基本管理控制器控制诊断面板的CPU故障LED指示灯、内存故障LED指示灯以及硬盘故障LED指示灯以灯亮的形式分别显示服务器系统故障点的故障类型信息,三个对应的指示灯亮,表明服务器故障点的故障类型是CPU、内存以及硬盘。
第二控制模块102用于控制诊断面板的数码管显示故障点的故障位置信息或分别先后显示故障点的故障位置信息和故障代码信息。
在需要显示故障点的故障位置时,基本管理控制器控制诊断面板的数码管显示故障点的故障位置信息,在需要显示故障点的故障位置和故障代码时,基本管理控制器控制诊断面板的数码管分别先后显示故障点的故障位置信息和故障代码信息。
例如,当服务器故障点的故障类型是CPU、内存以及硬盘时,CPU需要显示故障位置信息和故障代码信息,内存需要显示故障位置信息,故障点的故障类型CPU、内存以及硬盘显示的先后顺序不做限制,以CPU、内存以及硬盘的顺序为例,则基本管理控制器控制诊断面板的CPU故障LED指示灯亮,同时控制数码管先显示CPU的故障位置信息,然后显示CPU的故障代码信息;接着控制诊断面板的内存故障LED指示灯亮,同时控制数码管显示内存的故障位置信息;最后控制诊断面板的硬盘故障LED指示灯亮。基本管理控制器通过控制诊断面板的故障指示单元和数码管,从而既能显示服务器系统故障点的故障类型信息,又能显示所述故障点的故障位置信息或所述故障点的故障位置信息和故障代码信息。
本发明实施方式由于通过控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息,因而能够在服务器存在故障点时,控制诊断面板自动显示故障点的故障类型、故障位置或故障位置与故障代码。
参阅图8,图8是本发明服务器的诊断装置另一实施方式的结构示意图,该装置包括:第一控制模块201、第二控制模块202、第三控制模块203、第四控制模块204以及第五控制模块205。
需要说明的是,本实施方式的装置可以执行图3中的步骤。
第一控制模块201用于控制诊断面板的故障指示单元显示服务器系统故障点的故障类型信息。
基本管理控制器(BMC,Baseboard Management Controller)的主要功能是自动监视平台系统管理事件,把发生的事件记录在非易失的系统事件日志中。BMC记录的事件类型包括温度超标、电压超标、风扇故障和机箱入侵等。在监视过程中,BMC管理非易失传感器数据记录存储库,从该库中可以检索出系统运行时的信息。
诊断面板用于显示服务器系统的故障点的故障信息。故障类型是指服务器具体的故障点,例如主板、扩展板(如硬盘背板、电源背板等)、CPU、内存、硬盘、电源、风扇等。故障指示单元可以让操作人员知道服务器发生故障的故障点具体是什么故障类型。例如故障指示单元可以是故障LED指示灯。
例如,当服务器故障点的故障类型是CPU、内存以及硬盘时,基本管理控制器控制诊断面板的CPU故障LED指示灯、内存故障LED指示灯以及硬盘故障LED指示灯以灯亮的形式分别显示服务器系统故障点的故障类型信息,三个对应的指示灯亮,表明服务器故障点的故障类型是CPU、内存以及硬盘。
第一控制模块201具体用于控制诊断面板与服务器系统故障点的故障类型对应的故障指示单元显示两种不同的信号,以使得故障指示单元在显示所有故障点的故障类型时,突出显示其中一个故障点。
基本管理控制器控制诊断面板与服务器系统故障点的故障类型对应的故障指示单元显示两种不同的信号,这样做的目的有两个,一方面,可以显示服务器所有故障点的故障类型,另一方面,可以突出显示其中一个故障点。
第二控制模块102用于控制诊断面板的数码管显示故障点的故障位置信息或分别先后显示故障点的故障位置信息和故障代码信息。
在需要显示故障点的故障位置时,基本管理控制器控制诊断面板的数码管显示故障点的故障位置信息,在需要显示故障点的故障位置和故障代码时,基本管理控制器控制诊断面板的数码管分别先后显示故障点的故障位置信息和故障代码信息。
第二控制模块202具体用于在突出显示其中一个故障点的时间内,控制诊断面板的数码管显示故障点的故障位置信息,或分别先后显示故障点的故障位置信息和故障代码信息。
由于基本管理控制器控制诊断面板的数码管显示故障点的故障位置信息,或分别先后显示故障点的故障位置信息和故障代码信息,是在突出显示其中一个故障点的时间内进行显示的,因此,可以明确地知道当前数码管显示的故障点的故障位置信息或分别先后显示故障点的故障位置信息和故障代码信息,是突出显示的其中一个故障点的相关信息。
例如,当服务器故障点的故障类型是CPU、内存以及硬盘时,CPU需要显示故障位置信息和故障代码信息,内存需要显示故障位置信息,故障点的故障类型CPU、内存以及硬盘显示的先后顺序不做限制,以CPU、内存以及硬盘的顺序为例,则基本管理控制器控制诊断面板的CPU故障LED指示灯亮,同时控制数码管先显示CPU的故障位置信息,然后显示CPU的故障代码信息;接着控制诊断面板的内存故障LED指示灯亮,同时控制数码管显示内存的故障位置信息;最后控制诊断面板的硬盘故障LED指示灯亮。基本管理控制器通过控制诊断面板的故障指示单元和数码管,从而既能显示服务器系统故障点的故障类型信息,又能显示所述故障点的故障位置信息或所述故障点的故障位置信息和故障代码信息。
第三控制模块203用于控制诊断面板的数码管显示服务器系统的80码信息或服务器系统的总功耗信息。
第四控制模块204用于在数码管显示信息时,控制数码管下方的显示类型指示单元显示信号,以便于指示数码管显示的类型。
在服务器处于系统上电自检POST阶段时,第三控制模块203控制诊断面板的数码管显示服务器系统的80码信息,同时第四控制模块204控制数码管下方的80码指示单元显示信号,以便于指示数码管显示的是80码。
在POST阶段结束后,若服务器系统没有故障点,第三控制模块203控制诊断面板的数码管显示服务器系统的总功耗信息,同时第四控制模块204控制数码管下方的总功耗指示单元显示信号,以便于指示数码管显示的是系统的总功耗。
其中,数码管是两位的数码管。数码管是一种半导体发光器件,其基本单元是发光二极管。数码管按能显示多少个“8”可分为1位、2位、3位、4位、5位、6位、7位等数码管。本实施方式中,数码管是两位数码管,此时,两位数码管显示大于两位的数值的方法如下所述。
第三控制模块203还用于控制诊断面板的数码管分别先后显示总功耗数值中前面两位数值和后面两位数值。具体内容是:
A.第三控制模块203控制诊断面板的数码管处于显示总功耗数值中前面两位数值的第一显示状态,并使第一显示状态保持第四预定时间。
B.第四预定时间结束后,第三控制模块203控制诊断面板的数码管处于不显示信号的第二显示状态,并使第二显示状态保持第五预定时间。
C.在第五预定时间结束后,第三控制模块203控制诊断面板的数码管处于显示总功耗数值中后面两位数值的第三显示状态,并使第三显示状态保持第六预定时间。
例如:如果系统的总功耗为1217W,通过只有两位的数码管显示有四位数值的方法是:第一显示状态,数码管显示前面两位数值“12”,保持3秒,第二显示状态,数码管熄灭,保持0.5秒,第三显示状态,数码管显示后面两位数值“17”,保持1秒,这样就可以很容易明白哪两位是高位哪两位是低位。
第五控制模块205用于在服务器系统存在故障点时,控制声光报警器启动。
控制声光报警器启动,是为了方便操作人员快速找到存在故障点的服务器。
本发明实施方式由于通过控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息,因而能够在服务器存在故障点时,控制诊断面板自动显示故障点的故障类型、故障位置或故障位置与故障代码。另外,POST阶段和POST阶段后数码管可以分别显示服务器系统的80码信息和服务器系统的总功耗信息。
参阅图9,图9是本发明服务器的诊断装置又一实施方式的结构示意图,该装置包括:处理器11、存储器12以及数据总线13,其中,存储器12通过数据总线13与处理器11进行连接通信。
处理器11用于控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息。
处理器11还用于控制所述诊断面板与所述服务器系统故障点的故障类型对应的故障指示单元显示两种不同的信号,以使得所述故障指示单元在显示所有故障点的故障类型时,突出显示其中一个所述故障点。
处理器11还用于在突出显示其中一个所述故障点的时间内,控制所述诊断面板的数码管显示所述故障点的故障位置信息,或分别先后显示所述故障点的故障位置信息和故障代码信息。
处理器11还用于控制所述诊断面板的数码管显示所述服务器系统的80码信息或服务器系统的总功耗信息。
处理器11还用于控制所述数码管下方的显示类型指示单元显示信号,以便于指示所述数码管显示的类型。
其中,所述数码管是两位的数码管。
处理器11还用于控制所述诊断面板的数码管分别先后显示总功耗数值中前面两位数值和后面两位数值。
处理器11还用于若所述服务器系统存在故障点,则控制声光报警器启动。
本发明实施方式由于通过控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息,因而能够在服务器存在故障点时,控制诊断面板自动显示故障点的故障类型、故障位置或故障位置与故障代码。另外,POST阶段和POST阶段后数码管可以分别显示服务器系统的80码信息和服务器系统的总功耗信息。
在本发明所提供的几个实施方式中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本发明各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (16)

1.一种服务器的故障显示方法,其特征在于,包括:
基本管理控制器控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;
所述基本管理控制器控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息。
2.根据权利要求1所述的方法,其特征在于,所述基本管理控制器控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息的步骤,包括:
所述基本管理控制器控制所述诊断面板与所述服务器系统故障点的故障类型对应的故障指示单元显示两种不同的信号,以使得所述故障指示单元在显示所有故障点的故障类型时,突出显示其中一个所述故障点。
3.根据权利要求2所述的方法,其特征在于,所述基本管理控制器控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息的步骤,包括:
在突出显示其中一个所述故障点的时间内,所述基本管理控制器控制所述诊断面板的数码管显示所述故障点的故障位置信息,或分别先后显示所述故障点的故障位置信息和故障代码信息。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述基本管理控制器控制所述诊断面板的数码管显示所述服务器系统的80码信息或服务器系统的总功耗信息。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:在所述数码管显示信息时,所述基本管理控制器控制所述数码管下方的显示类型指示单元显示信号,以便于指示所述数码管显示的类型。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述数码管是两位的数码管。
7.根据权利要求6所述的方法,其特征在于,所述基本管理控制器控制所述诊断面板的数码管显示所述服务器系统的总功耗信息的步骤,包括:
所述基本管理控制器控制所述诊断面板的数码管分别先后显示总功耗数值中前面两位数值和后面两位数值。
8.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:若所述服务器系统存在故障点,则所述基本管理控制器控制声光报警器启动。
9.一种服务器的故障显示装置,其特征在于,所述装置包括:第一控制模块和第二控制模块;
所述第一控制模块用于控制所述诊断面板的故障指示单元显示服务器系统故障点的故障类型信息;
所述第二控制模块用于控制所述诊断面板的数码管显示所述故障点的故障位置信息或分别先后显示所述故障点的故障位置信息和故障代码信息。
10.根据权利要求9所述的装置,其特征在于,所述第一控制模块具体用于控制所述诊断面板与所述服务器系统故障点的故障类型对应的故障指示单元显示两种不同的信号,以使得所述故障指示单元在显示所有故障点的故障类型时,突出显示其中一个所述故障点。
11.根据权利要求10所述的装置,其特征在于,所述第二控制模块具体用于在突出显示其中一个所述故障点的时间内,控制所述诊断面板的数码管显示所述故障点的故障位置信息,或分别先后显示所述故障点的故障位置信息和故障代码信息。
12.根据权利要求9所述的装置,其特征在于,所述装置还包括第三控制模块,所述第三控制模块用于控制所述诊断面板的数码管显示所述服务器系统的80码信息或服务器系统的总功耗信息。
13.根据权利要求9至12任一项所述的装置,其特征在于,所述装置还包括第四控制模块,所述第四控制模块用于在所述数码管显示信息时,控制所述数码管下方的显示类型指示单元显示信号,以便于指示所述数码管显示的类型。
14.根据权利要求9至12任一项所述的装置,其特征在于,所述数码管是两位的数码管。
15.根据权利要求14所述的装置,其特征在于,所述第三控制模块还用于控制所述诊断面板的数码管分别先后显示总功耗数值中前面两位数值和后面两位数值。
16.根据权利要求9至12任一项所述的装置,其特征在于,所述装置还包括第五控制模块,所述第五控制模块用于在所述服务器系统存在故障点时,控制声光报警器启动。
CN201310409822.0A 2013-09-09 2013-09-09 服务器的故障显示方法及装置 Active CN103473167B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310409822.0A CN103473167B (zh) 2013-09-09 2013-09-09 服务器的故障显示方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310409822.0A CN103473167B (zh) 2013-09-09 2013-09-09 服务器的故障显示方法及装置

Publications (2)

Publication Number Publication Date
CN103473167A true CN103473167A (zh) 2013-12-25
CN103473167B CN103473167B (zh) 2016-08-10

Family

ID=49798032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310409822.0A Active CN103473167B (zh) 2013-09-09 2013-09-09 服务器的故障显示方法及装置

Country Status (1)

Country Link
CN (1) CN103473167B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744774A (zh) * 2014-01-23 2014-04-23 浪潮电子信息产业股份有限公司 一种服务器故障可视化快速诊断的方法
CN103810081A (zh) * 2014-01-24 2014-05-21 加弘科技咨询(上海)有限公司 异常状态警示方法
CN104391765A (zh) * 2014-10-27 2015-03-04 浪潮电子信息产业股份有限公司 一种自动诊断服务器启动故障的方法
CN104598346A (zh) * 2015-02-15 2015-05-06 浪潮电子信息产业股份有限公司 一种服务器系统中快速故障定位的监控管理装置及方法
CN105373465A (zh) * 2015-12-04 2016-03-02 英业达科技有限公司 一种系统状态的检测方法、系统及服务器
CN105847061A (zh) * 2016-04-28 2016-08-10 浪潮(北京)电子信息产业有限公司 一种服务器的传感器信息监控系统
CN106095628A (zh) * 2016-05-26 2016-11-09 合肥联宝信息技术有限公司 计算机调试方法及装置
CN106504797A (zh) * 2016-10-10 2017-03-15 郑州云海信息技术有限公司 测试存储器中RAID IO led灯的自动化方法
CN106557392A (zh) * 2015-09-29 2017-04-05 鸿富锦精密工业(深圳)有限公司 服务器故障检测装置及方法
CN106776242A (zh) * 2016-12-06 2017-05-31 郑州云海信息技术有限公司 一种用于存储系统的背板led控制系统
CN106897180A (zh) * 2017-02-27 2017-06-27 郑州云海信息技术有限公司 一种存储设备故障自检测方法及系统
CN108170476A (zh) * 2018-01-26 2018-06-15 郑州云海信息技术有限公司 一种记录服务器bios版本信息的方法及系统
CN109179211A (zh) * 2018-08-24 2019-01-11 中车齐齐哈尔车辆有限公司 故障类型的展示方法及装置
CN109976449A (zh) * 2019-03-13 2019-07-05 苏州浪潮智能科技有限公司 一种服务器工况检测显示装置
CN110413469A (zh) * 2018-04-28 2019-11-05 中国长城科技集团股份有限公司 一种故障检测系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04317112A (ja) * 1991-04-16 1992-11-09 Meidensha Corp マン・マシン・インターフェースのエラーメッセージ処理方法
CN1952909A (zh) * 2005-10-21 2007-04-25 鸿富锦精密工业(深圳)有限公司 电脑报错方法和系统
CN101840371A (zh) * 2010-04-23 2010-09-22 浪潮电子信息产业股份有限公司 一种快速显示计算机故障的方法
CN102479143A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 刀锋服务系统
CN103198000A (zh) * 2013-04-02 2013-07-10 浪潮电子信息产业股份有限公司 一种linux系统下的故障内存位置定位方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04317112A (ja) * 1991-04-16 1992-11-09 Meidensha Corp マン・マシン・インターフェースのエラーメッセージ処理方法
CN1952909A (zh) * 2005-10-21 2007-04-25 鸿富锦精密工业(深圳)有限公司 电脑报错方法和系统
CN101840371A (zh) * 2010-04-23 2010-09-22 浪潮电子信息产业股份有限公司 一种快速显示计算机故障的方法
CN102479143A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 刀锋服务系统
CN103198000A (zh) * 2013-04-02 2013-07-10 浪潮电子信息产业股份有限公司 一种linux系统下的故障内存位置定位方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744774A (zh) * 2014-01-23 2014-04-23 浪潮电子信息产业股份有限公司 一种服务器故障可视化快速诊断的方法
CN103810081A (zh) * 2014-01-24 2014-05-21 加弘科技咨询(上海)有限公司 异常状态警示方法
CN104391765A (zh) * 2014-10-27 2015-03-04 浪潮电子信息产业股份有限公司 一种自动诊断服务器启动故障的方法
CN104598346A (zh) * 2015-02-15 2015-05-06 浪潮电子信息产业股份有限公司 一种服务器系统中快速故障定位的监控管理装置及方法
CN106557392A (zh) * 2015-09-29 2017-04-05 鸿富锦精密工业(深圳)有限公司 服务器故障检测装置及方法
CN105373465A (zh) * 2015-12-04 2016-03-02 英业达科技有限公司 一种系统状态的检测方法、系统及服务器
CN105847061A (zh) * 2016-04-28 2016-08-10 浪潮(北京)电子信息产业有限公司 一种服务器的传感器信息监控系统
CN106095628A (zh) * 2016-05-26 2016-11-09 合肥联宝信息技术有限公司 计算机调试方法及装置
CN106504797A (zh) * 2016-10-10 2017-03-15 郑州云海信息技术有限公司 测试存储器中RAID IO led灯的自动化方法
CN106776242A (zh) * 2016-12-06 2017-05-31 郑州云海信息技术有限公司 一种用于存储系统的背板led控制系统
CN106897180A (zh) * 2017-02-27 2017-06-27 郑州云海信息技术有限公司 一种存储设备故障自检测方法及系统
CN108170476A (zh) * 2018-01-26 2018-06-15 郑州云海信息技术有限公司 一种记录服务器bios版本信息的方法及系统
CN110413469A (zh) * 2018-04-28 2019-11-05 中国长城科技集团股份有限公司 一种故障检测系统
CN109179211A (zh) * 2018-08-24 2019-01-11 中车齐齐哈尔车辆有限公司 故障类型的展示方法及装置
CN109976449A (zh) * 2019-03-13 2019-07-05 苏州浪潮智能科技有限公司 一种服务器工况检测显示装置

Also Published As

Publication number Publication date
CN103473167B (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
CN103473167A (zh) 服务器的故障显示方法及装置
JP6530774B2 (ja) ハードウェア障害回復システム
US9207948B2 (en) Multi-BIOS circuit and switching method between multiple BIOS chips
CN105700969B (zh) 服务器系统
US9146823B2 (en) Techniques for testing enclosure management controller using backplane initiator
US20120133520A1 (en) Computer chassis system and hard disk status display method thereof
US20120041707A1 (en) Cold boot test system and method for electronic devices
CN106354610A (zh) 伺服器系统及其操作方法
KR20080063162A (ko) 브레이드 서버 관리시스템
CN106055438A (zh) 一种快速定位主板上内存条异常的方法及系统
US11640377B2 (en) Event-based generation of context-aware telemetry reports
CN109032901A (zh) 一种远程带外ssd的监控方法、装置及受控终端
CN102479140A (zh) 计算机系统及其硬盘状态显示方法
US9158646B2 (en) Abnormal information output system for a computer system
CN101206599B (zh) 计算机主板设备诊断和隔离方法
CN104035855A (zh) 硬盘监测方法和装置
CN104572724A (zh) 主机工作状态的监测系统和监测方法
CN113311754A (zh) 一种基于gd32单片机的电源模块的bmc管理系统
US11126486B2 (en) Prediction of power shutdown and outage incidents
KR102706333B1 (ko) 테스트 신호를 이용한 빅데이터 기반의 엘이디 디스플레이 장치의 모니터링 시스템
KR102706334B1 (ko) 제어 신호를 이용한 빅데이터 기반의 엘이디 디스플레이 장치의 모니터링 시스템
CN111752790A (zh) 硬盘状态监测系统及硬盘状态监测方法
CN116010141A (zh) 一种多路服务器启动异常定位方法、装置及其介质
CN102053888A (zh) 运算装置的自我检测方法与系统
US11682274B2 (en) Programmable dynamic information handling system rack lighting system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant