CN103995768A - 一种服务器故障可视化快速诊断的方法 - Google Patents

一种服务器故障可视化快速诊断的方法 Download PDF

Info

Publication number
CN103995768A
CN103995768A CN201410254461.1A CN201410254461A CN103995768A CN 103995768 A CN103995768 A CN 103995768A CN 201410254461 A CN201410254461 A CN 201410254461A CN 103995768 A CN103995768 A CN 103995768A
Authority
CN
China
Prior art keywords
fault
failure
server
programmable logic
logic controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410254461.1A
Other languages
English (en)
Inventor
白秀杨
叶丰华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201410254461.1A priority Critical patent/CN103995768A/zh
Publication of CN103995768A publication Critical patent/CN103995768A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Testing And Monitoring For Control Systems (AREA)
  • Programmable Controllers (AREA)

Abstract

本发明主要介绍一种服务器故障可视化快速诊断的方法。涉及服务器维修技术领域,在服务器系统发生故障的时候,先通过前面板上不同的红色LED(发光二极管)灯来指示不同的故障类型,然后通过服务器前面板上的一块OLED(有机发光二极管)显示屏来查看具体的故障信息,以达到故障快速诊断的目的。

Description

一种服务器故障可视化快速诊断的方法
 
技术领域   
    本发明涉及服务器维修技术领域,具体地说是一种服务器故障可视化快速诊断的方法。
背景技术
服务器出故障造成的损失较大。作为服务器维修人员需要了解一些服务器故障恢复的基本知识,知道在维修时可以做些什么来最快速的解决问题也可以减少故障停机时间。
在服务器的维修中,线索都会显得扑朔迷离,一般来说不可能一次就可以准确地判断出问题的所在。这样就要求相关人员要有信心及耐心。出现错误一般的流程是通过系统日志上的信息来解决,如果没有解决问题再找出其它因素,然后再看日志信息。总之,服务器出错后,必须一步一步解决,没有捷径可言。
服务器一旦发生故障,其影响力远较普通电脑大得多,所以一旦服务器发生故障。必须在最快的时间内解决问题,以避免最大的损失。
高可靠性作为服务器的一个重要特性,使得故障检测必然成为服务器的一个重要功能。目前服务器故障检测主要是利用的LED灯或7段数码管与故障手册结合的方式,具体就是用户先判断LED灯或7段数码管的状态,然后查阅故障手册定位具体的故障,这种方法的缺点是故障手册中信息一般都很多,用户查找会花费很多的时间,无法做到快速定位故障的目的。
发明内容
本发明克服以上问题,在服务器出现故障的时候利用BMC(基板控制器)将故障信息收集起来传送到可编程控制器,最后利用可编程控制器控制红色LED灯指示出故障类型并在OLED显示屏上将故障信息内容显示出来,从而实现快速定位故障的目的。
    具体步骤如下:
1)服务器系统的BMC需实时监控系统是否发生故障。
2)当BMC监控到系统发生故障时,将故障信息打包通过串口发送到可编程控制器。
3)可编程控制器收到BMC发出的故障信息包后,将故障信息解码为故障类型和故障具体说明两部分。
4)可编程控制器通过判断故障类型,来点亮这种故障类型所对应的红色LED灯。
5)同时可编程控制器将故障具体信息发送到OLED屏幕显示出来。
6)另外如果系统同时出现两种或以上的故障时,用户可通过OLED屏幕的翻页控制按键来查阅完整的故障信息。
7)定位具体故障原因并解决故障。
    BMC实时监控服务器系统工作状态,并在服务器出现故障的时候,将故障信息按照故障类型和故障具体内容的格式编码为故障信息包,然后BMC通过RS232串行总线将编码完成的故障信息包传送到可编程控制器。
故障类型主要分为五类:一、CPU故障,包括CPU的核心电压异常,CPU温度异常,CPU功耗超过门限值等;二、内存故障,包括内存温度异常,内存总量异常等;三、PSU(Power Supply Unit)故障,包括PSU报警,系统功耗超过门限值等;四、传感器(Sensor)故障,包括系统内部温度超过门限值,系统电源电压异常等;五、PCI设配故障,包括PCI设备无法识别,PCI设备报警等;六、板卡故障,包括安装在系统上的功能板卡异常,功能板卡需更换等。
在OLED显示屏上将上面提到的六种故障作为一级菜单显示的,具体故障内容作为对应一级菜单下的二级菜单内容显示,用户可使用OLED显示屏翻页及确定/返回功能按键来查看不同故障类型下的具体故障信息,来定位具体的故障并使用对应的解决方案。此外可编程控制器可将固定一段时间内的所有故障信息进行保存,供用户及客服人员调用,以达到定期收集并排查故障的目的。
本发明的有益效果是:
 利用可编程控制器控制红色LED灯指示出故障类型并在OLED显示屏上将详细的故障信息内容显示出来,从而实现快速定位故障的目的。
用户可使用OLED显示屏翻页及确定/返回功能按键来查看不同故障类型下的具体故障信息,来定位具体的故障并使用对应的解决方案。此外可编程控制器可将固定一段时间内的所有故障信息进行保存,供用户及客服人员调用,以达到定期收集并排查故障的目的。
附图说明
附图1是本发明的故障诊断总体框图;
附图2是本发明的故障诊断UI界面。
具体实施方式
如图1所示,本发明利用现有服务器监控管理芯片BMC实时监控服务器系统工作状态,并在服务器出现故障的时候,将故障信息按照故障类型和故障具体内容的格式编码为故障信息包,然后BMC通过RS232串行总线将编码完成的故障信息包传送到可编程控制器。
 可编程控制器接收到故障信息包后,将其解码还原为故障类型和故障内容两部分;故障类型主要分为五类:一、CPU故障,包括CPU的核心电压异常,CPU温度异常,CPU功耗超过门限值等;二、内存故障,包括内存温度异常,内存总量异常等;三、PSU(Power Supply Unit)故障,包括PSU报警,系统功耗超过门限值等;四、传感器(Sensor)故障,包括系统内部温度超过门限值,系统电源电压异常等;五、PCI设配故障,包括PCI设备无法识别,PCI设备报警等;六、板卡故障,包括安装在系统上的功能板卡异常,功能板卡需更换等。可编程控制器判断故障类型后,点亮对应的LED故障类型指示灯(如图2)。
同时在OLED显示屏上将上面提到的六种故障作为一级菜单显示的,具体故障内容作为对应一级菜单下的二级菜单内容显示,用户可使用OLED显示屏翻页及确定/返回功能按键来查看不同故障类型下的具体故障信息,来定位具体的故障并使用对应的解决方案。此外可编程控制器可将固定一段时间内的所有故障信息进行保存,供用户及客服人员调用,以达到定期收集并排查故障的目的。
具体步骤按照以下方式进行:
1)服务器系统的BMC需实时监控系统是否发生故障。
2)当BMC监控到系统发生故障时,将故障信息打包通过串口发送到可编程控制器。
3)可编程控制器收到BMC发出的故障信息包后,将故障信息解码为故障类型和故障具体说明两部分。
4)可编程控制器通过判断故障类型,来点亮这种故障类型所对应的红色LED灯。
5)同时可编程控制器将故障具体信息发送到OLED屏幕显示出来。
6)另外如果系统同时出现两种或以上的故障时,用户可通过OLED屏幕的翻页控制按键来查阅完整的故障信息。
7)定位具体故障原因并解决故障。
在服务器系统发生故障的时候,先通过服务器前面板上不同的红色LED(发光二极管)灯来指示不同的故障类型,然后通过前面板上的一块OLED(有机发光二极管)显示屏来查看具体的故障信息,以达到故障快速诊断的目的。

Claims (4)

1.一种服务器故障可视化快速诊断的方法,其特征在于在服务器出现故障的时候利用BMC(基板控制器)将故障信息收集起来传送到可编程控制器,最后利用可编程控制器控制红色LED灯指示出故障类型并在OLED显示屏上将故障信息内容显示出来,从而实现快速定位故障的目的。
2.根据权利要求1所述的方法,其特征在于
   具体步骤如下:
服务器系统的BMC需实时监控系统是否发生故障;
当BMC监控到系统发生故障时,将故障信息打包通过串口发送到可编程控制器;
可编程控制器收到BMC发出的故障信息包后,将故障信息解码为故障类型和故障具体说明两部分;
可编程控制器通过判断故障类型,来点亮这种故障类型所对应的红色LED灯;
同时可编程控制器将故障具体信息发送到OLED屏幕显示出来;
另外如果系统同时出现两种或以上的故障时,用户可通过OLED屏幕的翻页控制按键来查阅完整的故障信息;
定位具体故障原因并解决故障。
3.根据权利要求2所述的方法,其特征在于BMC通过RS232串行总线将编码完成的故障信息包传送到可编程控制器。
4.根据权利要求2所述的方法,其特征在于故障类型主要分为五类:一、CPU故障,包括CPU的核心电压异常,CPU温度异常,CPU功耗超过门限值等;二、内存故障,包括内存温度异常,内存总量异常等;三、PSU(Power Supply Unit)故障,包括PSU报警,系统功耗超过门限值等;四、传感器(Sensor)故障,包括系统内部温度超过门限值,系统电源电压异常等;五、PCI设配故障,包括PCI设备无法识别,PCI设备报警等;六、板卡故障,包括安装在系统上的功能板卡异常,功能板卡需更换等。
CN201410254461.1A 2014-06-10 2014-06-10 一种服务器故障可视化快速诊断的方法 Pending CN103995768A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410254461.1A CN103995768A (zh) 2014-06-10 2014-06-10 一种服务器故障可视化快速诊断的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410254461.1A CN103995768A (zh) 2014-06-10 2014-06-10 一种服务器故障可视化快速诊断的方法

Publications (1)

Publication Number Publication Date
CN103995768A true CN103995768A (zh) 2014-08-20

Family

ID=51309941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410254461.1A Pending CN103995768A (zh) 2014-06-10 2014-06-10 一种服务器故障可视化快速诊断的方法

Country Status (1)

Country Link
CN (1) CN103995768A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199757A (zh) * 2014-09-05 2014-12-10 浪潮电子信息产业股份有限公司 一种服务器系统故障信息离线告警的方法
CN104503886A (zh) * 2014-12-03 2015-04-08 浪潮集团有限公司 一种利用psoc进行驱动oled的设计方法
CN104731084A (zh) * 2015-02-09 2015-06-24 浪潮电子信息产业股份有限公司 一种多功能离线诊断装置
CN105373465A (zh) * 2015-12-04 2016-03-02 英业达科技有限公司 一种系统状态的检测方法、系统及服务器
CN105847061A (zh) * 2016-04-28 2016-08-10 浪潮(北京)电子信息产业有限公司 一种服务器的传感器信息监控系统
CN106095628A (zh) * 2016-05-26 2016-11-09 合肥联宝信息技术有限公司 计算机调试方法及装置
CN106815108A (zh) * 2017-01-19 2017-06-09 郑州云海信息技术有限公司 一种多路服务器故障定位系统
WO2017096984A1 (zh) * 2015-12-07 2017-06-15 广州视源电子科技股份有限公司 板卡错误的显示方法和系统
CN106855839A (zh) * 2015-12-08 2017-06-16 中国移动通信集团公司 一种服务器故障指示方法及装置
CN107544893A (zh) * 2017-06-30 2018-01-05 紫光华山信息技术有限公司 一种故障诊断信息输出方法、装置及机器可读存储介质
CN109565183A (zh) * 2016-07-29 2019-04-02 豪倍公司 用于应急照明单元的自诊断故障识别系统
CN111901683A (zh) * 2020-07-24 2020-11-06 海信视像科技股份有限公司 一种故障告警信息的显示方法及显示设备
CN113448811A (zh) * 2021-05-31 2021-09-28 山东英信计算机技术有限公司 服务器系统故障灯点亮的方法、装置、设备及可读介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609350A (zh) * 2012-02-15 2012-07-25 浪潮电子信息产业股份有限公司 一种服务器内存故障报警方法
CN103744774A (zh) * 2014-01-23 2014-04-23 浪潮电子信息产业股份有限公司 一种服务器故障可视化快速诊断的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609350A (zh) * 2012-02-15 2012-07-25 浪潮电子信息产业股份有限公司 一种服务器内存故障报警方法
CN103744774A (zh) * 2014-01-23 2014-04-23 浪潮电子信息产业股份有限公司 一种服务器故障可视化快速诊断的方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199757A (zh) * 2014-09-05 2014-12-10 浪潮电子信息产业股份有限公司 一种服务器系统故障信息离线告警的方法
CN104503886A (zh) * 2014-12-03 2015-04-08 浪潮集团有限公司 一种利用psoc进行驱动oled的设计方法
CN104731084A (zh) * 2015-02-09 2015-06-24 浪潮电子信息产业股份有限公司 一种多功能离线诊断装置
CN105373465A (zh) * 2015-12-04 2016-03-02 英业达科技有限公司 一种系统状态的检测方法、系统及服务器
WO2017096984A1 (zh) * 2015-12-07 2017-06-15 广州视源电子科技股份有限公司 板卡错误的显示方法和系统
CN106855839A (zh) * 2015-12-08 2017-06-16 中国移动通信集团公司 一种服务器故障指示方法及装置
CN105847061A (zh) * 2016-04-28 2016-08-10 浪潮(北京)电子信息产业有限公司 一种服务器的传感器信息监控系统
CN106095628A (zh) * 2016-05-26 2016-11-09 合肥联宝信息技术有限公司 计算机调试方法及装置
CN109565183A (zh) * 2016-07-29 2019-04-02 豪倍公司 用于应急照明单元的自诊断故障识别系统
CN109565183B (zh) * 2016-07-29 2024-04-16 豪倍照明公司 用于应急照明单元的自诊断故障识别系统
CN106815108A (zh) * 2017-01-19 2017-06-09 郑州云海信息技术有限公司 一种多路服务器故障定位系统
CN107544893A (zh) * 2017-06-30 2018-01-05 紫光华山信息技术有限公司 一种故障诊断信息输出方法、装置及机器可读存储介质
CN111901683A (zh) * 2020-07-24 2020-11-06 海信视像科技股份有限公司 一种故障告警信息的显示方法及显示设备
CN111901683B (zh) * 2020-07-24 2023-02-28 海信视像科技股份有限公司 一种故障告警信息的显示方法及显示设备
CN113448811A (zh) * 2021-05-31 2021-09-28 山东英信计算机技术有限公司 服务器系统故障灯点亮的方法、装置、设备及可读介质

Similar Documents

Publication Publication Date Title
CN103995768A (zh) 一种服务器故障可视化快速诊断的方法
CN103744774A (zh) 一种服务器故障可视化快速诊断的方法
CN103186452A (zh) 服务器系统
CN202440104U (zh) 一种带式输送安全保护系统
CN106610712B (zh) 基板管理控制器复位系统及方法
CN206515675U (zh) 一种led显示屏智能监测管理系统
CN106354685A (zh) 一种psu和me通信i2c总线挂死恢复的实现方法
CN204044803U (zh) 一种usb接口的服务器主板故障诊断装置
US8421644B2 (en) Light-emitting diode control system and method
CN103309791A (zh) 具有故障诊断功能的显示装置
CN102693180A (zh) 一种硬件状态的监测方法和系统
CN202988519U (zh) 自动扶梯或自动人行道的方向故障一体化显示装置
CN202217034U (zh) 单板故障检测装置
TWI636439B (zh) Circuit monitoring and information management system for equipment engineering
CN203606932U (zh) 医用气体报警装置
CN203658871U (zh) 一种智能温度控制装置
CN102479143A (zh) 刀锋服务系统
CN104461841A (zh) 一种工作状态的监控方法及监控设备
CN205809863U (zh) 一种主板故障的实时检测装置
CN210864692U (zh) 一种ui面板、服务器
CN106815102A (zh) 一种计算机硬件故障检测系统
CN106383298A (zh) 一种配电网故障检测方法
CN109450491B (zh) 一种可温度监控的电缆调制解调器系统及其实现方法
CN101566653A (zh) 冰箱的十六进制故障显示方法
JP2015009753A (ja) 運行案内表示システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140820

WD01 Invention patent application deemed withdrawn after publication