CN103995758A - 一种主板故障信息的延时显示方法 - Google Patents

一种主板故障信息的延时显示方法 Download PDF

Info

Publication number
CN103995758A
CN103995758A CN201410214134.3A CN201410214134A CN103995758A CN 103995758 A CN103995758 A CN 103995758A CN 201410214134 A CN201410214134 A CN 201410214134A CN 103995758 A CN103995758 A CN 103995758A
Authority
CN
China
Prior art keywords
failure message
mainboard
fault
process unit
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410214134.3A
Other languages
English (en)
Inventor
刘涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201410214134.3A priority Critical patent/CN103995758A/zh
Publication of CN103995758A publication Critical patent/CN103995758A/zh
Pending legal-status Critical Current

Links

Abstract

本发明涉及计算机通信领域,具体是利用一种主板故障信息的延时显示方法,来解决当前在服务器系统断电过程中,无法实现服务器故障信息的延时直观读取问题。本方法保证了服务器系统断电过程中故障信息的延时直观显示设计,实现服务器系统可靠性、易维护性设计,对于服务器系统的快速维护具有重要的意义。

Description

一种主板故障信息的延时显示方法
 
技术领域   
    本发明涉及计算机通信领域,具体是利用一种主板故障信息的延时显示方法,来解决当前在服务器系统断电过程中,无法实现服务器故障信息的延时直观读取问题。本方法保证了服务器系统断电过程中故障信息的延时直观显示设计,实现服务器系统可靠性、易维护性设计,对于服务器系统的快速维护具有重要的意义。
背景技术
当今服务器主板的内存数量越来越多,内存作为关键部件,不断接受与传输运算数据,为了防止数据的出错,大多采用ECC设计,但仍存在内存长时间运行后出现颗粒故障的问题,同时由于内存条采用的是金手指拔插的方式,内存颗粒故障及拔插接触问题均影响服务器的内存数据的稳定,为了能及时定位、清除出现问题的内存条,需要在服务器主板上能直观的显示故障的问题点,使用户实现快速的故障点定位。实现服务器主板故障信息直观显示对主板的状态收集、故障定位至关重要。
当前对服务器主板故障信息直观显示,逐渐成为影响服务器维护管理的关键因素。当前的通常做法是服务器主板故障信息以LED的方式显示在主板上,即发生问题后,即点亮对应的指示LED。为了获取故障信息,必须打开机箱盖才能看到LED的显示状态,由于机架式服务器安装于机架箱中,为了打开机箱盖,必须断电,然后将服务器节点拉出来,但此时已经断电服务器无法保存已经报错的信息,即使服务器节点重新上电,由于LED灯复位,也无法看到之前报错的LED。这种故障信息的显示方式,无法实现断电后服务器系统的故障指示需求,且无日志记录;随着对服务器系统故障信息直观显示要求不断增加,为了保证服务器系统的稳定运行,在实际操作运行过程中,如何实现断电后服务器故障信息延时显示设计尤为重要,并成为决定服务器易维护性的关键要素之一。
发明内容
针对当前服务器故障信息的显示设计中遇到的上述问题,结合电池供电、状态锁存等关键电气因素,通过深入分析,提供了一种主板故障信息的延时显示方法。
 本发明是以控制理论支撑点,具体是利用一种主板故障信息的延时显示方法,来解决当前在服务器系统断电过程中,无法实现服务器故障信息的延时直观读取问题。本方法保证了服务器系统断电过程中故障信息的延时直观显示设计,实现服务器系统可靠性、易维护性设计,对于服务器系统的快速维护具有重要的意义,具体发明内容可以分为如下六个方面:
①将主板的故障信息所对应的信号,经过数据的缓冲隔离,统一为电压为3.3V的电平范围;
②将统一电平范围的故障信号汇总传送至故障信息延时处理单元,故障信息延时处理单元对故障信息进行有效判断,确认瞬时、长期故障。
③故障信息延时处理单元确认瞬时、长期故障后,将故障信息进行I2C串行编码,采用可能少的I2C线传输到主板上所需要显示故障的位置。
④故障信息延时处理单元由电池与主板的3.3V工作电源来动态切换获取供电,实际服务器主板的使用中,当用户需要进行故障查看时,需要将主板断电,并将主板从机架中拉出,此时由电池继续给故障信息延时处理单元供电,实现主板的故障的直观显示。
⑤故障信息延时处理单元在支持故障显示的同时,实时将故障的信息进行日志记录,实现故障日志的备份、读取追溯。
    其中:   
    将主板的故障信息所对应的信号,经过数据的缓冲隔离,统一为电压为3.3V的电平范围,主板的故障信息所对应的的信号包含:标志主板运行状态的电源信号、时序信号、使能信号、南桥smbus提供的运行状态数据;由于上述信号涉及主板的关键参数,为防止故障信息收集过程中对主板正常运行的影响,采用74HC14芯片进行信号的隔离,信号为单向传输,即故障信息延时处理单元对主板的信号不产生任何影响;由于主板信号为1.1V电压,采用两级2N7002串联进行电平转化。
    将统一电平范围的故障信号汇总传送至故障信息延时处理单元,故障信息延时处理单元对故障信息进行有效判断,确认瞬时、长期故障,故障信息延时处理单元作为独立于服务器主板的处理系统,负责对收集到的故障信息进行分类、组合,CPU过热保护、电源芯片的过热保护、风扇瞬时转速过高为瞬时故障,可以不必立即呈现指示给用户,但需要对该瞬时故障进行记录,内存的ECC报错、CPU的cater error为长期故障,需要呈现指示给用户,通过将对应的LED摆放在故障部件附近,直观的显示故障位置及类型。
    故障信息延时处理单元确认瞬时、长期故障后,将故障信息进行I2C串行编码,即将故障的各点信息作为串行数据传送出去,通过两根I2C线传输到主板上所需要显示故障的位置,采用ALTERA EPM320 CPLD串转并单元,将串行数据中故障信息转换为一对一的信号线,将该一对一的信号线对应到具体位置的LED显示,实现故障信息的对应显示。
    故障信息延时处理单元由电池与主板的3.3V工作电源来动态切换获取供电,动态切换采用低压差的大电流二极管“与”操作实现,即电池与主板的3.3V采用与运算实现,即当主板的3.3V工作时采用该电作为供电来源,减小电池的耗电,当主板断电后,电池继续作为电源供电,实现断电延时供电,即实现断电延时的故障状态指示。
    故障信息延时处理单元在支持故障显示的同时,实时将故障的信息进行日志记录,实现故障日志的备份、读取追溯,故障信息延时处理单元通过外加实时时钟,将收集到的故障信息按照时间顺序进行记录,并保存于外置的eeprom中,当需要重新确认故障信息时,将故障信息从eeprom中读取即可。
本发明的有益效果是:
本方法保证了服务器系统断电过程中故障信息的延时直观显示设计,实现服务器系统可靠性、易维护性设计,而且实现低成本、直观设计要求,对于服务器系统的快速维护具有重要的意义。
 附图说明
附图1是本发明的实施流程图。
具体实施方式
下面对本发明的内容进行更加详细的阐述:
①研发工程师将主板的故障信息所对应的信号,经过74HC14施密特触发器的缓冲隔离,统一为电压为3.3V的电平范围;
②采用ALTERA EPM240T100C5N组成故障信息延时处理单元,将统一电平范围的故障信号汇总传送至故障信息延时处理单元,故障信息延时处理单元对故障信息进行有效判断,确认瞬时、长期故障。
③故障信息延时处理单元确认瞬时、长期故障后,将故障信息进行I2C串行编码,采用I2C线传输到主板上所需要显示故障的位置,然后采用ALTERA EPM320 CPLD组成串转并单元,将串行数据中故障信息转换为一对一的信号线,将该一对一的信号线对应到具体位置的LED显示,实现故障信息的对应显示。
④将故障信息延时处理单元由电池与主板的3.3V工作电源采用低压差的大电流二极管“与”操作来实现动态切换获取供电,实际服务器主板的使用中,主板断电时,将主板从机架中拉出,此时由电池继续给故障信息延时处理单元供电,实现主板的故障的直观显示。
⑤故障信息延时处理单元在支持故障显示的同时,实时将故障的信息进行日志记录,及将故障信息存入外置的EEPROM中,实现故障日志的备份、读取追溯。
经过上面详细的实施,可以很方便的实现服务器断电后故障延时显示设计,不仅达到了延时显示要求,而且实现低成本、直观设计要求,实现服务器系统断电过程中故障信息的延时显示的可靠性、稳定性。

Claims (6)

1.一种主板故障信息的延时显示方法,其特征在于包括以下方面:
    ①将主板的故障信息所对应的信号,经过数据的缓冲隔离,统一为电压为3.3V的电平范围;
    ②将统一电平范围的故障信号汇总传送至故障信息延时处理单元,故障信息延时处理单元对故障信息进行有效判断,确认瞬时、长期故障;
    ③故障信息延时处理单元确认瞬时、长期故障后,将故障信息进行I2C串行编码,采用可能少的I2C线传输到主板上所需要显示故障的位置;
    ④故障信息延时处理单元由电池与主板的3.3V工作电源来动态切换获取供电,实际服务器主板的使用中,当用户需要进行故障查看时,需要将主板断电,并将主板从机架中拉出,此时由电池继续给故障信息延时处理单元供电,实现主板的故障的直观显示;
    ⑤故障信息延时处理单元在支持故障显示的同时,实时将故障的信息进行日志记录,实现故障日志的备份、读取追溯。
2.根据权利要求1所述的方法,其特征在于将主板的故障信息所对应的信号,经过数据的缓冲隔离,统一为电压为3.3V的电平范围,主板的故障信息所对应的的信号包含:标志主板运行状态的电源信号、时序信号、使能信号、南桥smbus提供的运行状态数据;由于上述信号涉及主板的关键参数,为防止故障信息收集过程中对主板正常运行的影响,采用74HC14芯片进行信号的隔离,信号为单向传输,即故障信息延时处理单元对主板的信号不产生任何影响;由于主板信号为1.1V电压,采用两级2N7002串联进行电平转化。
3.根据权利要求1所述的方法,其特征在于将统一电平范围的故障信号汇总传送至故障信息延时处理单元,故障信息延时处理单元对故障信息进行有效判断,确认瞬时、长期故障,故障信息延时处理单元作为独立于服务器主板的处理系统,负责对收集到的故障信息进行分类、组合,CPU过热保护、电源芯片的过热保护、风扇瞬时转速过高为瞬时故障,可以不必立即呈现指示给用户,但需要对该瞬时故障进行记录,内存的ECC报错、CPU的cater error为长期故障,需要呈现指示给用户,通过将对应的LED摆放在故障部件附近,直观的显示故障位置及类型。
4.根据权利要求1所述的方法,其特征在于故障信息延时处理单元确认瞬时、长期故障后,将故障信息进行I2C串行编码,即将故障的各点信息作为串行数据传送出去,通过两根I2C线传输到主板上所需要显示故障的位置,采用ALTERA EPM320 CPLD串转并单元,将串行数据中故障信息转换为一对一的信号线,将该一对一的信号线对应到具体位置的LED显示,实现故障信息的对应显示。
5.根据权利要求1所述的方法,其特征在于故障信息延时处理单元由电池与主板的3.3V工作电源来动态切换获取供电,动态切换采用低压差的大电流二极管“与”操作实现,即电池与主板的3.3V采用与运算实现,即当主板的3.3V工作时采用该电作为供电来源,减小电池的耗电,当主板断电后,电池继续作为电源供电,实现断电延时供电,即实现断电延时的故障状态指示。
6.根据权利要求1所述的方法,其特征在于故障信息延时处理单元在支持故障显示的同时,实时将故障的信息进行日志记录,实现故障日志的备份、读取追溯,故障信息延时处理单元通过外加实时时钟,将收集到的故障信息按照时间顺序进行记录,并保存于外置的eeprom中,当需要重新确认故障信息时,将故障信息从eeprom中读取即可。
CN201410214134.3A 2014-05-21 2014-05-21 一种主板故障信息的延时显示方法 Pending CN103995758A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410214134.3A CN103995758A (zh) 2014-05-21 2014-05-21 一种主板故障信息的延时显示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410214134.3A CN103995758A (zh) 2014-05-21 2014-05-21 一种主板故障信息的延时显示方法

Publications (1)

Publication Number Publication Date
CN103995758A true CN103995758A (zh) 2014-08-20

Family

ID=51309931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410214134.3A Pending CN103995758A (zh) 2014-05-21 2014-05-21 一种主板故障信息的延时显示方法

Country Status (1)

Country Link
CN (1) CN103995758A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106998060A (zh) * 2017-03-31 2017-08-01 山东超越数控电子有限公司 一种基于bmc的cpu过热保护方法
CN108089649A (zh) * 2016-11-22 2018-05-29 英业达(重庆)有限公司 电子装置及检测方法
CN109388210A (zh) * 2018-12-06 2019-02-26 京信通信系统(中国)有限公司 分布式机箱、分布式机箱的管理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1445669A (zh) * 2002-03-15 2003-10-01 联想(北京)有限公司 多途径获取和输出服务器监控信息的方法
CN1501249A (zh) * 2002-11-12 2004-06-02 联想(北京)有限公司 用于检测计算机故障的诊断电路模块及方法
US20080046707A1 (en) * 2006-08-15 2008-02-21 Tyan Computer Corporation Remote Monitor Module For Power Initialization Of Computer System
CN102411532A (zh) * 2011-12-31 2012-04-11 曙光信息产业股份有限公司 计算机故障提示方法和装置、以及计算机
CN103077103A (zh) * 2013-01-18 2013-05-01 浪潮电子信息产业股份有限公司 一种服务器故障的离线诊断方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1445669A (zh) * 2002-03-15 2003-10-01 联想(北京)有限公司 多途径获取和输出服务器监控信息的方法
CN1501249A (zh) * 2002-11-12 2004-06-02 联想(北京)有限公司 用于检测计算机故障的诊断电路模块及方法
US20080046707A1 (en) * 2006-08-15 2008-02-21 Tyan Computer Corporation Remote Monitor Module For Power Initialization Of Computer System
CN102411532A (zh) * 2011-12-31 2012-04-11 曙光信息产业股份有限公司 计算机故障提示方法和装置、以及计算机
CN103077103A (zh) * 2013-01-18 2013-05-01 浪潮电子信息产业股份有限公司 一种服务器故障的离线诊断方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108089649A (zh) * 2016-11-22 2018-05-29 英业达(重庆)有限公司 电子装置及检测方法
CN108089649B (zh) * 2016-11-22 2020-02-14 英业达(重庆)有限公司 电子装置及检测方法
CN106998060A (zh) * 2017-03-31 2017-08-01 山东超越数控电子有限公司 一种基于bmc的cpu过热保护方法
CN109388210A (zh) * 2018-12-06 2019-02-26 京信通信系统(中国)有限公司 分布式机箱、分布式机箱的管理方法及装置
CN109388210B (zh) * 2018-12-06 2024-03-29 京信网络系统股份有限公司 分布式机箱、分布式机箱的管理方法及装置

Similar Documents

Publication Publication Date Title
CN202285113U (zh) 配电单元控制系统
CN104483913A (zh) 一种应用i2c总线实现龙芯刀片服务器电源状态监控的方法
CN109086192B (zh) 一种基于ipmi的板载sata硬盘点灯系统及方法
CN107247647A (zh) 一种存储系统中bbu工作状态检测方法及系统
CN103995758A (zh) 一种主板故障信息的延时显示方法
CN105095142A (zh) 控制扩展卡的系统及方法
CN201887418U (zh) 电能计量芯片的电源管理模块
CN102290864B (zh) 一种实现虚拟负荷管理终端的方法和装置
CN204376535U (zh) 一种智能spd监控系统
CN101995931A (zh) 一种监控电源运行状态的方法及系统
CN103019914A (zh) 一种ups电源监控告警装置
CN104484753A (zh) 一种服务器资产信息追溯方法
US20130297949A1 (en) Hybrid blade webserver with solar as primary power source
CN202475463U (zh) 一种通信终端监测装置
CN202384840U (zh) 矿井配电自动化监控系统
CN204832891U (zh) 高性能多用途处理器卡
CN104680087A (zh) 一种刀片服务器热插拔的控制电路和装置
CN204205936U (zh) 基于ComExpress模块的单电源电源装置
CN204731725U (zh) 一种集群掉电自检自保护系统
CN201607685U (zh) 含备用电源的硬盘存储装置
CN105511980A (zh) 一种高端容错服务器的电源故障记录方法
CN204695092U (zh) 一种硼加热系统的pcs系统
CN203826299U (zh) 失电检查式低压断路器用智能控制装置
CN106530137A (zh) 一种远程自动获取电力数据信息的运行平台
CN102591441B (zh) 电源供应系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140820