CN102799506A - 一种定位故障内存的方法 - Google Patents
一种定位故障内存的方法 Download PDFInfo
- Publication number
- CN102799506A CN102799506A CN2012102198272A CN201210219827A CN102799506A CN 102799506 A CN102799506 A CN 102799506A CN 2012102198272 A CN2012102198272 A CN 2012102198272A CN 201210219827 A CN201210219827 A CN 201210219827A CN 102799506 A CN102799506 A CN 102799506A
- Authority
- CN
- China
- Prior art keywords
- memory
- failure
- bmc
- bios
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
本发明提供一种定位故障内存的方法,每条内存对应一个LED灯,系统开机过程中,BIOS检测内存,如果发现内存故障,发送IPMI命令给BMC,BMC根据IPMI命令获得故障内存的位置,并点亮故障内存对应的LED灯,LED灯亮位置对应的内存为故障内存。具体步骤如下:(1)系统开机,BIOS负责检测内存;(2)BIOS检测到内存故障,根据故障内存的位置信息组织IPMI命令,并发送给BMC;(3)BMC收到BIOS发送的IPMI命令,解析获得故障内存的位置信息,并点亮该故障内存对应的LED灯。
Description
技术领域
本发明涉及计算机应用技术领域, 具体地说是一种定位故障内存的方法。
背景技术
高性能计算技术的发展伴随着计算机技术的发展,同时也伴随着CPU处理能力和内存容量的提升,内存容量的提升一方面表现为单条内存条容量的提升,另一方面表现为内存条数的增加。伴随着内存条数的增加,增加了定位故障内存的难度,一旦出现内存故障,传统定位故障内存的方法是使用测试工具进行内存测试,同时测试过程中需要逐条拆下内存,然后再重新进行内存测试,最终找到故障内存,这种方法难度和复杂度非常大。并且传统的方法,随着内存条数的增加,测试难度和复杂度也会越来越大。而另一方面,计算机内存条数的增加又是不可阻挡的趋势。
这种传统的定位故障内存的方法,已经无法满足高性能计算技术的发展,因为此类方法适用于内存条数很少的计算机应用。然而,在日益增长的高性能计算领域,对内存容量和内存条数都有了更高的要求。因此,提出一种定位故障内存的方法就很有必要了。
发明内容
本发明的目的是提供一种定位故障内存的方法。
本发明的目的是按以下方式实现的,每条内存对应设置一个LED灯,系统开机过程中,BIOS检测内存,如果发现内存故障,发送IPMI命令给BMC,BMC根据IPMI命令获得故障内存的位置,并点亮故障内存对应的LED灯,LED灯亮位置对应的内存为故障内存,具体步骤如下:(1)系统开机,BIOS负责检测内存;(2)BIOS检测到内存故障,根据故障内存的位置信息组织IPMI命令,并发送给BMC;(3)BMC收到BIOS发送的IPMI命令,解析获得故障内存的位置信息,并点亮该故障内存对应的LED灯。
本发明的有益效果是:基于内存条数较多的计算机应用,可以方便的定位故障内存位置和故障内存条数,为系统管理人员更换故障内存提供了便利,从而减少系统管理的复杂程度。本发明中的定位故障内存的方法具有上述优点,使得弥补了传统定位故障内存方法的不足,使其更适用于复杂的高性能计算机应用领域,因而具有非常广阔的发展空间。系统开机过程中,BIOS检测内存,如果发现内存故障,根据故障内存的位置组织IPMI命令并发送给BMC,BMC收到BIOS发送的IPMI命令并解析,获得故障内存的位置,BMC负责点亮故障内存对应的LED灯。本方法在系统运行过程中就可以快速定位到故障内存。本方法因为有了内存LED指示灯,可以快速准确定位到故障内存,方便操作人员更换内存,大大减小了排查定位故障内存的时间。
附图说明
图1是定位故障内存方法原理示意图。
具体实施方式
参照说明书附图对本发明的作以下详细地说明。
正如发明内容中所描述的,本发明中提到的定位故障内存的方法使用LED指示灯来指示故障内存位置。首先,需要每条内存附近对应放置一个LED指示灯,以便出现内存故障时点亮此LED指示灯。其次,需要BIOS启动过程中,对所有内存进行检测,并且在出现内存故障时,根据故障内存位置信息组织IPMI命令并发送给BMC。最后,BMC接收BIOS发送的IPMI命令并解析,得到故障内存的位置,并负责点亮对应的LED指示灯。
与传统的定位故障内存的方法相比,本发明中定位故障内存的方法具有快速、定位准确等特性。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。
Claims (1)
1. 一种定位故障内存的方法, 其特征在于每条内存对应设置一个LED灯,系统开机过程中,BIOS检测内存,如果发现内存故障,发送IPMI命令给BMC,BMC根据IPMI命令获得故障内存的位置,并点亮故障内存对应的LED灯,LED灯亮位置对应的内存为故障内存,具体步骤如下:(1)系统开机,BIOS负责检测内存;(2)BIOS检测到内存故障,根据故障内存的位置信息组织IPMI命令,并发送给BMC;(3)BMC收到BIOS发送的IPMI命令,解析获得故障内存的位置信息,并点亮该故障内存对应的LED灯。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012102198272A CN102799506A (zh) | 2012-06-29 | 2012-06-29 | 一种定位故障内存的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012102198272A CN102799506A (zh) | 2012-06-29 | 2012-06-29 | 一种定位故障内存的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102799506A true CN102799506A (zh) | 2012-11-28 |
Family
ID=47198620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012102198272A Pending CN102799506A (zh) | 2012-06-29 | 2012-06-29 | 一种定位故障内存的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102799506A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198000A (zh) * | 2013-04-02 | 2013-07-10 | 浪潮电子信息产业股份有限公司 | 一种linux系统下的故障内存位置定位方法 |
CN103279406A (zh) * | 2013-05-31 | 2013-09-04 | 华为技术有限公司 | 一种内存的隔离方法和装置 |
CN103412769A (zh) * | 2013-07-25 | 2013-11-27 | 华为技术有限公司 | 外接卡参数配置方法、设备以及系统 |
CN103970661A (zh) * | 2014-05-19 | 2014-08-06 | 浪潮电子信息产业股份有限公司 | 一种利用ipmi工具进行批量服务器内存故障检测的方法 |
CN105095032A (zh) * | 2015-08-14 | 2015-11-25 | 浪潮电子信息产业股份有限公司 | 一种快速定位故障内存条的检测装置和方法 |
CN105183600A (zh) * | 2015-09-09 | 2015-12-23 | 浪潮电子信息产业股份有限公司 | 一种远程定位硬盘故障的装置和方法 |
CN105204968A (zh) * | 2015-11-10 | 2015-12-30 | 浪潮(北京)电子信息产业有限公司 | 一种故障内存检测方法和装置 |
WO2016101177A1 (zh) * | 2014-12-24 | 2016-06-30 | 华为技术有限公司 | 计算机设备内存的检测方法和计算机设备 |
CN106055438A (zh) * | 2016-05-27 | 2016-10-26 | 深圳市国鑫恒宇科技有限公司 | 一种快速定位主板上内存条异常的方法及系统 |
CN106445775A (zh) * | 2016-08-30 | 2017-02-22 | 浪潮电子信息产业股份有限公司 | 一种基于ipmitool工具循环侦测内存的方法 |
CN107179974A (zh) * | 2016-03-09 | 2017-09-19 | 佛山市顺德区顺达电脑厂有限公司 | 计算机硬件的监控方法 |
CN107273259A (zh) * | 2017-06-08 | 2017-10-20 | 郑州云海信息技术有限公司 | 一种Linux系统下基于IDK内存注错的测试方法及系统 |
CN107368385A (zh) * | 2017-07-26 | 2017-11-21 | 郑州云海信息技术有限公司 | 一种基于bmc控制的可扩展的多内存故障快速定位的方法及系统 |
CN109032867A (zh) * | 2018-07-25 | 2018-12-18 | 郑州云海信息技术有限公司 | 一种故障诊断方法、装置及设备 |
CN109542525A (zh) * | 2018-11-30 | 2019-03-29 | 郑州云海信息技术有限公司 | 一种通过bmc切换系统内存配置的方法、装置、终端及存储介质 |
CN110781053A (zh) * | 2019-09-29 | 2020-02-11 | 苏州浪潮智能科技有限公司 | 一种检测内存降级错误的方法和装置 |
CN113535509A (zh) * | 2021-06-10 | 2021-10-22 | 中国长城科技集团股份有限公司 | 内存条异常检测方法、装置及bmc |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090025008A1 (en) * | 2007-07-19 | 2009-01-22 | Aten International Co., Ltd. | Ipmi systems and electronic apparatus using the same |
CN102467434A (zh) * | 2010-11-10 | 2012-05-23 | 英业达股份有限公司 | 利用基板管理控制器取得储存装置状态信号的方法 |
-
2012
- 2012-06-29 CN CN2012102198272A patent/CN102799506A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090025008A1 (en) * | 2007-07-19 | 2009-01-22 | Aten International Co., Ltd. | Ipmi systems and electronic apparatus using the same |
CN102467434A (zh) * | 2010-11-10 | 2012-05-23 | 英业达股份有限公司 | 利用基板管理控制器取得储存装置状态信号的方法 |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198000A (zh) * | 2013-04-02 | 2013-07-10 | 浪潮电子信息产业股份有限公司 | 一种linux系统下的故障内存位置定位方法 |
CN103279406A (zh) * | 2013-05-31 | 2013-09-04 | 华为技术有限公司 | 一种内存的隔离方法和装置 |
CN103412769A (zh) * | 2013-07-25 | 2013-11-27 | 华为技术有限公司 | 外接卡参数配置方法、设备以及系统 |
CN103970661A (zh) * | 2014-05-19 | 2014-08-06 | 浪潮电子信息产业股份有限公司 | 一种利用ipmi工具进行批量服务器内存故障检测的方法 |
CN106030544B (zh) * | 2014-12-24 | 2020-01-21 | 华为技术有限公司 | 计算机设备内存的检测方法和计算机设备 |
WO2016101177A1 (zh) * | 2014-12-24 | 2016-06-30 | 华为技术有限公司 | 计算机设备内存的检测方法和计算机设备 |
CN106030544A (zh) * | 2014-12-24 | 2016-10-12 | 华为技术有限公司 | 计算机设备内存的检测方法和计算机设备 |
CN105095032A (zh) * | 2015-08-14 | 2015-11-25 | 浪潮电子信息产业股份有限公司 | 一种快速定位故障内存条的检测装置和方法 |
CN105183600A (zh) * | 2015-09-09 | 2015-12-23 | 浪潮电子信息产业股份有限公司 | 一种远程定位硬盘故障的装置和方法 |
CN105204968A (zh) * | 2015-11-10 | 2015-12-30 | 浪潮(北京)电子信息产业有限公司 | 一种故障内存检测方法和装置 |
CN105204968B (zh) * | 2015-11-10 | 2019-05-10 | 浪潮(北京)电子信息产业有限公司 | 一种故障内存检测方法和装置 |
CN107179974A (zh) * | 2016-03-09 | 2017-09-19 | 佛山市顺德区顺达电脑厂有限公司 | 计算机硬件的监控方法 |
CN106055438A (zh) * | 2016-05-27 | 2016-10-26 | 深圳市国鑫恒宇科技有限公司 | 一种快速定位主板上内存条异常的方法及系统 |
CN106055438B (zh) * | 2016-05-27 | 2019-12-03 | 深圳市同泰怡信息技术有限公司 | 一种快速定位主板上内存条异常的方法及系统 |
CN106445775A (zh) * | 2016-08-30 | 2017-02-22 | 浪潮电子信息产业股份有限公司 | 一种基于ipmitool工具循环侦测内存的方法 |
CN107273259A (zh) * | 2017-06-08 | 2017-10-20 | 郑州云海信息技术有限公司 | 一种Linux系统下基于IDK内存注错的测试方法及系统 |
CN107368385A (zh) * | 2017-07-26 | 2017-11-21 | 郑州云海信息技术有限公司 | 一种基于bmc控制的可扩展的多内存故障快速定位的方法及系统 |
CN109032867A (zh) * | 2018-07-25 | 2018-12-18 | 郑州云海信息技术有限公司 | 一种故障诊断方法、装置及设备 |
CN109542525A (zh) * | 2018-11-30 | 2019-03-29 | 郑州云海信息技术有限公司 | 一种通过bmc切换系统内存配置的方法、装置、终端及存储介质 |
CN110781053A (zh) * | 2019-09-29 | 2020-02-11 | 苏州浪潮智能科技有限公司 | 一种检测内存降级错误的方法和装置 |
US11853150B2 (en) | 2019-09-29 | 2023-12-26 | Inspur Suzhou Intelligent Technology Co., Ltd. | Method and device for detecting memory downgrade error |
CN113535509A (zh) * | 2021-06-10 | 2021-10-22 | 中国长城科技集团股份有限公司 | 内存条异常检测方法、装置及bmc |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102799506A (zh) | 一种定位故障内存的方法 | |
EP3700096A1 (en) | Apparatus and method for adaptive gesture recognition in portable terminal | |
CN103605596B (zh) | 用于atca刀片上的fpga芯片与bmc芯片协同电源管理系统和方法 | |
CN105183600A (zh) | 一种远程定位硬盘故障的装置和方法 | |
CN105323328A (zh) | 一种在rs—485上使用modbus通讯协议自动识别地址的方法 | |
CN104182243A (zh) | 休眠状态控制系统、计算机系统及其休眠状态检测的方法 | |
CN107222999A (zh) | 一种快速定位设备的系统、方法及机房管理系统 | |
WO2011159892A1 (en) | Multiple platform support in computer system firmware | |
EP3915184A1 (en) | Indicator for ac power adapter | |
CN104299170B (zh) | 间歇性能源海量数据处理方法 | |
CN103543682B (zh) | 普通io口识别输入状态的方法及装置 | |
US20130138852A1 (en) | Electronic device with baseboard management controller | |
CN104181380B (zh) | 轻载电流检测系统 | |
CN203011340U (zh) | 计算机视觉测量系统 | |
CN102929767B (zh) | 内存条插入状态的获取电路和内存条信息的管理系统 | |
CN114924998B (zh) | 内存信息读取装置及方法、计算设备主板、设备和介质 | |
CN202721686U (zh) | 带状态检测的网络处理控制器卡 | |
US20110270814A1 (en) | Expanding Functionality Of One Or More Hard Drive Bays In A Computing System | |
CN105718333A (zh) | 双路服务器主板主从cpu切换装置及其切换控制方法 | |
CN206282173U (zh) | 基于飞腾ft‑1500a芯片的主板 | |
CN202406353U (zh) | Led路灯强制风冷系统 | |
WO2017107159A1 (zh) | 一种数字装备工业控制方法、装置及系统 | |
CN204441847U (zh) | 一种精确可视化低压电缆分支箱 | |
TW201527958A (zh) | 可自動選擇主從模式的基板管理控制器、電子裝置及方法 | |
CN102110039A (zh) | 低温环境下使刀片服务器的管理模块主芯片工作的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20121128 |