CN102799506A - 一种定位故障内存的方法 - Google Patents

一种定位故障内存的方法 Download PDF

Info

Publication number
CN102799506A
CN102799506A CN2012102198272A CN201210219827A CN102799506A CN 102799506 A CN102799506 A CN 102799506A CN 2012102198272 A CN2012102198272 A CN 2012102198272A CN 201210219827 A CN201210219827 A CN 201210219827A CN 102799506 A CN102799506 A CN 102799506A
Authority
CN
China
Prior art keywords
memory
failure
bmc
bios
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012102198272A
Other languages
English (en)
Inventor
刘宝阳
黄家明
颜伟
平原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN2012102198272A priority Critical patent/CN102799506A/zh
Publication of CN102799506A publication Critical patent/CN102799506A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明提供一种定位故障内存的方法,每条内存对应一个LED灯,系统开机过程中,BIOS检测内存,如果发现内存故障,发送IPMI命令给BMC,BMC根据IPMI命令获得故障内存的位置,并点亮故障内存对应的LED灯,LED灯亮位置对应的内存为故障内存。具体步骤如下:(1)系统开机,BIOS负责检测内存;(2)BIOS检测到内存故障,根据故障内存的位置信息组织IPMI命令,并发送给BMC;(3)BMC收到BIOS发送的IPMI命令,解析获得故障内存的位置信息,并点亮该故障内存对应的LED灯。

Description

一种定位故障内存的方法
技术领域
本发明涉及计算机应用技术领域, 具体地说是一种定位故障内存的方法。
背景技术
高性能计算技术的发展伴随着计算机技术的发展,同时也伴随着CPU处理能力和内存容量的提升,内存容量的提升一方面表现为单条内存条容量的提升,另一方面表现为内存条数的增加。伴随着内存条数的增加,增加了定位故障内存的难度,一旦出现内存故障,传统定位故障内存的方法是使用测试工具进行内存测试,同时测试过程中需要逐条拆下内存,然后再重新进行内存测试,最终找到故障内存,这种方法难度和复杂度非常大。并且传统的方法,随着内存条数的增加,测试难度和复杂度也会越来越大。而另一方面,计算机内存条数的增加又是不可阻挡的趋势。
这种传统的定位故障内存的方法,已经无法满足高性能计算技术的发展,因为此类方法适用于内存条数很少的计算机应用。然而,在日益增长的高性能计算领域,对内存容量和内存条数都有了更高的要求。因此,提出一种定位故障内存的方法就很有必要了。
发明内容
本发明的目的是提供一种定位故障内存的方法。
本发明的目的是按以下方式实现的,每条内存对应设置一个LED灯,系统开机过程中,BIOS检测内存,如果发现内存故障,发送IPMI命令给BMC,BMC根据IPMI命令获得故障内存的位置,并点亮故障内存对应的LED灯,LED灯亮位置对应的内存为故障内存,具体步骤如下:(1)系统开机,BIOS负责检测内存;(2)BIOS检测到内存故障,根据故障内存的位置信息组织IPMI命令,并发送给BMC;(3)BMC收到BIOS发送的IPMI命令,解析获得故障内存的位置信息,并点亮该故障内存对应的LED灯。
本发明的有益效果是:基于内存条数较多的计算机应用,可以方便的定位故障内存位置和故障内存条数,为系统管理人员更换故障内存提供了便利,从而减少系统管理的复杂程度。本发明中的定位故障内存的方法具有上述优点,使得弥补了传统定位故障内存方法的不足,使其更适用于复杂的高性能计算机应用领域,因而具有非常广阔的发展空间。系统开机过程中,BIOS检测内存,如果发现内存故障,根据故障内存的位置组织IPMI命令并发送给BMC,BMC收到BIOS发送的IPMI命令并解析,获得故障内存的位置,BMC负责点亮故障内存对应的LED灯。本方法在系统运行过程中就可以快速定位到故障内存。本方法因为有了内存LED指示灯,可以快速准确定位到故障内存,方便操作人员更换内存,大大减小了排查定位故障内存的时间。
附图说明
图1是定位故障内存方法原理示意图。
具体实施方式
参照说明书附图对本发明的作以下详细地说明。
正如发明内容中所描述的,本发明中提到的定位故障内存的方法使用LED指示灯来指示故障内存位置。首先,需要每条内存附近对应放置一个LED指示灯,以便出现内存故障时点亮此LED指示灯。其次,需要BIOS启动过程中,对所有内存进行检测,并且在出现内存故障时,根据故障内存位置信息组织IPMI命令并发送给BMC。最后,BMC接收BIOS发送的IPMI命令并解析,得到故障内存的位置,并负责点亮对应的LED指示灯。
与传统的定位故障内存的方法相比,本发明中定位故障内存的方法具有快速、定位准确等特性。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (1)

1. 一种定位故障内存的方法, 其特征在于每条内存对应设置一个LED灯,系统开机过程中,BIOS检测内存,如果发现内存故障,发送IPMI命令给BMC,BMC根据IPMI命令获得故障内存的位置,并点亮故障内存对应的LED灯,LED灯亮位置对应的内存为故障内存,具体步骤如下:(1)系统开机,BIOS负责检测内存;(2)BIOS检测到内存故障,根据故障内存的位置信息组织IPMI命令,并发送给BMC;(3)BMC收到BIOS发送的IPMI命令,解析获得故障内存的位置信息,并点亮该故障内存对应的LED灯。
CN2012102198272A 2012-06-29 2012-06-29 一种定位故障内存的方法 Pending CN102799506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012102198272A CN102799506A (zh) 2012-06-29 2012-06-29 一种定位故障内存的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012102198272A CN102799506A (zh) 2012-06-29 2012-06-29 一种定位故障内存的方法

Publications (1)

Publication Number Publication Date
CN102799506A true CN102799506A (zh) 2012-11-28

Family

ID=47198620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012102198272A Pending CN102799506A (zh) 2012-06-29 2012-06-29 一种定位故障内存的方法

Country Status (1)

Country Link
CN (1) CN102799506A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103198000A (zh) * 2013-04-02 2013-07-10 浪潮电子信息产业股份有限公司 一种linux系统下的故障内存位置定位方法
CN103279406A (zh) * 2013-05-31 2013-09-04 华为技术有限公司 一种内存的隔离方法和装置
CN103412769A (zh) * 2013-07-25 2013-11-27 华为技术有限公司 外接卡参数配置方法、设备以及系统
CN103970661A (zh) * 2014-05-19 2014-08-06 浪潮电子信息产业股份有限公司 一种利用ipmi工具进行批量服务器内存故障检测的方法
CN105095032A (zh) * 2015-08-14 2015-11-25 浪潮电子信息产业股份有限公司 一种快速定位故障内存条的检测装置和方法
CN105183600A (zh) * 2015-09-09 2015-12-23 浪潮电子信息产业股份有限公司 一种远程定位硬盘故障的装置和方法
CN105204968A (zh) * 2015-11-10 2015-12-30 浪潮(北京)电子信息产业有限公司 一种故障内存检测方法和装置
WO2016101177A1 (zh) * 2014-12-24 2016-06-30 华为技术有限公司 计算机设备内存的检测方法和计算机设备
CN106055438A (zh) * 2016-05-27 2016-10-26 深圳市国鑫恒宇科技有限公司 一种快速定位主板上内存条异常的方法及系统
CN106445775A (zh) * 2016-08-30 2017-02-22 浪潮电子信息产业股份有限公司 一种基于ipmitool工具循环侦测内存的方法
CN107179974A (zh) * 2016-03-09 2017-09-19 佛山市顺德区顺达电脑厂有限公司 计算机硬件的监控方法
CN107273259A (zh) * 2017-06-08 2017-10-20 郑州云海信息技术有限公司 一种Linux系统下基于IDK内存注错的测试方法及系统
CN107368385A (zh) * 2017-07-26 2017-11-21 郑州云海信息技术有限公司 一种基于bmc控制的可扩展的多内存故障快速定位的方法及系统
CN109032867A (zh) * 2018-07-25 2018-12-18 郑州云海信息技术有限公司 一种故障诊断方法、装置及设备
CN109542525A (zh) * 2018-11-30 2019-03-29 郑州云海信息技术有限公司 一种通过bmc切换系统内存配置的方法、装置、终端及存储介质
CN110781053A (zh) * 2019-09-29 2020-02-11 苏州浪潮智能科技有限公司 一种检测内存降级错误的方法和装置
CN113535509A (zh) * 2021-06-10 2021-10-22 中国长城科技集团股份有限公司 内存条异常检测方法、装置及bmc

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090025008A1 (en) * 2007-07-19 2009-01-22 Aten International Co., Ltd. Ipmi systems and electronic apparatus using the same
CN102467434A (zh) * 2010-11-10 2012-05-23 英业达股份有限公司 利用基板管理控制器取得储存装置状态信号的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090025008A1 (en) * 2007-07-19 2009-01-22 Aten International Co., Ltd. Ipmi systems and electronic apparatus using the same
CN102467434A (zh) * 2010-11-10 2012-05-23 英业达股份有限公司 利用基板管理控制器取得储存装置状态信号的方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103198000A (zh) * 2013-04-02 2013-07-10 浪潮电子信息产业股份有限公司 一种linux系统下的故障内存位置定位方法
CN103279406A (zh) * 2013-05-31 2013-09-04 华为技术有限公司 一种内存的隔离方法和装置
CN103412769A (zh) * 2013-07-25 2013-11-27 华为技术有限公司 外接卡参数配置方法、设备以及系统
CN103970661A (zh) * 2014-05-19 2014-08-06 浪潮电子信息产业股份有限公司 一种利用ipmi工具进行批量服务器内存故障检测的方法
CN106030544B (zh) * 2014-12-24 2020-01-21 华为技术有限公司 计算机设备内存的检测方法和计算机设备
WO2016101177A1 (zh) * 2014-12-24 2016-06-30 华为技术有限公司 计算机设备内存的检测方法和计算机设备
CN106030544A (zh) * 2014-12-24 2016-10-12 华为技术有限公司 计算机设备内存的检测方法和计算机设备
CN105095032A (zh) * 2015-08-14 2015-11-25 浪潮电子信息产业股份有限公司 一种快速定位故障内存条的检测装置和方法
CN105183600A (zh) * 2015-09-09 2015-12-23 浪潮电子信息产业股份有限公司 一种远程定位硬盘故障的装置和方法
CN105204968A (zh) * 2015-11-10 2015-12-30 浪潮(北京)电子信息产业有限公司 一种故障内存检测方法和装置
CN105204968B (zh) * 2015-11-10 2019-05-10 浪潮(北京)电子信息产业有限公司 一种故障内存检测方法和装置
CN107179974A (zh) * 2016-03-09 2017-09-19 佛山市顺德区顺达电脑厂有限公司 计算机硬件的监控方法
CN106055438A (zh) * 2016-05-27 2016-10-26 深圳市国鑫恒宇科技有限公司 一种快速定位主板上内存条异常的方法及系统
CN106055438B (zh) * 2016-05-27 2019-12-03 深圳市同泰怡信息技术有限公司 一种快速定位主板上内存条异常的方法及系统
CN106445775A (zh) * 2016-08-30 2017-02-22 浪潮电子信息产业股份有限公司 一种基于ipmitool工具循环侦测内存的方法
CN107273259A (zh) * 2017-06-08 2017-10-20 郑州云海信息技术有限公司 一种Linux系统下基于IDK内存注错的测试方法及系统
CN107368385A (zh) * 2017-07-26 2017-11-21 郑州云海信息技术有限公司 一种基于bmc控制的可扩展的多内存故障快速定位的方法及系统
CN109032867A (zh) * 2018-07-25 2018-12-18 郑州云海信息技术有限公司 一种故障诊断方法、装置及设备
CN109542525A (zh) * 2018-11-30 2019-03-29 郑州云海信息技术有限公司 一种通过bmc切换系统内存配置的方法、装置、终端及存储介质
CN110781053A (zh) * 2019-09-29 2020-02-11 苏州浪潮智能科技有限公司 一种检测内存降级错误的方法和装置
US11853150B2 (en) 2019-09-29 2023-12-26 Inspur Suzhou Intelligent Technology Co., Ltd. Method and device for detecting memory downgrade error
CN113535509A (zh) * 2021-06-10 2021-10-22 中国长城科技集团股份有限公司 内存条异常检测方法、装置及bmc

Similar Documents

Publication Publication Date Title
CN102799506A (zh) 一种定位故障内存的方法
EP3700096A1 (en) Apparatus and method for adaptive gesture recognition in portable terminal
CN103605596B (zh) 用于atca刀片上的fpga芯片与bmc芯片协同电源管理系统和方法
CN105183600A (zh) 一种远程定位硬盘故障的装置和方法
CN105323328A (zh) 一种在rs—485上使用modbus通讯协议自动识别地址的方法
CN104182243A (zh) 休眠状态控制系统、计算机系统及其休眠状态检测的方法
CN107222999A (zh) 一种快速定位设备的系统、方法及机房管理系统
WO2011159892A1 (en) Multiple platform support in computer system firmware
EP3915184A1 (en) Indicator for ac power adapter
CN104299170B (zh) 间歇性能源海量数据处理方法
CN103543682B (zh) 普通io口识别输入状态的方法及装置
US20130138852A1 (en) Electronic device with baseboard management controller
CN104181380B (zh) 轻载电流检测系统
CN203011340U (zh) 计算机视觉测量系统
CN102929767B (zh) 内存条插入状态的获取电路和内存条信息的管理系统
CN114924998B (zh) 内存信息读取装置及方法、计算设备主板、设备和介质
CN202721686U (zh) 带状态检测的网络处理控制器卡
US20110270814A1 (en) Expanding Functionality Of One Or More Hard Drive Bays In A Computing System
CN105718333A (zh) 双路服务器主板主从cpu切换装置及其切换控制方法
CN206282173U (zh) 基于飞腾ft‑1500a芯片的主板
CN202406353U (zh) Led路灯强制风冷系统
WO2017107159A1 (zh) 一种数字装备工业控制方法、装置及系统
CN204441847U (zh) 一种精确可视化低压电缆分支箱
TW201527958A (zh) 可自動選擇主從模式的基板管理控制器、電子裝置及方法
CN102110039A (zh) 低温环境下使刀片服务器的管理模块主芯片工作的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121128