CN102708031A - 一种快速定位故障内存的硬件实现方法 - Google Patents

一种快速定位故障内存的硬件实现方法 Download PDF

Info

Publication number
CN102708031A
CN102708031A CN2012101492150A CN201210149215A CN102708031A CN 102708031 A CN102708031 A CN 102708031A CN 2012101492150 A CN2012101492150 A CN 2012101492150A CN 201210149215 A CN201210149215 A CN 201210149215A CN 102708031 A CN102708031 A CN 102708031A
Authority
CN
China
Prior art keywords
memory
led
gpio
control chip
cpld
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101492150A
Other languages
English (en)
Other versions
CN102708031B (zh
Inventor
叶丰华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201210149215.0A priority Critical patent/CN102708031B/zh
Publication of CN102708031A publication Critical patent/CN102708031A/zh
Application granted granted Critical
Publication of CN102708031B publication Critical patent/CN102708031B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明提供种快速定位故障内存的方法,将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的GPIO连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为standbypower,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的slot旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中。

Description

一种快速定位故障内存的硬件实现方法
技术领域
本发明涉及计算机应用技术领域, 具体地说是一种快速定位故障内存的硬件实现方法。
背景技术
随着服务器技术的发展,服务器对内存的容量的扩充需求也越来越大,导致板内的内存数量也越来越多,一个四路的boxbore EX平台服务器中内存数量可以达到96根,如果开机过程中有某一个内存出现故障,尤其是在机架服务器和刀片服务器等需要反复安装的服务器上,如果出现内存故障,没有故障分析软件的话,很难去定位故障内存。
发明内容
本发明的目的是提供种快速定位故障内存的方法。
本发明的目的是按以下方法实现的,将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的GPIO连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为standby power,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的slot旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中,具体步骤如下:
系统开机后,此时PCH上的SMbus已经开始工作,BIOS会先对系统memory进行training,得到内存信息后,通过smbus发送信息给LED控制芯片CPLD,修改LED控制芯片CPLD内部寄存器,假如内存个数为N,则需要寄存器大小至少N bits,同时对应与不同的GPIO,GPIO与所连接的内存插槽旁边的LED一一对应,从而控制GPIO的状态,寄存器bit0=0时,对应的GPIO输出为低电平;寄存器bit0=1时,对应的GPIO输出为高电平;
当没有内存故障时,系统会通过SMbus将LED控制芯片CPLD对应内存的寄存器置为“1”,对应外部的GPIO表现为高电平,所有LED不会点亮;
当系统内出现内存故障时,系统会通过SMbus将LED控制芯片CPLD内部对应内存的寄存器置为“0”,对应外部的GPIO表现为低电平,LED点亮,表示该LED对应的memory出现故障;
出现内存故障后,假如是在机架或刀片机箱中时,无法看到LED的状态的,此时关闭电源,打开机箱或拔出刀片,通过电源转接板插到power connector中供电,此时standby电会输出,LED控制芯片CPLD开始工作,因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入“0”的寄存器对应的GPIO仍然表现为低电平,standby电会驱动LED点亮,则旁边对应的内存一定有故障,这样出现故障内存则很容易找到。
LED控制芯片CPLD的选择条件如下:
1)有较多的GPIO;
2)能够使用I2C、SPI总线与系统之间沟通;
3)有可配置的寄存器空间,且在断电的时候能够保存满内存纤细。
本发明的有益效果是:系统在开机的过程中发现故障内存后,通过LED控制芯片点亮相对应的故障内存的slot旁边的LED,同时能够在断电的时候将信息保存到LED控制芯片中。
附图说明
 图1是内存故障定位系统的电路原理图;
图2是LED控制芯片CPLD的结构示意图;
图3是通过电源转接板为刀片供电检查故障内存的电路原理图。
具体实施方法
     参照说明书附图对本发明的方法作以下详细地说明:
系统开机后,此时PCH上的SMbus已经开始工作,BIOS会先对系统memory进行training,得到内存信息后,通过smbus发送信息给CPLD,修改CPLD内部寄存器(图2),假如内存个数为N,则需要寄存器大小至少N bits,同时对应与不同的GPIO(GPIO与所连接的内存插槽旁边的LED一一对应),从而控制GPIO的状态,寄存器bit0=0时,对应的GPIO输出为低电平;寄存器bit0=1时,对应的GPIO输出为高电平。
当没有内存故障时,系统会通过SMbus将CPLD对应内存的寄存器置为“1”,对应外部的GPIO表现为高电平,所有LED不会点亮。
当系统内出现内存故障时,系统会通过SMbus将CPLD内部对应内存的寄存器置为“0”,对应外部的GPIO表现为低电平,LED点亮,表示该LED对应的memory出现故障。
出现内存故障后,假如是在机架或刀片机箱中时,无法看到LED的状态的,此时可以关闭电源,打开机箱或拔出刀片,通过电源转接板插到图2中的power connector中供电,此时standby电会输出,CPLD开始工作。因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入“0”的寄存器对应的GPIO仍然表现为低电平,standby电会驱动LED点亮,则旁边对应的内存一定有故障,这样一来故障内存则很容易找到。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (1)

1.种快速定位故障内存的方法, 其特征在于将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的GPIO连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为standby power,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的slot旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中,具体步骤如下:
系统开机后,此时PCH上的SMbus已经开始工作,BIOS会先对系统memory进行training,得到内存信息后,通过smbus发送信息给LED控制芯片CPLD,修改LED控制芯片CPLD内部寄存器,假如内存个数为N,则需要寄存器大小至少N bits,同时对应与不同的GPIO,GPIO与所连接的内存插槽旁边的LED一一对应,从而控制GPIO的状态,寄存器bit0=0时,对应的GPIO输出为低电平;寄存器bit0=1时,对应的GPIO输出为高电平;
当没有内存故障时,系统会通过SMbus将LED控制芯片CPLD对应内存的寄存器置为“1”,对应外部的GPIO表现为高电平,所有LED不会点亮;
当系统内出现内存故障时,系统会通过SMbus将LED控制芯片CPLD内部对应内存的寄存器置为“0”,对应外部的GPIO表现为低电平,LED点亮,表示该LED对应的memory出现故障;
出现内存故障后,假如是在机架或刀片机箱中时,无法看到LED的状态的,此时关闭电源,打开机箱或拔出刀片,通过电源转接板插到power connector中供电,此时standby电会输出,LED控制芯片CPLD开始工作,因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入“0”的寄存器对应的GPIO仍然表现为低电平,standby电会驱动LED点亮,则旁边对应的内存一定有故障,这样出现故障内存则很容易找到。
CN201210149215.0A 2012-05-15 2012-05-15 一种快速定位故障内存的方法 Active CN102708031B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210149215.0A CN102708031B (zh) 2012-05-15 2012-05-15 一种快速定位故障内存的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210149215.0A CN102708031B (zh) 2012-05-15 2012-05-15 一种快速定位故障内存的方法

Publications (2)

Publication Number Publication Date
CN102708031A true CN102708031A (zh) 2012-10-03
CN102708031B CN102708031B (zh) 2016-08-31

Family

ID=46900839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210149215.0A Active CN102708031B (zh) 2012-05-15 2012-05-15 一种快速定位故障内存的方法

Country Status (1)

Country Link
CN (1) CN102708031B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103019898A (zh) * 2012-11-26 2013-04-03 加弘科技咨询(上海)有限公司 内存模块检测及槽位红绿灯定位报错系统
CN103902415A (zh) * 2012-12-26 2014-07-02 鸿富锦精密工业(深圳)有限公司 硬盘测试系统及方法
CN104021057A (zh) * 2014-06-27 2014-09-03 上海斐讯数据通信技术有限公司 一种cpu启动故障定位系统及其定位方法
CN104156291A (zh) * 2014-07-29 2014-11-19 英业达科技有限公司 服务器及其检测方法
CN104794033A (zh) * 2015-04-29 2015-07-22 浪潮电子信息产业股份有限公司 一种基于bmc的cpu低频故障的定位方法及装置
CN105528281A (zh) * 2015-12-09 2016-04-27 浪潮电子信息产业股份有限公司 一种基于cpld的在线设定硬盘故障指示灯的方法
CN106030544A (zh) * 2014-12-24 2016-10-12 华为技术有限公司 计算机设备内存的检测方法和计算机设备
CN106055438A (zh) * 2016-05-27 2016-10-26 深圳市国鑫恒宇科技有限公司 一种快速定位主板上内存条异常的方法及系统
CN106201961A (zh) * 2016-07-01 2016-12-07 英业达科技有限公司 控制处理器工作频率的计算器系统与方法
CN107066362A (zh) * 2017-04-18 2017-08-18 深圳市同泰怡信息技术有限公司 一种自动处理故障内存条的方法
CN108132869A (zh) * 2017-12-21 2018-06-08 郑州云海信息技术有限公司 一种快速定位服务器主板硬件故障的方法
CN108255684A (zh) * 2018-01-10 2018-07-06 郑州云海信息技术有限公司 一种用于显示大型机系统状态的装置及显示方法
CN109255265A (zh) * 2018-08-01 2019-01-22 武汉普利商用机器有限公司 读取身份证信息异常时的自恢复方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032877A (ja) * 2000-07-19 2002-01-31 Ntt Power & Building Facilities Inc 故障警報表示装置
US6862695B2 (en) * 2001-03-30 2005-03-01 Giga-Byte Technology Co., Ltd. Method and device for identifying failed devices in computer
CN101207510A (zh) * 2006-12-19 2008-06-25 英业达股份有限公司 群组式电脑设备管控总线失效状况处理方法及系统
CN101710677A (zh) * 2009-12-02 2010-05-19 中国南方电网有限责任公司超高压输电公司 一种屏柜内设备故障指示方法
CN202217034U (zh) * 2011-06-03 2012-05-09 中兴通讯股份有限公司 单板故障检测装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032877A (ja) * 2000-07-19 2002-01-31 Ntt Power & Building Facilities Inc 故障警報表示装置
US6862695B2 (en) * 2001-03-30 2005-03-01 Giga-Byte Technology Co., Ltd. Method and device for identifying failed devices in computer
CN101207510A (zh) * 2006-12-19 2008-06-25 英业达股份有限公司 群组式电脑设备管控总线失效状况处理方法及系统
CN101710677A (zh) * 2009-12-02 2010-05-19 中国南方电网有限责任公司超高压输电公司 一种屏柜内设备故障指示方法
CN202217034U (zh) * 2011-06-03 2012-05-09 中兴通讯股份有限公司 单板故障检测装置

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103019898A (zh) * 2012-11-26 2013-04-03 加弘科技咨询(上海)有限公司 内存模块检测及槽位红绿灯定位报错系统
CN103902415A (zh) * 2012-12-26 2014-07-02 鸿富锦精密工业(深圳)有限公司 硬盘测试系统及方法
CN104021057A (zh) * 2014-06-27 2014-09-03 上海斐讯数据通信技术有限公司 一种cpu启动故障定位系统及其定位方法
CN104156291A (zh) * 2014-07-29 2014-11-19 英业达科技有限公司 服务器及其检测方法
CN104156291B (zh) * 2014-07-29 2017-06-20 英业达科技有限公司 服务器及其检测方法
CN106030544A (zh) * 2014-12-24 2016-10-12 华为技术有限公司 计算机设备内存的检测方法和计算机设备
CN106030544B (zh) * 2014-12-24 2020-01-21 华为技术有限公司 计算机设备内存的检测方法和计算机设备
CN104794033A (zh) * 2015-04-29 2015-07-22 浪潮电子信息产业股份有限公司 一种基于bmc的cpu低频故障的定位方法及装置
CN105528281A (zh) * 2015-12-09 2016-04-27 浪潮电子信息产业股份有限公司 一种基于cpld的在线设定硬盘故障指示灯的方法
CN106055438B (zh) * 2016-05-27 2019-12-03 深圳市同泰怡信息技术有限公司 一种快速定位主板上内存条异常的方法及系统
CN106055438A (zh) * 2016-05-27 2016-10-26 深圳市国鑫恒宇科技有限公司 一种快速定位主板上内存条异常的方法及系统
CN106201961A (zh) * 2016-07-01 2016-12-07 英业达科技有限公司 控制处理器工作频率的计算器系统与方法
CN107066362A (zh) * 2017-04-18 2017-08-18 深圳市同泰怡信息技术有限公司 一种自动处理故障内存条的方法
CN107066362B (zh) * 2017-04-18 2020-04-21 深圳市同泰怡信息技术有限公司 一种自动处理故障内存条的方法
CN108132869A (zh) * 2017-12-21 2018-06-08 郑州云海信息技术有限公司 一种快速定位服务器主板硬件故障的方法
CN108255684A (zh) * 2018-01-10 2018-07-06 郑州云海信息技术有限公司 一种用于显示大型机系统状态的装置及显示方法
CN109255265A (zh) * 2018-08-01 2019-01-22 武汉普利商用机器有限公司 读取身份证信息异常时的自恢复方法及装置

Also Published As

Publication number Publication date
CN102708031B (zh) 2016-08-31

Similar Documents

Publication Publication Date Title
CN102708031A (zh) 一种快速定位故障内存的硬件实现方法
CN102339242A (zh) 计算机系统数据修复装置
CN106201963A (zh) 一种用于服务器内pci‑e卡热插拔的系统
CN101377538B (zh) 一种微处理器老化试验系统及试验方法
CN101458647A (zh) 双bios电路
CN105068860A (zh) 一种基于ARM的Linux采煤机管理主机系统
CN103455350A (zh) 一种bios更新的方法
CN105487959A (zh) 一种intel NVMe硬盘的管理方法
KR20110023836A (ko) 컴퓨터 어셈블링 방법, 컴퓨터 및 제어기 보드
CN101989390A (zh) 多核心嵌入式教学科研平台
CN104331300A (zh) 利用基板管理控制器直接更新设定的服务器
CN105487999A (zh) 级联式大规模usb扩展装置及工作方法、系统
CN203982359U (zh) 可同时连接多个模块的flash程序烧写装置
CN102999096B (zh) 计算机
TW201339822A (zh) 包括可組配最大處理器電流之用於能源效率及節能之方法、裝置及系統
CN101369257B (zh) 一种启动数据处理模块的方法、装置及系统
CN207008599U (zh) 一种服务器主板测试板
CN206282173U (zh) 基于飞腾ft‑1500a芯片的主板
CN102176589A (zh) Usb-8串口rs422集线器
CN102053888A (zh) 运算装置的自我检测方法与系统
CN105045624A (zh) PowerPC主机板及烧写方法
CN110647431B (zh) 一种用于板卡和整机诊断测试的测试盒
CN103035035B (zh) 自动售检票系统主控单元
CN202711239U (zh) 一种计算机系统
CN202995822U (zh) 自动售检票系统主控单元

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant