CN102708031A - 一种快速定位故障内存的硬件实现方法 - Google Patents
一种快速定位故障内存的硬件实现方法 Download PDFInfo
- Publication number
- CN102708031A CN102708031A CN2012101492150A CN201210149215A CN102708031A CN 102708031 A CN102708031 A CN 102708031A CN 2012101492150 A CN2012101492150 A CN 2012101492150A CN 201210149215 A CN201210149215 A CN 201210149215A CN 102708031 A CN102708031 A CN 102708031A
- Authority
- CN
- China
- Prior art keywords
- memory
- led
- gpio
- control chip
- cpld
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
本发明提供一种快速定位故障内存的方法,将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的GPIO连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为standbypower,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的slot旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中。
Description
技术领域
本发明涉及计算机应用技术领域, 具体地说是一种快速定位故障内存的硬件实现方法。
背景技术
随着服务器技术的发展,服务器对内存的容量的扩充需求也越来越大,导致板内的内存数量也越来越多,一个四路的boxbore EX平台服务器中内存数量可以达到96根,如果开机过程中有某一个内存出现故障,尤其是在机架服务器和刀片服务器等需要反复安装的服务器上,如果出现内存故障,没有故障分析软件的话,很难去定位故障内存。
发明内容
本发明的目的是提供一种快速定位故障内存的方法。
本发明的目的是按以下方法实现的,将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的GPIO连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为standby power,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的slot旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中,具体步骤如下:
系统开机后,此时PCH上的SMbus已经开始工作,BIOS会先对系统memory进行training,得到内存信息后,通过smbus发送信息给LED控制芯片CPLD,修改LED控制芯片CPLD内部寄存器,假如内存个数为N,则需要寄存器大小至少N bits,同时对应与不同的GPIO,GPIO与所连接的内存插槽旁边的LED一一对应,从而控制GPIO的状态,寄存器bit0=0时,对应的GPIO输出为低电平;寄存器bit0=1时,对应的GPIO输出为高电平;
当没有内存故障时,系统会通过SMbus将LED控制芯片CPLD对应内存的寄存器置为“1”,对应外部的GPIO表现为高电平,所有LED不会点亮;
当系统内出现内存故障时,系统会通过SMbus将LED控制芯片CPLD内部对应内存的寄存器置为“0”,对应外部的GPIO表现为低电平,LED点亮,表示该LED对应的memory出现故障;
出现内存故障后,假如是在机架或刀片机箱中时,无法看到LED的状态的,此时关闭电源,打开机箱或拔出刀片,通过电源转接板插到power connector中供电,此时standby电会输出,LED控制芯片CPLD开始工作,因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入“0”的寄存器对应的GPIO仍然表现为低电平,standby电会驱动LED点亮,则旁边对应的内存一定有故障,这样出现故障内存则很容易找到。
LED控制芯片CPLD的选择条件如下:
1)有较多的GPIO;
2)能够使用I2C、SPI总线与系统之间沟通;
3)有可配置的寄存器空间,且在断电的时候能够保存满内存纤细。
本发明的有益效果是:系统在开机的过程中发现故障内存后,通过LED控制芯片点亮相对应的故障内存的slot旁边的LED,同时能够在断电的时候将信息保存到LED控制芯片中。
附图说明
图1是内存故障定位系统的电路原理图;
图2是LED控制芯片CPLD的结构示意图;
图3是通过电源转接板为刀片供电检查故障内存的电路原理图。
具体实施方法
参照说明书附图对本发明的方法作以下详细地说明:
系统开机后,此时PCH上的SMbus已经开始工作,BIOS会先对系统memory进行training,得到内存信息后,通过smbus发送信息给CPLD,修改CPLD内部寄存器(图2),假如内存个数为N,则需要寄存器大小至少N bits,同时对应与不同的GPIO(GPIO与所连接的内存插槽旁边的LED一一对应),从而控制GPIO的状态,寄存器bit0=0时,对应的GPIO输出为低电平;寄存器bit0=1时,对应的GPIO输出为高电平。
当没有内存故障时,系统会通过SMbus将CPLD对应内存的寄存器置为“1”,对应外部的GPIO表现为高电平,所有LED不会点亮。
当系统内出现内存故障时,系统会通过SMbus将CPLD内部对应内存的寄存器置为“0”,对应外部的GPIO表现为低电平,LED点亮,表示该LED对应的memory出现故障。
出现内存故障后,假如是在机架或刀片机箱中时,无法看到LED的状态的,此时可以关闭电源,打开机箱或拔出刀片,通过电源转接板插到图2中的power connector中供电,此时standby电会输出,CPLD开始工作。因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入“0”的寄存器对应的GPIO仍然表现为低电平,standby电会驱动LED点亮,则旁边对应的内存一定有故障,这样一来故障内存则很容易找到。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。
Claims (1)
1.一种快速定位故障内存的方法, 其特征在于将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的GPIO连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为standby power,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的slot旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中,具体步骤如下:
系统开机后,此时PCH上的SMbus已经开始工作,BIOS会先对系统memory进行training,得到内存信息后,通过smbus发送信息给LED控制芯片CPLD,修改LED控制芯片CPLD内部寄存器,假如内存个数为N,则需要寄存器大小至少N bits,同时对应与不同的GPIO,GPIO与所连接的内存插槽旁边的LED一一对应,从而控制GPIO的状态,寄存器bit0=0时,对应的GPIO输出为低电平;寄存器bit0=1时,对应的GPIO输出为高电平;
当没有内存故障时,系统会通过SMbus将LED控制芯片CPLD对应内存的寄存器置为“1”,对应外部的GPIO表现为高电平,所有LED不会点亮;
当系统内出现内存故障时,系统会通过SMbus将LED控制芯片CPLD内部对应内存的寄存器置为“0”,对应外部的GPIO表现为低电平,LED点亮,表示该LED对应的memory出现故障;
出现内存故障后,假如是在机架或刀片机箱中时,无法看到LED的状态的,此时关闭电源,打开机箱或拔出刀片,通过电源转接板插到power connector中供电,此时standby电会输出,LED控制芯片CPLD开始工作,因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入“0”的寄存器对应的GPIO仍然表现为低电平,standby电会驱动LED点亮,则旁边对应的内存一定有故障,这样出现故障内存则很容易找到。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210149215.0A CN102708031B (zh) | 2012-05-15 | 2012-05-15 | 一种快速定位故障内存的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210149215.0A CN102708031B (zh) | 2012-05-15 | 2012-05-15 | 一种快速定位故障内存的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102708031A true CN102708031A (zh) | 2012-10-03 |
CN102708031B CN102708031B (zh) | 2016-08-31 |
Family
ID=46900839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210149215.0A Active CN102708031B (zh) | 2012-05-15 | 2012-05-15 | 一种快速定位故障内存的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102708031B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103019898A (zh) * | 2012-11-26 | 2013-04-03 | 加弘科技咨询(上海)有限公司 | 内存模块检测及槽位红绿灯定位报错系统 |
CN103902415A (zh) * | 2012-12-26 | 2014-07-02 | 鸿富锦精密工业(深圳)有限公司 | 硬盘测试系统及方法 |
CN104021057A (zh) * | 2014-06-27 | 2014-09-03 | 上海斐讯数据通信技术有限公司 | 一种cpu启动故障定位系统及其定位方法 |
CN104156291A (zh) * | 2014-07-29 | 2014-11-19 | 英业达科技有限公司 | 服务器及其检测方法 |
CN104794033A (zh) * | 2015-04-29 | 2015-07-22 | 浪潮电子信息产业股份有限公司 | 一种基于bmc的cpu低频故障的定位方法及装置 |
CN105528281A (zh) * | 2015-12-09 | 2016-04-27 | 浪潮电子信息产业股份有限公司 | 一种基于cpld的在线设定硬盘故障指示灯的方法 |
CN106030544A (zh) * | 2014-12-24 | 2016-10-12 | 华为技术有限公司 | 计算机设备内存的检测方法和计算机设备 |
CN106055438A (zh) * | 2016-05-27 | 2016-10-26 | 深圳市国鑫恒宇科技有限公司 | 一种快速定位主板上内存条异常的方法及系统 |
CN106201961A (zh) * | 2016-07-01 | 2016-12-07 | 英业达科技有限公司 | 控制处理器工作频率的计算器系统与方法 |
CN107066362A (zh) * | 2017-04-18 | 2017-08-18 | 深圳市同泰怡信息技术有限公司 | 一种自动处理故障内存条的方法 |
CN108132869A (zh) * | 2017-12-21 | 2018-06-08 | 郑州云海信息技术有限公司 | 一种快速定位服务器主板硬件故障的方法 |
CN108255684A (zh) * | 2018-01-10 | 2018-07-06 | 郑州云海信息技术有限公司 | 一种用于显示大型机系统状态的装置及显示方法 |
CN109255265A (zh) * | 2018-08-01 | 2019-01-22 | 武汉普利商用机器有限公司 | 读取身份证信息异常时的自恢复方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002032877A (ja) * | 2000-07-19 | 2002-01-31 | Ntt Power & Building Facilities Inc | 故障警報表示装置 |
US6862695B2 (en) * | 2001-03-30 | 2005-03-01 | Giga-Byte Technology Co., Ltd. | Method and device for identifying failed devices in computer |
CN101207510A (zh) * | 2006-12-19 | 2008-06-25 | 英业达股份有限公司 | 群组式电脑设备管控总线失效状况处理方法及系统 |
CN101710677A (zh) * | 2009-12-02 | 2010-05-19 | 中国南方电网有限责任公司超高压输电公司 | 一种屏柜内设备故障指示方法 |
CN202217034U (zh) * | 2011-06-03 | 2012-05-09 | 中兴通讯股份有限公司 | 单板故障检测装置 |
-
2012
- 2012-05-15 CN CN201210149215.0A patent/CN102708031B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002032877A (ja) * | 2000-07-19 | 2002-01-31 | Ntt Power & Building Facilities Inc | 故障警報表示装置 |
US6862695B2 (en) * | 2001-03-30 | 2005-03-01 | Giga-Byte Technology Co., Ltd. | Method and device for identifying failed devices in computer |
CN101207510A (zh) * | 2006-12-19 | 2008-06-25 | 英业达股份有限公司 | 群组式电脑设备管控总线失效状况处理方法及系统 |
CN101710677A (zh) * | 2009-12-02 | 2010-05-19 | 中国南方电网有限责任公司超高压输电公司 | 一种屏柜内设备故障指示方法 |
CN202217034U (zh) * | 2011-06-03 | 2012-05-09 | 中兴通讯股份有限公司 | 单板故障检测装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103019898A (zh) * | 2012-11-26 | 2013-04-03 | 加弘科技咨询(上海)有限公司 | 内存模块检测及槽位红绿灯定位报错系统 |
CN103902415A (zh) * | 2012-12-26 | 2014-07-02 | 鸿富锦精密工业(深圳)有限公司 | 硬盘测试系统及方法 |
CN104021057A (zh) * | 2014-06-27 | 2014-09-03 | 上海斐讯数据通信技术有限公司 | 一种cpu启动故障定位系统及其定位方法 |
CN104156291A (zh) * | 2014-07-29 | 2014-11-19 | 英业达科技有限公司 | 服务器及其检测方法 |
CN104156291B (zh) * | 2014-07-29 | 2017-06-20 | 英业达科技有限公司 | 服务器及其检测方法 |
CN106030544A (zh) * | 2014-12-24 | 2016-10-12 | 华为技术有限公司 | 计算机设备内存的检测方法和计算机设备 |
CN106030544B (zh) * | 2014-12-24 | 2020-01-21 | 华为技术有限公司 | 计算机设备内存的检测方法和计算机设备 |
CN104794033A (zh) * | 2015-04-29 | 2015-07-22 | 浪潮电子信息产业股份有限公司 | 一种基于bmc的cpu低频故障的定位方法及装置 |
CN105528281A (zh) * | 2015-12-09 | 2016-04-27 | 浪潮电子信息产业股份有限公司 | 一种基于cpld的在线设定硬盘故障指示灯的方法 |
CN106055438B (zh) * | 2016-05-27 | 2019-12-03 | 深圳市同泰怡信息技术有限公司 | 一种快速定位主板上内存条异常的方法及系统 |
CN106055438A (zh) * | 2016-05-27 | 2016-10-26 | 深圳市国鑫恒宇科技有限公司 | 一种快速定位主板上内存条异常的方法及系统 |
CN106201961A (zh) * | 2016-07-01 | 2016-12-07 | 英业达科技有限公司 | 控制处理器工作频率的计算器系统与方法 |
CN107066362A (zh) * | 2017-04-18 | 2017-08-18 | 深圳市同泰怡信息技术有限公司 | 一种自动处理故障内存条的方法 |
CN107066362B (zh) * | 2017-04-18 | 2020-04-21 | 深圳市同泰怡信息技术有限公司 | 一种自动处理故障内存条的方法 |
CN108132869A (zh) * | 2017-12-21 | 2018-06-08 | 郑州云海信息技术有限公司 | 一种快速定位服务器主板硬件故障的方法 |
CN108255684A (zh) * | 2018-01-10 | 2018-07-06 | 郑州云海信息技术有限公司 | 一种用于显示大型机系统状态的装置及显示方法 |
CN109255265A (zh) * | 2018-08-01 | 2019-01-22 | 武汉普利商用机器有限公司 | 读取身份证信息异常时的自恢复方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN102708031B (zh) | 2016-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102708031A (zh) | 一种快速定位故障内存的硬件实现方法 | |
CN102339242A (zh) | 计算机系统数据修复装置 | |
CN106201963A (zh) | 一种用于服务器内pci‑e卡热插拔的系统 | |
CN101377538B (zh) | 一种微处理器老化试验系统及试验方法 | |
CN101458647A (zh) | 双bios电路 | |
CN105068860A (zh) | 一种基于ARM的Linux采煤机管理主机系统 | |
CN103455350A (zh) | 一种bios更新的方法 | |
CN105487959A (zh) | 一种intel NVMe硬盘的管理方法 | |
KR20110023836A (ko) | 컴퓨터 어셈블링 방법, 컴퓨터 및 제어기 보드 | |
CN101989390A (zh) | 多核心嵌入式教学科研平台 | |
CN104331300A (zh) | 利用基板管理控制器直接更新设定的服务器 | |
CN105487999A (zh) | 级联式大规模usb扩展装置及工作方法、系统 | |
CN203982359U (zh) | 可同时连接多个模块的flash程序烧写装置 | |
CN102999096B (zh) | 计算机 | |
TW201339822A (zh) | 包括可組配最大處理器電流之用於能源效率及節能之方法、裝置及系統 | |
CN101369257B (zh) | 一种启动数据处理模块的方法、装置及系统 | |
CN207008599U (zh) | 一种服务器主板测试板 | |
CN206282173U (zh) | 基于飞腾ft‑1500a芯片的主板 | |
CN102176589A (zh) | Usb-8串口rs422集线器 | |
CN102053888A (zh) | 运算装置的自我检测方法与系统 | |
CN105045624A (zh) | PowerPC主机板及烧写方法 | |
CN110647431B (zh) | 一种用于板卡和整机诊断测试的测试盒 | |
CN103035035B (zh) | 自动售检票系统主控单元 | |
CN202711239U (zh) | 一种计算机系统 | |
CN202995822U (zh) | 自动售检票系统主控单元 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |