CN1797360A - 内存可靠性检测系统以及方法 - Google Patents

内存可靠性检测系统以及方法 Download PDF

Info

Publication number
CN1797360A
CN1797360A CN 200410104134 CN200410104134A CN1797360A CN 1797360 A CN1797360 A CN 1797360A CN 200410104134 CN200410104134 CN 200410104134 CN 200410104134 A CN200410104134 A CN 200410104134A CN 1797360 A CN1797360 A CN 1797360A
Authority
CN
China
Prior art keywords
dimm
computer installation
reliability
spd
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200410104134
Other languages
English (en)
Inventor
卢盈志
郑孟华
李浚溢
余亮宏
李家兴
张启聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CN 200410104134 priority Critical patent/CN1797360A/zh
Publication of CN1797360A publication Critical patent/CN1797360A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

一种内存可靠性检测系统以及方法,应用在计算机装置中,该计算机装置开机程序根据BIOS程序对主板进行检测,使该计算机装置顺利进入操作系统并稳定地运行;本发明内存可靠性检测方法包括:令该计算机装置根据该BIOS程序进行初始化程序;以及令该计算机装置读取设在主板上的DIMM参数进行检测,若检测结果不符合要求则令该计算机装置将此不符合要求的DIMM记录在存储单元中,使该计算机装置根据该标记识别出DIMM发生的问题,使开机后的计算机装置忽略有问题的DIMM,防止计算机装置运行过程中因读取有问题的DIMM影响运行的稳定性。

Description

内存可靠性检测系统以及方法
技术领域
本发明是关于一种内存可靠性检测系统以及方法,特别是关于一种检测DIMM发生问题与否的内存可靠性检测系统以及方法。
背景技术
计算机在个人生活及工作各方面的使用越来越广泛,在现代社会中似乎已成为不可或缺的生活必需品。由于计算机使用普及率的提高,加速计算机科技的发展,也带动网络科技的进步,使计算机产业是积极地投入服务器的开发。
无论是个人计算机或服务器等计算机装置的运行效能提高与否,使用者最为重视的不外乎是系统的可靠性和稳定性,系统的可靠性和稳定性往往受到内存的影响。
就目前计算机装置使用的双重内嵌式内存模块(Dual In-lineMemory Modules;DIMM)而言,计算机装置的基本输入输出系统(BasicInput/Output System,BIOS)程序须依据DIMM制造厂商提供的内存参数进行设定,该内存参数即是SPD(Serial Presence Detect;SPD)资料,是储存在DIMM内建的存储器(EEPROM)中,如此,在该计算机装置开机并由该BIOS程序对主板上的DIMM进行初始化程序,令该计算机装置顺利进入操作系统。然而,由于某些原因,例如DIMM SPD资料被计算机病毒破坏、DIMM I2C传输路径有问题或DIMM SPD在写入过程中写入错误信息等原因,故在开机后造成BIOS程序读取到的DIMM SPD资料是错误内容,因此,在内存初始化阶段系统很容易死机(Hang)或导致开机进入操作系统后系统运行不稳定。
因此,如何检测DIMM SPD资料正确与否,有效避免DIMM SPD错误影响系统运行的稳定性,是目前需要解决的问题。
发明内容
为解决上述现有技术的问题,本发明的主要目的在于提供一种内存可靠性检测系统以及方法,通过读取计算机各个DIMM的SPD资料检测DIMM的可靠性,除排计算机系统因读取有问题的DIMM影响其运行的稳定性。
为达成以上所述及其它目的,本发明提供一种内存可靠性检测系统以及方法。本发明的内存可靠性检测系统是应用在计算机装置中,供该计算机装置在开机程序即根据BIOS程序对主板进行检测,使该计算机装置顺利进入操作系统并稳定地进行运行,该系统包括:至少一双重内嵌式内存模块,该DIMM具有储存区;存储单元;控制器,与DIMM电性连接,对该DIMMSPD资料进行读写控制;以及检测模块,在该BIOS程序进行初始化程序时,令该控制器读取该DIMM的参数进行检测,若检测结果不符合要求,则将该检测不符合要求的DIMM记录在存储单元中,使该计算机装置根据储存在该存储单元的记录,识别出DIMM发生的问题,使开机后的计算机装置忽略有问题的DIMM,防止计算机装置运行过程中因读取有问题的DIMM影响运行的稳定性。
本发明的内存可靠性检测方法,应用在至少具有存储单元的计算机装置中,该计算机装置的开机程序根据BIOS程序对主板进行检测,使该计算机装置顺利进入操作系统并稳定地运行,该方法包括:令该计算机装置根据BIOS程序进行初始化程序;以及令该计算机装置读取设在该主板上的DIMM参数进行检测,若检测结果不符合要求,则将该不符合要求的DIMM记录在该存储单元,使该计算机装置根据储存在该存储单元的记录,识别出DIMM发生的问题,使开机后的计算机装置忽略有问题的DIMM,防止计算机装置运行过程中因读取有问题的DIMM影响运行的稳定性。
本发明的内存可靠性检测系统以及方法是在BIOS程序对DIMM进行初始化阶段时,即读取各个DIMM的SPD资料并进行检测,从而排除对已发生问题的DIMM进行存取动作,有效确保计算机装置的系统运行的可靠性及稳定性。
附图说明
图1是本发明的内存可靠性检测系统的基本结构方块示意图;以及
图2是本发明的内存可靠性检测方法的流程步骤图。
具体实施方式
实施例
图1是本发明的内存可靠性检测系统的基本结构方块示意图。在本实施例中,本发明的内存可靠性检测系统1是应用在计算机装置中,例如服务器及个人计算机等,供该计算机装置在开机程序中使BIOS程序对主板(未标出)进行检测,使该BIOS程序完成开机自我测试(Power On Self-Test)时即令该计算机装置顺利进入操作系统,并稳定地进行运行。由于上述BIOS程序及计算机装置开机自我测试(POST)程序均为一般计算机系统在运行前的必要构件及程序,以下不对其运行功能及内部结构作说明。
如图1所示,本发明的内存可靠性检测系统1至少包括:检测模块100、多个DIMM12、控制器13以及存储单元14。在此须提出说明的是,应用本发明的内存可靠性检测系统的计算机装置另具有其它功能单元,为简化附图及说明,此处仅显示与本发明有关的构件,例如南桥及北桥等的硬件结构,并未显示在附图中。再有,该DIMM12的数量并未限定为本实施例所示的四个,也可以是六个或八个等。
该检测模块100例如是检测程序,本实施例中该检测模块100是建构在储存BIOS程序(未标出)的存储单元10,供计算机装置开机后令中央处理单元(Central Processing Unit;CPU)11除了依据该存储单元10所预存的BIOS程序执行初始化程序外,另依据该存储单元10所预存的检测模块100,对各个DIMM12执行检测处理(详细内容见对图2的说明)。
该存储单元14例如是CMOS或NVRAM,记录有问题的DIMM。该DIMM 12具有储存区120,其例如是EEPROM,用于储存DIMM参数,也就是SPD(Serial Presence Detect;SPD)资料。该控制器13例如是I2C总线控制器,用于对多个DIMM 12进行SPD资料读写控制,该控制器13是与CPU11电性连接,该控制器13对该DIMM 12的SPD资料读写动作是受控于该CPU 11。其中,当该计算机装置开机,令CPU11执行BIOS程序(未标出)进行初始化程序时,该CPU 11也根据该检测模块100所设定的处理程序,令该控制器13对DIMM 12的储存区120内所储存的SPD资料进行检测处理,若检测结果不符合规定,则表示DIMM发生问题,则此发生问题的DIMM将被记录在存储单元14中,供后续的内存初始化时可识别出该DIMM存在的问题(例如损坏、DIMM SPD资料被计算机病毒破坏、DIMM I2C总线传输路径有问题或DIMM SPD在写入过程中存在写入错误信息)。
本发明的内存可靠性检测系统还包括警示模块(未标出),其例如是发光二极管或蜂鸣器,它与该中央处理单元11电性连接,该警示模块在检测出DIMM12发生问题时,发出警示信号供系统管理人员立即得知该DIMM 12发生问题。
本发明的内存可靠性检测系统还包括基板管理控制器(BaseboardManagement Controller,BMC)(未标出),它与该CPU 11电性连接,通过BMC在检测出DIMM 12发生问题时,即将DIMM12问题信息通过网络系统(例如国际互联网或局域网络)传送到远程服务器,供位于该服务器的系统管理人员在远程了解该DIMM 12发生的问题。
图2是本发明的内存可靠性检测方法的流程步骤。如图2所示,该计算机装置开机并由BIOS程序对主板上的DIMM进行初始化程序时,立即进到步骤S1,令该CPU 11根据该存储单元10的检测模块100,通过该控制器13对DIMM12进行检测处理,其中,该检测处理是指对该DIMM 12的SPD资料进行汇总检查(Check SUM),该汇总检查是指对SPD[0]、SPD[1]、SPD[2]、SPD[3]至SPD[62]的值进行汇总处理,并将汇总的结果与SPD[63]比较,接着进到步骤S2。
在该步骤S2中,令该CPU 11判断该步骤S1所得到的SPD[0]至SPD[62]的汇总结果是否等于SPD[63],若是,则进到步骤S4;反之,则进到步骤S3。
在该步骤S3中,该CPU 11判断该步骤S1所得到的SPD[0]至SPD[62]的汇总结果不等于SPD[63]时,表示该检测的DIMM 12发生问题,故将该检测有问题的DIMM 12记录在存储单元14中,供该计算机装置后续读取时可识别出该DIMM存在的问题,防止因读取有问题的DIMM影响计算机装置的运行,接着进到步骤S4。
在该步骤S4中,令该CPU 11判断是否已对所有的DIMM 12完成检测,若是,则进到步骤S6;反之,则进到步骤S5。
在该步骤S5中,令该CPU 11对下一个DIMM 12进行检测,并返回上述步骤S2。
在该步骤S6中,由于计算机装置已对所有的DIMM 12完成检测处理,进行下一阶段的开机自我测试程序(POST)。
综上所述,本发明的内存可靠性检测系统以及方法是在BIOS程序对DIMM进行初始化阶段时,即读取各个DIMM的SPD资料并进行检测,从而排除对已发生问题的DIMM进行存取动作,有效确保计算机装置的系统运行的可靠性及稳定性。

Claims (12)

1.一种内存可靠性检测系统,应用在计算机装置中,该计算机装置在开机程序根据基本输入输出系统程序对主板进行检测,使该计算机装置顺利进入操作系统并稳定地运行,其特征在于,该系统包括:
至少一双重内嵌式内存模块,该DIMM具有储存区;
存储单元;
控制器,与DIMM电性连接,对该DIMM SPD资料进行读写控制;以及
检测模块,在该BIOS程序进行初始化程序时,令该控制器读取该DIMM的参数进行检测,若检测结果不符合要求,则将该检测不符合要求的DIMM记录在存储单元中,使该计算机装置根据储存在该存储单元的记录,识别出DIMM发生的问题,使开机后的计算机装置忽略有问题的DIMM,防止计算机装置运行过程中因读取有问题的DIMM影响运行的稳定性。
2.如权利要求1所述的内存可靠性检测系统,其特征在于,该检测模块所进行的检测处理是指对该DIMM的SPD资料进行检测。
3.如权利要求2所述的内存可靠性检测系统,其特征在于,该检测模块所进行的检测处理是指对该DIMM的SPD资料进行汇总检查。
4.如权利要求3所述的内存可靠性检测系统,其特征在于,该汇总检查是指SPD[0]至SPD[62]的汇总结果是否等于SPD[63],若汇总结果等于SPD[63],则表示被检测的DIMM运行正常。
5.如权利要求1所述的内存可靠性检测系统,其特征在于,该DIMM的储存区是由EEPROM组成。
6.如权利要求1所述的内存可靠性检测系统,其特征在于,该检测模块是储存在该BIOS程序的存储器中。
7.一种内存可靠性检测方法,应用在至少具有存储单元的计算机装置中,供该计算机装置在开机程序即根据BIOS程序对主板进行检测,使该计算机装置顺利进入操作系统并稳定地运行,其特征在于,该方法包括:
令该计算机装置根据BIOS程序进行初始化程序;以及
令该计算机装置读取设在该主板上的DIMM参数进行检测,若检测结果不符合要求,则将该不符合要求的DIMM记录在该存储单元,使该计算机装置根据储存在该存储单元的记录,识别出DIMM发生的问题,使开机后的计算机装置忽略有问题的DIMM,防止计算机装置运行过程中因读取有问题的DIMM影响运行的稳定性。
8.如权利要求7所述的内存可靠性检测方法,其特征在于,该计算机装置所进行的检测处理是指对该DIMM的SPD资料进行检测。
9.如权利要求8所述的内存可靠性检测方法,其特征在于,该计算机装置所进行的检测处理是指对该DIMM的SPD资料进行汇总检查。
10.如权利要求9所述的内存可靠性检测方法,其特征在于,该汇总检查是指SPD[0]至SPD[62]的汇总结果是否等于SPD[63],若汇总结果等于SPD[63],则表示被检测的DIMM运行正常。
11.如权利要求7所述的内存可靠性检测方法,其特征在于,该DIMM的储存区是由EEPROM组成。
12.如权利要求7所述的内存可靠性检测方法,其特征在于,该计算机装置所进行的检测处理是由储存该BIOS程序的存储器中的检测程序执行的。
CN 200410104134 2004-12-30 2004-12-30 内存可靠性检测系统以及方法 Pending CN1797360A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200410104134 CN1797360A (zh) 2004-12-30 2004-12-30 内存可靠性检测系统以及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200410104134 CN1797360A (zh) 2004-12-30 2004-12-30 内存可靠性检测系统以及方法

Publications (1)

Publication Number Publication Date
CN1797360A true CN1797360A (zh) 2006-07-05

Family

ID=36818401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200410104134 Pending CN1797360A (zh) 2004-12-30 2004-12-30 内存可靠性检测系统以及方法

Country Status (1)

Country Link
CN (1) CN1797360A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101354673B (zh) * 2007-07-27 2010-05-26 佛山市顺德区顺达电脑厂有限公司 内存之spd芯片错误信息仿真装置
US8060785B2 (en) 2009-06-11 2011-11-15 Asustek Computer Inc. Method for tuning parameters in memory and computer system using the same
CN104572365A (zh) * 2013-10-18 2015-04-29 中国长城计算机深圳股份有限公司 一种内存自适配方法及装置
US9158638B2 (en) 2009-08-26 2015-10-13 Asustek Computer Inc. Memory controlling method
CN106469109A (zh) * 2015-08-15 2017-03-01 昆达电脑科技(昆山)有限公司 Dimm故障及时告知系统及其方法
CN110309374A (zh) * 2019-05-22 2019-10-08 深圳市金泰克半导体有限公司 一种解析方法、系统、终端设备及计算机可读存储介质
CN110955569A (zh) * 2019-11-26 2020-04-03 英业达科技有限公司 双列直插式存储器模块的测试方法、系统、介质及装置
CN112000537A (zh) * 2019-05-27 2020-11-27 英业达科技有限公司 计算机装置的内建内存检测方法
CN114385247A (zh) * 2020-10-21 2022-04-22 环达电脑(上海)有限公司 开机方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101354673B (zh) * 2007-07-27 2010-05-26 佛山市顺德区顺达电脑厂有限公司 内存之spd芯片错误信息仿真装置
US8060785B2 (en) 2009-06-11 2011-11-15 Asustek Computer Inc. Method for tuning parameters in memory and computer system using the same
US9158638B2 (en) 2009-08-26 2015-10-13 Asustek Computer Inc. Memory controlling method
CN104572365A (zh) * 2013-10-18 2015-04-29 中国长城计算机深圳股份有限公司 一种内存自适配方法及装置
CN104572365B (zh) * 2013-10-18 2017-12-01 中国长城科技集团股份有限公司 一种内存自适配方法及装置
CN106469109A (zh) * 2015-08-15 2017-03-01 昆达电脑科技(昆山)有限公司 Dimm故障及时告知系统及其方法
CN110309374A (zh) * 2019-05-22 2019-10-08 深圳市金泰克半导体有限公司 一种解析方法、系统、终端设备及计算机可读存储介质
CN112000537A (zh) * 2019-05-27 2020-11-27 英业达科技有限公司 计算机装置的内建内存检测方法
CN110955569A (zh) * 2019-11-26 2020-04-03 英业达科技有限公司 双列直插式存储器模块的测试方法、系统、介质及装置
CN110955569B (zh) * 2019-11-26 2021-10-01 英业达科技有限公司 双列直插式存储器模块的测试方法、系统、介质及装置
CN114385247A (zh) * 2020-10-21 2022-04-22 环达电脑(上海)有限公司 开机方法

Similar Documents

Publication Publication Date Title
US7143236B2 (en) Persistent volatile memory fault tracking using entries in the non-volatile memory of a fault storage unit
US6915440B2 (en) Apparatus, program product and method of performing power fault analysis in a computer system
US20080148238A1 (en) Runtime Analysis of a Computer Program to Identify Improper Memory Accesses that Cause Further Problems
CN2932488Y (zh) 故障检测装置
US6119248A (en) Operating system notification of correctable error in computer information
CN102422299B (zh) 信息设备以及防止执行不正当程序代码的方法
CN101295253B (zh) 一种更新韧体的方法
CN1797360A (zh) 内存可靠性检测系统以及方法
CN106843966A (zh) 一种加载io模块驱动程序的方法及装置
US20060206764A1 (en) Memory reliability detection system and method
US7447943B2 (en) Handling memory errors in response to adding new memory to a system
US6941504B2 (en) Method and apparatus for test case evaluation using a cyclic redundancy checker
KR100755021B1 (ko) 메모리 모듈의 전자적 테스트 방법
US20040243731A1 (en) Upgrading a memory subsystem
CN113010341A (zh) 一种故障内存定位的方法和设备
CN1991782A (zh) 内存模块安装状态检测方法及系统
CN1601461A (zh) 自适应的运行时可修复的入口寄存器文件
CN100369009C (zh) 使用系统管理中断信号的监控系统及方法
US11593209B2 (en) Targeted repair of hardware components in a computing device
US20070169117A1 (en) Firmware loading device
Chen et al. Testing approach of component security based on dynamic monitoring
TWI823556B (zh) 記憶體異常檢測系統、主機板、電子裝置及異常檢測方法
CN117387730A (zh) 水位传感器的故障检测方法、系统、设备及介质
US7065691B2 (en) Apparatus and method for saving precise system state following exceptions
CN1967480A (zh) 固件加载方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication