CN110544504A - 一种关于内存adddc功能的测试方法、系统及设备 - Google Patents
一种关于内存adddc功能的测试方法、系统及设备 Download PDFInfo
- Publication number
- CN110544504A CN110544504A CN201910683345.4A CN201910683345A CN110544504A CN 110544504 A CN110544504 A CN 110544504A CN 201910683345 A CN201910683345 A CN 201910683345A CN 110544504 A CN110544504 A CN 110544504A
- Authority
- CN
- China
- Prior art keywords
- log
- memory
- error
- repairable
- address
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/56—External testing equipment for static stores, e.g. automatic test equipment [ATE]; Interfaces therefor
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
本发明提出的一种关于内存ADDDC功能的测试方法、系统及设备,主要用于服务器内存ADDDC功能测试,通过模拟内存故障情形,验证ADDDC功能是否正常。即可提高测试效率,提高测试质量也同时节约测试时间和成本。
Description
技术领域
本发明涉及计算机网络技术领域,更具体的说是涉及一种关于内存ADDDC功能的测试方法、系统及设备。
背景技术
ADDDC是一种自适应双DRAM设备更正技术,用于管理DDR4DRAM DIMM可能在产品使用寿命期间诱发的错误,ADDDC(MR)可以纠正连续的两个DRAM故障。如果该区域的第二个设备发生故障,仍然支持可修复错误检测和纠正,并允许系统继续运行。
ADDDC的出现,内存子系统通常配置为以性能模式运行。当DRAM设备的更正数量达到目标阀值,所识别的故障DRAM区域将在UEFI运行时代码的帮助下自适应地被放置在锁步模式下,以便从ECC中标记出DRAM设备的故障区域。持续在DIMM上提供SDDC ECC覆盖,进而延长DIMM的使用寿命。这一操作通常在DRAM Bank和/或Rank的精细化过程中进行,以便对整个系统性能产生的影响达到最小。
因此,为了保证ADDDC的稳定执行,亟需一种ADDDC功能的测试方法,用于服务器出厂时验证ADDDC功能。
发明内容
针对以上问题,本发明的目的在于提供一种关于内存ADDDC功能的测试方法、系统及设备,通过模拟内存故障情形,验证ADDDC功能是否正常。
本发明为实现上述目的,通过以下技术方案实现:一种关于内存ADDDC功能的测试方法,包括:
进入被测试机台的Set up下,配置测试环境参数,并重启系统;
指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志;
如果系统没有因为内存故障异常,且所述注入的可修复错误在BMC日志中的错误记录日志中已被记录,则测试成功。
进一步,所述进入被测试机台的Set up下,配置测试环境参数包括:
设置ADDDC sparing及SDDC plus one为Enabled;
设置Correctable Error Threshold为1;
设置System Errors为Enable;
设置WHEA Support为Enable;
设置WHEA Error Injection为Enable。
进一步,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志包括:
指定内存设备寄存器的第一地址并给内存的第一Bank注入可修复错误,所述可修复错误达到阈值触发Bank virtual lockstep;
查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADC BankVLS日志。
进一步,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志还包括:
指定内存设备寄存器的第二地址并给内存的第二Bank注入可修复错误,所述可修复错误达到阈值触发Rank virtual lockstep;
查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADC RankVLS日志。
进一步,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志还包括:
指定内存设备寄存器的第三地址并给内存的第三Bank注入可修复错误,所述可修复错误达到阈值触发SDDC sparing;
查看系统日志中的内存故障重启记录,查看系统日志及BMC日志中记录SDDC+1日志。
进一步,所述第一地址、第二地址和第三地址各不相同;所述第一Bank、第二Bank和第三Bank各不相同。
相应的,本发明还公开了一种关于内存ADDDC功能的测试系统,包括:
参数配置模块,用于在被测试机台的Set up下配置测试环境参数;
数据注入模块,用于指定被测试机台的内存设备寄存器地址并向其注入可修复错误;
信息查看模块,查看系统日志和BMC日志中的错误记录日志。
相应的,本发明还公开了一种关于内存ADDDC功能的测试设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任一项所述关于内存ADDDC功能的测试方法的步骤。
对比现有技术,本发明有益效果在于:本发明提供了一种关于内存ADDDC功能的测试方法、系统及设备,主要用于服务器内存ADDDC功能测试,通过模拟内存故障情形,验证ADDDC功能是否正常。即可提高测试效率,提高测试质量也同时节约测试时间和成本。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
附图1是本发明的方法流程图。
附图2是本发明的系统结构图。
具体实施方式
下面结合附图对本发明的具体实施方式做出说明。
如图1所示的一种多节点机型MAC地址的导出方法,包括如下步骤:
步骤1:进入被测试机台的Set up下,配置测试环境参数,并重启系统。
配置测试环境参数包括:
设置ADDDC sparing及SDDC plus one为Enabled;
设置Correctable Error Threshold为1;
设置System Errors为Enable;
设置WHEA Support为Enable;
设置WHEA Error Injection为Enable。
步骤2:指定内存设备寄存器的第一地址并给内存的第一Bank注入可修复错误,所述可修复错误达到阈值触发Bank virtual lockstep。
步骤3:查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADCBank VLS日志。
步骤4:指定内存设备寄存器的第二地址并给内存的第二Bank注入可修复错误,所述可修复错误达到阈值触发Rank virtual lockstep。
步骤5:查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADCRank VLS日志。
步骤6:指定内存设备寄存器的第三地址并给内存的第三Bank注入可修复错误,所述可修复错误达到阈值触发SDDC sparing;
步骤7:查看系统日志中的内存故障重启记录,查看系统日志及BMC日志中记录SDDC+1日志。
其中,前述的第一地址、第二地址和第三地址各不相同;第一Bank、第二Bank和第三Bank各不相同。
步骤8:如果系统没有因为内存故障异常,且所述注入的可修复错误分别在BMC日志中的ADC Rank VLS日志、ADC Rank VLS日志、SDDC+1日志中已被记录,则测试成功。
相应的,如图2所示,本发明还公开了本发明还公开了一种关于内存ADDDC功能的测试系统,包括:
参数配置模块,用于在被测试机台的Set up下配置测试环境参数;
数据注入模块,用于指定被测试机台的内存设备寄存器地址并向其注入可修复错误;
信息查看模块,查看系统日志和BMC日志中的错误记录日志。
相应的,本发明还公开了还公开了一种关于内存ADDDC功能的测试设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任一项所述关于内存ADDDC功能的测试方法的步骤。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
结合附图和具体实施例,对本发明作进一步说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所限定的范围。
Claims (8)
1.一种关于内存ADDDC功能的测试方法,其特征在于,包括:
进入被测试机台的Set up下,配置测试环境参数,并重启系统;
指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志;
如果系统没有因为内存故障异常,且所述注入的可修复错误在BMC日志中的错误记录日志中已被记录,则测试成功。
2.根据权利要求1所述的关于内存ADDDC功能的测试方法,其特征在于,所述进入被测试机台的Set up下,配置测试环境参数包括:
设置ADDDC sparing及SDDC plus one为Enabled;
设置Correctable Error Threshold为1;
设置System Errors为Enable;
设置WHEA Support为Enable;
设置WHEA Error Injection为Enable。
3.根据权利要求1所述的关于内存ADDDC功能的测试方法,其特征在于,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志包括:
指定内存设备寄存器的第一地址并给内存的第一Bank注入可修复错误,所述可修复错误达到阈值触发Bank virtual lockstep;
查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADC Bank VLS日志。
4.根据权利要求3所述的关于内存ADDDC功能的测试方法,其特征在于,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志还包括:
指定内存设备寄存器的第二地址并给内存的第二Bank注入可修复错误,所述可修复错误达到阈值触发Rank virtual lockstep;
查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADC Rank VLS日志。
5.根据权利要求4所述的关于内存ADDDC功能的测试方法,其特征在于,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志还包括:
指定内存设备寄存器的第三地址并给内存的第三Bank注入可修复错误,所述可修复错误达到阈值触发SDDC sparing;
查看系统日志中的内存故障重启记录,查看系统日志及BMC日志中记录SDDC+1日志。
6.根据权利要求5所述的关于内存ADDDC功能的测试方法,其特征在于,所述第一地址、第二地址和第三地址各不相同;所述第一Bank、第二Bank和第三Bank各不相同。
7.一种关于内存ADDDC功能的测试系统,其特征在于,包括:
参数配置模块,用于在被测试机台的Set up下配置测试环境参数;
数据注入模块,用于指定被测试机台的内存设备寄存器地址并向其注入可修复错误;
信息查看模块,查看系统日志和BMC日志中的错误记录日志。
8.一种关于内存ADDDC功能的测试设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述关于内存ADDDC功能的测试方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910683345.4A CN110544504A (zh) | 2019-07-26 | 2019-07-26 | 一种关于内存adddc功能的测试方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910683345.4A CN110544504A (zh) | 2019-07-26 | 2019-07-26 | 一种关于内存adddc功能的测试方法、系统及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110544504A true CN110544504A (zh) | 2019-12-06 |
Family
ID=68710294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910683345.4A Pending CN110544504A (zh) | 2019-07-26 | 2019-07-26 | 一种关于内存adddc功能的测试方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110544504A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113064773A (zh) * | 2021-03-08 | 2021-07-02 | 山东英信计算机技术有限公司 | 一种内存ppr测试与修复方法、系统及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8707104B1 (en) * | 2011-09-06 | 2014-04-22 | Western Digital Technologies, Inc. | Systems and methods for error injection in data storage systems |
CN105207839A (zh) * | 2015-08-17 | 2015-12-30 | 浪潮(北京)电子信息产业有限公司 | 一种网络重传设计的自动测试方法及装置 |
US9563548B2 (en) * | 2014-05-01 | 2017-02-07 | International Business Machines Corporation | Error injection and error counting during memory scrubbing operations |
CN107122277A (zh) * | 2017-05-09 | 2017-09-01 | 郑州云海信息技术有限公司 | 基于pcie协议分析仪的pcieras注错测试系统及方法 |
CN107832179A (zh) * | 2017-11-27 | 2018-03-23 | 郑州云海信息技术有限公司 | 一种PCIe Error Enabling测试方法 |
CN109101377A (zh) * | 2018-07-18 | 2018-12-28 | 郑州云海信息技术有限公司 | 一种内存sddc的测试方法 |
CN109656768A (zh) * | 2018-12-27 | 2019-04-19 | 郑州云海信息技术有限公司 | 一种查看cpu ieer的测试方法 |
CN109918254A (zh) * | 2019-02-27 | 2019-06-21 | 苏州浪潮智能科技有限公司 | 一种AEP内存Error Detection功能测试方法、系统、终端及存储介质 |
-
2019
- 2019-07-26 CN CN201910683345.4A patent/CN110544504A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8707104B1 (en) * | 2011-09-06 | 2014-04-22 | Western Digital Technologies, Inc. | Systems and methods for error injection in data storage systems |
US9563548B2 (en) * | 2014-05-01 | 2017-02-07 | International Business Machines Corporation | Error injection and error counting during memory scrubbing operations |
CN105207839A (zh) * | 2015-08-17 | 2015-12-30 | 浪潮(北京)电子信息产业有限公司 | 一种网络重传设计的自动测试方法及装置 |
CN107122277A (zh) * | 2017-05-09 | 2017-09-01 | 郑州云海信息技术有限公司 | 基于pcie协议分析仪的pcieras注错测试系统及方法 |
CN107832179A (zh) * | 2017-11-27 | 2018-03-23 | 郑州云海信息技术有限公司 | 一种PCIe Error Enabling测试方法 |
CN109101377A (zh) * | 2018-07-18 | 2018-12-28 | 郑州云海信息技术有限公司 | 一种内存sddc的测试方法 |
CN109656768A (zh) * | 2018-12-27 | 2019-04-19 | 郑州云海信息技术有限公司 | 一种查看cpu ieer的测试方法 |
CN109918254A (zh) * | 2019-02-27 | 2019-06-21 | 苏州浪潮智能科技有限公司 | 一种AEP内存Error Detection功能测试方法、系统、终端及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113064773A (zh) * | 2021-03-08 | 2021-07-02 | 山东英信计算机技术有限公司 | 一种内存ppr测试与修复方法、系统及存储介质 |
CN113064773B (zh) * | 2021-03-08 | 2023-03-24 | 山东英信计算机技术有限公司 | 一种内存ppr测试与修复方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10204698B2 (en) | Method to dynamically inject errors in a repairable memory on silicon and a method to validate built-in-self-repair logic | |
US8904244B2 (en) | Heuristic approach for faster consistency check in a redundant storage system | |
US9818492B2 (en) | Method for testing a memory and memory system | |
US10146604B2 (en) | Bad block detection and predictive analytics in NAND flash storage devices | |
CN102298545B (zh) | 一种系统启动引导处理方法及装置 | |
US7356744B2 (en) | Method and system for optimizing testing of memory stores | |
US7661044B2 (en) | Method, apparatus and program product to concurrently detect, repair, verify and isolate memory failures | |
CN108932249B (zh) | 一种管理文件系统的方法及装置 | |
US8812915B2 (en) | Determining whether a right to use memory modules in a reliability mode has been acquired | |
CN112000513A (zh) | 一种计算机及其vpd数据操作方法、装置、存储介质 | |
CN114385418A (zh) | 通信设备的保护方法、装置、设备和存储介质 | |
CN114116355A (zh) | 内存测试方法、装置及电子设备 | |
CN110544504A (zh) | 一种关于内存adddc功能的测试方法、系统及设备 | |
CN111816239A (zh) | 磁盘检测方法、装置、电子设备及机器可读存储介质 | |
CN114579163A (zh) | 一种磁盘固件升级方法、计算装置及系统 | |
CN106250193B (zh) | 一种基于nand存储器的系统启动方法及系统 | |
CN117373525A (zh) | Ecc功能测试方法、装置、电子设备及存储介质 | |
CN105575439B (zh) | 一种存储单元失效纠错的方法及存储器 | |
CN110956284A (zh) | 一种产品信息的可靠性维护方法、系统、设备及存储介质 | |
CN116244127A (zh) | 一种硬盘检测方法、装置、设备以及存储介质 | |
WO2023077607A1 (zh) | 一种故障日志的存储方法、装置、电子设备及存储介质 | |
CN114840364A (zh) | 对内存中的存储数据进行备份的方法、装置及电子设备 | |
CN115705261A (zh) | 内存故障的修复方法、cpu、os、bios及服务器 | |
CN112463019A (zh) | 数据读取方法及装置 | |
TWI777259B (zh) | 開機方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191206 |