CN110544504A - 一种关于内存adddc功能的测试方法、系统及设备 - Google Patents

一种关于内存adddc功能的测试方法、系统及设备 Download PDF

Info

Publication number
CN110544504A
CN110544504A CN201910683345.4A CN201910683345A CN110544504A CN 110544504 A CN110544504 A CN 110544504A CN 201910683345 A CN201910683345 A CN 201910683345A CN 110544504 A CN110544504 A CN 110544504A
Authority
CN
China
Prior art keywords
log
memory
error
repairable
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910683345.4A
Other languages
English (en)
Inventor
刘学艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910683345.4A priority Critical patent/CN110544504A/zh
Publication of CN110544504A publication Critical patent/CN110544504A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/56External testing equipment for static stores, e.g. automatic test equipment [ATE]; Interfaces therefor

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明提出的一种关于内存ADDDC功能的测试方法、系统及设备,主要用于服务器内存ADDDC功能测试,通过模拟内存故障情形,验证ADDDC功能是否正常。即可提高测试效率,提高测试质量也同时节约测试时间和成本。

Description

一种关于内存ADDDC功能的测试方法、系统及设备
技术领域
本发明涉及计算机网络技术领域,更具体的说是涉及一种关于内存ADDDC功能的测试方法、系统及设备。
背景技术
ADDDC是一种自适应双DRAM设备更正技术,用于管理DDR4DRAM DIMM可能在产品使用寿命期间诱发的错误,ADDDC(MR)可以纠正连续的两个DRAM故障。如果该区域的第二个设备发生故障,仍然支持可修复错误检测和纠正,并允许系统继续运行。
ADDDC的出现,内存子系统通常配置为以性能模式运行。当DRAM设备的更正数量达到目标阀值,所识别的故障DRAM区域将在UEFI运行时代码的帮助下自适应地被放置在锁步模式下,以便从ECC中标记出DRAM设备的故障区域。持续在DIMM上提供SDDC ECC覆盖,进而延长DIMM的使用寿命。这一操作通常在DRAM Bank和/或Rank的精细化过程中进行,以便对整个系统性能产生的影响达到最小。
因此,为了保证ADDDC的稳定执行,亟需一种ADDDC功能的测试方法,用于服务器出厂时验证ADDDC功能。
发明内容
针对以上问题,本发明的目的在于提供一种关于内存ADDDC功能的测试方法、系统及设备,通过模拟内存故障情形,验证ADDDC功能是否正常。
本发明为实现上述目的,通过以下技术方案实现:一种关于内存ADDDC功能的测试方法,包括:
进入被测试机台的Set up下,配置测试环境参数,并重启系统;
指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志;
如果系统没有因为内存故障异常,且所述注入的可修复错误在BMC日志中的错误记录日志中已被记录,则测试成功。
进一步,所述进入被测试机台的Set up下,配置测试环境参数包括:
设置ADDDC sparing及SDDC plus one为Enabled;
设置Correctable Error Threshold为1;
设置System Errors为Enable;
设置WHEA Support为Enable;
设置WHEA Error Injection为Enable。
进一步,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志包括:
指定内存设备寄存器的第一地址并给内存的第一Bank注入可修复错误,所述可修复错误达到阈值触发Bank virtual lockstep;
查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADC BankVLS日志。
进一步,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志还包括:
指定内存设备寄存器的第二地址并给内存的第二Bank注入可修复错误,所述可修复错误达到阈值触发Rank virtual lockstep;
查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADC RankVLS日志。
进一步,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志还包括:
指定内存设备寄存器的第三地址并给内存的第三Bank注入可修复错误,所述可修复错误达到阈值触发SDDC sparing;
查看系统日志中的内存故障重启记录,查看系统日志及BMC日志中记录SDDC+1日志。
进一步,所述第一地址、第二地址和第三地址各不相同;所述第一Bank、第二Bank和第三Bank各不相同。
相应的,本发明还公开了一种关于内存ADDDC功能的测试系统,包括:
参数配置模块,用于在被测试机台的Set up下配置测试环境参数;
数据注入模块,用于指定被测试机台的内存设备寄存器地址并向其注入可修复错误;
信息查看模块,查看系统日志和BMC日志中的错误记录日志。
相应的,本发明还公开了一种关于内存ADDDC功能的测试设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任一项所述关于内存ADDDC功能的测试方法的步骤。
对比现有技术,本发明有益效果在于:本发明提供了一种关于内存ADDDC功能的测试方法、系统及设备,主要用于服务器内存ADDDC功能测试,通过模拟内存故障情形,验证ADDDC功能是否正常。即可提高测试效率,提高测试质量也同时节约测试时间和成本。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
附图1是本发明的方法流程图。
附图2是本发明的系统结构图。
具体实施方式
下面结合附图对本发明的具体实施方式做出说明。
如图1所示的一种多节点机型MAC地址的导出方法,包括如下步骤:
步骤1:进入被测试机台的Set up下,配置测试环境参数,并重启系统。
配置测试环境参数包括:
设置ADDDC sparing及SDDC plus one为Enabled;
设置Correctable Error Threshold为1;
设置System Errors为Enable;
设置WHEA Support为Enable;
设置WHEA Error Injection为Enable。
步骤2:指定内存设备寄存器的第一地址并给内存的第一Bank注入可修复错误,所述可修复错误达到阈值触发Bank virtual lockstep。
步骤3:查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADCBank VLS日志。
步骤4:指定内存设备寄存器的第二地址并给内存的第二Bank注入可修复错误,所述可修复错误达到阈值触发Rank virtual lockstep。
步骤5:查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADCRank VLS日志。
步骤6:指定内存设备寄存器的第三地址并给内存的第三Bank注入可修复错误,所述可修复错误达到阈值触发SDDC sparing;
步骤7:查看系统日志中的内存故障重启记录,查看系统日志及BMC日志中记录SDDC+1日志。
其中,前述的第一地址、第二地址和第三地址各不相同;第一Bank、第二Bank和第三Bank各不相同。
步骤8:如果系统没有因为内存故障异常,且所述注入的可修复错误分别在BMC日志中的ADC Rank VLS日志、ADC Rank VLS日志、SDDC+1日志中已被记录,则测试成功。
相应的,如图2所示,本发明还公开了本发明还公开了一种关于内存ADDDC功能的测试系统,包括:
参数配置模块,用于在被测试机台的Set up下配置测试环境参数;
数据注入模块,用于指定被测试机台的内存设备寄存器地址并向其注入可修复错误;
信息查看模块,查看系统日志和BMC日志中的错误记录日志。
相应的,本发明还公开了还公开了一种关于内存ADDDC功能的测试设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任一项所述关于内存ADDDC功能的测试方法的步骤。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
结合附图和具体实施例,对本发明作进一步说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所限定的范围。

Claims (8)

1.一种关于内存ADDDC功能的测试方法,其特征在于,包括:
进入被测试机台的Set up下,配置测试环境参数,并重启系统;
指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志;
如果系统没有因为内存故障异常,且所述注入的可修复错误在BMC日志中的错误记录日志中已被记录,则测试成功。
2.根据权利要求1所述的关于内存ADDDC功能的测试方法,其特征在于,所述进入被测试机台的Set up下,配置测试环境参数包括:
设置ADDDC sparing及SDDC plus one为Enabled;
设置Correctable Error Threshold为1;
设置System Errors为Enable;
设置WHEA Support为Enable;
设置WHEA Error Injection为Enable。
3.根据权利要求1所述的关于内存ADDDC功能的测试方法,其特征在于,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志包括:
指定内存设备寄存器的第一地址并给内存的第一Bank注入可修复错误,所述可修复错误达到阈值触发Bank virtual lockstep;
查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADC Bank VLS日志。
4.根据权利要求3所述的关于内存ADDDC功能的测试方法,其特征在于,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志还包括:
指定内存设备寄存器的第二地址并给内存的第二Bank注入可修复错误,所述可修复错误达到阈值触发Rank virtual lockstep;
查看系统日志中的内存故障异常记录,查看系统日志及BMC日志中记录ADC Rank VLS日志。
5.根据权利要求4所述的关于内存ADDDC功能的测试方法,其特征在于,所述指定被测试机台的内存设备寄存器地址并向其注入可修复错误并查看系统日志和BMC日志中的错误记录日志还包括:
指定内存设备寄存器的第三地址并给内存的第三Bank注入可修复错误,所述可修复错误达到阈值触发SDDC sparing;
查看系统日志中的内存故障重启记录,查看系统日志及BMC日志中记录SDDC+1日志。
6.根据权利要求5所述的关于内存ADDDC功能的测试方法,其特征在于,所述第一地址、第二地址和第三地址各不相同;所述第一Bank、第二Bank和第三Bank各不相同。
7.一种关于内存ADDDC功能的测试系统,其特征在于,包括:
参数配置模块,用于在被测试机台的Set up下配置测试环境参数;
数据注入模块,用于指定被测试机台的内存设备寄存器地址并向其注入可修复错误;
信息查看模块,查看系统日志和BMC日志中的错误记录日志。
8.一种关于内存ADDDC功能的测试设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述关于内存ADDDC功能的测试方法的步骤。
CN201910683345.4A 2019-07-26 2019-07-26 一种关于内存adddc功能的测试方法、系统及设备 Pending CN110544504A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910683345.4A CN110544504A (zh) 2019-07-26 2019-07-26 一种关于内存adddc功能的测试方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910683345.4A CN110544504A (zh) 2019-07-26 2019-07-26 一种关于内存adddc功能的测试方法、系统及设备

Publications (1)

Publication Number Publication Date
CN110544504A true CN110544504A (zh) 2019-12-06

Family

ID=68710294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910683345.4A Pending CN110544504A (zh) 2019-07-26 2019-07-26 一种关于内存adddc功能的测试方法、系统及设备

Country Status (1)

Country Link
CN (1) CN110544504A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113064773A (zh) * 2021-03-08 2021-07-02 山东英信计算机技术有限公司 一种内存ppr测试与修复方法、系统及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8707104B1 (en) * 2011-09-06 2014-04-22 Western Digital Technologies, Inc. Systems and methods for error injection in data storage systems
CN105207839A (zh) * 2015-08-17 2015-12-30 浪潮(北京)电子信息产业有限公司 一种网络重传设计的自动测试方法及装置
US9563548B2 (en) * 2014-05-01 2017-02-07 International Business Machines Corporation Error injection and error counting during memory scrubbing operations
CN107122277A (zh) * 2017-05-09 2017-09-01 郑州云海信息技术有限公司 基于pcie协议分析仪的pcieras注错测试系统及方法
CN107832179A (zh) * 2017-11-27 2018-03-23 郑州云海信息技术有限公司 一种PCIe Error Enabling测试方法
CN109101377A (zh) * 2018-07-18 2018-12-28 郑州云海信息技术有限公司 一种内存sddc的测试方法
CN109656768A (zh) * 2018-12-27 2019-04-19 郑州云海信息技术有限公司 一种查看cpu ieer的测试方法
CN109918254A (zh) * 2019-02-27 2019-06-21 苏州浪潮智能科技有限公司 一种AEP内存Error Detection功能测试方法、系统、终端及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8707104B1 (en) * 2011-09-06 2014-04-22 Western Digital Technologies, Inc. Systems and methods for error injection in data storage systems
US9563548B2 (en) * 2014-05-01 2017-02-07 International Business Machines Corporation Error injection and error counting during memory scrubbing operations
CN105207839A (zh) * 2015-08-17 2015-12-30 浪潮(北京)电子信息产业有限公司 一种网络重传设计的自动测试方法及装置
CN107122277A (zh) * 2017-05-09 2017-09-01 郑州云海信息技术有限公司 基于pcie协议分析仪的pcieras注错测试系统及方法
CN107832179A (zh) * 2017-11-27 2018-03-23 郑州云海信息技术有限公司 一种PCIe Error Enabling测试方法
CN109101377A (zh) * 2018-07-18 2018-12-28 郑州云海信息技术有限公司 一种内存sddc的测试方法
CN109656768A (zh) * 2018-12-27 2019-04-19 郑州云海信息技术有限公司 一种查看cpu ieer的测试方法
CN109918254A (zh) * 2019-02-27 2019-06-21 苏州浪潮智能科技有限公司 一种AEP内存Error Detection功能测试方法、系统、终端及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113064773A (zh) * 2021-03-08 2021-07-02 山东英信计算机技术有限公司 一种内存ppr测试与修复方法、系统及存储介质
CN113064773B (zh) * 2021-03-08 2023-03-24 山东英信计算机技术有限公司 一种内存ppr测试与修复方法、系统及存储介质

Similar Documents

Publication Publication Date Title
US10204698B2 (en) Method to dynamically inject errors in a repairable memory on silicon and a method to validate built-in-self-repair logic
US8904244B2 (en) Heuristic approach for faster consistency check in a redundant storage system
US9818492B2 (en) Method for testing a memory and memory system
US10146604B2 (en) Bad block detection and predictive analytics in NAND flash storage devices
CN102298545B (zh) 一种系统启动引导处理方法及装置
US7356744B2 (en) Method and system for optimizing testing of memory stores
US7661044B2 (en) Method, apparatus and program product to concurrently detect, repair, verify and isolate memory failures
CN108932249B (zh) 一种管理文件系统的方法及装置
US8812915B2 (en) Determining whether a right to use memory modules in a reliability mode has been acquired
CN112000513A (zh) 一种计算机及其vpd数据操作方法、装置、存储介质
CN114385418A (zh) 通信设备的保护方法、装置、设备和存储介质
CN114116355A (zh) 内存测试方法、装置及电子设备
CN110544504A (zh) 一种关于内存adddc功能的测试方法、系统及设备
CN111816239A (zh) 磁盘检测方法、装置、电子设备及机器可读存储介质
CN114579163A (zh) 一种磁盘固件升级方法、计算装置及系统
CN106250193B (zh) 一种基于nand存储器的系统启动方法及系统
CN117373525A (zh) Ecc功能测试方法、装置、电子设备及存储介质
CN105575439B (zh) 一种存储单元失效纠错的方法及存储器
CN110956284A (zh) 一种产品信息的可靠性维护方法、系统、设备及存储介质
CN116244127A (zh) 一种硬盘检测方法、装置、设备以及存储介质
WO2023077607A1 (zh) 一种故障日志的存储方法、装置、电子设备及存储介质
CN114840364A (zh) 对内存中的存储数据进行备份的方法、装置及电子设备
CN115705261A (zh) 内存故障的修复方法、cpu、os、bios及服务器
CN112463019A (zh) 数据读取方法及装置
TWI777259B (zh) 開機方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191206