CN114003419A - 一种基于oses实现内存ras特性自动测试的方法、系统及装置 - Google Patents

一种基于oses实现内存ras特性自动测试的方法、系统及装置 Download PDF

Info

Publication number
CN114003419A
CN114003419A CN202111158359.8A CN202111158359A CN114003419A CN 114003419 A CN114003419 A CN 114003419A CN 202111158359 A CN202111158359 A CN 202111158359A CN 114003419 A CN114003419 A CN 114003419A
Authority
CN
China
Prior art keywords
oses
test
ras
mode
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111158359.8A
Other languages
English (en)
Inventor
刘元爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111158359.8A priority Critical patent/CN114003419A/zh
Publication of CN114003419A publication Critical patent/CN114003419A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/073Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a memory management context, e.g. virtual memory or cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods

Abstract

本发明提出的一种基于OSES实现内存RAS特性自动测试的方法、系统及装置,所述方法包括:通过OSES实现对BIOS配置的识别,检查当前BIOS配置中的RAS模式,并可进行Mirror和Sparing模式的配置切换;通过OSES读取每个活动的内存容量,并判断与实际是否一致;通过OSES读取内存总容量,并判断是否符合当前模式的容量规律;通过OSES启动系统下memtester压力测试;通过OSES重启存储系统;通过OSES接收和分析RAS特性测试生成的文件,将结果以事件日志方式上报;测试完成后,能够将所有事件日志打包成zip并下载。本发明通过存储系统的OSES模块实现对BIOS、内存等的监测和管理,并利用OSES的日志分析能力输出测试结果,整个过程实现全自动化,能极大提高测试效率。

Description

一种基于OSES实现内存RAS特性自动测试的方法、系统及装置
技术领域
本发明涉及内存测试技术领域,更具体的说是涉及一种基于OSES实现内存RAS特性自动测试的方法、系统及装置。
背景技术
OSES,是Organic SAS Enclosure Service的简称,中文全称为统一SAS机箱服务,OSES作为存储设备的整机箱管理模块,具有强大的功能,既可以实时监测设备的运行状态,也可以实现与存储各系统模块之间的交互与管理;SAS,是Serial Attached SCSI的简称,中文全称为串口连接接口。RAS,是Reliability,、Availability、Serviceability的简称,中文全称为可靠性,可用性和可服务性。
当前,存储机器往往用于储存客户重要的数据,是以稳定性可靠性著称的,而内存子系统作为存储系统上非常重要的一个系统,内存子系统设计质量的高低直接决定了存储系统的稳定性与可靠性。而内存RAS特性测试,作为一种针对内存可靠性、可用性和可服务性的专业内存测试手段,它从整体上确保整个系统尽可能长期可靠的运行而不下线,并且具备足够强大的容错机制,在系统运行状态下,可测试绝大部分的内存可能故障。因此,在内存子系统设计过程与内存部件的引入测试过程中,RAS特性测试尤其显得重要,是必须的一项测试。
通常情况下,针对RAS特性测试,需要测试人员利用BIOS,使用串口工具连接串口进行测试,测试完成后收集RAS测试相关日志,然后人工完成RAS测试结果的判定。现有的RAS特性测试方法不仅需要手动进入BIOS修改RAS模式开关,而且需要人工完成RAS结果的判定,并人工进行结果汇总,测试效率较低;另外,由于RAS测试需要遍历内存RAS模式(Mirror和Sparing),如果采用传统方法,则需要每测试一次,就要手动重启存储进入BIOS修改RAS模式,费时又费力。
发明内容
针对以上问题,本发明的目的在于提供一种基于OSES实现内存RAS特性自动测试的方法、系统及装置,通过存储系统的OSES模块实现对BIOS、内存等的监测和管理,并利用OSES的日志分析能力输出测试结果,整个过程实现全自动化,能极大提高测试效率。
本发明为实现上述目的,通过以下技术方案实现:一种基于OSES实现内存RAS特性自动测试的方法,包括:
步骤1:存储机器从满配内存开始上电启机,开始RAS特性测试;
步骤2:通过OSES将当前BIOS配置中的RAS的测试模式调整为Mirror模式;
步骤3:通过OSES读取每个活动内存的容量是否与实际容量一致,若一致,则转到下一步,若不一致,则转达步骤9;
步骤4:通过OSES读取当前内存总容量是否符合当前RAS的测试模式的容量规律,若一致,则转到下一步,若不一致,则转达步骤9;
步骤5:通过OSES在当前存储系统下启动memtester压力测试,等待测试执行完成;
步骤6:测试执行完成后生成测试文件,发送给OSES;
步骤7:通过OSES重启存储系统;
步骤8:通过OSES识别当前BIOS下的RAS测试模式是否是Sparing模式,如果不是则通过OSES将BIOS配置中的RAS测试模式修改成Sparing模式,并转到步骤3;如果是则说明Sparing模式下的测试完成,直接转到下一步;
步骤9:通过OSES分析RAS测试结果,并将分析结果以事件日志方式上报;
步骤10:通过OSES将所有事件日志打包成zip格式文件供用户下载。
进一步,所述步骤2包括:
通过OSES识别当前BIOS下的RAS测试模式是否是Mirror模式,如果不是则通过OSES将BIOS配置中的RAS测试模式修改成Mirror模式;如果是则直接转到下一步。
进一步,所述RAS的测试模式包括Mirror模式和Sparing模式。
进一步,所述Mirror模式下的内存容量规律为:内存实际容量=内侧总容量×0.5。
进一步,所述Sparing模式下的内存容量规律为:内存实际容量=内存总容量×(N-1)/N,N是指每通道内存的芯片组数量。
进一步,所述RAS测试结果包括:单内存容量检查结果、内存总容量与当前模式下容量规律的检查结果、memtester压力测试结果、系统log检查结果。
进一步,所述步骤7具体为:等待存储数据完全保存后,通过OSES重启存储系统。
相应的,本发明还公开了一种基于OSES实现内存RAS特性自动测试的系统,包括:
启动单元,用于存储机器从满配内存开始上电启机,开始RAS特性测试;
模式调整单元,用于通过OSES将当前BIOS配置中的RAS的测试模式调整为Mirror模式或Sparing模式;
容量读取单元,用于通过OSES读取每个活动内存的容量是否与实际容量一致;容量规律判断单元,用于通过OSES读取当前内存总容量是否符合当前RAS的测试模式的容量规律;
压力测试单元,用于通过OSES在当前存储系统下启动memtester压力测试;
文件输出单元,用于测试执行完成后生成测试文件,发送给OSES;
重启单元,用于通过OSES重启存储系统;
上报单元,用于通过OSES分析RAS测试结果,并将分析结果以事件日志方式上报;日志封装单元,用于通过OSES将所有事件日志打包成zip格式文件供用户下载。
进一步,重启单元具体用于:等待存储数据完全保存后,通过OSES重启存储系统。
相应的,本发明公开了一种基于OSES实现内存RAS特性自动测试的装置,包括:
存储器,用于存储基于OSES实现内存RAS特性自动测试的程序;
处理器,用于执行所述基于OSES实现内存RAS特性自动测试的程序时实现如上文任一项所述基于OSES实现内存RAS特性自动测试的方法步骤。
相应的,本发明公开了一种可读存储介质,所述可读存储介质上存储有基于OSES实现内存RAS特性自动测试的程序,所述基于OSES实现内存RAS特性自动测试的程序被处理器执行时实现如上文任一项所述基于OSES实现内存RAS特性自动测试的方法步骤。
对比现有技术,本发明有益效果在于:
本发明通过存储系统的OSES模块实现对BIOS、内存等的监测和管理,并利用OSES的日志分析能力输出测试结果,整个过程实现全自动化,能极大提高测试效率;另外,由于采用OSES对存储系统进行控制,会保证存储数据在完全保存后才会重启,也最大程度上保护了整个存储系统。
本发明充分利用和挖掘OSES的功能特性,实现对整个RAS特性测试流程的自动协调控制,在整个流程中,OSES主要发挥如下几个方面作用:
1、通过OSES实现对BIOS配置的识别,检查当前BIOS配置中的RAS模式,并可进行Mirror和Sparing模式的配置切换;
2、通过OSES读取每个活动的内存容量,并判断与实际是否一致;通过OSES读取内存总容量,并判断是否符合当前模式的容量规律;
3、通过OSES启动系统下memtester压力测试,省去人工开启压力测试的麻烦;
4、通过OSES重启存储系统,省去每一次测试手动重启的麻烦,并且OSES会等待存储数据完全保存后再重启,这样保证数据不丢失;
5、通过OSES接收和分析RAS特性测试生成的文件,将结果以事件日志方式上报;测试完成后,能够将所有事件日志打包成zip并下载。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
附图1是本发明的方法流程图。
附图2是本发明的系统结构图。
图中,1为启动单元;2为模式调整单元;3为容量读取单元;4为容量规律判断单元;5为压力测试单元;6为文件输出单元;7为重启单元;8为上报单元;9为上报单元。
具体实施方式
本发明的核心是提供一种基于OSES实现内存RAS特性自动测试的方法,现有的RAS特性测试方法不仅需要手动进入BIOS修改RAS模式开关,而且需要人工完成RAS结果的判定,并人工进行结果汇总,测试效率较低;另外,由于RAS测试需要遍历内存RAS模式(Mirror和Sparing),如果采用传统方法,则需要每测试一次,就要手动重启存储进入BIOS修改RAS模式,费时又费力。
而本发明提供的基于OSES实现内存RAS特性自动测试的方法,通过OSES实现对BIOS配置的识别,检查当前BIOS配置中的RAS模式,并可进行Mirror和Sparing模式的配置切换;通过OSES读取每个活动的内存容量,并判断与实际是否一致;通过OSES读取内存总容量,并判断是否符合当前模式的容量规律;通过OSES启动系统下memtester压力测试,省去人工开启压力测试的麻烦;通过OSES重启存储系统,省去每一次测试手动重启的麻烦,并且OSES会等待存储数据完全保存后再重启,这样保证数据不丢失;通过OSES接收和分析RAS特性测试生成的文件,将结果以事件日志方式上报;测试完成后,能够将所有事件日志打包成zip并下载。
由此可见,本发明充分利用和挖掘OSES的功能特性,实现了对整个RAS特性测试流程的自动协调控制。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
如图1所示,本实施例提供了一种基于OSES实现内存RAS特性自动测试的方法,包括如下步骤:
步骤1:存储机器从满配内存开始上电启机,开始RAS特性测试。
步骤2:通过OSES将当前BIOS配置中的RAS的测试模式调整为Mirror模式。本步骤具体为:通过OSES识别当前BIOS下的RAS测试模式是否是Mirror模式,如果不是则通过OSES将BIOS配置中的RAS测试模式修改成Mirror模式;如果是则直接转到下一步。其中,AS的测试模式包括Mirror模式和Sparing模式。
步骤3:通过OSES读取每个活动内存的容量是否与实际容量一致,若一致,则转到下一步,若不一致,则转达步骤9。
判断每个活动内存的容量是否与实际一致,其目的在于保证全部内存正常,如果不一致,OSES将错误以事件日志方式上报。
步骤4:通过OSES读取当前内存总容量是否符合当前RAS的测试模式的容量规律,若一致,则转到下一步,若不一致,则转达步骤9。
其中,Mirror模式下的内存容量规律为:内存实际容量=内侧总容量×0.5。Sparing模式下的内存容量规律为:内存实际容量=内存总容量×(N-1)/N,N是指每通道内存的总rank。
步骤5:通过OSES在当前存储系统下启动memtester压力测试,等待测试执行完成。
步骤6:测试执行完成后生成测试文件,发送给OSES。
步骤7:通过OSES重启存储系统。
通过OSES重启存储系统,省去每一次测试手动重启的麻烦,并且OSES会等待存储数据完全保存后再重启,这样保证数据不丢失。
步骤8:通过OSES识别当前BIOS下的RAS测试模式是否是Sparing模式,如果不是则通过OSES将BIOS配置中的RAS测试模式修改成Sparing模式,并转到步骤3;如果是则说明Sparing模式下的测试完成,直接转到下一步。
步骤9:通过OSES分析RAS测试结果,并将分析结果以事件日志方式上报。
其中,RAS测试结果文件包括单内存容量检查结果、内存总容量与当前模式下容量规律的检查结果、memtester压力测试结果、系统log检查结果。将结果以事件日志方式上报,用户可在事件日志中进行单条查看;
步骤10:通过OSES将所有事件日志打包成zip格式文件供用户下载。
本实施例提供了一种基于OSES实现内存RAS特性自动测试的方法,通过存储系统的OSES模块实现对BIOS、内存等的监测和管理,并利用OSES的日志分析能力输出测试结果,整个过程实现全自动化,能极大提高测试效率;另外,由于采用OSES对存储系统进行控制,会保证存储数据在完全保存后才会重启,也最大程度上保护了整个存储系统。
实施例二:
基于实施例一,如图2所示,本发明还公开了一种基于OSES实现内存RAS特性自动测试的系统,包括:启动单元1、模式调整单元2、容量读取单元3、容量规律判断单元4、压力测试单元5、文件输出单元6、重启单元7、上报单元8和日志封装单元9。
启动单元1,用于存储机器从满配内存开始上电启机,开始RAS特性测试。
模式调整单元2,用于通过OSES将当前BIOS配置中的RAS的测试模式调整为Mirror模式或Sparing模式。
容量读取单元3,用于通过OSES读取每个活动内存的容量是否与实际容量一致。
容量规律判断单元4,用于通过OSES读取当前内存总容量是否符合当前RAS的测试模式的容量规律。
压力测试单元5,用于通过OSES在当前存储系统下启动memtester压力测试。
文件输出单元6,用于测试执行完成后生成测试文件,发送给OSES。
重启单元7,用于通过OSES重启存储系统。
上报单元8,用于通过OSES分析RAS测试结果,并将分析结果以事件日志方式上报。
日志封装单元9,用于通过OSES将所有事件日志打包成zip格式文件供用户下载。
本实施例提供了一种基于OSES实现内存RAS特性自动测试的系统,通过存储系统的OSES模块实现对BIOS、内存等的监测和管理,并利用OSES的日志分析能力输出测试结果,整个过程实现全自动化,能极大提高测试效率;另外,由于采用OSES对存储系统进行控制,会保证存储数据在完全保存后才会重启,也最大程度上保护了整个存储系统。
实施例三:
本实施例公开了一种基于OSES实现内存RAS特性自动测试的装置,包括处理器和存储器;其中,所述处理器执行所述存储器中保存的基于OSES实现内存RAS特性自动测试的程序时实现以下步骤:
1、通过OSES实现对BIOS配置的识别,检查当前BIOS配置中的RAS模式,并可进行Mirror和Sparing模式的配置切换。
2、通过OSES读取每个活动的内存容量,并判断与实际是否一致;通过OSES读取内存总容量,并判断是否符合当前模式的容量规律。
3、通过OSES启动系统下memtester压力测试,省去人工开启压力测试的麻烦。
4、通过OSES重启存储系统,省去每一次测试手动重启的麻烦,并且OSES会等待存储数据完全保存后再重启,这样保证数据不丢失。
5、通过OSES接收和分析RAS特性测试生成的文件,将结果以事件日志方式上报;测试完成后,能够将所有事件日志打包成zip并下载。
进一步的,本实施例中的基于OSES实现内存RAS特性自动测试的装置,还可以包括:
输入接口,用于获取外界导入的基于OSES实现内存RAS特性自动测试的程序,并将获取到的基于OSES实现内存RAS特性自动测试的程序保存至所述存储器中,还可以用于获取外界终端设备传输的各种指令和参数,并传输至处理器中,以便处理器利用上述各种指令和参数展开相应的处理。本实施例中,所述输入接口具体可以包括但不限于USB接口、串行接口、语音输入接口、指纹输入接口、硬盘读取接口等。
输出接口,用于将处理器产生的各种数据输出至与其相连的终端设备,以便于与输出接口相连的其他终端设备能够获取到处理器产生的各种数据。本实施例中,所述输出接口具体可以包括但不限于USB接口、串行接口等。
通讯单元,用于在基于OSES实现内存RAS特性自动测试的装置和外部服务器之间建立远程通讯连接,以便于基于OSES实现内存RAS特性自动测试的装置能够将镜像文件挂载到外部服务器中。本实施例中,通讯单元具体可以包括但不限于基于无线通讯技术或有线通讯技术的远程通讯单元。
键盘,用于获取用户通过实时敲击键帽而输入的各种参数数据或指令。
显示器,用于运行服务器供电线路短路定位过程的相关信息进行实时显示。
鼠标,可以用于协助用户输入数据并简化用户的操作。
实施例四:
本实施例还公开了一种可读存储介质,这里所说的可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动硬盘、CD-ROM或技术领域内所公知的任意其他形式的存储介质。可读存储介质中存储有基于OSES实现内存RAS特性自动测试的程序,所述基于OSES实现内存RAS特性自动测试的程序被处理器执行时实现以下步骤:
1、通过OSES实现对BIOS配置的识别,检查当前BIOS配置中的RAS模式,并可进行Mirror和Sparing模式的配置切换。
2、通过OSES读取每个活动的内存容量,并判断与实际是否一致;通过OSES读取内存总容量,并判断是否符合当前模式的容量规律。
3、通过OSES启动系统下memtester压力测试,省去人工开启压力测试的麻烦。
4、通过OSES重启存储系统,省去每一次测试手动重启的麻烦,并且OSES会等待存储数据完全保存后再重启,这样保证数据不丢失。
5、通过OSES接收和分析RAS特性测试生成的文件,将结果以事件日志方式上报;测试完成后,能够将所有事件日志打包成zip并下载。
综上所述,本发明充分利用和挖掘OSES的功能特性,实现了对整个RAS特性测试流程的自动协调控制,整个过程实现全自动化,能极大提高测试效率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的方法而言,由于其与实施例公开的系统相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
同理,在本发明各个实施例中的各处理单元可以集成在一个功能模块中,也可以是各个处理单元物理存在,也可以两个或两个以上处理单元集成在一个功能模块中。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的基于OSES实现内存RAS特性自动测试的方法、系统、装置及可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种基于OSES实现内存RAS特性自动测试的方法,其特征在于,包括如下步骤:
步骤1:存储机器从满配内存开始上电启机,开始RAS特性测试;
步骤2:通过OSES将当前BIOS配置中的RAS的测试模式调整为Mirror模式;
步骤3:通过OSES读取每个活动内存的容量是否与实际容量一致,若一致,则转到下一步,若不一致,则转达步骤9;
步骤4:通过OSES读取当前内存总容量是否符合当前RAS的测试模式的容量规律,若一致,则转到下一步,若不一致,则转达步骤9;
步骤5:通过OSES在当前存储系统下启动memtester压力测试,等待测试执行完成;
步骤6:测试执行完成后生成测试文件,发送给OSES;
步骤7:通过OSES重启存储系统;
步骤8:通过OSES识别当前BIOS下的RAS测试模式是否是Sparing模式,如果不是则通过OSES将BIOS配置中的RAS测试模式修改成Sparing模式,并转到步骤3;如果是则说明Sparing模式下的测试完成,直接转到下一步;
步骤9:通过OSES分析RAS测试结果,并将分析结果以事件日志方式上报;
步骤10:通过OSES将所有事件日志打包成zip格式文件供用户下载。
2.根据权利要求1所述的基于OSES实现内存RAS特性自动测试的方法,其特征在于,所述步骤2包括:
通过OSES识别当前BIOS下的RAS测试模式是否是Mirror模式,如果不是则通过OSES将BIOS配置中的RAS测试模式修改成Mirror模式;如果是则直接转到下一步。
3.根据权利要求1所述的基于OSES实现内存RAS特性自动测试的方法,其特征在于,所述RAS的测试模式包括Mirror模式和Sparing模式。
4.根据权利要求3所述的基于OSES实现内存RAS特性自动测试的方法,其特征在于,所述Mirror模式下的内存容量规律为:内存实际容量=内侧总容量×0.5。
5.根据权利要求3所述的基于OSES实现内存RAS特性自动测试的方法,其特征在于,所述Sparing模式下的内存容量规律为:内存实际容量=内存总容量×
(N-1)/N,N是指每通道内存的芯片组数量。
6.根据权利要求1所述的基于OSES实现内存RAS特性自动测试的方法,其特征在于,所述RAS测试结果包括:单内存容量检查结果、内存总容量与当前模式下容量规律的检查结果、memtester压力测试结果、系统log检查结果。
7.根据权利要求1所述的基于OSES实现内存RAS特性自动测试的方法,其特征在于,所述步骤7具体为:等待存储数据完全保存后,通过OSES重启存储系统。
8.一种基于OSES实现内存RAS特性自动测试的系统,其特征在于,包括:
启动单元,用于存储机器从满配内存开始上电启机,开始RAS特性测试;
模式调整单元,用于通过OSES将当前BIOS配置中的RAS的测试模式调整为Mirror模式或Sparing模式;
容量读取单元,用于通过OSES读取每个活动内存的容量是否与实际容量一致;容量规律判断单元,用于通过OSES读取当前内存总容量是否符合当前RAS的测试模式的容量规律;
压力测试单元,用于通过OSES在当前存储系统下启动memtester压力测试;
文件输出单元,用于测试执行完成后生成测试文件,发送给OSES;
重启单元,用于通过OSES重启存储系统;
上报单元,用于通过OSES分析RAS测试结果,并将分析结果以事件日志方式上报;日志封装单元,用于通过OSES将所有事件日志打包成zip格式文件供用户下载。
9.根据权利要求8所述的基于OSES实现内存RAS特性自动测试的系统,其特征在于,所述重启单元具体用于:等待存储数据完全保存后,通过OSES重启存储系统。
10.一种基于OSES实现内存RAS特性自动测试的装置,其特征在于,包括:
存储器,用于存储基于OSES实现内存RAS特性自动测试的程序;
处理器,用于执行所述基于OSES实现内存RAS特性自动测试的程序时实现如权利要求1至7任一项权利要求所述的基于OSES实现内存RAS特性自动测试的方法步骤。
CN202111158359.8A 2021-09-30 2021-09-30 一种基于oses实现内存ras特性自动测试的方法、系统及装置 Pending CN114003419A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111158359.8A CN114003419A (zh) 2021-09-30 2021-09-30 一种基于oses实现内存ras特性自动测试的方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111158359.8A CN114003419A (zh) 2021-09-30 2021-09-30 一种基于oses实现内存ras特性自动测试的方法、系统及装置

Publications (1)

Publication Number Publication Date
CN114003419A true CN114003419A (zh) 2022-02-01

Family

ID=79922102

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111158359.8A Pending CN114003419A (zh) 2021-09-30 2021-09-30 一种基于oses实现内存ras特性自动测试的方法、系统及装置

Country Status (1)

Country Link
CN (1) CN114003419A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477479A (zh) * 2009-01-08 2009-07-08 浪潮电子信息产业股份有限公司 一种测试内存兼容性和稳定性的方法
CN104407951A (zh) * 2014-11-05 2015-03-11 浪潮电子信息产业股份有限公司 一种自动化进行服务器整机测试的方法
CN106649005A (zh) * 2016-09-30 2017-05-10 郑州云海信息技术有限公司 基于shell的内存ras特性自动化压力测试方法
CN112463623A (zh) * 2020-12-07 2021-03-09 苏州浪潮智能科技有限公司 一种基于oses实现rmt自动测试的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477479A (zh) * 2009-01-08 2009-07-08 浪潮电子信息产业股份有限公司 一种测试内存兼容性和稳定性的方法
CN104407951A (zh) * 2014-11-05 2015-03-11 浪潮电子信息产业股份有限公司 一种自动化进行服务器整机测试的方法
CN106649005A (zh) * 2016-09-30 2017-05-10 郑州云海信息技术有限公司 基于shell的内存ras特性自动化压力测试方法
CN112463623A (zh) * 2020-12-07 2021-03-09 苏州浪潮智能科技有限公司 一种基于oses实现rmt自动测试的方法及装置

Similar Documents

Publication Publication Date Title
CN110245078B (zh) 一种软件的压力测试方法、装置、存储介质和服务器
CN109361562B (zh) 一种基于关联网络设备接入的自动化测试方法
CN110727556A (zh) 一种bmc健康状态监控方法、系统、终端及存储介质
CN110557299A (zh) 一种网络传输功能批量测试方法、系统、终端及存储介质
CN114077525A (zh) 异常日志处理方法、装置、终端设备、云服务器及系统
CN112115038A (zh) 一种应用测试方法、装置和存储介质
CN110347565B (zh) 一种应用程序的异常分析方法及装置、电子设备
CN109918221B (zh) 一种硬盘报错解析方法、系统、终端及存储介质
CN111506455B (zh) 服务发布结果的查验方法及装置
CN109558300B (zh) 一种整机柜告警处理方法、装置、终端及存储介质
CN114003419A (zh) 一种基于oses实现内存ras特性自动测试的方法、系统及装置
CN115470056A (zh) 服务器硬件上电启动故障排查方法、系统、装置及介质
CN110543394A (zh) 服务器sensor信息一致性测试方法、系统、终端及存储介质
CN112463504B (zh) 一种双控存储产品测试方法、系统、终端及存储介质
CN115827358A (zh) 一种pfr功能的自动化测试系统、方法、装置及存储介质
CN115629919A (zh) 一种快速故障系统切换的方法及装置
CN112486785B (zh) 一种服务器定位宕机阶段的方法、系统、终端及存储介质
CN110990237B (zh) 一种信息收集系统、方法及存储介质
CN114595089A (zh) 硬盘远程诊断方法、系统、终端及存储介质
CN112947964A (zh) 一种芯片的固件更新方法、装置、设备及存储介质
CN111352802A (zh) 一种网络总线的监控处理方法、装置、设备及存储介质
CN113760696A (zh) 一种程序问题定位方法、装置、电子设备和存储介质
CN111562956B (zh) 终端的主题切换方法、装置、存储介质与电子设备
CN109920466B (zh) 一种硬盘测试数据解析方法、装置、终端及存储介质
CN115641900A (zh) 一种固态硬盘的异常分析方法、系统、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination