CN112631841A - 一种循环老化测试和数据收集的方法、系统及介质 - Google Patents

一种循环老化测试和数据收集的方法、系统及介质 Download PDF

Info

Publication number
CN112631841A
CN112631841A CN202011437031.5A CN202011437031A CN112631841A CN 112631841 A CN112631841 A CN 112631841A CN 202011437031 A CN202011437031 A CN 202011437031A CN 112631841 A CN112631841 A CN 112631841A
Authority
CN
China
Prior art keywords
test
aging test
aging
server
tested
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011437031.5A
Other languages
English (en)
Inventor
李园园
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202011437031.5A priority Critical patent/CN112631841A/zh
Publication of CN112631841A publication Critical patent/CN112631841A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods

Abstract

本发明公开了一种循环老化测试和数据收集的方法,包括部署测试环境;根据老化测试配置信息选择老化测试程序,执行老化测试;循环检测老化测试时是否出现异常;若老化测试时未出现异常,则计算测试时间;判断测试结果日志文件或老化测试时是否出现异常;若测试结果日志文件中存在异常关键字,或老化测试时出现异常,则保留当前测试环境;若测试结果日志文件中不存在异常关键字及老化测试时未出现异常,且累计测试时间小于总测试时间,则进入下轮老化测试;进行数据收集;本发明能够针对服务器进行循环老化测试和测试数据收集,优化测试自动部署、循环测试和数据交互机制,为服务器测试中的长时间定时循环老化测试需求提供极大的便利性。

Description

一种循环老化测试和数据收集的方法、系统及介质
技术领域
本发明涉及测试技术领域,特别是涉及一种循环老化测试和数据收集的方法、系统及介质。
背景技术
目前针对服务器进行定制化测试过程中,有数天到数十天的长时间老化测试需求。然而定制化测试程序单轮测试时间有限,在数小时到数十小时不等,往往无法满足长时间老化测试的需求,所以需要进行多轮循环测试;定制化测试程序每轮测试完成时间未知,传统方式无法做到单轮测试完成后及时执行下一轮测试;根据被测服务器配置不同定制化测试程序的每轮测试时长不同,传统方式无法灵活控制对不同配置进行规定总时长的老化测试。
目前的老化测试方法都是配置老化测试环境,运行老化测试脚本,现阶段没有一种可以自动根据机器类型选择老化测试脚本并收集老化测试数据结果的方法。
发明内容
本发明主要解决的技术问题是提供一种循环老化测试和数据收集的方法、系统及介质,能够针对服务器进行循环老化测试和测试数据收集,优化测试自动部署、循环测试和数据交互机制,为服务器测试中的长时间定时循环老化测试需求提供极大的便利性。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种循环老化测试和数据收集的方法,包括:
部署测试环境,搭建中央服务器,中央服务器启动测试部署程序,与待测服务器建立数据传输通道;
获取中央服务器中老化测试配置信息和日志信息,根据老化测试配置信息选择老化测试程序,执行老化测试,将老化测试结果写入测试结果日志文件中;
设定检测频率,检测老化测试时是否出现异常;
若老化测试时出现异常,则停止运行老化测试程序,结束测试,并上报异常情况;
若老化测试时未出现异常,则等待老化测试完成,计算测试时间,获取老化测试配置信息中老化测试的总时长以及日志信息中待测服务器累计测试时长,并计算累计老化测试时长;
将累计老化测试时长写入测试结果日志文件中;
若测试结果日志文件中存在异常关键字,或老化测试时出现异常,则保留当前老化测试环境,等待测试人员进行分析和定位问题;
若测试结果日志文件中不存在异常关键字,以及老化测试时未出现异常,且累计老化测试时长小于老化测试的总时长,则将待测服务器重启并再次进行老化测试;
循环老化测试完成后,进行数据收集,将老化测试数据存储至中央服务器中。
进一步,所述老化测试配置信息中包括老化测试的总时长、机型号、老化测试程序名称和套餐号。
进一步,所述根据老化测试配置信息选择老化测试程序包括以下步骤:
检测待测服务器机型号;
根据待测服务器中现场可更换单元信息中机型号和老化测试程序对应关系以及套餐号和测试总时长对应关系,选择与待测服务器机型号对应的测试程序,以及老化测试信息中套餐号对应的老化测试总时长。
进一步,所述循环检测老化测试时是否出现异常包括以下情况:
检测测试结果日志文件,根据检测频率检测测试结果日志文件,若测试结果日志文件中测试结果未更新,则老化测试时出现异常;
检测待测服务器系统日志,若待测服务器系统日志中存在异常字段,则老化测试时出现异常;
通过ipmitool检测待测服务器中BMC日志,若ipmitool收到异常反馈或未收到反馈,则老化测试时出现异常。
进一步,所述ipmitool收到异常反馈包括以下情况:
通过ipmitool检测待测服务器中BMC日志列表,若BMC日志列表中含有异常字段,则ipmitool收到异常反馈;
通过ipmitool检测待测服务器中元件列表,若元件列表中含有异常关键字,则ipmitool收到异常反馈。
进一步,所述进行数据收集包括以下步骤:
创建含有老化测试程序名称、老化测试程序版本、待测机型信息、累计测试时长信息和本轮测试结束时间信息的测试数据目录文件;
将测试结果日志文件信息存入测试数据目录文件中;
将测试目录文件压缩为压缩包;
将压缩包传输至中央服务器中,完成存档。
一种循环老化测试和数据收集的系统,包括环境部署模块、测试执行模块、监控模块、判断模块和数据收集模块;
所述环境部署模块搭建中央服务器,并建立中央服务器与待测服务器的数据传输通道;
所述测试执行模块从中央服务器中获取老化测试配置信息和日志信息并根据待测服务器FRU信息和老化测试配置信息选择老化测试程序,执行老化测试程序,生成测试结果日志文件;
所述监控模块定时监测老化测试结果日志文件的记录情况、待测服务器系统日志以及待测服务器运行情况,并判断老化测试时是否出现异常;
所述判断模块计算本轮测试时长以及累计测试时长,并获取所述老化测试配置信息中测试总时长,若累计测试时长不大于测试总时长,则通知所述测试执行模块执行老化测试;
所述数据收集模块创建含有老化测试程序名称、老化测试程序版本、待测机型信息、累计测试时长信息和本轮测试结束时间信息的测试数据目录文件;将测试结果日志文件信息存入测试数据目录文件中,将测试目录文件压缩为压缩包并传输到中央服务器中。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行上述任一项所述的一种循环老化测试和数据收集的方法的步骤。
本发明的有益效果是:本发明通过环境部署、测试执行和监控、数据收集,可以根据测试配置情况执行对应的定制化测试程序,决策循环测试策略,收集测试数据,在无人值守的情况下自动完成长时间定时循环进行老化测试,增加了工作效率,并且自动完成老化测试减少了测试人员的操作时间。
附图说明
图1是本发明一种循环老化测试和数据收集的方法一较佳实施例的流程图;
图2是本发明一种循环老化测试和数据收集的系统架构示意图。
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
本发明实施例包括:
见图1,第一方面,一种循环老化测试和数据收集的方法,包括:
首先进行环境部署:
基于DHCP、HTTP、TFTP、NFS等技术搭建PXE中央服务器;
PXE中央服务器中储存有老化测试主体目录以及老化测试数据目录;老化测试主体目录中含有针对不同种类以及机型的测试工具;老化测试数据目录存储待测服务器上通过老化测试产生的数据;
将老化测试主体和老化测试数据通过NFS进行共享配置;
待测服务器通过网络连接到PXE中央服务器,PXE中央服务器通过PXE引导待测服务器进入ramos内存操作系统,在内存操作系统ramos启动阶段启动老化测试环境部署程序并打开与PXE中央服务器的数据传输通道。
然后执行老化测试和监测:
执行老化测试环境部署程序,进行老化测试以及监控,并从PXE中央服务器中获取老化测试配置信息以及日志信息;老化测试配置信息中包含进行老化测试的总时长、机型号、老化测试程序名称和套餐号;
获取老化测试配置信息中老化测试的总时长T以及获取对应日志信息中待测服务器历史累计测试时长T0;
老化测试环境部署程序检测待测服务器机型号,并根据老化测试配置信息选择需要使用的老化测试程序;
不同的机型号对应不同的老化测试程序,可以根据待测服务器中FRU信息里的机型号来判断和获取老化程序;
不同配置对应的测试总时长不同,每种配置都有一个套餐号,可以根据待测服务器中FRU信息里的套餐号来对应和获取测试总时长;
从PXE中央服务器加载老化测试程序并执行老化测试,将老化测试结果写入log文件中;
定时设置,设定检测频率,检测老化测试结果log文件的记录情况、待测服务器的系统日志以及待测服务器运行情况,根据log文件的记录情况,以及系统日志检测老化测试时是否出现异常;
检测频率为1分钟;检测频率的时间小于进行老化测试的时间。
根据log文件的记录情况,以及系统日志检测老化测试时是否出现异常包括:
检测频率1分钟内检查log文件的记录情况没有继续更新,则老化测试出现异常;
当检测到dmesg/messages等系统日志,有hardware error、Temperature abovethreshold、media error、I/O error、failure等一些异常字段,则老化测试出现异常;
当通过ipmitool软件使用ipmitool sel list或ipmitool sdr list命令检测待测服务器中BMC日志,若ipmitool软件收到异常反馈或未收到反馈,则老化测试出现异常;
收到异常反馈包括:
sel list中有fail、fault、low、error、lost、critical等异常字段,sdr list中有cr、nr等异常关键字,则收到异常反馈。
若老化测试时出现异常,则停止运行老化测试程序,结束测试,并上报异常情况;
若老化测试时未出现异常,则等待老化测试程序运行完成;
老化测试程序运行完成后,进行计算老化测试程序从开始到运行完成的时长T1,并计算当前累计老化测试时长T2=T0+T1,并写入log文件中;
收集老化测试结果数据,并检查系统日志和待测服务器运行状况,将以上信息写入log文件中;
保存log文件;
当老化测试程序运行完成后,生成老化测试结果log文件,根据老化测试结果log文件或老化测试时是否出现异常,进行下一步循环测试;
若老化测试结果log文件中存在fail、incorrect等异常关键字,或老化测试时出现异常,则保留当前测试环境,停止老化测试,等待测试人员进行分析和定位问题;
若老化测试结果log文件中不存在fail、incorrect等异常关键字,以及老化测试时未出现异常,且T2小于T,则将待测服务器重启并进入下轮老化测试。
进行数据收集:
创建含有老化测试程序名称、老化测试程序版本、待测机型信息、累计测试时长信息和本轮测试结束时间信息的测试数据目录文件;
将保存的log文件存入测试数据目录文件中;
将测试目录中的数据压缩为压缩包;
利用NFS将压缩包传输到PXE中央服务器老化测试数据目录中,完成存档。
见图2,第二方面,基于与前述实施例中一种循环老化测试和数据收集的方法同样的发明构思,本说明书实施例还提供一种循环老化测试和数据收集的系统,包括环境部署模块、测试执行模块、监控模块、判断模块和数据收集模块;
所述环境部署模块搭建PXE中央服务器,并建立PXE中央服务器与待测服务器的数据传输通道;
所述测试执行模块从PXE中央服务器中获取老化测试配置信息和日志信息并根据待测服务器FRU信息和老化测试配置信息选择老化测试程序,执行老化测试程序;
所述监控模块定时监测老化测试结果log文件的记录情况、系统日志以及待测服务器运行情况,并判断是否出现异常;
所述判断模块计算本轮测试时长以及当前累计测试时长,并获取所述老化测试配置信息中测试总时长,若当前累计测试时长不大于测试总时长,则通知所述测试执行模块执行老化测试;
所述数据收集模块创建含有老化测试程序名称、老化测试程序版本、待测机型信息、累计测试时长信息和本轮测试结束时间信息的测试数据目录;将log文件存入测试数据目录中;将测试目录中的数据压缩为压缩包并传输到PXE中央服务器中。
第三方面,基于与前述实施例中基于循环老化测试和数据收集的方法的发明构思,本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行上述的一种循环老化测试和数据收集的方法的步骤。
其中,PXE也被称为预执行环境,提供了一种使用网络接口(Network Interface)启动计算机的机制,这种机制让计算机的启动可以不依赖本地数据存储设备(如硬盘)或本地已安装的操作系统。
DHCP(动态主机配置协议)是一个局域网的网络协议,指的是由服务器控制一段IP地址范围,客户机登录服务器时就可以自动获得服务器分配的IP地址和子网掩码,默认情况下,DHCP作为Windows Server的一个服务组件不会被系统自动安装,还需要管理员手动安装并进行必要的配置。
TFTP(Trivial File Transfer Protocol,简单文件传输协议)是TCP/IP协议族中的一个用来在客户机与服务器之间进行简单文件传输的协议,提供不复杂、开销不大的文件传输服务。
NFS网络文件系统,是由SUN公司研制的UNIX表示层协议(presentation layerprotocol),能使使用者访问网络上别处的文件就像在使用自己的计算机一样。
FRU信息为现场可更换单元信息。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种循环老化测试和数据收集的方法,其特征在于,包括:
S100,部署测试环境,搭建中央服务器,中央服务器启动测试部署程序,与待测服务器建立数据传输通道;
S200,获取中央服务器中老化测试配置信息和日志信息,根据老化测试配置信息选择老化测试程序,执行老化测试,将老化测试结果写入测试结果日志文件中;
设定检测频率,检测老化测试时是否出现异常;
若老化测试时出现异常,则停止运行老化测试程序,结束测试,并上报异常情况;
若老化测试时未出现异常,则等待老化测试完成,计算测试时间,并写入测试结果日志文件中;
S300,判断是否满足重复测试条件;
若满足重复测试条件,则进入S200;
若不满足重复测试条件,则进行数据收集,将老化测试数据存储至中央服务器中。
2.根据权利要求1所述的一种循环老化测试和数据收集的方法,其特征在于:所述老化测试配置信息中包括老化测试的总时长、机型号、老化测试程序名称和套餐号。
3.根据权利要求2所述的一种循环老化测试和数据收集的方法,其特征在于:所述S200步骤中,根据老化测试配置信息选择老化测试程序包括以下步骤:
检测待测服务器机型号;
根据待测服务器中现场可更换单元信息中机型号和老化测试程序对应关系以及套餐号和测试总时长对应关系,选择与待测服务器机型号对应的测试程序,以及老化测试信息中套餐号对应的老化测试总时长。
4.根据权利要求1所述的一种循环老化测试和数据收集的方法,其特征在于:所述S200步骤中,检测老化测试时是否出现异常包括以下情况:
检测测试结果日志文件,根据检测频率检测测试结果日志文件,若测试结果日志文件中测试结果未更新,则老化测试时出现异常;
检测待测服务器系统日志,若待测服务器系统日志中存在异常字段,则老化测试时出现异常;
通过平台管理工具检测待测服务器中BMC日志,若平台管理工具收到异常反馈或未收到反馈,则老化测试时出现异常。
5.根据权利要求4所述的一种循环老化测试和数据收集的方法,其特征在于:所述平台管理工具收到异常反馈包括以下情况:
通过平台管理工具检测待测服务器中BMC日志列表,若BMC日志列表中含有异常字段,则平台管理工具收到异常反馈;
通过平台管理工具检测待测服务器中元件列表,若元件列表中含有异常关键字,则平台管理工具收到异常反馈。
6.根据权利要求4所述的一种循环老化测试和数据收集的方法,其特征在于:所述S200步骤中,计算测试时间包括以下步骤:
获取老化测试配置信息中老化测试的总时长以及日志信息中待测服务器累计测试时长,并计算累计老化测试时长;
将累计老化测试时长写入测试结果日志文件中。
7.根据权利要求6所述的一种循环老化测试和数据收集的方法,其特征在于:所述S300步骤中,判断是否满足重复测试条件包括以下步骤:
若测试结果日志文件中存在异常关键字,或老化测试时出现异常,则保留当前老化测试环境,停止老化测试,进行问题定位和分析;
若测试结果日志文件中不存在异常关键字,以及老化测试时未出现异常,且累计老化测试时长小于老化测试的总时长,则将待测服务器重启并进入S200步骤,再次进行老化测试。
8.根据权利要求1所述的一种循环老化测试和数据收集的方法,其特征在于:所述S300步骤中,进行数据收集包括以下步骤:
创建含有老化测试程序名称、老化测试程序版本、待测机型信息、累计测试时长信息和本轮测试结束时间信息的测试数据目录文件;
将测试结果日志文件信息存入测试数据目录文件中;
将测试目录文件压缩为压缩包;
将压缩包传输至中央服务器中,完成存档。
9.一种循环老化测试和数据收集的系统,其特征在于,包括环境部署模块、测试执行模块、监控模块、判断模块和数据收集模块;
所述环境部署模块搭建中央服务器,并建立中央服务器与待测服务器的数据传输通道;
所述测试执行模块从中央服务器中获取老化测试配置信息和日志信息并根据老化测试配置信息选择老化测试程序,执行老化测试程序,生成测试结果日志文件;
所述监控模块定时监测老化测试结果日志文件的记录情况、待测服务器系统日志以及待测服务器运行情况,并判断老化测试时是否出现异常;
所述判断模块计算本轮测试时长以及累计测试时长,并获取所述老化测试配置信息中测试总时长,若累计测试时长不大于测试总时长,则通知所述测试执行模块执行老化测试;
所述数据收集模块创建含有老化测试程序名称、老化测试程序版本、待测机型信息、累计测试时长信息和本轮测试结束时间信息的测试数据目录文件;将测试结果日志文件信息存入测试数据目录文件中,将测试目录文件压缩为压缩包并传输到中央服务器中。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行上述权利要求1-8任一项所述的一种循环老化测试和数据收集的方法的步骤。
CN202011437031.5A 2020-12-07 2020-12-07 一种循环老化测试和数据收集的方法、系统及介质 Pending CN112631841A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011437031.5A CN112631841A (zh) 2020-12-07 2020-12-07 一种循环老化测试和数据收集的方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011437031.5A CN112631841A (zh) 2020-12-07 2020-12-07 一种循环老化测试和数据收集的方法、系统及介质

Publications (1)

Publication Number Publication Date
CN112631841A true CN112631841A (zh) 2021-04-09

Family

ID=75310204

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011437031.5A Pending CN112631841A (zh) 2020-12-07 2020-12-07 一种循环老化测试和数据收集的方法、系统及介质

Country Status (1)

Country Link
CN (1) CN112631841A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114003448A (zh) * 2021-09-30 2022-02-01 苏州浪潮智能科技有限公司 一种服务器的循环老化测试方法、装置、设备及介质
CN114328040A (zh) * 2021-11-30 2022-04-12 浪潮(山东)计算机科技有限公司 一种异常板卡的检测方法、系统、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874159A (zh) * 2016-12-30 2017-06-20 北京同有飞骥科技股份有限公司 一种集群式自动化测试方法
CN111782547A (zh) * 2020-07-24 2020-10-16 迈普通信技术股份有限公司 设备测试方法、装置、服务器及可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874159A (zh) * 2016-12-30 2017-06-20 北京同有飞骥科技股份有限公司 一种集群式自动化测试方法
CN111782547A (zh) * 2020-07-24 2020-10-16 迈普通信技术股份有限公司 设备测试方法、装置、服务器及可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114003448A (zh) * 2021-09-30 2022-02-01 苏州浪潮智能科技有限公司 一种服务器的循环老化测试方法、装置、设备及介质
CN114003448B (zh) * 2021-09-30 2023-08-22 苏州浪潮智能科技有限公司 一种服务器的循环老化测试方法、装置、设备及介质
CN114328040A (zh) * 2021-11-30 2022-04-12 浪潮(山东)计算机科技有限公司 一种异常板卡的检测方法、系统、电子设备及存储介质
CN114328040B (zh) * 2021-11-30 2023-12-22 浪潮(山东)计算机科技有限公司 一种异常板卡的检测方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US6629267B1 (en) Method and system for reporting a program failure
US8688792B2 (en) Methods and systems for discovering configuration data
US6587960B1 (en) System model determination for failure detection and isolation, in particular in computer systems
US7174265B2 (en) Heterogeneous multipath path network test system
Durães et al. Dependability benchmarking of web-servers
US8381036B2 (en) Systems and methods for restoring machine state history related to detected faults in package update process
CN112631841A (zh) 一种循环老化测试和数据收集的方法、系统及介质
CN101145964A (zh) 一种网管系统自动冒烟测试方法和系统
CN104572422A (zh) 一种基于Linux系统开关机下内存监测实现方法
CN107277193B (zh) 一种基板管理控制器地址管理方法、装置和系统
CN108572895B (zh) 一种Linux下自动检查软硬件配置的稳定性测试方法
US8327189B1 (en) Diagnosing an incident on a computer system using a diagnostics analyzer database
JP5400873B2 (ja) ソフトウェア問題を識別するための方法、システム、およびコンピュータ・プログラム
CN114546747A (zh) 一种bmc冷重启压力测试系统及方法
US20100251029A1 (en) Implementing self-optimizing ipl diagnostic mode
CN112148616B (zh) 一种性能测试管理平台
CN112269697B (zh) 一种设备存储性能测试方法、系统及相关装置
US8997048B1 (en) Method and apparatus for profiling a virtual machine
US11831488B2 (en) Systems and methods for self-correcting network equipment
CN111666200A (zh) 一种pc软件冷启动耗时的测试方法及终端
CN109412880B (zh) 一种列车网络通信设备启动异常的测试方法
US20090019320A1 (en) Method and apparatus for troubleshooting a computer system
JP2001243089A (ja) ソフトウェア検証装置及びソフトウェア検証方法
CN113553243A (zh) 远端侦错方法
US9239775B1 (en) Coordinated testing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210409

RJ01 Rejection of invention patent application after publication