CN105930240A - 一种对服务器进行自动化差异化老化测试的方法 - Google Patents

一种对服务器进行自动化差异化老化测试的方法 Download PDF

Info

Publication number
CN105930240A
CN105930240A CN201610334717.9A CN201610334717A CN105930240A CN 105930240 A CN105930240 A CN 105930240A CN 201610334717 A CN201610334717 A CN 201610334717A CN 105930240 A CN105930240 A CN 105930240A
Authority
CN
China
Prior art keywords
test
server
configuration
fru
burn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610334717.9A
Other languages
English (en)
Inventor
李光达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201610334717.9A priority Critical patent/CN105930240A/zh
Publication of CN105930240A publication Critical patent/CN105930240A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Factory Administration (AREA)

Abstract

本发明公开了一种对服务器进行自动化差异化老化测试的方法,所述方法通过利用服务器的FRU系统,在服务器的FRU系统中写入服务器的配置代码,在进行老化测试时,由自动化老化测试系统检测该服务器的配置代码,检索配置数据库,检测当前配置并进行比对;比对确认配置以及相关设置都正常以后,开始针对该机型进行差异化的测试。本发明方法可以对服务器进行自动化、差异化的老化测试,既保证了老化测试的全面性、有效性,可以有效地覆盖所有的测试部件和测试项目,又通过自动测试降低了操作难度,简化了测试流程,提高了测试效率,降低了对测试人员的能力需求,降低了手工操作的出错概率。

Description

一种对服务器进行自动化差异化老化测试的方法
技术领域
本发明涉及服务器测试技术领域,具体涉及一种对服务器进行自动化差异化老化测试的方法。
背景技术
随着服务器行业的高速发展,在各个领域中越来越多的客户采用计算能力更强的服务器运行自己的核心应用。国内各大服务器供应商,为了满足高度并行化及高性能需求的客户,在推高性能服务器的同时,通用注重产品的质量和和可靠性和稳定性。
服务器在出厂之前必须进行各种严格的测试和老化,以保证产品的性能、稳定性和可靠性。各服务器供应商凭借多年来的服务器生产经验,在这方面形成了自己的严格的测试体系和测试规范,各种测试体系和测试规范的侧重点不同,形式各种各样,为此,需要寻求一种最优化的测试方法,力求使测试能够具有最全面的覆盖性,最优的测试效率,最简单的测试流程。
一般情况下,在产线执行的服务器的老化测试程序和步骤都是相同的,这样可以适应大规模批量的工业化生产,降低生产难度,降低对产线操作工人的技术、能力和经验要求。但是,这样的通用老化测试流程无法对差异化的产品进行差异化的测试,只能进行同质化的测试项目。
发明内容
本发明要解决的技术问题是:为了解决上述问题,本发明提出了一种对服务器进行自动化差异化老化测试的方法。
本发明所采用的技术方案为:
一种对服务器进行自动化差异化老化测试的方法,所述方法通过利用服务器的FRU系统,在服务器的FRU系统中写入服务器的配置代码(套餐名称),在进行老化测试时,由自动化老化测试系统检测该服务器的配置代码,检索配置数据库,检测当前配置并进行比对;比对确认配置以及相关设置都正常以后,开始针对该机型进行差异化的测试。
FRU:Field Replace Unit,现场可更换单元,一般都是用在电脑上的一些可更换的部件。厂商为了节省成本,把设备分成多个FRU,大到power supply,小到fan之类的。直接更换而不修,所以以后想更换零件先看看它是不是fru。如果设备上没有表示fru,那么有part number(或者product number,serial number)的就是FRU。PART NUBMER是厂商给用户看的,如果你想买某个部件,那PARTS就是跟价格相关的。PRODUCT NUMBER 是给厂商自己看的,同一个部件(PARTS)可能有多个product number,厂商供货、保修时是看这个的。
所述方法操作步骤如下:
1)在生产时根据生产指令在fru中刷入产品配置代码;
2)在老化时执行老化测试程序脚本;(老化测试程序脚本一般预先放在母盘中,并且跟随OS启动自动运行)
3)老化程序检测fru中的产品配置代码,根据不同的配置类型,自动检测配置是否正确,自动检测bios设置是否符合预设要求,并根据不同配置调用相关的老化程序,自动执行不同的老化测试项目。
所述老化程序内容如下:
1)启动相关ipmi服务,进行fru检测;
2)检查ipmi服务是否正确启动;
3)读取fru中的产品配置代码;
4)检测读取是否成功;
5)按照读取的配置执行相应的老化程序。
IPMI是智能型平台管理接口(Intelligent Platform Management Interface)的缩写,是管理基于 Intel结构的企业系统中所使用的外围设备采用的一种工业标准,该标准由英特尔、惠普、NEC、美国戴尔电脑和SuperMicro等公司制定。用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。
本发明的有益效果为:
本发明方法可以对服务器进行自动化、差异化的老化测试,既保证了老化测试的全面性、有效性,可以有效地覆盖所有的测试部件和测试项目,又通过自动测试降低了操作难度,简化了测试流程,提高了测试效率,降低了对测试人员的能力需求,降低了手工操作的出错概率。
附图说明
图1为本发明方法程序流程图。
具体实施方式
下面结合说明书附图,根据具体实施方式对本发明进一步说明:
实施例1:
一种对服务器进行自动化差异化老化测试的方法,所述方法通过利用服务器的FRU系统,在服务器的FRU系统中写入服务器的配置代码(套餐名称),在进行老化测试时,由自动化老化测系统检测该服务器的配置代码,检索配置数据库,检测当前配置并进行比对;比对确认配置以及相关设置都正常以后,开始针对该机型进行差异化的测试。
FRU:Field Replace Unit,现场可更换单元,一般都是用在电脑上的一些可更换的部件。厂商为了节省成本,把设备分成多个FRU,大到power supply,小到fan之类的。直接更换而不修,所以以后想更换零件先看看它是不是fru。如果设备上没有表示fru,那么有part number(或者product number,serial number)的就是FRU。PART NUBMER是厂商给用户看的,如果你想买某个部件,那PARTS就是跟价格相关的。PRODUCT NUMBER 是给厂商自己看的,同一个部件(PARTS)可能有多个product number,厂商供货、保修时是看这个的。
实施例2
如图1所示,在实施例1的基础上,本实施例所述方法操作步骤如下:
1)在生产时根据生产指令在fru中刷入产品配置代码;
2)在老化时执行老化测试程序脚本;(老化测试程序脚本一般预先放在母盘中,并且跟随OS启动自动运行)
3)老化程序检测fru中的产品配置代码,根据不同的配置类型,自动检测配置是否正确,自动检测bios设置是否符合预设要求,并根据不同配置调用相关的老化程序,自动执行不同的老化测试项目。
实施例3
在实施例1或2的基础上,本实施例所述老化程序内容如下:
1)启动相关ipmi服务,进行fru检测;
2)检查ipmi服务是否正确启动;
3)读取fru中的产品配置代码;
4)检测读取是否成功;
5)按照读取的配置执行相应的老化程序。
IPMI是智能型平台管理接口(Intelligent Platform Management Interface)的缩写,是管理基于 Intel结构的企业系统中所使用的外围设备采用的一种工业标准,该标准由英特尔、惠普、NEC、美国戴尔电脑和SuperMicro等公司制定。用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。
实施例4
在实施例3的基础上,本实施例老化程序相关代码如下:
#!/bin/bash
service ipmi start ;启动相关ipmi服务,进行fru检测
if [ "$?" != "0" ]; then
echo "Can not start ipmi service!"
echo "Program will exit"
exit
fi ;检查ipmi服务是否正确启动
pm=`ipmitool fru list |grep "Product Part Number" |awk '{print $5}' `
;读取fru中的产品配置代码
if [ "$?" != "0" ]; then
echo "Can not get PPN from fru!"
echo "Program will exit"
exit
fi ;检测读取是否成功
case $pm in "X02" )
python machcheck.py -j ‘{“machModel”:”sa5112m4r”,”purTime”:”201602”,”purPackage”:”x02-x12”}’ -t 240 ;执行X02配置的老化程序
;;
"F62" )
python machcheck.py -j ‘{“machModel”:”sa5112m4r”,”purTime”:”201602”,”purPackage”:”f62-x12”}’ -t 240 ;执行X02配置的老化程序
;;
* )
echo "Can not find the test program for $pm,Please check the PPN!"
esac
上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (3)

1.一种对服务器进行自动化差异化老化测试的方法,其特征在于:所述方法通过利用服务器的FRU系统,在服务器的FRU系统中写入服务器的配置代码,在进行老化测试时,检测该服务器的配置代码,检索配置数据库,检测当前配置并进行比对;比对确认配置以及相关设置都正常以后,开始针对该机型进行差异化的测试。
2.根据权利要求1所述的一种对服务器进行自动化差异化老化测试的方法,其特征在于,所述方法操作步骤如下:
1)在生产时根据生产指令在fru中刷入产品配置代码;
2)在老化时执行老化测试程序脚本;
3)老化程序检测fru中的产品配置代码,根据不同的配置类型,自动检测配置是否正确,自动检测bios设置是否符合预设要求,并根据不同配置调用相关的老化程序,自动执行不同的老化测试项目。
3.根据权利要求1或2所述的一种对服务器进行自动化差异化老化测试的方法,其特征在于,所述老化程序内容如下:
1)启动相关ipmi服务,进行fru检测;
2)检查ipmi服务是否正确启动;
3)读取fru中的产品配置代码;
4)检测读取是否成功;
5)按照读取的配置执行相应的老化程序。
CN201610334717.9A 2016-05-19 2016-05-19 一种对服务器进行自动化差异化老化测试的方法 Pending CN105930240A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610334717.9A CN105930240A (zh) 2016-05-19 2016-05-19 一种对服务器进行自动化差异化老化测试的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610334717.9A CN105930240A (zh) 2016-05-19 2016-05-19 一种对服务器进行自动化差异化老化测试的方法

Publications (1)

Publication Number Publication Date
CN105930240A true CN105930240A (zh) 2016-09-07

Family

ID=56840772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610334717.9A Pending CN105930240A (zh) 2016-05-19 2016-05-19 一种对服务器进行自动化差异化老化测试的方法

Country Status (1)

Country Link
CN (1) CN105930240A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874153A (zh) * 2017-02-28 2017-06-20 郑州云海信息技术有限公司 一种基于Canaima操作系统的计算机老化程序
CN107133137A (zh) * 2017-05-26 2017-09-05 郑州云海信息技术有限公司 一种便捷的获取rmt测试信息的方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102497293A (zh) * 2011-12-08 2012-06-13 曙光信息产业(北京)有限公司 一种大规模服务器的硬件测试分析方法
US8433953B1 (en) * 2007-08-13 2013-04-30 The Mathworks, Inc. Automatic configuration of a test environment
CN103970655A (zh) * 2014-05-08 2014-08-06 浪潮电子信息产业股份有限公司 一种基于expect的服务器自动化集群测试方法
CN104268046A (zh) * 2014-10-17 2015-01-07 浪潮电子信息产业股份有限公司 一种Linux下人工交互的NVIDIA GPU自动化测试方法
CN104407951A (zh) * 2014-11-05 2015-03-11 浪潮电子信息产业股份有限公司 一种自动化进行服务器整机测试的方法
CN104850495A (zh) * 2015-05-14 2015-08-19 曙光信息产业(北京)有限公司 自动化检测方法及装置
CN105045707A (zh) * 2015-07-24 2015-11-11 浪潮电子信息产业股份有限公司 一种基于Python服务器稳定性测试的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8433953B1 (en) * 2007-08-13 2013-04-30 The Mathworks, Inc. Automatic configuration of a test environment
CN102497293A (zh) * 2011-12-08 2012-06-13 曙光信息产业(北京)有限公司 一种大规模服务器的硬件测试分析方法
CN103970655A (zh) * 2014-05-08 2014-08-06 浪潮电子信息产业股份有限公司 一种基于expect的服务器自动化集群测试方法
CN104268046A (zh) * 2014-10-17 2015-01-07 浪潮电子信息产业股份有限公司 一种Linux下人工交互的NVIDIA GPU自动化测试方法
CN104407951A (zh) * 2014-11-05 2015-03-11 浪潮电子信息产业股份有限公司 一种自动化进行服务器整机测试的方法
CN104850495A (zh) * 2015-05-14 2015-08-19 曙光信息产业(北京)有限公司 自动化检测方法及装置
CN105045707A (zh) * 2015-07-24 2015-11-11 浪潮电子信息产业股份有限公司 一种基于Python服务器稳定性测试的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874153A (zh) * 2017-02-28 2017-06-20 郑州云海信息技术有限公司 一种基于Canaima操作系统的计算机老化程序
CN107133137A (zh) * 2017-05-26 2017-09-05 郑州云海信息技术有限公司 一种便捷的获取rmt测试信息的方法

Similar Documents

Publication Publication Date Title
WO2021196521A1 (zh) 远程运维管理系统及方法
US9471462B2 (en) Proactive risk analysis and governance of upgrade process
TWI225194B (en) Standardized format for reporting error events occurring within logically partitioned multiprocessing systems
CN102279775B (zh) 一种Linux系统下的硬盘故障处理方法
US20140188729A1 (en) Remote notification and action system with event generating
WO2012157471A1 (ja) 複数の制御システムの異常を検知する異常検知システム
US20140195860A1 (en) Early Detection Of Failing Computers
CN110516971A (zh) 异常检测的方法、装置、介质和计算设备
CN103324565B (zh) 日志监控方法
US11853150B2 (en) Method and device for detecting memory downgrade error
CN111786807B (zh) 故障提示系统、方法、装置和存储介质
CN103902442A (zh) 一种云软件健康度评测方法及系统
CN110178121A (zh) 一种数据库的检测方法及其终端
CN105930240A (zh) 一种对服务器进行自动化差异化老化测试的方法
US20210382801A1 (en) Method and System for Intelligent Failure Diagnosis Center for Burn-In Devices Under Test
JP2022100301A (ja) ソフトウェア・アップグレードがコンピューティング・デバイスに与える潜在的な影響を判定するための方法、コンピュータ・プログラム、および更新推奨コンピュータ・サーバ(ソフトウェア・アップグレードの安定性の推奨)
CN109871307A (zh) 一种精确定位启动时间问题的自动化测试方法
CN106534262B (zh) 一种网络信息系统故障的切换方法
El-Sherbeny et al. Reliability and sensitivity analysis of a repairable system with warranty and administrative delay in repair
CN110851316A (zh) 异常预警方法及装置、系统、电子设备、存储介质
CN103902312B (zh) 一种应用程序的发送方法及装置
CN107168819B (zh) 一种操作系统重启方法及装置
US20140101260A1 (en) Processing a technical system
CN106776169A (zh) 一种测试服务器的psu的方法及装置
CN102346706A (zh) 服务器管理系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160907

RJ01 Rejection of invention patent application after publication