CN105068920B - 一种基于shell测试rack资产信息稳定性的方法 - Google Patents

一种基于shell测试rack资产信息稳定性的方法 Download PDF

Info

Publication number
CN105068920B
CN105068920B CN201510422607.3A CN201510422607A CN105068920B CN 105068920 B CN105068920 B CN 105068920B CN 201510422607 A CN201510422607 A CN 201510422607A CN 105068920 B CN105068920 B CN 105068920B
Authority
CN
China
Prior art keywords
capacity
shell
assets
stability
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510422607.3A
Other languages
English (en)
Other versions
CN105068920A (zh
Inventor
史沛玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201510422607.3A priority Critical patent/CN105068920B/zh
Publication of CN105068920A publication Critical patent/CN105068920A/zh
Application granted granted Critical
Publication of CN105068920B publication Critical patent/CN105068920B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开一种基于shell测试rack资产信息稳定性的方法,属于rack测试领域;本发明基于shell工具通过对服务器各个资产模块的访问,自动化执行测试步骤,自动保存以及处理测试结果;分别对bios/BMC资产号和序列号同步稳定性,CPU核数,内存条数及容量,硬盘个数容量进行检查,并进行自动化循环测试,收集测试结果;节省大量的人力、时间、成本等多方面的资源,也减少了不必要的人工交互过程,从而大大提高了测试效率。

Description

一种基于shell测试rack资产信息稳定性的方法
技术领域
本发明公开一种测试rack稳定性的方法,属于rack测试领域,具体地说是一种基于shell测试rack资产信息稳定性的方法。
背景技术
随着IT领域技术的不断发展,对服务器的稳定性要求越来越高。作为服务器产品提供商,一款服务器无论是在研发阶段还是生产阶段都需要对产品进行系统可靠性测试,从而严格保证该产品的稳定性。Rack,即机架式机柜,是一款集管理、供电、散热、服务为一体的高密度、高可用的整机柜,其当前全新的DMI/FRU 产品名称、资产号、序列号等信息的同步设计,以及小空间大存储容量的无raid存储设计,性能得到进一步提升的同时,整机柜的稳定性就更加受到重视,然而在客户应用中,客户往往要根据服务的资产号序列号来分配IP、灌装OS等重要任务,磁盘上就会存有客户大量数据,一旦掉盘就是非常严重的故障,这些环节的稳定性比较薄弱。因此对于Rack这种整机柜产品,其稳定性必须要经过重点测试验证。但是,由于Rack 服务器节点较多以及以往的测试需要大量的人力投入,造成测试人员需要花费大量精力和物力完成测试,而本发明提供一种基于shell测试rack资产信息稳定性的方法,基于shell工具通过对服务器资产信息的检查,自动化执行对比,测试结果的自动保存以及处理,节省大量的人力、时间、成本等多方面的资源,也减少了不必要的人工交互过程,从而大大提高了测试效率,并保证产品的稳定性,因而,具有很好的推广使用价值。
shell是一个免费的编程语言,用来实现自动和交互式任务进行通信,而无需人的干预。使用它可以创建脚本用来实现对命令或程序提供输入,shell则可以根据程序的提示模拟标准输入提供给程序需要的输入来实现交互程序执行。
发明内容
本发明针对Rack 服务器节点较多以及以往的测试需要大量的人力投入,造成测试人员需要花费大量精力和物力完成测试的问题,提供一种基于shell测试rack资产信息稳定性的方法,节省大量的人力、时间、成本等多方面的资源,也减少了不必要的人工交互过程,从而大大提高了测试效率。
本发明提出的具体方案是:
一种基于shell测试rack资产信息稳定性的方法,基于shell工具通过对服务器各个资产模块的访问,自动化执行测试步骤,自动保存以及处理测试结果;分别对bios/BMC资产号和序列号同步稳定性,CPU核数,内存条数及容量,硬盘个数容量进行检查,并进行自动化循环测试,收集测试结果。
所述对bios/BMC 资产号和序列号同步稳定性的检查,其过程为:shell脚本中首先通过dmidecode及ipmitool fru指令分别抓取BIOS dmi及BMC fru中的资产号及产品序列号,然后对比dmi及fru中资产号及产品序列号是否一致,一致则判定dmi同步,fru 资产及序列号成功;反之则fail。
所述CPU核数的检查过程为:通过cat proc/cpuinfo获取服务器CPU核数,然后与已知的CPU核数比较,如果一致说明CPU工作正常,无失效情况,反之则fail。
所述内存条数及容量的检查过程为:通过脚本获取服务器内内存的容量及条数,然后与已知内存条数及容量去比较,如果数据一致,判定内存资产正常,反之则fail。
所述硬盘个数容量检查过程为:通过脚本获取HDD的个数及容量,然后与已知HDD数量及容量进行比较,如果数据一致,判定磁盘资产正常,反之则说明有掉盘情况。
所述自动化循环测试中将shell脚本的指令放在系统下rc.local中,并新增一行使得节点不断延时reboot。延时时间可设定,比如为100s等等。
所述对收集的测试结果,查看所记录的log有没有fail的日志,判断资产信息是否有变化。
本发明的有益之处是:本发明基于shell脚本,自动化测试rack资产信息稳定性,通过对服务器资产信息的检查,自动化执行对比,测试结果的自动保存以及处理来测试rack资产信息稳定性,节省大量的人力、时间、成本等多方面的资源,也减少了不必要的人工交互过程,从而大大提高了测试效率,并保证产品的稳定性,因而,具有很好的推广使用价值。
具体实施方式
一种基于shell测试rack资产信息稳定性的方法,基于shell工具通过对服务器各个资产模块的访问,自动化执行测试步骤,自动保存以及处理测试结果;分别对bios/BMC资产号和序列号同步稳定性,CPU核数,内存条数及容量,硬盘个数容量进行检查,并进行自动化循环测试,收集测试结果。
其中所述对bios/BMC 资产号和序列号同步稳定性的检查,其过程为:shell脚本中首先通过dmidecode及ipmitool fru指令分别抓取BIOS dmi及BMC fru中的资产号及产品序列号,然后对比dmi及fru中资产号及产品序列号是否一致,一致则判定dmi同步,fru资产及序列号成功;反之则fail。代码如下:
echo "the reboot times:`tail -n 1 /root/times`"
biosserial=`/usr/sbin/dmidecode | grep -A5 -i "System information" |awk ' /Serial/{print$3}'`
biosasset=`/usr/sbin/dmidecode |grep -A5 -i "Base Board Information"| awk '/Asset/{print $3}'`
/sbin/service ipmi start >/dev/null
if [ $? = 0 ] ;then
fruasset=`/usr/bin/ipmitool fru |awk '/Asset/{print $5}'`
fruserial=`/usr/bin/ipmitool fru |awk '/Product Serial/{print $4}'`
else
echo -e "\033[41m IPMI Driver StartFAILED..............................Failed \033[0m"
fisn=$1
asset=$2
if [ "$1" != "" ] ;then
if [ $sn = $biosserial ] && [ $sn = $fruserial ] ;then
echo -e "\033[42m Serial Number of This Node is $sn ....................Passed \033[0m"
else
echo -e "\033[41m Serila Number of This node: BIOS Serial $biosserial, BMC Serial $fruserial. Needed $sn.....................Failed \033[0m"
fi
if [ $asset ] ;then
if [ "$asset" = "$biosasset" ] && [ "$asset" = "$fruasset" ] ;then
echo -e "\033[42m Zichan Bianaho of This Node is $asset ....................Passed \033[0m"
else
echo -e "\033[41m Zichan Bianaho of This node: BIOS Asset $biosasset, BMC Asset $fruasset. Needed $asset .....................Failed \033[0m"
fi
fi
fi
所述CPU核数的检查过程为:通过cat proc/cpuinfo获取服务器CPU核数,然后与已知的CPU核数比较,如果一致说明CPU工作正常,无失效情况,反之则fail,代码如下:
coremount=$3
a=`cat /proc/cpuinfo | grep "model name" | wc -l`
if [ $coremount= $al ] ;then
echo -e "\033[42m CPU cores mount of This Node is $coremount................Passed \033[0m"
else
echo -e "\033[41m cores mount of This Node is not $coremount.................Failed \033[0m"
fi
内存条数及容量检查过程:通过脚本获取服务器内内存的容量及条数,然后与已知内存条数及容量去比较,如果数据一致,判定内存资产正常,反之则fail;代码如下:
memcap=$4
b=`free`
if [ $memcap= $b ] ;then
echo -e "\033[42m MEM capacity of This Node is $memcap ................Passed \033[0m"
else
echo -e "\033[41m MEM capacity of This Node is not $memcap............Failed \033[0m"
fi
硬盘个数容量检查过程:通过脚本获取HDD的个数及容量,然后与已知HDD数量及容量进行比较,如果数据一致,判定磁盘资产正常,反之则说明又掉盘情况;代码如下:
hddmount=$5
c=`fdisk-1|grep sd|wc-1`
if [ $hddmount= $c ] ;then
echo -e "\033[42m HDD mount of This Node is $hddmount ................Passed \033[0m"
else
echo -e "\033[41m MEM capacity of This Node is not $hddmount........Failed \033[0m"
fi
所述自动化循环测试中将shell脚本的指令放在系统下rc.local中,并新增一行使得节点不断延时reboot。延时时间可设定,比如为100s代码添加如下:
./stabilitytest 序列号 资产编号 cpu核数 内存容量 硬盘数量。
reboot
sleep 100
所述对收集的测试结果,查看所记录的log有没有fail的日志,判断资产信息是否有变化。
收集测试结果:收集测试结果,查看所记录的log有没有fail的日志,判断资产信息是否有变化,把步骤1-4执行的结果全部重定向到stability.log文件中,此指令可作为stabilitytest组成部分,然后检索其中的fail项;代码如下:
所以结果重定向到stability.log
All test result above >> stability.log
检索测试结果
cat stability.log |grep fail
本发明并不限于上述的具体实施方式。除本发明所要求保护的技术方案外,均为所属领域的技术人员可获知的现有技术。

Claims (3)

1.一种基于shell测试rack资产信息稳定性的方法,其特征是基于shell工具通过对服务器各个资产模块的访问,自动化执行测试步骤,自动保存以及处理测试结果;分别对BIOS/BMC 资产号和序列号同步稳定性,CPU核数,内存条数及容量,硬盘个数容量进行检查,并进行自动化循环测试,收集测试结果;
所述对BIOS/BMC 资产号和序列号同步稳定性的检查,其过程为:shell脚本中首先通过dmidecode及ipmitool fru指令分别抓取BIOS dmi及BMC fru中的资产号及产品序列号,然后对比dmi及fru中资产号及产品序列号是否一致,一致则判定dmi同步,fru 资产及序列号成功;反之则fail;
所述CPU核数的检查过程为:通过cat proc/cpuinfo获取服务器CPU核数,然后与已知的CPU核数比较,如果一致说明CPU工作正常,无失效情况,反之则fail;
所述内存条数及容量的检查过程为:通过脚本获取服务器内内存的容量及条数,然后与已知内存条数及容量去比较,如果数据一致,判定内存资产正常,反之则fail;
所述硬盘个数容量检查过程为:通过脚本获取HDD的个数及容量,然后与已知HDD数量及容量进行比较,如果数据一致,判定磁盘资产正常,反之则说明有掉盘情况。
2.根据权利要求1所述的一种基于shell测试rack资产信息稳定性的方法,其特征是所述自动化循环测试中将shell脚本的指令放在系统下rc.local中,并新增一行使得节点不断延时reboot。
3.据权利要求1或2所述的一种基于shell测试rack资产信息稳定性的方法,其特征是对收集的测试结果,查看所记录的log有没有fail的日志,判断资产信息是否有变化。
CN201510422607.3A 2015-07-17 2015-07-17 一种基于shell测试rack资产信息稳定性的方法 Active CN105068920B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510422607.3A CN105068920B (zh) 2015-07-17 2015-07-17 一种基于shell测试rack资产信息稳定性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510422607.3A CN105068920B (zh) 2015-07-17 2015-07-17 一种基于shell测试rack资产信息稳定性的方法

Publications (2)

Publication Number Publication Date
CN105068920A CN105068920A (zh) 2015-11-18
CN105068920B true CN105068920B (zh) 2018-01-02

Family

ID=54498297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510422607.3A Active CN105068920B (zh) 2015-07-17 2015-07-17 一种基于shell测试rack资产信息稳定性的方法

Country Status (1)

Country Link
CN (1) CN105068920B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550084A (zh) * 2015-12-10 2016-05-04 浪潮电子信息产业股份有限公司 一种自动化测试服务器节点功耗的方法
CN107133145A (zh) * 2017-05-02 2017-09-05 郑州云海信息技术有限公司 一种基于linux下的DMI信息测试脚本程序
CN107133137B (zh) * 2017-05-26 2020-03-06 郑州云海信息技术有限公司 一种便捷的获取rmt测试信息的方法
CN107943699A (zh) * 2017-11-24 2018-04-20 郑州云海信息技术有限公司 一种测试服务器fru和dmi信息同步功能的方法及系统
CN108829594A (zh) * 2018-06-07 2018-11-16 郑州云海信息技术有限公司 一种Linux下自动化测试BMC web资产信息功能的方法及系统
CN108920312A (zh) * 2018-06-14 2018-11-30 郑州云海信息技术有限公司 一种Windows系统中自动检测硬盘掉盘的方法及系统
CN108984359A (zh) * 2018-07-19 2018-12-11 郑州云海信息技术有限公司 一种系统uuid同步检测方法、装置、设备及存储介质
CN109783146A (zh) * 2019-01-08 2019-05-21 郑州云海信息技术有限公司 一种shell下读取服务器DMI信息的方法
CN109981417A (zh) * 2019-04-08 2019-07-05 苏州浪潮智能科技有限公司 一种服务器状态监控稳定性的测试方法及装置
CN110427528A (zh) * 2019-07-31 2019-11-08 东莞记忆存储科技有限公司 Ssd标识符测试方法、装置、计算机设备及存储介质
CN110415756B (zh) * 2019-07-31 2021-06-08 东莞记忆存储科技有限公司 一种测试ssd标签信息的方法及其装置
CN110659166B (zh) * 2019-09-03 2022-08-02 苏州浪潮智能科技有限公司 一种bmc资产信息功能的测试方法和设备
CN112101000A (zh) * 2020-09-17 2020-12-18 浪潮电子信息产业股份有限公司 信息一致性测试方法、装置、设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102984627A (zh) * 2012-11-29 2013-03-20 沈阳信达信息科技有限公司 蓝牙耳机的控制电路
CN103699433A (zh) * 2013-12-18 2014-04-02 中国科学院计算技术研究所 一种于Hadoop平台中动态调整任务数目的方法及系统
CN104317667A (zh) * 2014-10-27 2015-01-28 浪潮电子信息产业股份有限公司 一种dmi同步fru的方法
CN104461611A (zh) * 2014-11-05 2015-03-25 浪潮电子信息产业股份有限公司 一种rack机柜批量刷新节点bios的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377102A (zh) * 2012-04-20 2013-10-30 鸿富锦精密工业(深圳)有限公司 电脑重启及开关机测试系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102984627A (zh) * 2012-11-29 2013-03-20 沈阳信达信息科技有限公司 蓝牙耳机的控制电路
CN103699433A (zh) * 2013-12-18 2014-04-02 中国科学院计算技术研究所 一种于Hadoop平台中动态调整任务数目的方法及系统
CN104317667A (zh) * 2014-10-27 2015-01-28 浪潮电子信息产业股份有限公司 一种dmi同步fru的方法
CN104461611A (zh) * 2014-11-05 2015-03-25 浪潮电子信息产业股份有限公司 一种rack机柜批量刷新节点bios的方法

Also Published As

Publication number Publication date
CN105068920A (zh) 2015-11-18

Similar Documents

Publication Publication Date Title
CN105068920B (zh) 一种基于shell测试rack资产信息稳定性的方法
CN102968374B (zh) 一种数据仓库测试方法
EP2895956B1 (en) Method and system for monitoring execution of user request in distributed system
US9569325B2 (en) Method and system for automated test and result comparison
US7992040B2 (en) Root cause analysis by correlating symptoms with asynchronous changes
CN107688531A (zh) 数据库集成测试方法、装置、计算机设备及存储介质
US9116779B2 (en) Test management domain asset discovery and analysis
CN106682036A (zh) 一种数据交换系统及其交换方法
CN106445755A (zh) 一种整机柜服务器自动化测试方法
CN111881011A (zh) 日志管理方法、平台、服务器及存储介质
CN110008129B (zh) 一种存储定时快照的可靠性测试方法、装置及设备
CN110764980A (zh) 日志处理方法和装置
CN103069749A (zh) 虚拟环境中的问题的隔离
CN105260286A (zh) 一种实时监控cpu工作状态的方法
Liu Research of performance test technology for big data applications
US10083070B2 (en) Log file reduction according to problem-space network topology
CN107491372A (zh) 一种针对Linux系统RPM包统计CPU占用率的方法及系统
CN108647118A (zh) 基于存储集群的副本异常恢复方法、装置及计算机设备
Zhu et al. Loghub: A large collection of system log datasets for ai-driven log analytics
CN110008084A (zh) 一种独立日志信息记录方法、系统、装置及存储介质
EP3657351B1 (en) Smart data transition to cloud
Chuah et al. Insights into the diagnosis of system failures from cluster message logs
Narayanan et al. Towards' integrated'monitoring and management of datacenters using complex event processing techniques
CN112003727A (zh) 一种多节点服务器电源测试方法、系统、终端及存储介质
Zhou et al. Trace bench: An open data set for trace-oriented monitoring

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant