CN106598796A - 一种测试reboot时硬件信息稳定性的方法 - Google Patents

一种测试reboot时硬件信息稳定性的方法 Download PDF

Info

Publication number
CN106598796A
CN106598796A CN201611167637.5A CN201611167637A CN106598796A CN 106598796 A CN106598796 A CN 106598796A CN 201611167637 A CN201611167637 A CN 201611167637A CN 106598796 A CN106598796 A CN 106598796A
Authority
CN
China
Prior art keywords
information
reboot
hardware information
hardware
log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611167637.5A
Other languages
English (en)
Inventor
周志超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201611167637.5A priority Critical patent/CN106598796A/zh
Publication of CN106598796A publication Critical patent/CN106598796A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2268Logging of test results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种测试reboot时硬件信息稳定性的方法,属于计算机性能测试技术领域。本发明的测试reboot时硬件信息稳定性的方法基于dmidecode、impitool命令读取Linux系统的硬件信息并记录读取的硬件信息,记录每次重启系统的时间对出现的丢失硬件信息快速定位,查看硬件出现问题对应的重启时间,在Linux环境下对多次重启系统测试后的结果进行解析,完成测试故障分析。该发明的测试reboot时硬件信息稳定性的方法,每次系统重启时记录硬件信息,从而能降低出现故障信息被认为忽略,提升服务器产品品质,具有很好的推广应用价值。

Description

一种测试reboot时硬件信息稳定性的方法
技术领域
本发明涉及计算机性能测试技术领域,具体提供一种测试reboot时硬件信息稳定性的方法。
背景技术
计算机具有存储信息量大,使用者获取信息方便快捷并且信息可信性高的优点,受到越来越多人的青睐。特别是近年来随着社会及经济的飞速发展,使用者对计算机的各项性能要求越来越高,特别是对计算机的稳定性要求。计算机在运行过程中的稳定性问题是使用者关心的重中之重,因此,计算机在出厂之前要进行稳定性测试,以保证使用者能够安全稳定的使用计算机。其中,计算机的硬件信息的稳定性是首要关注的问题,通常进行linux下测试reboot是否会丢失硬件信息,以确定计算机硬件信息的稳定性。在进行reboot重启1000次或者24小时测试时,工程师往往只查看系统日志及BMC log,但是可能会出现问题,如:其中某次启动和上一次关机间隔时间过长而无法发现;CPU、内存或HDD在某次启动后出现丢失、信息显示错误或者系统没有抓取到的情况;BMC log里面出现大量信息(一些正常信息及报警信息)。这些都需要工程师一一排查,不仅浪费时间,而且不知道出现的问题的时间及出现错误log的次数,需要进一步改进。
发明内容
本发明的技术任务是针对上述存在的问题,提供一种每次系统重启时记录硬件信息,避免出现故障信息被人为忽略的弊端,从而提升服务器产品品质的测试reboot时硬件信息稳定性的方法。
为实现上述目的,本发明提供了如下技术方案:
一种测试reboot时硬件信息稳定性的方法,基于dmidecode、impitool命令读取Linux系统的硬件信息并记录读取的硬件信息,记录每次重启系统的时间对出现的丢失硬件信息快速定位,查看硬件出现问题对应的重启时间,在Linux环境下对多次重启系统测试后的结果进行解析,完成测试故障分析。
作为优选,所述测试reboot时硬件信息稳定性的方法具体包括以下步骤:
S1:在服务器安装Linux系统;
S2:将重启reboot脚本拷贝至服务器Linux系统下;
S3:在Linux系统下,编译/etc/rc.d/rc.local文件;
S4:将需要保存的log信息命令写在/etc/rc.d/rc.local文件中;
S5:将运行的reboot脚本地址写在/etc/rc.d/rc.local文件的最后;
S6:手动重启一次Linux系统;
S7:每次Linux系统重启时先记录要保存的硬件信息,调用reboot脚本,再自动重启Linux系统。
在Linux系统下,会先运行/etc/rc.d/rc.local命令才会登入到系统登入界面,而/etc/rc.d/rc.local命令是使用者自定义开机程序。本发明中在/etc/rc.d/rc.local命令下编辑文件,先写入要记录的log命令,再在最后写入reboot脚本地址,进入Linux系统后先记录硬件信息,再运行reboot脚本令Linux系统重启。
/etc/rc.d/rc.local系统文件可以执行自己想要执行的系统指令,任何在开机时需要进行的工作,直接写入/etc/rc.d/rc.local,则该工作在开机时会自动载入,不需登入系统去启动。
作为优选,记录Linux系统的硬件信息的过程为:
a.创建CPU log文件;
b.将本次启动的CPU信息写进CPU log文件中,下次启动的CPU信息将会保存,且不会覆盖;
c.创建memory log文件;
d.将本次启动的内存信息写进内存log文件中,下次启动的内存信息将会保存,且不会覆盖;
e.创建硬盘#0的log文件;
f.将本次启动的硬盘分区信息写进硬盘#0的log文件中,下次启动的信息将会保存,且不会覆盖;
g.创建硬盘#1的log文件;
h.将本次启动的硬盘信息写进硬盘#1的log文件中,下次启动的信息将会保存,且不会覆盖;
i.Linux下启动ipmitool功能;
j.创建SEL的log文件;
k.将本次启动的BMC SEL信息写进SEL的log文件中,下次启动的SEL信息将会保存,且不会覆盖;
l.清除本机的BMC的log信息。
其中,创建CPU log文件的命令为echo ---------------------- >> /root/cpu.log。
将本次启动的CPU信息写进CPU log文件中,下次启动的CPU信息将会保存,且不会覆盖的命令为:dmidecode -t 4 >> /root/cpu.log。
创建memory log文件的命令为:echo ------------------------->> /root/memory.log。
将本次启动的内存信息写进内存log文件中,下次启动的内存信息将会保存,且不会覆盖的命令为:dmidecode -t 17 >> /root/memory.log。
Dmidecode是一种可用在Linux系统下的命令,可以实现获取、显示软件和硬件信息等功能。“dmidecode -t 4”命令读取CPU的信息,“dmidecode -t 17”命令读取内存的信息。
创建硬盘#0的log文件的命令为:echo ------------------------- >> /root/HDD.log。
将本次启动的硬盘分区信息写进硬盘#0的log文件中,下次启动的信息将会保存,且不会覆盖的命令为:fdisk -l >> /root/HDD.log。
创建硬盘#1的log文件的命令为:fdisk -l >> /root/HDD1.log。
将本次启动的硬盘信息写进硬盘#1的log文件中,下次启动的信息将会保存,且不会覆盖的命令为:lsscsi >> /root/HDD1.log。
Linux下启动ipmitool功能的命令为:Service impi start。
Ipmitool是一种可用在Linux系统下的命令行方式的ipmi平台管理工具,支持ipmi1.5规范。
创建SEL的log文件的命令为:echo ------------------------- >> /root/BMCSEL.log。
将本次启动的BMC SEL信息写进SEL的log文件中,下次启动的SEL信息将会保存,且不会覆盖的命令为:ipmitool sel elist >> /root/BMCSEL.log。
清除本机的BMC的log信息的命令为:ipmitool sel clear。
作为优选,通过所述ipmitool命令获取传感器的信息、显示系统日志内容及网络远程开关机。
与现有技术相比,本发明的测试reboot时硬件信息稳定性的方法具有以下突出的有益效果:本发明的测试reboot时硬件信息稳定性的方法实现了对每次系统重启记录硬件信息,测试完成后只要查看这些信息就可以避免出现故障信息被人为忽略的弊端,能够保证计算机的稳定性,有利于提升服务器产品品质。
附图说明
图1是本发明所述测试reboot时硬件信息稳定性的方法的流程图。
具体实施方式
下面将结合附图和实施例,对本发明的测试reboot时硬件信息稳定性的方法作进一步详细说明。
实施例
如图1所示,本发明的测试reboot时硬件信息稳定性的方法,基于dmidecode、impitool命令读取Linux系统的硬件信息并记录读取的硬件信息,记录每次重启系统的时间对出现的丢失硬件信息快速定位,查看硬件出现问题对应的重启时间,在Linux环境下对多次重启系统测试后的结果进行解析,完成测试故障分析。记录Linux系统的硬件信息的过程为:
a.echo ---------------------- >> /root/cpu.log
创建CPU log文件;
b.dmidecode -t 4 >> /root/cpu.log
将本次启动的CPU信息写进CPU log文件中,下次启动的CPU信息将会保存,且不会覆盖;
c.echo ------------------------->> /root/memory.log
创建memory log文件;
d.dmidecode -t 17 >> /root/memory.log
将本次启动的内存信息写进内存log文件中,下次启动的内存信息将会保存,且不会覆盖;
dmidecode是一种可用在Linux系统下的命令,可以实现获取、显示软件和硬件信息等功能。“dmidecode -t 4”命令读取CPU的信息,“dmidecode -t 17”命令读取内存的信息。
e.echo ------------------------- >> /root/HDD.log
创建硬盘#0的log文件;
f.fdisk -l >> /root/HDD.log
将本次启动的硬盘分区信息写进硬盘#0的log文件中,下次启动的信息将会保存,且不会覆盖;
g.fdisk -l >> /root/HDD1.log
创建硬盘#1的log文件;
h.lsscsi >> /root/HDD1.log
将本次启动的硬盘信息写进硬盘#1的log文件中,下次启动的信息将会保存,且不会覆盖;
i.Service impi start
Linux下启动ipmitool功能;
j.echo ------------------------- >> /root/BMCSEL.log
创建SEL的log文件;
k.ipmitool sel elist >> /root/BMCSEL.log
将本次启动的BMC SEL信息写进SEL的log文件中,下次启动的SEL信息将会保存,且不会覆盖;
ipmitool是一种可用在Linux系统下的命令行方式的ipmi平台管理工具,支持ipmi1.5规范,通过ipmitool获取传感器的信息、显示系统日志内容及网络远程开关机。
l.ipmitool sel clear
清除本机的BMC的log信息。
该测试reboot时硬件信息稳定性的方法具体包括以下步骤:
S1:在服务器安装Linux系统。
S2:将重启reboot脚本拷贝至服务器Linux系统下。
S3:在Linux系统下,编译/etc/rc.d/rc.local文件。
S4:将需要保存的log信息命令写在/etc/rc.d/rc.local文件中。
S5:将运行的reboot脚本地址写在/etc/rc.d/rc.local文件的最后。
S6:手动重启一次Linux系统。
S7:每次Linux系统重启时先记录要保存的硬件信息,调用reboot脚本,再自动重启Linux系统。
以上所述的实施例,只是本发明较优选的具体实施方式,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。

Claims (4)

1.一种测试reboot时硬件信息稳定性的方法,其特征在于:基于dmidecode、impitool命令读取Linux系统的硬件信息并记录读取的硬件信息,记录每次重启系统的时间对出现的丢失硬件信息快速定位,查看硬件出现问题对应的重启时间,在Linux环境下对多次重启系统测试后的结果进行解析,完成测试故障分析。
2.根据权利要求1所述的测试reboot时硬件信息稳定性的方法,其特征在于:所述测试reboot时硬件信息稳定性的方法具体包括以下步骤:
S1:在服务器安装Linux系统;
S2:将重启reboot脚本拷贝至服务器Linux系统下;
S3:在Linux系统下,编译/etc/rc.d/rc.local文件;
S4:将需要保存的log信息命令写在/etc/rc.d/rc.local文件中;
S5:将运行的reboot脚本地址写在/etc/rc.d/rc.local文件的最后;
S6:手动重启一次Linux系统;
S7:每次Linux系统重启时先记录要保存的硬件信息,调用reboot脚本,再自动重启Linux系统。
3.根据权利要求1或2所述的测试reboot时硬件信息稳定性的方法,其特征在于:记录Linux系统的硬件信息的过程为:
a.创建CPU log文件;
b.将本次启动的CPU信息写进CPU log文件中,下次启动的CPU信息将会保存,且不会覆盖;
c.创建memory log文件;
d.将本次启动的内存信息写进内存log文件中,下次启动的内存信息将会保存,且不会覆盖;
e.创建硬盘#0的log文件;
f.将本次启动的硬盘分区信息写进硬盘#0的log文件中,下次启动的信息将会保存,且不会覆盖;
g.创建硬盘#1的log文件;
h.将本次启动的硬盘信息写进硬盘#1的log文件中,下次启动的信息将会保存,且不会覆盖;
i.Linux下启动ipmitool功能;
j.创建SEL的log文件;
k.将本次启动的BMC SEL信息写进SEL的log文件中,下次启动的SEL信息将会保存,且不会覆盖;
l.清除本机的BMC的log信息。
4.根据权利要求3所述的测试reboot时硬件信息稳定性的方法,其特征在于:通过所述ipmitool命令获取传感器的信息、显示系统日志内容及网络远程开关机。
CN201611167637.5A 2016-12-16 2016-12-16 一种测试reboot时硬件信息稳定性的方法 Pending CN106598796A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611167637.5A CN106598796A (zh) 2016-12-16 2016-12-16 一种测试reboot时硬件信息稳定性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611167637.5A CN106598796A (zh) 2016-12-16 2016-12-16 一种测试reboot时硬件信息稳定性的方法

Publications (1)

Publication Number Publication Date
CN106598796A true CN106598796A (zh) 2017-04-26

Family

ID=58599680

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611167637.5A Pending CN106598796A (zh) 2016-12-16 2016-12-16 一种测试reboot时硬件信息稳定性的方法

Country Status (1)

Country Link
CN (1) CN106598796A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229545A (zh) * 2017-06-26 2017-10-03 郑州云海信息技术有限公司 一种Linux系统硬件检测的测试方法及系统
CN107608829A (zh) * 2017-09-26 2018-01-19 郑州云海信息技术有限公司 一种验证服务器是否存在硬件丢失的方法
CN107832178A (zh) * 2017-11-20 2018-03-23 郑州云海信息技术有限公司 一种服务器稳定性的自动化测试方法
CN107888696A (zh) * 2017-11-24 2018-04-06 郑州云海信息技术有限公司 一种存储实验室设备信息获取方法、系统及相关装置
CN107918574A (zh) * 2017-12-05 2018-04-17 郑州云海信息技术有限公司 一种基于Redhat下测试硬件信息的检验方法
CN107943699A (zh) * 2017-11-24 2018-04-20 郑州云海信息技术有限公司 一种测试服务器fru和dmi信息同步功能的方法及系统
CN108572895A (zh) * 2018-04-02 2018-09-25 郑州云海信息技术有限公司 一种Linux下自动检查软硬件配置的稳定性测试方法
CN108845901A (zh) * 2018-06-12 2018-11-20 郑州云海信息技术有限公司 一种实现系统reboot测试状态远程监控的方法及装置
CN109324834A (zh) * 2018-09-19 2019-02-12 郑州云海信息技术有限公司 一种分布式存储服务器自动重启的系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182288A (zh) * 2014-08-18 2014-12-03 浪潮电子信息产业股份有限公司 一种服务器集群系统功耗自动化测试的方法
CN104536875A (zh) * 2015-01-16 2015-04-22 浪潮电子信息产业股份有限公司 一种基于ipmi的对服务器进行自动化重启测试的方法
CN105740112A (zh) * 2016-02-03 2016-07-06 浪潮电子信息产业股份有限公司 一种Linux下的开机自动检测硬件信息的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182288A (zh) * 2014-08-18 2014-12-03 浪潮电子信息产业股份有限公司 一种服务器集群系统功耗自动化测试的方法
CN104536875A (zh) * 2015-01-16 2015-04-22 浪潮电子信息产业股份有限公司 一种基于ipmi的对服务器进行自动化重启测试的方法
CN105740112A (zh) * 2016-02-03 2016-07-06 浪潮电子信息产业股份有限公司 一种Linux下的开机自动检测硬件信息的方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229545A (zh) * 2017-06-26 2017-10-03 郑州云海信息技术有限公司 一种Linux系统硬件检测的测试方法及系统
CN107608829A (zh) * 2017-09-26 2018-01-19 郑州云海信息技术有限公司 一种验证服务器是否存在硬件丢失的方法
CN107832178A (zh) * 2017-11-20 2018-03-23 郑州云海信息技术有限公司 一种服务器稳定性的自动化测试方法
CN107888696A (zh) * 2017-11-24 2018-04-06 郑州云海信息技术有限公司 一种存储实验室设备信息获取方法、系统及相关装置
CN107943699A (zh) * 2017-11-24 2018-04-20 郑州云海信息技术有限公司 一种测试服务器fru和dmi信息同步功能的方法及系统
CN107918574A (zh) * 2017-12-05 2018-04-17 郑州云海信息技术有限公司 一种基于Redhat下测试硬件信息的检验方法
CN108572895A (zh) * 2018-04-02 2018-09-25 郑州云海信息技术有限公司 一种Linux下自动检查软硬件配置的稳定性测试方法
CN108572895B (zh) * 2018-04-02 2021-07-30 郑州云海信息技术有限公司 一种Linux下自动检查软硬件配置的稳定性测试方法
CN108845901A (zh) * 2018-06-12 2018-11-20 郑州云海信息技术有限公司 一种实现系统reboot测试状态远程监控的方法及装置
CN108845901B (zh) * 2018-06-12 2021-10-08 郑州云海信息技术有限公司 一种实现系统reboot测试状态远程监控的方法及装置
CN109324834A (zh) * 2018-09-19 2019-02-12 郑州云海信息技术有限公司 一种分布式存储服务器自动重启的系统及方法

Similar Documents

Publication Publication Date Title
CN106598796A (zh) 一种测试reboot时硬件信息稳定性的方法
CN110750396B (zh) 一种服务器操作系统兼容性测试方法、装置及存储介质
CN110609778A (zh) 一种保存服务器宕机日志的方法及系统
CN105024879A (zh) 虚拟机故障检测、恢复系统及虚拟机检测、恢复、启动方法
CN104714863A (zh) 一种基于Linux操作系统的系统宕机后Raid卡日志完整保存的方法
CH717425B1 (it) Sistema e metodo per il ripristino selettivo di un sistema informatico a uno stato operativo.
CN109254922A (zh) 一种服务器BMC Redfish功能的自动化测试方法及装置
US10514972B2 (en) Embedding forensic and triage data in memory dumps
CN104809054B (zh) 实现程序测试的方法和系统
CN103092718A (zh) 测试数据备份系统及方法
WO2023226380A1 (zh) 一种磁盘处理方法、系统及电子设备
CN108572895B (zh) 一种Linux下自动检查软硬件配置的稳定性测试方法
TW201500919A (zh) 基板管理控制器遠端調試系統及方法
US7979238B2 (en) System, method and computer program product for evaluating a test of an alternative system
US20160266951A1 (en) Diagnostic collector for hadoop
CN113655846B (zh) 一种OpenPOWER服务器时间同步方法及系统
US10776240B2 (en) Non-intrusive performance monitor and service engine
CN115757099A (zh) 平台固件保护恢复功能自动测试方法和装置
CN101751283A (zh) 虚拟机监视器,虚拟机系统及客户操作系统状态获取方法
CN109213569B (zh) 一种基于虚拟机的审计方法、装置、服务器及存储介质
JP6060781B2 (ja) 障害診断装置およびプログラム
CN105242880A (zh) 一种自动化创建Raid并执行压力测试的方法
CN109327344B (zh) 一种白盒交换机故障诊断方法及装置
CN117116333B (zh) 一种企业级固态硬盘vpd信息的测试方法和测试装置
TWI775360B (zh) 用以記錄電腦系統的硬體元件狀態的儲存裝置及其電腦實施方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170426

RJ01 Rejection of invention patent application after publication