CN108108276A - 一种针对日志报警功能的通用测试方法及装置 - Google Patents

一种针对日志报警功能的通用测试方法及装置 Download PDF

Info

Publication number
CN108108276A
CN108108276A CN201711373696.2A CN201711373696A CN108108276A CN 108108276 A CN108108276 A CN 108108276A CN 201711373696 A CN201711373696 A CN 201711373696A CN 108108276 A CN108108276 A CN 108108276A
Authority
CN
China
Prior art keywords
cpu
memory
simulation
address
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711373696.2A
Other languages
English (en)
Inventor
李俊卿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201711373696.2A priority Critical patent/CN108108276A/zh
Publication of CN108108276A publication Critical patent/CN108108276A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/261Functional testing by simulating additional hardware, e.g. fault simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种针对日志报警功能的通用测试方法及装置,所述的方法包括:S1:获取测试机器中所有的传感器名称及其对应的地址值;S2:选取CPU、内存、ME对应的传感器及相应地址;S3:利用S2中选取的地址模拟失效报警;S4:检查BMC日志,判断测试结果。所述的装置包括:一级获取单元,用以获取测试机器中所有的传感器名称及其对应的地址值;二级获取单元,用以选取CPU、内存、ME对应的传感器及相应地址;故障模拟单元,用以通过ipmitool发送模拟CPU、内存、ME故障;结果输出单元,利用ipmitool sel elist抓取所有BMC报警日志,通过对比日志信息是否与模拟的故障一致来判断对应故障报警功能是否正常,并输出判断结果。可以模拟故障,提升了测试效率。

Description

一种针对日志报警功能的通用测试方法及装置
技术领域
本发明涉及服务器运维领域,具体的说是一种针对日志报警功能的通用测试方法及装置。
背景技术
随着云计算和大数据的飞速发展,客户运维服务器的数量也迅速增长,这对运维团队提出了更高的挑战。服务器运维中关键的一点是监控服务器的各个硬件的运行状态,其中最主要的部分就是CPU、内存和ME,如果此功能存在问题则会给运维造成非常大的麻烦。
以往的CPU、内存和ME的日志报警功能测试都是通过手动模拟fail现象,然后查看对应BMC报警日志是否正确,且不同机型测试方法不统一,这种方法的弊端是效率较低,而且测试覆盖率不够,考虑情况比较单一。
发明内容
为了解决上述问题,提供了一种针对日志报警功能的通用测试方法及装置,不仅适用于所有型号的服务器,还能够大大提高测试效率。
本发明实施例提供了一种针对日志报警功能的通用测试方法,所述的方法包括:
S1:获取测试机器中所有的传感器名称及其对应的地址值;
S2:选取CPU、内存、ME对应的传感器及相应地址;
S3:利用S2中选取的地址模拟失效报警;
S4:检查BMC日志,判断测试结果。
进一步的,步骤S1的具体实现过程为:通过ipmitool sdr elist获取所有传感器信息,并保存的日志文件中。
进一步的,步骤S2中,通过自动检索CPU、内存、ME对应传感器的通用名称来选取CPU、内存、ME对应的传感器。
进一步的,步骤S3的具体实现过程为:
S31:通过遍历每个CPU状态的地址位,逐个模拟故障日志;
S32:通过遍历所有内存状态传感器地址位,逐个模拟内存ECC故障;
S33:通过ipmitool发送模拟ME故障的命令。
进一步的,步骤S4的具体实现过程为:利用ipmitool sel elist抓取所有BMC报警日志,通过对比日志信息是否与模拟的故障一致来判断对应故障报警功能是否正常。
本发明实施例还提供了一种针对日志报警功能的通用测试装置,所述的装置包括:
一级获取单元,用以获取测试机器中所有的传感器名称及其对应的地址值;
二级获取单元,用以选取CPU、内存、ME对应的传感器及相应地址;
故障模拟单元,用以通过ipmitool发送模拟CPU、内存、ME故障;
结果输出单元,利用ipmitool sel elist抓取所有BMC报警日志,通过对比日志信息是否与模拟的故障一致来判断对应故障报警功能是否正常,并输出判断结果。
进一步的,所述的故障模拟单元包括:
CPU故障模拟单元,通过遍历每个CPU状态的地址位,逐个模拟故障日志;
内存故障模拟单元,通过遍历所有内存状态传感器地址位,逐个模拟内存ECC故障;
ME故障模拟单元,通过ipmitool发送模拟ME故障的命令。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
通过脚本命令来自动实现,可以自动获取传感器信息并模拟故障,针对所有主流带有IPMI模块的服务器均适用,实现了不同机型一键测试,解放了人力,提升了测试效率。
附图说明
图1是本发明方法实施例的流程图;
图2是本发明装置的原理图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
本发明设计的原理为:
IPMI(Intelligent Platform Management Interface)即智能平台管理接口是使硬件管理具备“智能化”的新一代通用接口标准。用户可以利用IPMI监视服务器的物理特征,如温度、电压、电扇工作状态、电源供应以及机箱入侵等。IPMI最大的优势在于它是独立于CPU、BIOS和OS的,所以用户无论在开机还是关机的状态下,只要接通电源就可以实现对服务器的监控。IPMI是一种规范的标准,其中最重要的物理部件就是BMC(BaseboardManagement Controller),一种嵌入式管理微控制器,它相当于整个平台管理的“大脑”,通过它IPMI可以监控各个传感器的数据并记录各种事件的日志。
Shell是指“提供使用者使用界面”的软件。它类似于DOS下的command和后来的cmd.exe。它接收用户命令,然后调用相应的应用程序。同时它又是一种程序设计语言。作为命令语言,它交互式解释和执行用户输入的命令或者自动地解释和执行预先设定好的一连串的命令;作为程序设计语言,它定义了各种变量和参数,并提供了许多在高级语言中才具有的控制结构,包括循环和分支。
实施例
如图1所示,本发明实施例提供了一种针对日志报警功能的通用测试方法,所述的方法包括:
S1:获取测试机器中所有的传感器名称及其对应的地址值,具体实现过程为:通过ipmitool sdr elist获取所有传感器信息,并保存的日志文件中。
S2:选取CPU、内存、ME对应的传感器及相应地址。该步骤的原理为:通过自动检索CPU、内存、ME对应传感器的通用名称来选取CPU、内存、ME对应的传感器。
例如,purley平台CPU状态传感器名称都为CPU_Status,内存的传感器名称一般都为CPU_xx_xx,通过排除的方式获取所有内存传感器地址位,ME状态传感器名称一般都为ME_FW_Status。
S3:利用S2中选取的地址模拟失效报警。
步骤S3的具体实现过程为:
S31:通过遍历每个CPU状态的地址位,逐个模拟故障日志。
S32:通过遍历所有内存状态传感器地址位,逐个模拟内存ECC故障。
S33:通过ipmitool发送模拟ME故障的命令。
在实际操作中,整个步骤S3都是通过ipmitool发送模拟故障的命令,把这些命令整合到函数中,在脚本中统一执行。
S4:检查BMC日志,判断测试结果。
步骤S4的具体实现过程为:利用ipmitool sel elist抓取所有BMC报警日志,通过对比日志信息是否与模拟的故障一致来判断对应故障报警功能是否正常。
如图2所示,本发明实施例还提供了一种针对日志报警功能的通用测试装置,所述的装置包括一级获取单元、二级获取单元、故障模拟单元、结果输出单元。
所述的一级获取单元,主要用以获取测试机器中所有的传感器名称及其对应的地址值。
所述的二级获取单元,主要在一级获取单元完成操作后,从一级获取单元的结果中选取CPU、内存、ME对应的传感器及相应地址。
所述的故障模拟单元,主要用以通过ipmitool发送模拟CPU、内存、ME故障。该单元可以细分为以下三个单元:
1)CPU故障模拟单元,通过遍历每个CPU状态的地址位,逐个模拟故障日志。
2)内存故障模拟单元,通过遍历所有内存状态传感器地址位,逐个模拟内存ECC故障。
3)ME故障模拟单元,通过ipmitool发送模拟ME故障的命令。
所述的结果输出单元,利用ipmitool sel elist抓取所有BMC报警日志,通过对比日志信息是否与模拟的故障一致来判断对应故障报警功能是否正常,并输出判断结果。
尽管说明书及附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换;而一切不脱离本发明创造的精神和范围的技术方案及其改进,其均涵盖在本发明创造专利的保护范围当中。

Claims (7)

1.一种针对日志报警功能的通用测试方法,其特征是:所述的方法包括:
S1:获取测试机器中所有的传感器名称及其对应的地址值;
S2:选取CPU、内存、ME对应的传感器及相应地址;
S3:利用S2中选取的地址模拟失效报警;
S4:检查BMC日志,判断测试结果。
2.根据权利要求1所述的一种针对日志报警功能的通用测试方法,其特征是:步骤S1的具体实现过程为:通过ipmitoolsdrelist获取所有传感器信息,并保存的日志文件中。
3.根据权利要求1所述的一种针对日志报警功能的通用测试方法,其特征是:步骤S2中,通过自动检索CPU、内存、ME对应传感器的通用名称来选取CPU、内存、ME对应的传感器。
4.根据权利要求1所述的一种针对日志报警功能的通用测试方法,其特征是:步骤S3的具体实现过程为:
S31:通过遍历每个CPU状态的地址位,逐个模拟故障日志;
S32:通过遍历所有内存状态传感器地址位,逐个模拟内存ECC故障;
S33:通过ipmitool发送模拟ME故障的命令。
5.根据权利要求1所述的一种针对日志报警功能的通用测试方法,其特征是:步骤S4的具体实现过程为:利用ipmitoolselelist抓取所有BMC报警日志,通过对比日志信息是否与模拟的故障一致来判断对应故障报警功能是否正常。
6.一种针对日志报警功能的通用测试装置,其特征是:所述的装置包括:
一级获取单元,用以获取测试机器中所有的传感器名称及其对应的地址值;
二级获取单元,用以选取CPU、内存、ME对应的传感器及相应地址;
故障模拟单元,用以通过ipmitool发送模拟CPU、内存、ME故障;
结果输出单元,利用ipmitoolselelist抓取所有BMC报警日志,通过对比日志信息是否与模拟的故障一致来判断对应故障报警功能是否正常,并输出判断结果。
7.根据权利要求6所述的一种针对日志报警功能的通用测试装置,其特征是:所述的故障模拟单元包括:
CPU故障模拟单元,通过遍历每个CPU状态的地址位,逐个模拟故障日志;
内存故障模拟单元,通过遍历所有内存状态传感器地址位,逐个模拟内存ECC故障;
ME故障模拟单元,通过ipmitool发送模拟ME故障的命令。
CN201711373696.2A 2017-12-19 2017-12-19 一种针对日志报警功能的通用测试方法及装置 Pending CN108108276A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711373696.2A CN108108276A (zh) 2017-12-19 2017-12-19 一种针对日志报警功能的通用测试方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711373696.2A CN108108276A (zh) 2017-12-19 2017-12-19 一种针对日志报警功能的通用测试方法及装置

Publications (1)

Publication Number Publication Date
CN108108276A true CN108108276A (zh) 2018-06-01

Family

ID=62210200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711373696.2A Pending CN108108276A (zh) 2017-12-19 2017-12-19 一种针对日志报警功能的通用测试方法及装置

Country Status (1)

Country Link
CN (1) CN108108276A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086155A (zh) * 2018-07-27 2018-12-25 郑州云海信息技术有限公司 服务器故障定位方法、装置、设备及计算机可读存储介质
CN109918254A (zh) * 2019-02-27 2019-06-21 苏州浪潮智能科技有限公司 一种AEP内存Error Detection功能测试方法、系统、终端及存储介质
CN112731016A (zh) * 2020-12-21 2021-04-30 广汽菲亚特克莱斯勒汽车有限公司 一种电动车远程服务与管理报警功能测试方法和系统
CN114490203A (zh) * 2021-12-23 2022-05-13 新华三云计算技术有限公司 一种功能验证方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833493A (zh) * 2010-03-24 2010-09-15 浪潮电子信息产业股份有限公司 一种基于linux系统下服务器稳定性可靠性的测试方法
CN103389124A (zh) * 2012-05-10 2013-11-13 鸿富锦精密工业(深圳)有限公司 传感器测试的方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833493A (zh) * 2010-03-24 2010-09-15 浪潮电子信息产业股份有限公司 一种基于linux系统下服务器稳定性可靠性的测试方法
CN103389124A (zh) * 2012-05-10 2013-11-13 鸿富锦精密工业(深圳)有限公司 传感器测试的方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086155A (zh) * 2018-07-27 2018-12-25 郑州云海信息技术有限公司 服务器故障定位方法、装置、设备及计算机可读存储介质
CN109918254A (zh) * 2019-02-27 2019-06-21 苏州浪潮智能科技有限公司 一种AEP内存Error Detection功能测试方法、系统、终端及存储介质
CN112731016A (zh) * 2020-12-21 2021-04-30 广汽菲亚特克莱斯勒汽车有限公司 一种电动车远程服务与管理报警功能测试方法和系统
CN114490203A (zh) * 2021-12-23 2022-05-13 新华三云计算技术有限公司 一种功能验证方法及装置

Similar Documents

Publication Publication Date Title
Eckhart et al. Towards security-aware virtual environments for digital twins
CN108108276A (zh) 一种针对日志报警功能的通用测试方法及装置
CN107590042A (zh) 一种基于Linux系统的服务器开关机测试方法与系统
CN108376107A (zh) 一种服务器故障检测的方法、装置、设备及存储介质
CN107451040B (zh) 故障原因的定位方法、装置及计算机可读存储介质
CN108089566A (zh) 一种bmc稳定性并行测试方法及系统
US10234921B2 (en) Systems and methods for operating a virtual power environment
Pezze et al. Generating effective integration test cases from unit ones
CN107301101A (zh) 一种存储故障注入方法及系统
CN107678962A (zh) 一种cli接口的自动化测试方法及装置
CN105045146B (zh) 一种具有复位功能的系统及其重启控制方法
CN103795786A (zh) 具有web服务功能的嵌入式集中器系统
CN107894956A (zh) 一种远程bios升降级刷新自动化测试方法
Wang et al. A model-based framework for cloud API testing
CN111858201A (zh) 一种bmc综合测试方法、系统、终端及存储介质
CN115604256A (zh) 基于源数据仿真的手机app取证方法、系统及存储介质
CN108804269A (zh) 一种基于域控制测试raid板卡稳定性的系统及方法
CN113536658B (zh) 基于stm32嵌入式处理器的机电设备轻量化故障诊断方法
CN110287112A (zh) 客户端的维护方法、装置及可读存储介质
CN106844158A (zh) 一种服务器节点状态的监测方法及装置
CN104615521A (zh) 一种测试bmc蓝屏捕获功能的方法
CN112486785B (zh) 一种服务器定位宕机阶段的方法、系统、终端及存储介质
Li et al. Modeling web application for cross-browser compatibility testing
Matos et al. Evaluation of a disaster recovery solution through fault injection experiments
CN114764641A (zh) 基于安全验证的两票管理方法、系统、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180601