CN111488288A - 一种测试bmc acd稳定性的方法、装置、终端及存储介质 - Google Patents

一种测试bmc acd稳定性的方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN111488288A
CN111488288A CN202010307859.2A CN202010307859A CN111488288A CN 111488288 A CN111488288 A CN 111488288A CN 202010307859 A CN202010307859 A CN 202010307859A CN 111488288 A CN111488288 A CN 111488288A
Authority
CN
China
Prior art keywords
error
acd
bmc
triggering
error injection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010307859.2A
Other languages
English (en)
Inventor
刘美欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010307859.2A priority Critical patent/CN111488288A/zh
Publication of CN111488288A publication Critical patent/CN111488288A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Prevention of errors by analysis, debugging or testing of software
    • G06F11/362Debugging of software
    • G06F11/3636Debugging of software by tracing the execution of the program

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开一种测试BMC ACD稳定性的方法、装置、终端及存储介质,触发测试节点进行CPU IERR注错;触发抓取并保存报错文件;检查报错文件是否完整且正确;若完整且正确,则BMC ACD稳定,否则不稳定。本发明通过触发注错的方式对测试节点进行注错,注错后触发抓取并保存报错文件,检查所保存报错文件是否完整且正确来验证BMC ACD的稳定性,测试过程简单,可操作性强,且可保证有效验证BMC ACD的稳定性,为用户提供保障。

Description

一种测试BMC ACD稳定性的方法、装置、终端及存储介质
技术领域
本发明涉及BMC ACD稳定性测试领域,具体涉及一种测试BMC ACD稳定性的方法、装置、终端及存储介质。
背景技术
ACD(Autonomous Crash Dump)是自治崩溃转储的缩写,用于收集大规模的故障记录调试(播种)。内部调试器收集的调试数据的标准化,用于故障的分类和执行第一级调试,调试数据包含来自CPU的足够信息来理解故障。随着客户对BMC ACD功能要求的提高,需防止出现服务器故障时,BMC ACD功能达不到每次都能稳定产生日志的问题,只有保证了BMCACD功能的稳定性,客户现场出现服务器崩溃,在第一次失败时捕获必要的数据来分析和分类问题,才能有效的分析和解决问题。因此,有必要提供一种测试BMC ACD稳定性的方法。
发明内容
为解决上述问题,本发明提供一种测试BMC ACD稳定性的方法、装置、终端及存储介质,有效测试BMC ACD的稳定性。
本发明的技术方案是:一种测试BMC ACD稳定性的方法,包括以下步骤:
触发测试节点进行CPU IERR注错;
触发抓取并保存报错文件;
检查报错文件是否完整且正确;
若完整且正确,则BMC ACD稳定,否则不稳定。
进一步地,本方法中多次触发测试节点进行CPU IERR注错,每次触发注错后,触发一次抓取并保存报错文件。
进一步地,触发下一次注错前,控制测试节点重启。
进一步地,执行完预设次数的注错和抓取保存报错文件之后,再检查全部报错文件是否完整且正确。
进一步地,所述触发CPU IERR注错,具体包括,
将测试控制端BIOS选项中包含直连的选择设置为使能;
将测试控制端与测试节点直连;
运行注错脚本,触发测试节点BIOS调取注错命令对测试节点进行CPU IERR注错。
本发明的技术方案还包括一种测试BMC ACD稳定性的装置,包括,
触发注错模块:触发测试节点进行CPU IERR注错;
触发抓取保存文件模块:触发抓取并保存报错文件;
检查文件模块:检查报错文件是否完整且正确;
稳定性判断模块:若报错文件完整且正确,则BMC ACD稳定,否则不稳定。
进一步地,触发注错模块执行多次触发测试节点进行CPU IERR注错的操作。
进一步地,该装置还包括,
控制重启模块:触发注错模块触发下一次注错前,控制测试节点重启。
本发明的技术方案还包括一种终端,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行上述任一项所述的方法。
本发明的技术方案还包括一种存储有计算机程序的计算机可读存储介质,该程序被处理器执行时实现上述任一项所述的方法。
本发明提供的一种测试BMC ACD稳定性的方法、装置、终端及存储介质,通过触发注错的方式对测试节点进行注错,注错后触发抓取并保存报错文件,检查所保存报错文件是否完整且正确来验证BMC ACD的稳定性。优选可进行多次注错,检查BMC ACD是否每次都可成功抓取报错文件,进一步有效验证BMC ACD的稳定性。该方案测试过程简单,可操作性强,且可保证有效验证BMC ACD的稳定性,为用户提供保障。
附图说明
图1是本发明具体实施例一方法流程示意图;
图2是本发明具体实施例二具体实现方法流程示意图;
图3本发明具体实施例三结构示意框图。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
实施例一
ACD是当BMC出现IERR报错(IERR是一种严重的CPU错误,IERR错误表明对应的处理器有不可恢复的错误或与CPU相关的严重错误事件)时抓取json格式文件(报错文件),内容主要是CPU相关寄存器,有助于分析导致报错的原因。当产生IERR报错时会以json格式存储,使用客户端将json格式内容显示。
如图1所示,本实施例提供一种测试BMC ACD稳定性的方法,包括以下步骤:
S101,触发测试节点进行CPU IERR注错;
S102,触发抓取并保存报错文件;
S103,检查报错文件是否完整且正确;
S104,若完整且正确,则BMC ACD稳定,否则不稳定。
本方法通过触发注错的方式对测试节点进行注错,注错后触发抓取并保存报错文件,检查所保存报错文件是否完整且正确来验证BMC ACD的稳定性。
实施例二
优选地,本实施例在实施例一基础上提供一种测试BMC ACD稳定性的方法,本方法中多次触发测试节点进行CPU IERR注错,每次触发注错后,触发一次抓取并保存报错文件。
需要说明的是,可预设注错次数,执行完预设次数的注错和抓取保存报错文件之后,再检查全部报错文件是否完整且正确,提高测试效率和测试结果的有效性。
另外,在触发下一次注错前,控制测试节点重启,以使测试节点恢复为正常状态,便于下一次注错测试。
如图2所示,本方法具体实现时执行以下步骤:
S201,触发测试节点进行CPU IERR注错;
S202,触发抓取并保存报错文件;
S203,控制测试节点重启;
S204,判断注错次数是否到达预设次数;
S205,若未达到预设次数,则返回步骤S201;若达到预测次数,则进入步骤S206;
S206,检查报错文件是否完整且正确;
S207,若完整且正确,则BMC ACD稳定,否则不稳定。
触发CPU IERR注错时,测试节点BMC系统事件日志中会有相应的日志产生,BMCWEB页面系统摘要下的CPU状态对应为严重状态。本实施例中,步骤S202触发抓取报错文件通过RestFul_Test_Tool工具(RestFul接口测试工具)实现,将RestFul_Test_Tool工具放到测试控制端,执行RestFul_Test_Tool.sh-G BMCIP ADMIN ADMIN命令,实现抓取报错文件的动作。
测试控制端将报错文件存储到BMCLog目录下,需要说明的是,若没有产生IERR报错,则抓取到的文件内容为空,可终断执行查看BMCLog目录下的文件内容。
本实施例步骤S206中,通过cat命令,具体为cat sel.log |grep “error”,自动检查所抓取报错文件的完整性和正确性。
本实施例还提供一种触发CPU IERR注错的实现方法,包括以下步骤:
SS1,将测试控制端BIOS选项中包含直连的选择设置为使能;
SS2,将测试控制端与测试节点直连;
SS3,运行注错脚本,触发测试节点BIOS调取注错命令对测试节点进行CPU IERR注错。
需要说明的是,本实施例多次触发注错,开始测试前执行步骤SS1和SS2,配置测试环境,测试后每次触发注错,执行步骤SS3。
具体地,在测试控制端安装Intel_DAL_PDT1.1847.513.200_Licensed软件(英特尔平台调试工具包,该软件实现config Console、DCI_Config、Python Console、java的安装,USB驱动更新及安装新驱动程序),通过SCE工具将BIOS选项进行导出,把BIOS选项中包含DCI的选项都设置为Enable。测试控制端和测试节点通过DCI连接线(USB 3.0串口线)进行直连。打开安装好的Config Console软件,在Platfrom Select下选择 CLX_LBG_OpenDCI_Dbc_Only_Purley_ReferenceSetting,然后点击Apply和Click to Connect。将startCscripts脚本(注错脚本)放在C盘根目录下(注意:需放在一个没有中文文件夹的路径)。双击打开startCscripts脚本,依次运行以下三条命令,实现CPU IERR注错:
(1) >>halt
(2) >>ei.injectIERR()
(3) >>go
需要说明的是,以上只是实现CPU IERR注错的一种方式,本领域技术人员也可根据需要选择其他实现CPU IERR注错的方式。
实施例三
如图3所示,本实施例提供一种测试BMC ACD稳定性的装置,包括以下功能模块,
触发注错模块11:触发测试节点进行CPU IERR注错;
触发抓取保存文件模块12:触发抓取并保存报错文件;
检查文件模块13:检查报错文件是否完整且正确;
稳定性判断模块14:若报错文件完整且正确,则BMC ACD稳定,否则不稳定。
本实施例触发注错模块执行多次触发测试节点进行CPU IERR注错的操作,以确保测试的准确性和有效性。
在触发下一次注错前,控制测试节点重启,以使测试节点恢复为正常状态,便于下一次注错测试。因此,该装置还包括控制重启模块15:触发注错模块触发下一次注错前,控制测试节点重启。
实施例四
本实施例提供一种终端,该终端包括处理器和存储器。
存储器用于存储处理器的执行指令。存储器可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器中的执行指令由处理器执行时,使得终端能够执行以下上述方法实施例中的部分或全部步骤。
处理器为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(IntegratedCircuit,简称IC) 组成,例如可以由单颗封装的IC 所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。
实施例五
本实施例提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:randomaccess memory,简称:RAM)等。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

Claims (10)

1.一种测试BMC ACD稳定性的方法,其特征在于,包括以下步骤:
触发测试节点进行CPU IERR注错;
触发抓取并保存报错文件;
检查报错文件是否完整且正确;
若完整且正确,则BMC ACD稳定,否则不稳定。
2.根据权利要求1所述的测试BMC ACD稳定性的方法,其特征在于,本方法中多次触发测试节点进行CPU IERR注错,每次触发注错后,触发一次抓取并保存报错文件。
3.根据权利要求2所述的测试BMC ACD稳定性的方法,其特征在于,触发下一次注错前,控制测试节点重启。
4.根据权利要求2或3所述的测试BMC ACD稳定性的方法,其特征在于,执行完预设次数的注错和抓取保存报错文件之后,再检查全部报错文件是否完整且正确。
5.根据权利要求1、2或3所述的测试BMC ACD稳定性的方法,其特征在于,所述触发CPUIERR注错,具体包括,
将测试控制端BIOS选项中包含直连的选择设置为使能;
将测试控制端与测试节点直连;
运行注错脚本,触发测试节点BIOS调取注错命令对测试节点进行CPU IERR注错。
6.一种测试BMC ACD稳定性的装置,其特征在于,包括,
触发注错模块:触发测试节点进行CPU IERR注错;
触发抓取保存文件模块:触发抓取并保存报错文件;
检查文件模块:检查报错文件是否完整且正确;
稳定性判断模块:若报错文件完整且正确,则BMC ACD稳定,否则不稳定。
7.根据权利要求6所述的测试BMC ACD稳定性的装置,其特征在于,触发注错模块执行多次触发测试节点进行CPU IERR注错的操作。
8.根据权利要求7所述的测试BMC ACD稳定性的装置,其特征在于,该装置还包括,
控制重启模块:触发注错模块触发下一次注错前,控制测试节点重启。
9.一种终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-5任一项所述的方法。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-5任一项所述的方法。
CN202010307859.2A 2020-04-17 2020-04-17 一种测试bmc acd稳定性的方法、装置、终端及存储介质 Pending CN111488288A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010307859.2A CN111488288A (zh) 2020-04-17 2020-04-17 一种测试bmc acd稳定性的方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010307859.2A CN111488288A (zh) 2020-04-17 2020-04-17 一种测试bmc acd稳定性的方法、装置、终端及存储介质

Publications (1)

Publication Number Publication Date
CN111488288A true CN111488288A (zh) 2020-08-04

Family

ID=71798036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010307859.2A Pending CN111488288A (zh) 2020-04-17 2020-04-17 一种测试bmc acd稳定性的方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN111488288A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112463481A (zh) * 2020-11-23 2021-03-09 苏州浪潮智能科技有限公司 一种基于远程xdp功能测试bmc故障诊断功能的方法及系统
CN114116330A (zh) * 2021-10-22 2022-03-01 苏州浪潮智能科技有限公司 服务器性能测试方法、系统、终端及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04188353A (ja) * 1990-11-22 1992-07-06 Nec Corp 周辺制御装置の障害診断方式
CN1949182A (zh) * 2005-10-14 2007-04-18 戴尔产品有限公司 用于将可恢复的错误记入日志的系统和方法
US20150006962A1 (en) * 2013-06-27 2015-01-01 Robert C. Swanson Memory dump without error containment loss
CN109656768A (zh) * 2018-12-27 2019-04-19 郑州云海信息技术有限公司 一种查看cpu ieer的测试方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04188353A (ja) * 1990-11-22 1992-07-06 Nec Corp 周辺制御装置の障害診断方式
CN1949182A (zh) * 2005-10-14 2007-04-18 戴尔产品有限公司 用于将可恢复的错误记入日志的系统和方法
US20150006962A1 (en) * 2013-06-27 2015-01-01 Robert C. Swanson Memory dump without error containment loss
CN109656768A (zh) * 2018-12-27 2019-04-19 郑州云海信息技术有限公司 一种查看cpu ieer的测试方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吴玲琳等: "《软件测试技术任务驱动式教程》", 30 June 2017, 北京理工大学出版社 *
孙海峰: "《Web安全程序设计与实践》", 1 April 2019, 西安电子科技大学出版社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112463481A (zh) * 2020-11-23 2021-03-09 苏州浪潮智能科技有限公司 一种基于远程xdp功能测试bmc故障诊断功能的方法及系统
CN114116330A (zh) * 2021-10-22 2022-03-01 苏州浪潮智能科技有限公司 服务器性能测试方法、系统、终端及存储介质
CN114116330B (zh) * 2021-10-22 2024-05-24 苏州浪潮智能科技有限公司 服务器性能测试方法、系统、终端及存储介质

Similar Documents

Publication Publication Date Title
CN103186461B (zh) 一种现场数据的保存方法和恢复方法以及相关装置
US20240012706A1 (en) Method, system and apparatus for fault positioning in starting process of server
CN108388514B (zh) 接口自动化测试方法、装置、设备及计算机可读存储介质
CN112084113B (zh) 基于嵌入式仿真验证软件的可配置自动化测试方法及系统
CN108572895B (zh) 一种Linux下自动检查软硬件配置的稳定性测试方法
CN111488288A (zh) 一种测试bmc acd稳定性的方法、装置、终端及存储介质
CN116382968B (zh) 外部设备的故障检测方法以及装置
CN111984524A (zh) 故障注入方法、故障模拟方法、故障注入装置及存储介质
CN114116330B (zh) 服务器性能测试方法、系统、终端及存储介质
CN115620799A (zh) 基于固件仿真的故障现场回溯方法、设备及可读存储介质
CN110704315B (zh) 一种嵌入式软件测试的故障注入装置
US20070083792A1 (en) System and method for error detection and reporting
CN111125990A (zh) 一种寄生参数结果正确性的判断方法
CN115756914A (zh) 测试方法、系统及测试平台和测试机器
CN115562918A (zh) 计算机系统故障的测试方法、装置、电子设备及可读介质
CN116820932A (zh) 一种bmc故障诊断方法、装置、设备及介质
CN116401086A (zh) 内存漏斗错误上报机制的测试方法、装置、设备及介质
CN115756935A (zh) 嵌入式软件系统的异常故障定位方法、装置及设备
CN115455431A (zh) 自动化代码安全检测和漏洞修复方法、装置、终端及介质
CN116430835B (zh) 一种Cortex-M微控制器的故障存储与分析方法
CN113094221A (zh) 故障注入方法、装置、计算机设备以及可读存储介质
CN107766251B (zh) 加载image的检测方法、系统、设备及可读存储介质
CN113900914A (zh) 异常处理方法、装置、电子设备及计算机存储介质
CN111427623A (zh) 程序退出方法、装置、计算机设备和存储介质
US20240231347A1 (en) Fault injection test method and apparatus, and fault injection method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200804

RJ01 Rejection of invention patent application after publication