CN107145426A - 一种bmc 测试me状态异常的方法 - Google Patents

一种bmc 测试me状态异常的方法 Download PDF

Info

Publication number
CN107145426A
CN107145426A CN201710322343.3A CN201710322343A CN107145426A CN 107145426 A CN107145426 A CN 107145426A CN 201710322343 A CN201710322343 A CN 201710322343A CN 107145426 A CN107145426 A CN 107145426A
Authority
CN
China
Prior art keywords
status
bmc
states
tests
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710322343.3A
Other languages
English (en)
Inventor
戴明甫
熊婷凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710322343.3A priority Critical patent/CN107145426A/zh
Publication of CN107145426A publication Critical patent/CN107145426A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种BMC测试ME状态异常的方法,所述方法通过在系统下刷新ME,发生短暂的BMC—ME连接中断,短暂触发ME_FW_Status异常,通过ipmi对BMC中ME_FW_Statussensor的不间断读取,并通过对返回结果的判断sensor的状态,达到监控该sensor测试的效果。本发明方法可以持续验证ME_FW_Status的状态,可以自主设定运行的次数和读取的机台,可以判断ME_FW_Status异常情况,可以快速定位问题log,分析问题原因。

Description

一种BMC 测试ME状态异常的方法
技术领域
本发明涉及测试资源优化技术领域,具体涉及一种BMC 测试ME状态异常的方法。
背景技术
ME 作为BIOS 的核心模块,BMC 与硬件间的通信很多通过ME 获取,故监控管理中需要对ME的状态实时进行监控,但是出于实际的技术考量,监控管理界面对数据的刷新以分钟计,所以对于各模块短暂的异常很难在界面中实时的反应出来。
发明内容
本发明要解决的技术问题是:本发明针对以上问题,提供一种BMC 测试ME状态异常的方法,可解决BMC 对于ME_FW_Status 正常及异常状态的检测,增加测试覆盖率。
本发明所采用的技术方案为:
一种BMC 测试ME状态异常的方法,所述方法通过在系统下刷新ME,发生短暂的BMC—ME连接中断,短暂触发ME_FW_Status异常,通过ipmi对BMC 中ME_FW_Status sensor的不间断读取,并通过对返回结果的判断sensor 的状态,达到监控该sensor测试的效果。
所述方法通过实时侦测ME 状态的脚本实现,测试过程中,操作人员根据脚本运行的实际情况,同步刷新web 界面,查看对应的sensor状态,对比ipmi读取结果,达到测试ME状态的效果。
所述脚本通过sdr实时读取,截取ME_FW_Status的状态信息,通过对ME_FW_Status返回信息的读取判断,从而得出ME_FW_Status的实际状态。
所述方法通过在预留的短接跳冒,触发ME 异常。
所述方法实现步骤如下:
1)通过host端远程登陆服务器,运行脚本,得出ME_FW_Status的状态显示,脚本根据提前预设的测试次数进行测试;
2)在待测端系统下运行ME 刷新的命令,更新ME;
3)当 ME 完成更新之后,ME 与BMC 断开连接,ME_FW_Status状态异常,ME 重启之后恢复正常;
4)根据脚本运行的实际情况,同步刷新web 界面,查看对应的sensor状态,对比ipmi读取结果;
5)每次读取ME_FW_Status状态的判断在屏幕上输出判断结果,若发生错误,根据cycletest的数量及时定位出log 的位置,分析log出错的原因,快速定位;若发生ME—BMC连接中断,屏幕上同步输出判断结果,提示测试人员连接已经中断。
本发明的有益效果为:
本发明方法可以持续验证ME_FW_Status的状态,可以自主设定运行的次数和读取的机台,可以判断ME_FW_Status异常情况,可以快速定位问题log,分析问题原因。
具体实施方式
根据具体实施方式对本发明进一步说明:
实施例1
一种BMC 测试ME状态异常的方法,基于“系统下刷新ME,可短暂的触发ME 异常”的情况,所述方法通过在系统下刷新ME,发生短暂的BMC—ME 连接中断,短暂触发ME_FW_Status异常,通过ipmi对BMC 中ME_FW_Status sensor的不间断读取,并通过对返回结果的判断sensor 的状态,达到监控该sensor测试的效果。
ME 在系统下的更新时,会发生短暂的BMC—ME 连接中断,通过对BMC 中ME_FW_Status sensor的不间断读取,从而判断sensor 的状态,达到监控该sensor测试的效果。
实施例2
在实施例1的基础上,本实施例所述方法通过实时侦测ME 状态的脚本实现,测试过程中,操作人员根据脚本运行的实际情况,同步刷新web 界面,查看对应的sensor状态,对比ipmi读取结果,达到测试ME 状态的效果。
通过在系统下刷新ME,ipmi不间断的读取ME_FW_Status信息,通过返回结果的判断直接得出结果判断
ME 正常返回值:ME_FW_Status| C0h | ok | 34.0 | 0 reserved
ME 异常返回值:ME_FW_Status | C0h | unc | 34.0 | 0 reserved
ME_FW_Status | C0h | ns | 34.0 | No Readin
实施例3
在实施例1或2的基础上,本实施例所述脚本通过sdr实时读取,截取ME_FW_Status的状态信息,通过对ME_FW_Status返回信息的读取判断,从而得出ME_FW_Status的实际状态。
ipmitoolPath = (r'D:\Study\Python\ipmitool\ipmitool.exe')
//ipmi路径
bmcip= '192.168.0.102
/// ip 输出
def sendCmd(cmd):
p = subprocess.Popen(cmd, shell = True,stdout=subprocess.PIPE)
return p.stdout.read()
//命令发送函数定义
def me_status_count()
Sdr_read = sendCmd('{0} -I lanplus -H {1} -U admin -P admin sdr elist'.format(ipmitoolPath,bmcip)).decode('utf-8')
//sdr读取
f = open(r'D:\test\sdrelist.txt','a')
f.write(Sdr_read)
f.close()
读取内容存储
Sdr_count = len(open(r'D:\test\sdrelist.txt').readlines())
//文件行数读取
for n in range(0,Sdr_count+1):
line = linecache.getline(r'D:\test\sdrelist.txt',n)
//ME_status 状态行读取
if line.find("ME_FW_Status") != -1:
for i in range(1,9000000000):
//测试次数设置
print("Test cycle {0}".format(i))
sdr_reading = sendCmd('{0} -I lanplus -H {1} -U admin -P admin sdrelist'.format(ipmitoolPath,bmcip)).decode('utf-8')
f = open(r'D:\test\sdrelist.txt','a')
f.write(sdr_reading)
f.close()
Me_status_read = linecache.getline(r'D:\test\sdrelist.txt',(Sdr_count*(i-1) + n))
print(Me_status_read)
if((Me_status_read.find("unc")) or (Me_status_read.find("ns"))):
//结果判断
print("ME STATUS CHANGE")
def main():
file1=r'D:\test\sdrelist.txt'
if os.path.exists(file1):
os.remove(file1)
存储文件判断及清楚
me_status_count()
实施例4
在实施例3的基础上,本实施例所述方法通过在预留的短接跳冒,触发ME 异常。
实施例5
在实施例4的基础上,本实施例所述方法实现步骤如下:
1)通过host端远程登陆服务器,运行脚本,得出ME_FW_Status的状态显示,脚本根据提前预设的测试次数进行测试;
2)在待测端UEFI或者Windows系统下运行ME 刷新的命令,更新ME;
3)当 ME 完成更新之后,ME 与BMC 断开连接,ME_FW_Status状态异常,ME 重启之后恢复正常;
4)根据脚本运行的实际情况,同步刷新web 界面,查看对应的sensor状态,对比ipmi读取结果;
5)每次读取ME_FW_Status状态的判断在屏幕上输出判断结果,若发生错误,根据cycletest的数量及时定位出log 的位置,分析log出错的原因,快速定位;若发生ME—BMC连接中断,屏幕上同步输出判断结果,提示测试人员连接已经中断。
实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (5)

1.一种BMC 测试ME状态异常的方法,其特征在于,所述方法通过在系统下刷新ME,发生短暂的BMC—ME 连接中断,短暂触发ME_FW_Status异常,通过ipmi对BMC 中ME_FW_Statussensor的不间断读取,并通过对返回结果的判断sensor 的状态,达到监控该sensor测试的效果。
2.根据权利要求1所述的一种BMC 测试ME状态异常的方法,其特征在于,所述方法通过实时侦测ME 状态的脚本实现,测试过程中,操作人员根据脚本运行的实际情况,同步刷新web 界面,查看对应的sensor状态,对比ipmi读取结果,达到测试ME 状态的效果。
3.根据权利要求1或2所述的一种BMC 测试ME状态异常的方法,其特征在于,所述脚本通过sdr实时读取,截取ME_FW_Status的状态信息,通过对ME_FW_Status返回信息的读取判断,从而得出ME_FW_Status的实际状态。
4.根据权利要求3所述的一种BMC 测试ME状态异常的方法,其特征在于,所述方法通过在预留的短接跳冒,触发ME 异常。
5.根据权利要求4所述的一种BMC 测试ME状态异常的方法,其特征在于,所述方法实现步骤如下:
1)通过host端远程登陆服务器,运行脚本,得出ME_FW_Status的状态显示,脚本根据提前预设的测试次数进行测试;
2)在待测端系统下运行ME 刷新的命令,更新ME;
3)当 ME 完成更新之后,ME 与BMC 断开连接,ME_FW_Status状态异常,ME 重启之后恢复正常;
4)根据脚本运行的实际情况,同步刷新web 界面,查看对应的sensor状态,对比ipmi读取结果;
5)每次读取ME_FW_Status状态的判断在屏幕上输出判断结果,若发生错误,根据cycletest的数量及时定位出log 的位置,分析log出错的原因,快速定位;若发生ME—BMC连接中断,屏幕上同步输出判断结果,提示测试人员连接已经中断。
CN201710322343.3A 2017-05-09 2017-05-09 一种bmc 测试me状态异常的方法 Pending CN107145426A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710322343.3A CN107145426A (zh) 2017-05-09 2017-05-09 一种bmc 测试me状态异常的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710322343.3A CN107145426A (zh) 2017-05-09 2017-05-09 一种bmc 测试me状态异常的方法

Publications (1)

Publication Number Publication Date
CN107145426A true CN107145426A (zh) 2017-09-08

Family

ID=59778371

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710322343.3A Pending CN107145426A (zh) 2017-05-09 2017-05-09 一种bmc 测试me状态异常的方法

Country Status (1)

Country Link
CN (1) CN107145426A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108459942A (zh) * 2018-03-15 2018-08-28 联想(北京)有限公司 一种数据处理方法、装置及存储介质
CN108845939A (zh) * 2018-06-12 2018-11-20 郑州云海信息技术有限公司 一种服务器BMC Web硬件信息监控的测试方法及系统
CN111290920A (zh) * 2020-02-28 2020-06-16 苏州浪潮智能科技有限公司 基于peci总线测试cpu温度的系统、方法及存储介质
CN116915583A (zh) * 2023-09-12 2023-10-20 苏州浪潮智能科技有限公司 通信异常的诊断方法、其装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120151233A1 (en) * 2010-12-14 2012-06-14 Hon Hai Precision Industry Co., Ltd. Network device for controlling power consumption and method employing the same
CN104317692A (zh) * 2014-10-27 2015-01-28 浪潮电子信息产业股份有限公司 一种me fw在线更新稳定性的自动测试方法
CN104360922A (zh) * 2014-10-20 2015-02-18 浪潮电子信息产业股份有限公司 一种基于ipmitool的自动监测BMC工作状态的方法
CN104615472A (zh) * 2015-03-06 2015-05-13 浪潮集团有限公司 一种防止在线刷新bios+me fw失败的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120151233A1 (en) * 2010-12-14 2012-06-14 Hon Hai Precision Industry Co., Ltd. Network device for controlling power consumption and method employing the same
CN104360922A (zh) * 2014-10-20 2015-02-18 浪潮电子信息产业股份有限公司 一种基于ipmitool的自动监测BMC工作状态的方法
CN104317692A (zh) * 2014-10-27 2015-01-28 浪潮电子信息产业股份有限公司 一种me fw在线更新稳定性的自动测试方法
CN104615472A (zh) * 2015-03-06 2015-05-13 浪潮集团有限公司 一种防止在线刷新bios+me fw失败的方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108459942A (zh) * 2018-03-15 2018-08-28 联想(北京)有限公司 一种数据处理方法、装置及存储介质
CN108845939A (zh) * 2018-06-12 2018-11-20 郑州云海信息技术有限公司 一种服务器BMC Web硬件信息监控的测试方法及系统
CN111290920A (zh) * 2020-02-28 2020-06-16 苏州浪潮智能科技有限公司 基于peci总线测试cpu温度的系统、方法及存储介质
CN111290920B (zh) * 2020-02-28 2022-12-23 苏州浪潮智能科技有限公司 基于peci总线测试cpu温度的系统、方法及存储介质
CN116915583A (zh) * 2023-09-12 2023-10-20 苏州浪潮智能科技有限公司 通信异常的诊断方法、其装置及电子设备
CN116915583B (zh) * 2023-09-12 2024-01-26 苏州浪潮智能科技有限公司 通信异常的诊断方法、其装置及电子设备

Similar Documents

Publication Publication Date Title
Nguyen et al. Fchain: Toward black-box online fault localization for cloud systems
CN110050441B (zh) 在故障情况下实时捕获流量以进行协议调试
Sauvanaud et al. Anomaly detection and root cause localization in virtual network functions
CN107145426A (zh) 一种bmc 测试me状态异常的方法
US11687391B2 (en) Serializing machine check exceptions for predictive failure analysis
CN102439888B (zh) 一种快速通道互连链路监控方法和设备及系统
CN106155883B (zh) 一种虚拟机可靠性测试方法及装置
US9384108B2 (en) Functional built-in self test for a chip
CN109783262A (zh) 故障数据处理方法、装置、服务器及计算机可读存储介质
US8639986B2 (en) Firmware tracing in a storage data communication system
CN109510742B (zh) 一种服务器网卡远程测试方法、装置、终端及存储介质
CN104572385B (zh) 存储器故障检测系统及方法
US20190229998A1 (en) Methods, systems, and computer readable media for providing cloud visibility
CN106407059A (zh) 一种服务器节点测试系统及方法
CN106547653A (zh) 计算机系统故障状态检测方法、装置及系统
CN106649019B (zh) 一种基于串口的整机自动化pcie通信质量测试方法
CN106405383B (zh) 基于视觉检测技术的嵌入式板卡自动测试系统及方法
US20220253375A1 (en) Systems and methods for device testing to avoid resource conflicts for a large number of test scenarios
CN115617610A (zh) 一种基于Kubernetes的旁路无侵入式应用运行中的全行为监测方法及系统
CN105975373A (zh) 软件程序的运行监测方法及装置
CN102959521B (zh) 计算机系统的管理方法以及管理系统
CN114003417B (zh) 实现raid卡故障自动转存的方法、装置及存储介质
JP2012150661A (ja) プロセッサ動作検査システム、及びその検査方法
Ungar Economic evaluation of testability and diagnosability for commercial off the shelf equipment
CN114816822A (zh) 一种基于内存故障的服务器管理方法、装置以及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170908