CN107656848A - 一种验证bmc可存储sel条目数量和sel覆盖功能的方法 - Google Patents

一种验证bmc可存储sel条目数量和sel覆盖功能的方法 Download PDF

Info

Publication number
CN107656848A
CN107656848A CN201710868720.3A CN201710868720A CN107656848A CN 107656848 A CN107656848 A CN 107656848A CN 201710868720 A CN201710868720 A CN 201710868720A CN 107656848 A CN107656848 A CN 107656848A
Authority
CN
China
Prior art keywords
sel
bmc
event
entries
store
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710868720.3A
Other languages
English (en)
Inventor
周志超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710868720.3A priority Critical patent/CN107656848A/zh
Publication of CN107656848A publication Critical patent/CN107656848A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法,包括:通过命令查看BMC可以存储的SEL总条目数量;远程读取服务器当前的传感器清单,得到每个传感器对应的ID;创建可在EFI环境下运行的批处理文件,将其拷贝到待测试的服务器存储盘上,并进入EFI环境运行文件;进入BMC的SEL页面查看记录的日志信息,若最后一个事件的ID等于S1中得到的SEL总条目数,表示此BMC没有覆盖功能,若最后一个事件的ID大于S1中得到的SEL条目数,且第一个事件的ID不为1,并且最后一个事件的ID减去第一个事件的ID的结果等于S1中得到的SEL条目数,表示此BMC含有覆盖功能。本发明解决了现有技术中手动产生事件日志费时费力的问题,提高了测试效率和产品质量。

Description

一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法
技术领域
本发明涉及服务器技术领域,具体来说涉及一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法。
背景技术
IPMI是管理基于Intel结构的企业系统中所使用的外围设备而采用的一种工业标准,其针对大量监控、控制和自动回复服务器的作业提供智能型的管理方式,用户可以利用IPMI来监视服务器的物理健康特征,如温度、电压、风扇工作状态及电源状态等。IPMI的核心是基板管理控制器BMC,基板管理控制器并不依赖于服务器的处理器、BIOS或操作系统来工作,而是一个单独在系统内运行的无代理管理子系统,其重要功能之一是故障日志记录和SNMP警报发送、访问系统事件日志SEL和传感器状况,也就是对服务器的传感器和系统其它故障有记录存储的功能,并且其记录的故障日志可以被我们访问查看。
Ipmitool是一种可用在Linux系统下的命令行方式的ipmi平台管理工具,通过它可以实现获取传感器的信息、显示系统日志内容、网络远程开关机等功能,并且通过BMCipmi可以监控各个传感器的数据并记录各种事件的日志,当各个传感器出现异常时,异常信息将被当做一个事件记录在BMC的SEL中。由于BMC是一个硬件芯片,所以它记录的SEL数量是有条数限制的,当服务器记录的SEL条数写满时,通常有两种处理方式,一种是最大条数写满时不在记录SEL信息,同时发出警报提示用户;另一种是不发出报警,而是保存最新的日志信息并自动覆盖之前的记录,但总的条目数量保持不变。现有技术中,只能通过产生新的SEL事件日志来确认BMC存储的实际最大SEL条目数量,但由于一般的SEL条目总数有数千条,靠手动产生事件日志费时费力、效率低下。
发明内容
本发明的目的在于提供一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法,用于在EFI环境下确认BMC存储的最大SEL条目数量及它是否会覆盖之前的SEL记录,提高测试效率。
为实现上述目的,本发明采用以下技术方案:
一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法,所述方法包括以下步骤:
S1、通过命令查看BMC可以存储的SEL总条目数量;
S2、远程读取服务器当前的传感器清单,得到每个传感器对应的ID;
S3、创建可在EFI环境下运行的批处理文件,将创建的批处理文件拷贝到待测试的服务器存储盘上,并进入服务器的EFI环境运行此文件;
S4、进入BMC的SEL页面查看记录的日志信息,若最后一个事件的ID等于所述S1中得到的SEL总条目数,则表示此BMC没有覆盖功能;若最后一个事件的ID大于所述S1中得到的SEL条目数,且第一个事件的ID不为1,并且最后一个事件的ID减去第一个事件的ID的结果等于S1中得到的SEL条目数,则表示此BMC含有覆盖功能。
若最后一个事件的ID小于所述S1中得到的SEL条目数,或者最后一个事件的ID减去第一个事件的ID的结果小于S1中得到的SEL条目数,则表示实际的SEL存储条目小于理论值,说明当前BMC芯片实际存储SEL条目数存在问题。
作为一种优化,在所述的S1中,用于查看BMC存储的SEL总条目数量的命令为:GetSEL Allocation Info[NetFn,Cmd]=[Storage(0A),41h](ipmitool 0A 41),其中,返回值得到的第2、3位就是SEL的总条目数,并且第3位是高位,第2位是低位。
作为一种优化,在所述的S2中,用于读取服务器当前传感器清单的命令为ipmitool sdr elist。
作为一种优化,在所述的S3中,用于创建可在EFI环境下运行批处理文件的命令为cmdtool.efi 20 28 44 30 00 02 00 00 00 00 20 00 04 02 10 0A 2B 00 00。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
本发明实施例提出的一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法,在EFI环境下创建可运行的批处理文件,并且批处理文件采用符合IPMI2.0协议的命令,保证了所有使用BMC芯片的服务器均可使用。该批处理命令通过循环产生新的SEL信息来验证SEL实际可存储的总条目数量,并且验证了SEL是否含有覆盖功能、如果没有覆盖功能服务器是否会报警的问题。本发明方案的实施,可应用在所有带BMCSEL功能的服务器上,并且可在EFI环境下运行,避免了使用DOS启动的U盘等外接设备,解决了手动产生事件日志费时费力的问题,提高了测试效率和产品质量。
附图说明
图1是本发明实施例提供的一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法的流程示意图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为方便对本发明技术方案的理解,对本发明中涉及的英文缩予以解释和说明。
BMC:Baseboard Management Controller,基板管理控制器;
IPMI:ntelligent Platform Management Interface,智能型平台管理接口;
EFI:Extensible Firmware Interface,一种可扩展固件接口,类似于一个低阶的操作系统,并且具有操控所有硬件资源的能力;
SEL:System Event Log,系统事件日志。
图1所示为本实施例一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法的实现流程图,所述方法包括以下步骤:
S1、通过命令查看BMC可以存储的SEL总条目数量;
S2、远程读取服务器当前的传感器清单,得到每个传感器对应的ID;
S3、创建可在EFI环境下运行的批处理文件,将创建的批处理文件拷贝到待测试的服务器存储盘上,并进入服务器的EFI环境运行此文件;
S4、进入BMC的SEL页面查看记录的日志信息,若最后一个事件的ID等于所述S1中得到的SEL总条目数,则表示此BMC没有覆盖功能;若最后一个事件的ID大于所述S1中得到的SEL条目数,且第一个事件的ID不为1,并且最后一个事件的ID减去第一个事件的ID的结果等于S1中得到的SEL条目数,则表示此BMC含有覆盖功能;若最后一个事件的ID小于所述S1中得到的SEL条目数,或者最后一个事件的ID减去第一个事件的ID的结果小于S1中得到的SEL条目数,则表示实际的SEL存储条目小于理论值,说明当前BMC芯片实际存储SEL条目数存在问题。
具体而言,在所述的S1中,通过命令“Get SEL Allocation Info[NetFn,Cmd]=[Storage(0A),41h](ipmitool 0A 41)”查看BMC存储的SEL总条目数量的命令,并得到返回值为“37 0e 12 00 00 00 00 00 01”,且第一位返回值00在IPMI中不显示。通过IPMI SPEC协议可知,返回值得到的第2、3位就是SEL的总条目数,并且第3位是高位,第2位是低位,从而得到总的SEL的条目总数量为0e 37,转换为十进制为3639。
在所述的S2中,通过命令“ipmitool sdr elist”远程读取服务器当前的传感器清单,得到每个传感器对应的ID。
由于EFI环境下不允许.bat的批处理,因此在所述的S3中,创建可在EFI环境下运行的.nsh批处理文件,采用的批处理命令为
:loop
cmdtool.efi 20 28 44 30 00 02 00 00 00 00 20 00 04 02 10 0A 2B 00 00
goto loop
即创建一个LOOP循环,其中,第一位20等于raw;28对应0A;44为添加一个SEL条目;30 00为记录ID,由于事件ID会覆盖这两位,所以该两位可以为其他值;02表示普通的系统事件记录;00 00 00 00四位表示这个事件发生的时间和当时BMC时间一致;20 00表示它的发生器ID;04表示这个事件时间消息的格式版本;02表示这个事件代表的传感器类型为电压;10表示这个传感器对应的ID;0A表示为一般的声明事件,且事件类型代码为离散;后面3位事件数据0B 00 00为完全冗余已经恢复。修改代表传感器类型的位和传感器对应的ID位,使其与所述S2中得到的传感器信息一致。
接下来,将上面做好的.nsh文件拷贝到要测试的服务器存储盘上,在BIOS中进入服务器的EFI环境运行此.nsh文件。由于要写入几千条命令,因此该步骤需要5到10分钟的等待时间。
最后,进入BMC的SEL页面查看记录的日志信息,如果最后一个事件的ID等于所述S1中得到的SEL总条目数,即最后一条信息的ID为3639,表示此BMC没有覆盖功能;如果最后一个事件的ID大于所述S1中得到的SEL条目数,且第一个事件的ID不为1,并且最后一个事件的ID减去第一个事件的ID的结果等于S1中得到的SEL条目数3639,则表示此BMC含有覆盖功能;如果最后一个事件的ID小于所述S1中得到的SEL条目数,或者最后一个事件的ID减去第一个事件的ID的结果小于S1中得到的SEL条目数,则表示实际的SEL存储条目小于理论值,说明当前BMC芯片实际存储SEL条目数存在问题。
本实施例的验证BMC可存储SEL条目数量和SEL覆盖功能的方法,在EFI环境下创建可运行的批处理文件,并且批处理命令通过循环产生新的SEL信息来验证SEL实际可存储的总条目数量,验证了SEL是否含有覆盖功能及如果没有覆盖功能服务器是否会报警的问题。本方案可应用在所有带BMC SEL功能的服务器上,避免了手动验证,提高了测试效率。
以上所述仅为本发明的较佳实施例而已,并不用以限定本发明,对于本技术领域的技术人员来说,在不脱离本发明原理的前提下所作的任何修改、改进和等同替换等,均包含在本发明的保护范围内。

Claims (5)

1.一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法,其特征在于,所述方法包括以下步骤:
S1、通过命令查看BMC可以存储的SEL总条目数量;
S2、远程读取服务器当前的传感器清单,得到每个传感器对应的ID;
S3、创建可在EFI环境下运行的批处理文件,将创建的批处理文件拷贝到待测试的服务器存储盘上,并进入服务器的EFI环境运行此文件;
S4、进入BMC的SEL页面查看记录的日志信息,若最后一个事件的ID等于所述S1中得到的SEL总条目数,表示此BMC没有覆盖功能;若最后一个事件的ID大于所述S1中得到的SEL条目数,且第一个事件的ID不为1,并且最后一个事件的ID减去第一个事件的ID的结果等于S1中得到的SEL条目数,表示此BMC含有覆盖功能。
2.根据权利要求1所述的一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法,其特征在于,在所述的S4中,若最后一个事件的ID小于所述S1中得到的SEL条目数,或者最后一个事件的ID减去第一个事件的ID的结果小于S1中得到的SEL条目数,表示实际的SEL存储条目小于理论值。
3.根据权利要求1所述的一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法,其特征在于,在所述的S1中,用于查看BMC存储的SEL总条目数量的命令为“Get SEL AllocationInfo[NetFn,Cmd]=[Storage(0A),41h](ipmitool 0A 41)”,返回值得到的第2、3位就是SEL的总条目数,并且第3位是高位,第2位是低位。
4.根据权利要求1所述的一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法,其特征在于,在所述的S2中,用于读取服务器当前传感器清单的命令为“ipmitool sdr elist”。
5.根据权利要求1所述的一种验证BMC可存储SEL条目数量和SEL覆盖功能的方法,其特征在于,在所述的S3中,用于创建可在EFI环境下运行批处理文件的命令为“cmdtool.efi20 28 44 30 00 02 00 00 00 00 20 00 04 02 10 0A 2B 00 00”。
CN201710868720.3A 2017-09-22 2017-09-22 一种验证bmc可存储sel条目数量和sel覆盖功能的方法 Pending CN107656848A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710868720.3A CN107656848A (zh) 2017-09-22 2017-09-22 一种验证bmc可存储sel条目数量和sel覆盖功能的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710868720.3A CN107656848A (zh) 2017-09-22 2017-09-22 一种验证bmc可存储sel条目数量和sel覆盖功能的方法

Publications (1)

Publication Number Publication Date
CN107656848A true CN107656848A (zh) 2018-02-02

Family

ID=61131310

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710868720.3A Pending CN107656848A (zh) 2017-09-22 2017-09-22 一种验证bmc可存储sel条目数量和sel覆盖功能的方法

Country Status (1)

Country Link
CN (1) CN107656848A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726130A (zh) * 2019-01-02 2019-05-07 浪潮商用机器有限公司 Bmc事件日志策略的测试系统、方法、设备及存储介质
TWI748652B (zh) * 2020-09-18 2021-12-01 英業達股份有限公司 基於基板管理控制器的伺服器測試系統及其方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7574624B2 (en) * 2007-02-20 2009-08-11 Inventec Corporation Integrated test method on multi-operating system platform
CN103389124A (zh) * 2012-05-10 2013-11-13 鸿富锦精密工业(深圳)有限公司 传感器测试的方法及系统
CN103902435A (zh) * 2012-12-26 2014-07-02 鸿富锦精密工业(深圳)有限公司 测试服务器的日志事件记录系统及方法
CN105426297A (zh) * 2015-12-24 2016-03-23 北京恒华伟业科技股份有限公司 一种系统性能测试方法及装置
CN105743707A (zh) * 2016-04-01 2016-07-06 浪潮电子信息产业股份有限公司 一种基于Redhat系统测试BMC日志解析功能的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7574624B2 (en) * 2007-02-20 2009-08-11 Inventec Corporation Integrated test method on multi-operating system platform
CN103389124A (zh) * 2012-05-10 2013-11-13 鸿富锦精密工业(深圳)有限公司 传感器测试的方法及系统
CN103902435A (zh) * 2012-12-26 2014-07-02 鸿富锦精密工业(深圳)有限公司 测试服务器的日志事件记录系统及方法
CN105426297A (zh) * 2015-12-24 2016-03-23 北京恒华伟业科技股份有限公司 一种系统性能测试方法及装置
CN105743707A (zh) * 2016-04-01 2016-07-06 浪潮电子信息产业股份有限公司 一种基于Redhat系统测试BMC日志解析功能的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726130A (zh) * 2019-01-02 2019-05-07 浪潮商用机器有限公司 Bmc事件日志策略的测试系统、方法、设备及存储介质
TWI748652B (zh) * 2020-09-18 2021-12-01 英業達股份有限公司 基於基板管理控制器的伺服器測試系統及其方法

Similar Documents

Publication Publication Date Title
US10175973B2 (en) Microcode upgrade in a storage system
US9183106B2 (en) System and method for the automated generation of events within a server environment
US20150149754A1 (en) Server and inspecting method thereof
US10509689B2 (en) Method for processing application and terminal
CN108762966A (zh) 系统异常拦截方法、装置、计算机设备及存储介质
CN110851320A (zh) 一种服务器宕机监管方法、系统、终端及存储介质
CN109189627B (zh) 一种硬盘故障监控检测方法、装置、终端及存储介质
US20140089477A1 (en) System and method for monitoring storage machines
US8189458B2 (en) Monitoring system, monitoring device, monitored device, and monitoring method
US10275330B2 (en) Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus
US10135874B1 (en) Compliance management system and method for an integrated computing system
CN111522703A (zh) 监控访问请求的方法、设备和计算机程序产品
CN109858257B (zh) 访问控制方法及装置
CN108459932A (zh) 一种管理raid卡的方法、装置以及设备
US20180082066A1 (en) Secure data erasure in hyperscale computing systems
CN107656848A (zh) 一种验证bmc可存储sel条目数量和sel覆盖功能的方法
US10754748B2 (en) System and method for constructing extensible event log with javascript object notation (JSON) encoded payload data
CN109669845A (zh) 一种云操作系统设备告警通知方法及系统
US20130254588A1 (en) Standby system device, a control method, and a program thereof
CN113487182B (zh) 设备健康状态评估方法、装置、计算机设备和介质
CN115080340A (zh) 软磁盘阵列监控方法、系统、计算机设备和存储介质
CN111352662B (zh) 一种服务器启动顺序控制方法、系统、终端及存储介质
CN102541722A (zh) 一种监控服务器内存的方法以及服务器内存监控系统
US20080216057A1 (en) Recording medium storing monitoring program, monitoring method, and monitoring system
CN109558300B (zh) 一种整机柜告警处理方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180202

RJ01 Rejection of invention patent application after publication