CN111124809B - 一种服务器传感器系统的测试方法及装置 - Google Patents

一种服务器传感器系统的测试方法及装置 Download PDF

Info

Publication number
CN111124809B
CN111124809B CN201911208382.6A CN201911208382A CN111124809B CN 111124809 B CN111124809 B CN 111124809B CN 201911208382 A CN201911208382 A CN 201911208382A CN 111124809 B CN111124809 B CN 111124809B
Authority
CN
China
Prior art keywords
sensor
name
list
server
definition document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911208382.6A
Other languages
English (en)
Other versions
CN111124809A (zh
Inventor
刘子丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN201911208382.6A priority Critical patent/CN111124809B/zh
Publication of CN111124809A publication Critical patent/CN111124809A/zh
Application granted granted Critical
Publication of CN111124809B publication Critical patent/CN111124809B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Abstract

本发明涉及一种服务器传感器系统的测试方法及装置,包括以下步骤:S1:匹配获取传感器定义文档,判断传感器定位文档的属性格式是否正确,正确则继续执行,否则终止测试;S2:输出传感器名称的比较结果,输出两者一致的传感器名称列表,和不一致的传感器名称列表;S3:依次测试全部传感器,根据传感器定义文档与服务器命令查询的传感器列表比较输出的两者都存在的传感器名称列表,对列表中的每个传感器依次测试;S4:根据测试结果,整理日志输出。

Description

一种服务器传感器系统的测试方法及装置
技术领域
本发明属于服务器测试技术领域,具体涉及一种服务器传感器系统的测试方法及装置。
背景技术
服务器有许多硬件模块组成,如CPU在系统运行时会产生热,需要由BMC来读取相关的温度或存在状态,并建立成传感器及SDR,当发生问题时可以产生SEL。当发生系统故障时,可借由查询SEL和精准日志得知当时系统的状态,便于查出故障原因并且可以快速更换硬件,让系统可以在最短时间内恢复运营,并且进一步提升效率。可见Sensor传感器在服务器中起着重要作用,但是目前服务器的交付件中没有专门对传感器定义的系统规格,也没有对支持的告警事件有一定的说明,导致在开发传感器时,比较随意,对传感器实现的功能比较单一,随着客户要求再增加传感器功能,引入不可预估的风险;在测试传感器时,往往很模糊,容易漏测,或者不知道从哪些方面测试传感器,测试内容不全面,且随着监控要求的提高,服务器中的传感器变得越来越多,一个服务器中会存在大概上百个乃至上千个传感器,测试服务器所有传感器的工作量变得越来越大,通过人工的方式进行识别也容易出错,存在很大的风险。为此现有技术中存在的缺陷和不足。
有鉴于此,本发明给出一种服务器传感器系统的测试方法及装置;以解决现有技术中存在的缺陷和不足,是非常有必要的。
发明内容
针对现有技术的上述不足,本发明提供一种服务器传感器系统的测试方法及装置,以解决上述技术问题。
为实现上述目的,本发明给出以下技术方案:
第一方面,本发明提供一种服务器传感器系统的测试方法,包括以下步骤:
S1:匹配获取传感器定义文档,判断传感器定义文档的属性格式是否正确,正确则继续执行,否则终止测试;
S2:输出传感器名称的比较结果,输出两者一致的传感器名称列表,和不一致的传感器名称列表;
S3:依次测试全部传感器,根据传感器定义文档与服务器命令查询的传感器列表比较输出的两者都存在的传感器名称列表,对列表中的每个传感器依次测试;
S4:根据测试结果,整理日志输出。
作为优选,所述步骤S1中,
自动获取匹配传感器定义文档,先获取服务器型号,再获取以服务器型号命名的传感器定义文档,用于比对传感器的相关属性数据;获取到传感器定义文档后,需要先判断文档属性,格式是否正确,如果不正确,终止测试,需要测试人员调整格式,如果正确,继续执行。
作为优选,所述步骤S2中,
以传感器定义文档为基准,依次与服务器上Ipmitool sdr elist 命令返回的传感器列表做比对,输出两者传感器名称一致的列表,和服务器中缺少的传感器列表,再以服务器命令返回的传感器列表为基准,依次与传感器定义文档中传感器名称做比对,输出服务器中多余的传感器列表,执行完成后,输出两者一致的传感器名称列表,和不一致的传感器名称列表(服务器缺少和多余的传感器名称)。
作为优选,所述步骤S3中,
首先检查传感器的编号、EntityID是否一致,检查传感器的状态,状态如果是NS,表示没有检测到,需要记录log,状态是OK,表示传感器正常,接着检查传感器的读值,并根据传感器定义文档确认是否有阈值限制,如为NA,则无限制,如有限制,再判断输出读值是否在阈值范围内,如果在阈值范围内,则结束检查,如果不在阈值范围内,则检查SEL和精准日志,通过传感器定义文档中错误码判断日志是否记录正确。
作为优选,所述步骤S4中,测试过程中每一步执行完成后产生对应的日志,整理日志输出测试结果,包含服务器命令返回的传感器列表与文档中定义的传感器一致的传感器名称、服务器中缺少的传感器名称,服务器中多余的传感器名称,测试通过的传感器名称,测试失败的传感器名称及原因,并给出产生告警的传感器名称、错误码,告警恢复策略,及告警处理建议。
第二方面,本发明提供一种服务器传感器系统的测试装置,包括:
匹配获取传感器定义文档模块,该模块判断传感器定义文档的属性格式是否正确,正确则继续执行,否则终止测试;
输出传感器名称比较结果模块,该模块输出两者一致的传感器名称列表,和不一致的传感器名称列表;
测试传感器模块,该模块根据传感器定义文档与服务器命令查询的传感器列表比较输出的两者都存在的传感器名称列表,对列表中的每个传感器依次测试;
整理测试结果输出模块。
作为优选,所述匹配获取传感器定义文档模块中,
自动获取匹配传感器定义文档,先获取服务器型号,再获取以服务器型号命名的传感器定义文档,用于比对传感器的相关属性数据;获取到传感器定义文档后,需要先判断文档属性,格式是否正确,如果不正确,终止测试,需要测试人员调整格式,如果正确,继续执行。
作为优选,所述输出传感器名称比较结果模块中,
以传感器定义文档为基准,依次与服务器上Ipmitool sdr elist 命令返回的传感器列表做比对,输出两者传感器名称一致的列表,和服务器中缺少的传感器列表,再以服务器命令返回的传感器列表为基准,依次与传感器定义文档中传感器名称做比对,输出服务器中多余的传感器列表,执行完成后,输出两者一致的传感器名称列表,和不一致的传感器名称列表(服务器缺少和多余的传感器名称)。
作为优选,所述测试传感器模块中,
首先检查传感器的编号、EntityID是否一致,检查传感器的状态,状态如果是NS,表示没有检测到,需要记录log,状态是OK,表示传感器正常,接着检查传感器的读值,并根据传感器定义文档确认是否有阈值限制,如为NA,则无限制,如有限制,再判断输出读值是否在阈值范围内,如果在阈值范围内,则结束检查,如果不在阈值范围内,则检查SEL和精准日志,通过传感器定义文档中错误码判断日志是否记录正确。
作为优选,所述整理测试结果输出模块中,测试过程中每一步执行完成后产生对应的日志,整理日志输出测试结果,包含服务器命令返回的传感器列表与文档中定义的传感器一致的传感器名称、服务器中缺少的传感器名称,服务器中多余的传感器名称,测试通过的传感器名称,测试失败的传感器名称及原因,并给出产生告警的传感器名称、错误码,告警恢复策略,及告警处理建议。
本发明的有益效果在于,从传感器设计的维度和告警事件不同维度定义方法,从根本上解决了目前服务器传感器定义不明确,告警事件没有依据可以参考的问题,通过提供测试装置,解决了测试传感器工作量大的问题。快速测试服务器所有传感器(几百个至上千个)与传感器定义文档是否一致,传感器状态和告警日志是否正常记录的问题,大大提高了工作效率,节约了人力资源,降低成本,且能降低人为检查错误的几率。通过检查服务器SEL日志和精准日志,输出整理后的Log,给出存在告警的传感器名称,错误码,告警恢复策略,告警处理建议,还能大大缩减了从SEL日志和精准日志中查找因传感器引起的错误码的时间,使测试人员或运维人员能快速定位和解决服务器的问题。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种服务器传感器系统的测试方法的流程图。
图2是本发明提供的一种服务器传感器系统的测试装置的原理框图。
其中,1-匹配获取传感器定义文档模块,2-输出传感器名称比较结果模块,3-测试传感器模块,4-整理测试结果输出模块。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例1:
如图1所示,本实施例提供的一种服务器传感器系统的测试方法,包括以下步骤:
S1:匹配获取传感器定义文档,判断传感器定义文档的属性格式是否正确,正确则继续执行,否则终止测试;自动获取匹配传感器定义文档,先获取服务器型号,再获取以服务器型号命名的传感器定义文档,用于比对传感器的相关属性数据;获取到传感器定义文档后,需要先判断文档属性,格式是否正确,如果不正确,终止测试,需要测试人员调整格式,如果正确,继续执行。
S2:输出传感器名称的比较结果,输出两者一致的传感器名称列表,和不一致的传感器名称列表;以传感器定义文档为基准,依次与服务器上Ipmitool sdr elist 命令返回的传感器列表做比对,输出两者传感器名称一致的列表,和服务器中缺少的传感器列表,再以服务器命令返回的传感器列表为基准,依次与传感器定义文档中传感器名称做比对,输出服务器中多余的传感器列表,执行完成后,输出两者一致的传感器名称列表,和不一致的传感器名称列表(服务器缺少和多余的传感器名称)。
S3:依次测试全部传感器,根据传感器定义文档与服务器命令查询的传感器列表比较输出的两者都存在的传感器名称列表,对列表中的每个传感器依次测试;首先检查传感器的编号、EntityID是否一致,检查传感器的状态,状态如果是NS,表示没有检测到,需要记录log,状态是OK,表示传感器正常,接着检查传感器的读值,并根据传感器定义文档确认是否有阈值限制,如为NA,则无限制,如有限制,再判断输出读值是否在阈值范围内,如果在阈值范围内,则结束检查,如果不在阈值范围内,则检查SEL和精准日志,通过传感器定义文档中错误码判断日志是否记录正确。
S4:根据测试结果,整理日志输出。测试过程中每一步执行完成后产生对应的日志,整理日志输出测试结果,包含服务器命令返回的传感器列表与文档中定义的传感器一致的传感器名称、服务器中缺少的传感器名称,服务器中多余的传感器名称,测试通过的传感器名称,测试失败的传感器名称及原因,并给出产生告警的传感器名称、错误码,告警恢复策略,及告警处理建议。
实施例2:
如图2所示,本实施例提供的一种服务器传感器系统的测试装置,包括:
匹配获取传感器定义文档模块1,该模块判断传感器定义文档的属性格式是否正确,正确则继续执行,否则终止测试;自动获取匹配传感器定义文档,先获取服务器型号,再获取以服务器型号命名的传感器定义文档,用于比对传感器的相关属性数据;获取到传感器定义文档后,需要先判断文档属性,格式是否正确,如果不正确,终止测试,需要测试人员调整格式,如果正确,继续执行。
输出传感器名称比较结果模块2,该模块输出两者一致的传感器名称列表,和不一致的传感器名称列表;以传感器定义文档为基准,依次与服务器上Ipmitool sdr elist 命令返回的传感器列表做比对,输出两者传感器名称一致的列表,和服务器中缺少的传感器列表,再以服务器命令返回的传感器列表为基准,依次与传感器定义文档中传感器名称做比对,输出服务器中多余的传感器列表,执行完成后,输出两者一致的传感器名称列表,和不一致的传感器名称列表(服务器缺少和多余的传感器名称)。
测试传感器模块3,该模块根据传感器定义文档与服务器命令查询的传感器列表比较输出的两者都存在的传感器名称列表,对列表中的每个传感器依次测试;首先检查传感器的编号、EntityID是否一致,检查传感器的状态,状态如果是NS,表示没有检测到,需要记录log,状态是OK,表示传感器正常,接着检查传感器的读值,并根据传感器定义文档确认是否有阈值限制,如为NA,则无限制,如有限制,再判断输出读值是否在阈值范围内,如果在阈值范围内,则结束检查,如果不在阈值范围内,则检查SEL和精准日志,通过传感器定义文档中错误码判断日志是否记录正确。
整理测试结果输出模块4;所述整理测试结果输出模块中,测试过程中每一步执行完成后产生对应的日志,整理日志输出测试结果,包含服务器命令返回的传感器列表与文档中定义的传感器一致的传感器名称、服务器中缺少的传感器名称,服务器中多余的传感器名称,测试通过的传感器名称,测试失败的传感器名称及原因,并给出产生告警的传感器名称、错误码,告警恢复策略,及告警处理建议。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (2)

1.一种服务器传感器系统的测试方法,其特征在于,包括以下步骤:
S1:匹配获取传感器定义文档,判断传感器定义文档的属性格式是否正确,正确则继续执行,否则终止测试;
S2:输出传感器名称的比较结果,输出两者一致的传感器名称列表,和不一致的传感器名称列表;
S3:依次测试全部传感器,根据传感器定义文档与服务器命令查询的传感器列表比较输出的两者都存在的传感器名称列表,对列表中的每个传感器依次测试;
S4:根据测试结果,整理日志输出;
所述步骤S1中,
自动获取匹配传感器定义文档,先获取服务器型号,再获取以服务器型号命名的传感器定义文档,用于比对传感器的相关属性数据;获取到传感器定义文档后,需要先判断文档属性,格式是否正确,如果不正确,终止测试,需要测试人员调整格式,如果正确,继续执行;
所述步骤S2中,
以传感器定义文档为基准,依次与服务器上Ipmitool sdr elist 命令返回的传感器列表做比对,输出两者传感器名称一致的列表,和服务器中缺少的传感器列表,再以服务器命令返回的传感器列表为基准,依次与传感器定义文档中传感器名称做比对,输出服务器中多余的传感器列表,执行完成后,输出两者一致的传感器名称列表,和不一致的传感器名称列表;
所述步骤S3中,
首先检查传感器的编号、EntityID是否一致,检查传感器的状态,状态如果是NS,表示没有检测到,需要记录log,状态是OK,表示传感器正常,接着检查传感器的读值,并根据传感器定义文档确认是否有阈值限制,如为NA,则无限制,如有限制,再判断输出读值是否在阈值范围内,如果在阈值范围内,则结束检查,如果不在阈值范围内,则检查SEL和精准日志,通过传感器定义文档中错误码判断日志是否记录正确;
所述步骤S4中,测试过程中每一步执行完成后产生对应的日志,整理日志输出测试结果,包含服务器命令返回的传感器列表与文档中定义的传感器一致的传感器名称、服务器中缺少的传感器名称,服务器中多余的传感器名称,测试通过的传感器名称,测试失败的传感器名称及原因,并给出产生告警的传感器名称、错误码,告警恢复策略,及告警处理建议。
2.一种服务器传感器系统的测试装置,其特征在于,包括:
匹配获取传感器定义文档模块,该模块判断传感器定义文档的属性格式是否正确,正确则继续执行,否则终止测试;
输出传感器名称比较结果模块,该模块输出两者一致的传感器名称列表,和不一致的传感器名称列表;
测试传感器模块,该模块根据传感器定义文档与服务器命令查询的传感器列表比较输出的两者都存在的传感器名称列表,对列表中的每个传感器依次测试;
整理测试结果输出模块;
所述匹配获取传感器定义文档模块中,
自动获取匹配传感器定义文档,先获取服务器型号,再获取以服务器型号命名的传感器定义文档,用于比对传感器的相关属性数据;获取到传感器定义文档后,需要先判断文档属性,格式是否正确,如果不正确,终止测试,需要测试人员调整格式,如果正确,继续执行;
所述输出传感器名称比较结果模块中,
以传感器定义文档为基准,依次与服务器上Ipmitool sdr elist 命令返回的传感器列表做比对,输出两者传感器名称一致的列表,和服务器中缺少的传感器列表,再以服务器命令返回的传感器列表为基准,依次与传感器定义文档中传感器名称做比对,输出服务器中多余的传感器列表,执行完成后,输出两者一致的传感器名称列表,和不一致的传感器名称列表;
所述测试传感器模块中,
首先检查传感器的编号、EntityID是否一致,检查传感器的状态,状态如果是NS,表示没有检测到,需要记录log,状态是OK,表示传感器正常,接着检查传感器的读值,并根据传感器定义文档确认是否有阈值限制,如为NA,则无限制,如有限制,再判断输出读值是否在阈值范围内,如果在阈值范围内,则结束检查,如果不在阈值范围内,则检查SEL和精准日志,通过传感器定义文档中错误码判断日志是否记录正确;
所述整理测试结果输出模块中,测试过程中每一步执行完成后产生对应的日志,整理日志输出测试结果,包含服务器命令返回的传感器列表与文档中定义的传感器一致的传感器名称、服务器中缺少的传感器名称,服务器中多余的传感器名称,测试通过的传感器名称,测试失败的传感器名称及原因,并给出产生告警的传感器名称、错误码,告警恢复策略,及告警处理建议。
CN201911208382.6A 2019-11-30 2019-11-30 一种服务器传感器系统的测试方法及装置 Active CN111124809B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911208382.6A CN111124809B (zh) 2019-11-30 2019-11-30 一种服务器传感器系统的测试方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911208382.6A CN111124809B (zh) 2019-11-30 2019-11-30 一种服务器传感器系统的测试方法及装置

Publications (2)

Publication Number Publication Date
CN111124809A CN111124809A (zh) 2020-05-08
CN111124809B true CN111124809B (zh) 2022-10-18

Family

ID=70497266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911208382.6A Active CN111124809B (zh) 2019-11-30 2019-11-30 一种服务器传感器系统的测试方法及装置

Country Status (1)

Country Link
CN (1) CN111124809B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950231B (zh) * 2020-07-24 2022-07-29 苏州浪潮智能科技有限公司 一种bmc传感器信息检查比对方法及系统
CN112762976B (zh) * 2020-12-14 2022-05-13 苏州浪潮智能科技有限公司 一种对bmc传感器综合测试的自动化方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103389124A (zh) * 2012-05-10 2013-11-13 鸿富锦精密工业(深圳)有限公司 传感器测试的方法及系统
CN109684166A (zh) * 2018-12-03 2019-04-26 郑州云海信息技术有限公司 自动测试Sensor日志规范性的方法、装置、终端及存储介质
CN109800117A (zh) * 2019-01-25 2019-05-24 郑州云海信息技术有限公司 一种基于ipmi的dc自动化测试方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103389124A (zh) * 2012-05-10 2013-11-13 鸿富锦精密工业(深圳)有限公司 传感器测试的方法及系统
CN109684166A (zh) * 2018-12-03 2019-04-26 郑州云海信息技术有限公司 自动测试Sensor日志规范性的方法、装置、终端及存储介质
CN109800117A (zh) * 2019-01-25 2019-05-24 郑州云海信息技术有限公司 一种基于ipmi的dc自动化测试方法及系统

Also Published As

Publication number Publication date
CN111124809A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
US9569325B2 (en) Method and system for automated test and result comparison
CN107025224B (zh) 一种监控任务运行的方法和设备
CN110008129B (zh) 一种存储定时快照的可靠性测试方法、装置及设备
US7930597B2 (en) Method and apparatus for validating system properties exhibited in execution traces
CN111124809B (zh) 一种服务器传感器系统的测试方法及装置
CN107451058B (zh) 一种软件开发方法和装置
US10657028B2 (en) Method for replicating production behaviours in a development environment
CN104102563A (zh) 一种发现服务器系统的mca错误的方法及装置
JP5495310B2 (ja) 情報処理装置、障害解析方法及び障害解析プログラム
CN111309584B (zh) 数据处理方法、装置、电子设备及存储介质
US9372746B2 (en) Methods for identifying silent failures in an application and devices thereof
CN110795142B (zh) 一种配置文件的生成方法及装置
CN113037521A (zh) 识别通讯设备状态的方法、通讯系统及存储介质
CN107861842B (zh) 一种元数据损坏检测方法、系统、设备及存储介质
CN111858385B (zh) Sql数据库的测试方法、装置、设备及存储介质
CN114297015B (zh) 一种服务器的配置检查方法、系统、设备以及介质
CN117439871B (zh) 抄表故障定位方法、装置、存储介质及电子设备
CN112214409B (zh) 一种用于测试环境下的运维方法及装置
CN117407207B (zh) 一种内存故障处理方法、装置、电子设备及存储介质
CN111679951B (zh) 基于交易支付系统的监控方法及装置
CN111290920B (zh) 基于peci总线测试cpu温度的系统、方法及存储介质
CN114356061B (zh) 电源故障检测方法、装置、系统以及检测设备
CN117270664A (zh) 一种基于汽车智能存储芯片复位系统
CN114205259A (zh) 一种网关上数异常诊断方法和装置
CN115686962A (zh) 服务器链路检测方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant