CN110058979A - 一种温度读取失败故障的监控方法、bmc及存储介质 - Google Patents

一种温度读取失败故障的监控方法、bmc及存储介质 Download PDF

Info

Publication number
CN110058979A
CN110058979A CN201910313324.3A CN201910313324A CN110058979A CN 110058979 A CN110058979 A CN 110058979A CN 201910313324 A CN201910313324 A CN 201910313324A CN 110058979 A CN110058979 A CN 110058979A
Authority
CN
China
Prior art keywords
temperature
component
temperature value
detection
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910313324.3A
Other languages
English (en)
Inventor
王龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910313324.3A priority Critical patent/CN110058979A/zh
Publication of CN110058979A publication Critical patent/CN110058979A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3031Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a motherboard or an expansion card
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种温度读取失败故障的监控方法,由基板管理控制器BMC获取到检测装置对部件的温度检测结果后,根据检测装置对应的协议分析温度检测结果得到检测温度值,并通过将检测温度值与预设的异常温度值进行对比,从而判断获取到的温度检测结果是实际的温度检测结果,还是检测装置发出的温度读取失败的信号,并在温度读取失败后记录对相应部件的温度读取失败事件的信息,以便运维人员查看并及时检查温度读取失败的部件,避免更为严重的后果的产生。本发明还公开了一种基板管理控制器BMC及存储介质,具有上述有益效果。

Description

一种温度读取失败故障的监控方法、BMC及存储介质
技术领域
本发明涉及服务器运行管理技术领域,特别是涉及一种温度读取失败故障的监控方法、基板管理控制器BMC及存储介质。
背景技术
基板管理控制器BMC(Baseboard Management Controller)是服务器特有的管理控制器,基板管理控制器BMC可以自动监控服务器运行状态,并及时根据当前状态进行调控,其中主要的一个功能就是获取当前服务器各模块的温度,根据当前温度进行风扇转速控制及告警等操作。
基板管理控制器BMC的温度监控对象包括处理器温度,内存温度,环境温度等多个传感器的温度,不同的传感器温度读取的方式不相同,有些是直接读取寄存器获取的,有些是通过处理器间接获取的,有些则是通过发送命令与主板通信获取的,等等。进行温度读取失败的判断,需要运维人员针对每个传感器的读取结果单独进行判断,实现比较复杂而且容易出错。另外,在部件插拔后,基板管理控制器BMC不能记录当前部件的在位情况,直接进行温度读取判断会导致温度误报的情况。而在不了解温度读取情况时,运维人员无法及时发现系统故障,由此导致严重的后果。
因此,如何监控温度读取失败故障,从而提醒运维人员及时检查温度读取失败的部件,避免更为严重的后果的产生,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种温度读取失败故障的监控方法、基板管理控制器BMC及存储介质,用于通过监控温度读取失败故障,提醒运维人员及时检查温度读取失败的部件,避免更为严重的后果的产生。
为解决上述技术问题,本发明提供一种温度读取失败故障的监控方法,基于基板管理控制器BMC,包括:
获取检测装置对部件的温度检测结果;
根据所述检测装置对应的协议分析所述温度检测结果得到检测温度值;
判断所述检测温度值是否为预设的异常温度值;
如果是,则记录对所述部件的温度读取失败事件的信息。
可选的,所述预设的异常温度值具体为与所述检测装置对应的协议规定的异常温度值。
可选的,所述预设的异常温度值具体为预设的正常温度范围之外的温度值。
可选的,在所述判断所述检测温度值是否为预设的异常温度值之前,还包括:
将所述检测温度值转换为预设格式的检测温度值;
相应的,所述判断所述检测温度值是否为预设的异常温度值,具体为:
判断所述预设格式的检测温度值是否为所述基板管理控制器BMC规定的异常温度值。
可选的,当所述检测温度值为所述异常温度值时,还包括:
记录所述部件的检测温度值为所述异常温度值的事件的次数;
判断所述次数是否达到预设次数;
如果是,则进入所述记录对所述部件的温度读取失败事件的信息的步骤;
如果否,则返回所述获取检测装置对部件的温度检测结果的步骤。
可选的,在所述记录对所述部件的温度读取失败事件的信息之后,还包括:
继续获取所述检测装置在所述温度读取失败事件之后对所述部件的温度检测结果;
判断所述温度读取失败事件之后的温度检测结果是否为所述异常温度值;
如果否,则记录对所述部件的温度读取失败事件解除的信息。
可选的,还包括:
预先对所述部件设置初始值为0的存在标志位、初始值为0的温度异常标志位和初始值为0的告警标志位;
当所述部件的检测温度值不是所述异常温度值时,将所述部件对应的存在标志位置1;
当所述部件的检测温度值为所述异常温度值时,将所述部件对应的温度异常标志位置1;
当所述部件对应的次数达到所述预设次数时,将所述部件对应的存在标志位置0,并将所述部件对应的告警标志位置1;
当所述温度读取失败事件之后的温度检测结果不为所述异常温度值时,将所述部件对应的告警标志位置0。
为解决上述技术问题,本发明还提供一种基板管理控制器BMC,包括:
获取单元,用于获取检测装置对部件的温度检测结果;
分析单元,用于根据所述检测装置对应的协议分析所述温度检测结果得到检测温度值;
判断单元,用于判断所述检测温度值是否为预设的异常温度值;如果是,则记录对所述部件的温度读取失败事件的信息。
为解决上述技术问题,本发明还提供一种基板管理控制器BMC,包括:
存储器,用于存储指令,所述指令包括上述任意一项所述温度读取失败故障的监控方法的步骤;
处理器,用于执行所述指令。
为解决上述技术问题,本发明还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述温度读取失败故障的监控方法的步骤。
现有技术中的基板管理控制器BMC仅仅是将读取到的温度检测结果输出到指定位置,即使检测装置读取失败,基板管理控制器BMC也能够读取到一个温度值,而不同的检测装置对异常温度值的规定可能不同。本发明所提供的温度读取失败故障的监控方法,由基板管理控制器BMC获取到检测装置对部件的温度检测结果后,根据检测装置对应的协议分析温度检测结果得到检测温度值,并通过将检测温度值与预设的异常温度值进行对比,从而判断获取到的温度检测结果是实际的温度检测结果,还是检测装置发出的温度读取失败的信号,并在温度读取失败后记录对相应部件的温度读取失败事件的信息,以便运维人员查看并及时检查温度读取失败的部件,避免更为严重的后果的产生。本发明还提供一种基板管理控制器BMC及存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的第一种温度读取失败故障的监控方法的流程图;
图2为本发明实施例提供的第二种温度读取失败故障的监控方法的流程图;
图3为本发明实施例提供的第三种温度读取失败故障的监控方法的流程图;
图4为本发明实施例提供的一种基板管理控制器BMC的结构示意图;
图5为本发明实施例提供的另一种基板管理控制器BMC的结构示意图。
具体实施方式
本发明的核心是提供一种温度读取失败故障的监控方法、基板管理控制器BMC及存储介质,用于通过监控温度读取失败故障,提醒运维人员及时检查温度读取失败的部件,避免更为严重的后果的产生。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的第一种温度读取失败故障的监控方法的流程图。如图1所示,基于基板管理控制器BMC,温度读取失败故障的监控方法包括:
S101:获取检测装置对部件的温度检测结果。
在具体实施中,基板管理控制器BMC以轮询的方式从各检测装置读取对系统中各部件的温度检测结果。
S102:根据检测装置对应的协议分析该温度检测结果得到检测温度值。
不同的检测装置检测温度的方法不同,所对应的协议也不同。根据预先在基板管理控制器BMC配置的各检测装置的协议分析温度检测结果得到检测温度值。
S103:判断该检测温度值是否为预设的异常温度值;如果是,则进入步骤S104。
各部件在服务器开机后温度都会大于0度,通常各部件的温度正常范围在0度到255度之间。
在具体实施中,预设的异常温度值可以为与检测装置对应的协议规定的异常温度值。
在未检测到部件的温度时,有的检测装置输出的温度检测结果为0度,有的检测装置则输出十六进制FF,即255度,这就是异常温度值。当检测温度值为与该检测装置对应的协议规定的异常温度值时,说明该检测装置为读取到相应部件的温度。
预设的异常温度值还可以为预设的正常温度范围之外的温度值。
如以大于0度且小于255度为正常温度范围,当检测温度值超出这个范围时,认为检测温度值为异常温度值。
可选地,在步骤S103之前,还包括:
将检测温度值转换为预设格式的检测温度值;
相应的,步骤S103的判断具体为:
判断预设格式的检测温度值是否为基板管理控制器BMC规定的异常温度值。
基板管理控制器BMC根据与检测装置对应的协议将温度检测结果统一为预设格式,并统一在未检测到温度时对应的标志,如规定255度为未检测到温度时对应的预设格式的检测温度值。
相应的,在确定检测温度值为255度时,认为检测温度值为异常温度值。
S104:记录对该部件的温度读取失败事件的信息。
记录对该部件的温度读取失败事件的信息,可以包括但不限于将温度读取失败事件的发生时间、对应的部件标识等记录在故障诊断日志中,或将温度读取失败事件的信息发送至指定位置,或在监控界面弹出报警窗口等。
本发明实施例提供的温度读取失败故障的监控方法,由基板管理控制器BMC获取到检测装置对部件的温度检测结果后,根据检测装置对应的协议分析温度检测结果得到检测温度值,并通过将检测温度值与预设的异常温度值进行对比,从而判断获取到的温度检测结果是实际的温度检测结果,还是检测装置发出的温度读取失败的信号,并在温度读取失败后记录对相应部件的温度读取失败事件的信息,以便运维人员查看并及时检查温度读取失败的部件,避免更为严重的后果的产生。
图2为本发明实施例提供的第二种温度读取失败故障的监控方法的流程图。如图2所示,在上述实施例的基础上,在另一实施例中,当步骤S103中判断检测温度值为异常温度值时,温度读取失败故障的监控方法还包括:
S201:记录该部件的检测温度值为异常温度值的事件的次数。
S202:判断该次数是否达到预设次数;如果是,则进入步骤S104;如果否,则返回步骤S101。
为避免检测装置检测出错、基板管理控制器BMC在读取温度时出错或基板管理控制器BMC分析温度结果出错等问题,当检测温度值为异常温度值的事件发生一次时不认为检测装置读取温度失败,而是继续读取该检测装置的温度检测结果,对检测温度值为异常温度值的事件发生的次数进行累加,直至达到预设次数,如10次,再进入步骤S104记录对该部件的温度读取失败事件的信息;如果未到预设次数时的一次分析中,检测温度值不为异常温度值,则认为温度读取成功,清除累加的次数。
可选地,在步骤S104之后,还包括:
S203:继续获取检测装置在温度读取失败事件之后对部件的温度检测结果。
S204:判断温度读取失败事件之后的温度检测结果是否为异常温度值;如果否,则进入步骤S205。
S205:记录对部件的温度读取失败事件解除的信息。
本发明实施例提供的温度读取失败故障的监控方法,在上述实施例的基础上,通过多次检测到检测温度值为异常温度值时才记录温度读取失败事件的信息,确保温度读取失败事件的准确性,并通过在记录温度读取失败事件之后继续读取检测装置的温度检测结果,在分析得到检测温度值不为异常温度值时记录温度读取失败事件解除的信息,保证监控的实时性。
图3为本发明实施例提供的第三种温度读取失败故障的监控方法的流程图。在上述实施例的基础上,在另一实施例中,温度读取失败故障的监控方法还包括:
预先对部件设置初始值为0的存在标志位、初始值为0的温度异常标志位和初始值为0的告警标志位;
当部件的检测温度值不是异常温度值时,将部件对应的存在标志位置1;
当部件的检测温度值为异常温度值时,将部件对应的温度异常标志位置1;
当部件对应的次数达到预设次数时,将部件对应的存在标志位置0,并将部件对应的告警标志位置1;
当温度读取失败事件之后的温度检测结果不为异常温度值时,将部件对应的告警标志位置0。
在具体实施中,预先对每个部件设置三个标志位用以标记部件在温度检测过程中的状态。其中,存在标志位初始值为0,表示部件不在位;温度异常标志位初始值为0,表示部件温度读取无异常;告警标志位初始值为0,表示无针对部件温度读取失败的告警信息。
本发明实施例提供的温度读取失败故障的监控方法的具体实施方式如图3所示:
S301:设置各部件的存在标志位初始值为0,温度异常标志位初始值为0,告警标志位初始值为0。
S302:获取检测装置对部件的温度检测结果。
S303:根据检测装置对应的协议分析该温度检测结果得到检测温度值。
S304:判断该检测温度值是否为预设的异常温度值;如果是,则进入步骤S305;如果否,则进入步骤S310。
S305:将该部件的温度异常标志位置1,并记录该部件的检测温度值为异常温度值的事件的次数。
S306:判断该次数是否达到预设次数;如果是,则进入步骤S307;如果否,则返回步骤S302。
S307:将告警标志位置1,并记录对该部件的温度读取失败事件的信息。
S308:继续获取检测装置在温度读取失败事件之后对部件的温度检测结果。
S309:判断温度读取失败事件之后的温度检测结果是否为异常温度值;如果是,则返回步骤S308;如果否,则进入步骤S309。
S310:将告警标志位置0,将温度异常标志位置0,将存在标志位置1,并记录对部件的温度读取失败事件解除的信息。
S311:将存在标志位置1。
本发明实施例提供的温度读取失败故障的监控方法,在上述实施例的基础上,提供了一种具体的实施方式,通过存在标志位、温度异常标志位、告警标志位三个标志位标记部件在温度检测过程中的状态,具有更高的实用性。
上文详述了温度读取失败故障的监控方法对应的各个实施例,在此基础上,本发明还公开了与上述方法对应的基板管理控制器BMC。
图4为本发明实施例提供的一种基板管理控制器BMC的结构示意图。如图4所示,基板管理控制器BMC包括:
获取单元401,用于获取检测装置对部件的温度检测结果;
分析单元402,用于根据检测装置对应的协议分析温度检测结果得到检测温度值;
判断单元403,用于判断检测温度值是否为预设的异常温度值;如果是,则记录对部件的温度读取失败事件的信息。
由于基板管理控制器BMC部分的实施例与方法部分的实施例相互对应,因此基板管理控制器BMC部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
图5为本发明实施例提供的另一种基板管理控制器BMC的结构示意图。如图5所示,该基板管理控制器BMC可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算装置中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在基板管理控制器BMC500上执行存储介质530中的一系列指令操作。
基板管理控制器BMC500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述图1至图3所描述的温度读取失败故障的监控中的步骤由基板管理控制器BMC基于该图5所示的结构实现。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的基板管理控制器BMC及存储介质的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法、基板管理控制器BMC及存储介质,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,功能调用装置,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明所提供的一种温度读取失败故障的监控方法、基板管理控制器BMC及存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种温度读取失败故障的监控方法,其特征在于,基于基板管理控制器BMC,包括:
获取检测装置对部件的温度检测结果;
根据所述检测装置对应的协议分析所述温度检测结果得到检测温度值;
判断所述检测温度值是否为预设的异常温度值;
如果是,则记录对所述部件的温度读取失败事件的信息。
2.根据权利要求1所述的监控方法,其特征在于,所述预设的异常温度值具体为与所述检测装置对应的协议规定的异常温度值。
3.根据权利要求1所述的监控方法,其特征在于,所述预设的异常温度值具体为预设的正常温度范围之外的温度值。
4.根据权利要求1所述的监控方法,其特征在于,在所述判断所述检测温度值是否为预设的异常温度值之前,还包括:
将所述检测温度值转换为预设格式的检测温度值;
相应的,所述判断所述检测温度值是否为预设的异常温度值,具体为:
判断所述预设格式的检测温度值是否为所述基板管理控制器BMC规定的异常温度值。
5.根据权利要求1所述的监控方法,其特征在于,当所述检测温度值为所述异常温度值时,还包括:
记录所述部件的检测温度值为所述异常温度值的事件的次数;
判断所述次数是否达到预设次数;
如果是,则进入所述记录对所述部件的温度读取失败事件的信息的步骤;
如果否,则返回所述获取检测装置对部件的温度检测结果的步骤。
6.根据权利要5所述的监控方法,其特征在于,在所述记录对所述部件的温度读取失败事件的信息之后,还包括:
继续获取所述检测装置在所述温度读取失败事件之后对所述部件的温度检测结果;
判断所述温度读取失败事件之后的温度检测结果是否为所述异常温度值;
如果否,则记录对所述部件的温度读取失败事件解除的信息。
7.根据权利要6所述的监控方法,其特征在于,还包括:
预先对所述部件设置初始值为0的存在标志位、初始值为0的温度异常标志位和初始值为0的告警标志位;
当所述部件的检测温度值不是所述异常温度值时,将所述部件对应的存在标志位置1;
当所述部件的检测温度值为所述异常温度值时,将所述部件对应的温度异常标志位置1;
当所述部件对应的次数达到所述预设次数时,将所述部件对应的存在标志位置0,并将所述部件对应的告警标志位置1;
当所述温度读取失败事件之后的温度检测结果不为所述异常温度值时,将所述部件对应的告警标志位置0。
8.一种基板管理控制器BMC,其特征在于,包括:
获取单元,用于获取检测装置对部件的温度检测结果;
分析单元,用于根据所述检测装置对应的协议分析所述温度检测结果得到检测温度值;
判断单元,用于判断所述检测温度值是否为预设的异常温度值;如果是,则记录对所述部件的温度读取失败事件的信息。
9.一种基板管理控制器BMC,其特征在于,包括:
存储器,用于存储指令,所述指令包括权利要求1至7任意一项所述温度读取失败故障的监控方法的步骤;
处理器,用于执行所述指令。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述温度读取失败故障的监控方法的步骤。
CN201910313324.3A 2019-04-18 2019-04-18 一种温度读取失败故障的监控方法、bmc及存储介质 Withdrawn CN110058979A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910313324.3A CN110058979A (zh) 2019-04-18 2019-04-18 一种温度读取失败故障的监控方法、bmc及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910313324.3A CN110058979A (zh) 2019-04-18 2019-04-18 一种温度读取失败故障的监控方法、bmc及存储介质

Publications (1)

Publication Number Publication Date
CN110058979A true CN110058979A (zh) 2019-07-26

Family

ID=67319404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910313324.3A Withdrawn CN110058979A (zh) 2019-04-18 2019-04-18 一种温度读取失败故障的监控方法、bmc及存储介质

Country Status (1)

Country Link
CN (1) CN110058979A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114153689A (zh) * 2021-11-19 2022-03-08 苏州浪潮智能科技有限公司 一种bmc及其器件监测方法、装置及可读存储介质
CN114721859A (zh) * 2022-04-29 2022-07-08 苏州浪潮智能科技有限公司 一种监控mlcc电容短路风险的方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108287775A (zh) * 2018-03-01 2018-07-17 郑州云海信息技术有限公司 一种服务器故障检测的方法、装置、设备及存储介质
CN108376107A (zh) * 2018-03-01 2018-08-07 郑州云海信息技术有限公司 一种服务器故障检测的方法、装置、设备及存储介质
CN109387303A (zh) * 2018-09-12 2019-02-26 中车青岛四方机车车辆股份有限公司 轴温传感器的检测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108287775A (zh) * 2018-03-01 2018-07-17 郑州云海信息技术有限公司 一种服务器故障检测的方法、装置、设备及存储介质
CN108376107A (zh) * 2018-03-01 2018-08-07 郑州云海信息技术有限公司 一种服务器故障检测的方法、装置、设备及存储介质
CN109387303A (zh) * 2018-09-12 2019-02-26 中车青岛四方机车车辆股份有限公司 轴温传感器的检测方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114153689A (zh) * 2021-11-19 2022-03-08 苏州浪潮智能科技有限公司 一种bmc及其器件监测方法、装置及可读存储介质
CN114153689B (zh) * 2021-11-19 2024-01-12 苏州浪潮智能科技有限公司 一种bmc及其器件监测方法、装置及可读存储介质
CN114721859A (zh) * 2022-04-29 2022-07-08 苏州浪潮智能科技有限公司 一种监控mlcc电容短路风险的方法、装置及存储介质
CN114721859B (zh) * 2022-04-29 2024-05-24 苏州浪潮智能科技有限公司 一种监控mlcc电容短路风险的方法、装置及存储介质

Similar Documents

Publication Publication Date Title
US9569325B2 (en) Method and system for automated test and result comparison
US20180107196A1 (en) Method of Detecting Home Appliance Bus Control System
TWI588660B (zh) 使用基板管理控制器偵測通訊匯流排上錯誤的方法以及用於網路系統的偵錯器
CN112732477B (zh) 一种带外自检故障隔离的方法
CN103500133A (zh) 故障定位方法及装置
CN104699589B (zh) 风扇错误侦测系统及方法
CN112286709A (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
CN113708986B (zh) 服务器监控装置、方法及计算机可读存储介质
CN110191017B (zh) 一种用于监测路由设备异常的监控系统及方法
CN109254922A (zh) 一种服务器BMC Redfish功能的自动化测试方法及装置
CN109450669B (zh) 一种异常报警的方法、设备和计算机存储介质
CN106021066A (zh) 一种故障信息检测方法及电子设备
CN110058979A (zh) 一种温度读取失败故障的监控方法、bmc及存储介质
US9158646B2 (en) Abnormal information output system for a computer system
CN111858244A (zh) 一种硬盘的监控方法、系统、设备以及介质
CN108920337A (zh) 一种设备异常信息展示方法和计算机设备
CN113672306A (zh) 服务器组件自检异常恢复方法、装置、系统及介质
US7188275B2 (en) Method of verifying a monitoring and responsive infrastructure of a system
US11733689B2 (en) Control system, programmable logic controller, and information processing method
CN218568024U (zh) 一种usb端口检测装置
CN115934446A (zh) 一种自检方法、服务器、设备和存储介质
CN116225802A (zh) 一种故障测试方法、装置及计算设备
CN115080132A (zh) 信息处理方法、装置、服务器及存储介质
CN112596983A (zh) 一种服务器内连接器的监测方法
CN117055718B (zh) 一种服务器功耗检测系统、方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190726