CN107590053A - 一种硬件监控系统及方法 - Google Patents

一种硬件监控系统及方法 Download PDF

Info

Publication number
CN107590053A
CN107590053A CN201710854574.9A CN201710854574A CN107590053A CN 107590053 A CN107590053 A CN 107590053A CN 201710854574 A CN201710854574 A CN 201710854574A CN 107590053 A CN107590053 A CN 107590053A
Authority
CN
China
Prior art keywords
management module
service modules
sensor
data
monitoring management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710854574.9A
Other languages
English (en)
Inventor
韩廷卯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710854574.9A priority Critical patent/CN107590053A/zh
Publication of CN107590053A publication Critical patent/CN107590053A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种硬件监控系统及方法,包括:监控管理模块,SERVICE模块及基板控制器,其中,监控管理模块用于定时发送数据读取指令,并对SERVICE模块返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型,SERVICE模块接收数据读取指令,并发送至基板控制器,SERVICE模块还用于接收基板控制器返回的传感器数据,并发送至监控管理模块,基板控制器接收数据读取指令,读取对应的传感器的数据。本方案通过监控管理模块、SERVICE模块及基板控制器实现对硬件的监控管理,避免了人工监控硬件状态,节约了人力财力,提高了用户体验。

Description

一种硬件监控系统及方法
技术领域
本发明涉及硬件领域,尤其涉及一种硬件监控系统及方法。
背景技术
存储服务器在云服务和大数据领域起着十分重要的作用,随着存储服务器的性能越来越高,其对硬件运行环境的可靠性也提出了更高的要求。一旦硬件环境出现故障,很可能影响到整个存储服务器的运行结果。
为了保证存储服务器的正常运行,必须实施监控硬件状态,检测硬件故障,快速恢复硬件运行环境。例如:获取机箱各个监测点的温度值,当温度过高时,通过提高风扇转速,实现机箱快速降温。
然而,传统的硬件监控方式是由管理人员手动查看硬件状态数据,判断数据是否为故障数据,从而确定该硬件是否出现故障。采用上述人工监控硬件状态的方式,费事费力,不利于广泛应用。
发明内容
有鉴于此,本发明提供一种硬件监控系统及方法,以解决现有技术中人工监控硬件状态的方式,费时费力的问题,其具体方案如下:
一种硬件监控系统,包括:监控管理模块,SERVICE模块及基板控制器,其中:
监控管理模块用于定时发送数据读取指令,并对SERVICE模块返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型;
所述SERVICE模块用于接收所述监控管理模块发送的数据读取指令,并将接收到数据读取指令发送至所述基板控制器,所述SERVICE模块还用于接收所述基板控制器返回的传感器数据,并将所述基板控制器返回的传感器数据发送至所述监控管理模块;
所述基板控制器用于接收所述SERVICE模块发送的数据读取指令,根据所述数据读取指令对所述基板控制器对应的传感器进行数据读取。
进一步的,所述监控管理模块还用于:
存储所述基板控制器对应的传感器配置数据,所述传感器配置数据包括:与所述基板控制器连接的传感器的名称、类型、故障类型及故障阈值。
进一步的,所述监控管理模块对SERVICE模块返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型,包括:
所述监控管理模块将所述SERVICE模块返回的传感器数据与所述传感器配置数据进行比对,确定是否有传感器数据发生异常,根据发生异常的传感器数据确定所述发生异常的传感器的故障类型。
进一步的,所述传感器配置数据还包括:不同故障类型的处理措施;所述监控管理模块还用于:
根据所述发生异常的传感器的故障类型及不同故障类型的处理措施发送故障处理指令;
所述SERVICE模块还用于:接收所述故障处理指令,并将所述故障处理指令发送至所述基板控制器;
所述基板控制器还用于:根据所述故障处理指令对发生故障的传感器进行处理。
进一步的,所述SERVICE模块将接收到数据读取指令及故障处理指令发送至所述基板控制器,包括:
所述SERVICE模块将接收到的数据读取指令及故障处理指令转换成ipmitool命令发送至所述基板控制器。
一种硬件监控方法,应用于硬件监控系统,所述硬件监控系统包括:监控管理模块,SERVICE传输模块及基板控制器,其中,硬件监控方法包括:
所述监控管理模块定时发送数据读取指令;
所述SERVICE模块接收所述数据读取指令,并将所述数据读取指令发送至所述基板控制器;
所述基板控制器接收所述数据读取指令,读取对应传感器的传感器数据,并发送至所述SERVICE模块;
所述SERVICE模块将所述传感器数据发送至所述监控管理模块;
所述监控管理模块接收所述传感器数据,并对所述传感器数据进行逻辑判断,确定是否有传感器发生故障以及故障类型。
进一步的,还包括:
所述监控管理模块存储所述基板控制器对应的传感器配置数据,所述传感器配置数据包括:与所述基板控制器连接的传感器的名称、类型、故障类型及故障阈值。
进一步的,所述监控管理模块对SERVICE模块返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型,包括:
所述监控管理模块将接收到的传感器数据与所述传感器配置数据进行比对,确定是否有传感器数据发生异常,根据发生异常的传感器数据确定所述发生异常的传感器的故障类型。
进一步的,传感器配置数据还包括:不同故障类型的处理措施,所述方法还包括:
所述监控管理模块根据所述发生异常的传感器的故障类型及不同故障类型的处理措施发送故障处理指令;
所述SERVICE模块接收所述故障处理指令,并将所述故障处理指令发送至所述基板控制器;
所述基板控制器根据所述故障处理指令对发生故障的传感器进行处理。
进一步的,SERVICE模块将接收到数据读取指令及故障处理指令发送至所述基板控制器,包括:
所述SERVICE模块将接收到的数据读取指令及故障处理指令转换成ipmitool命令发送至所述基板控制器。
从上述技术方案可以看出,本申请公开的硬件监控系统及方法,包括:监控管理模块,SERVICE模块及基板控制器,其中,监控管理模块用于定时发送数据读取指令,并对SERVICE模块返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型,SERVICE模块接收数据读取指令,并发送至基板控制器,SERVICE模块还用于接收基板控制器返回的传感器数据,并发送至监控管理模块,基板控制器接收数据读取指令,读取对应的传感器的数据。本方案通过监控管理模块、SERVICE模块及基板控制器实现对硬件的监控管理,避免了人工监控硬件状态,节约了人力财力,提高了用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例公开的一种硬件监控系统的结构示意图;
图2为本发明实施例公开的一种硬件监控方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明公开了一种硬件监控系统,其结构示意图如图1所示,包括:
监控管理模块11,SERVICE模块12及基板控制器13。
其中,监控管理模块11用于定时发送数据读取指令,并对SERVICE模块12返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型。
SERVICE模块12用于接收监控管理模块11发送的数据读取指令,并将接收到的数据读取指令发送至基板控制器13,SERVICE模块12还用于接收基板控制器13返回的传感器数据,并将基板控制器13返回的传感器数据发送至监控管理模块11。
基板控制器13接收SERVICE模块12发送的数据读取指令,根据数据读取指令对基板控制器13对应的传感器进行数据读取。
监控管理模块11通过SERVICE模块12与基板控制器13进行数据传输。
其中,基板控制器13与多个硬件连接,其中,硬件可以包括:传感器,也可以为其他硬件,基板控制器13用于对多个硬件进行管理,如:获取传感器数据,对传感器进行处理等,并提供通信接口以实现硬件与软件之间的通信。
SERVICE模块12用于接收上层监控管理模块11及下层基板控制器13发送的数据,并将接收到的上层监控管理模块11发送的数据发送到下层基板控制器13,将基板控制器13发送的数据发送到监控管理模块11。在数据传输过程中,通过支持浮点数据计算的语言实现,如:perl语言。其中,在数据传输过程中,当接收到监控管理模块11发送的数据时,将接收到的数据转换成ipmitool命令之后,再下发给基板控制器13,其中,ipmitool命令是IPMI协议的命令,用于软件系统与基板控制器之间的通信,IPMI为智能平台管理接口。
监控管理模块11定时发送数据读取指令,以读取与基板控制器13连接的各传感器的数据,确定各传感器是否出现异常,以便于及时发现异常并排除故障。
进一步的,每一个基板控制器13连接的多个传感器均属于同一个硬件平台,当针对不同的硬件平台时,只需要修改SERVICE模块12中的SERVICE脚本即可实现本实施例公开的硬件监控系统对支持IPMI的不同硬件平台的监控,从而降低了开发成本。
本实施例公开的硬件监控系统,包括:监控管理模块,SERVICE模块及基板控制器,其中,监控管理模块用于定时发送数据读取指令,并对SERVICE模块返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型,SERVICE模块接收数据读取指令,并发送至基板控制器,SERVICE模块还用于接收基板控制器返回的传感器数据,并发送至监控管理模块,基板控制器接收数据读取指令,读取对应的传感器的数据。本方案通过监控管理模块、SERVICE模块及基板控制器实现对硬件的监控管理,避免了人工监控硬件状态,节约了人力财力,提高了用户体验。
本实施例公开的硬件监控系统,其结构示意图如图1所示,包括:
监控管理模块11,SERVICE模块12及基板控制器13。
除与上一实施例相同的功能外,本实施例公开的硬件监控系统中的监控管理模块11还用于:
存储基板控制器13对应的传感器配置数据,传感器配置数据包括:与基板控制器13连接的传感器的名称、类型、故障类型及故障阈值等。
传感器配置数据中包括:所有与基板控制器13连接的传感器的相关数据,其中,故障类型及故障阈值是针对每一个传感器可能出现的故障类型及故障阈值。
其中,传感器配置数据为:故障查询表格,当接收到传回的传感器数据时,将传感器数据中针对每一个传感器的数据与传感器配置数据中与该传感器的配置数据进行比对,当传感器数据出现在故障阈值中时,即出现对应类型的故障,具体的:
监控管理模块11将SERVICE模块返回的传感器数据与传感器配置数据进行比对,确定是否有传感器数据发生异常,根据发生异常的传感器数据确定发生异常的传感器的故障类型。
例如:与基板控制器13连接的其中一个传感器为传感器A,基板控制器13返回的传感器A的数据为a,查询传感器配置数据中传感器A的故障阈值,发现a处于故障B的故障阈值范围内,那么,可以确定传感器A发生故障,且其故障类型为故障B。
进一步的,传感器配置数据中还可以包括:不同故障类型的处理措施,此时,监控管理模块11还用于根据发生异常的传感器的故障类型及不同故障类型的处理措施发送故障处理指令。SERVICE模块接收该故障处理指令,将故障处理指令发送至基板控制器13,基板控制器13根据故障处理指令对发生故障的传感器进行处理。
其中,不同故障类型的处理措施可以包括:设置传感器的阈值,还可以包括重启出现异常的传感器数据所表示的硬件,还可以为:重启基板控制器。
进一步的,监控管理模块可以为:建立传感器数据模型,创建传感器数据数组,用于保存所有传感器的数据信息;建立故障模型,创建故障数组,用于保存所有故障类型的信息,其中,故障类型的信息包括:故障类型,故障恢复手段,故障产生标志,用于指向触发该故障的传感器数据的指针。
系统初始化时,通过INIT操作获取当前传感器的配置信息,包括:传感器类型、对应的故障类型及判断故障产生的方式,并保存在传感器数据数组中。系统初始化时,故障数组清零。通过READ操作,获取当前各传感器的读数信息,并更新到传感器数据数组中,遍历故障数组中的故障,根据触发该故障的传感器数据,判断是否仍然存在故障,如果故障已经消除,则将故障产生标志清除。遍历传感器数据数组中的传感器,根据最新的数据判断对应的故障是否发生,如果发生,则将故障数组中的相应故障标志置位,指针赋值,并根据故障恢复手段写下WRITE操作。
本实施例公开的硬件监控系统,包括:监控管理模块,SERVICE模块及基板控制器,其中,监控管理模块用于定时发送数据读取指令,并对SERVICE模块返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型,SERVICE模块接收数据读取指令,并发送至基板控制器,SERVICE模块还用于接收基板控制器返回的传感器数据,并发送至监控管理模块,基板控制器接收数据读取指令,读取对应的传感器的数据。本方案通过监控管理模块、SERVICE模块及基板控制器实现对硬件的监控管理,避免了人工监控硬件状态,节约了人力财力,提高了用户体验。
本实施例公开了一种硬件监控方法,应用于硬件监控系统,其中,硬件监控系统包括:监控管理模块,SERVICE模块及基板控制器,硬件监控方法的流程图如图2所示,包括:
步骤S21、监控管理模块定时发送数据读取指令;
步骤S22、接收数据读取指令,并将数据读取指令发送至基板控制器;
步骤S23、基板控制器接收数据读取指令,读取对应传感器的传感器数据,并发送至SERVICE模块;
步骤S24、SERVICE模块将传感器数据发送至监控管理模块;
步骤S25、监控管理模块接收传感器数据,并对传感器数据进行逻辑判断,确定是否有传感器发生故障以及故障类型。
监控管理模块通过SERVICE模块与基板控制器进行数据传输。
其中,基板控制器与多个硬件连接,其中,硬件可以包括:传感器,也可以为其他硬件,基板控制器用于对多个硬件进行管理,如:获取传感器数据,对传感器进行处理等,并提供通信接口以实现硬件与软件之间的通信。
SERVICE模块用于接收上层监控管理模块及下层基板控制器发送的数据,并将接收到的上层监控管理模块发送的数据发送到下层基板控制器,将基板控制器发送的数据发送到监控管理模块。在数据传输过程中,通过支持浮点数据计算的语言实现,如:perl语言。其中,在数据传输过程中,当接收到监控管理模块发送的数据时,将接收到的数据转换成ipmitool命令之后,再下发给基板控制器,其中,ipmitool命令是IPMI协议的命令,用于软件系统与基板控制器之间的通信,IPMI为智能平台管理接口。
监控管理模块定时发送数据读取指令,以读取与基板控制器连接的各传感器的数据,确定各传感器是否出现异常,以便于及时发现异常并排除故障。
进一步的,每一个基板控制器连接的多个传感器均属于同一个硬件平台,当针对不同的硬件平台时,只需要修改SERVICE模块中的SERVICE脚本即可实现本实施例公开的硬件监控系统对支持IPMI的不同硬件平台的监控,从而降低了开发成本。
具体的,监控管理模块负责整体控制以及故障检查的逻辑判断,只要下层的服务提供者按照指定的形式提供服务或数据,即可保证监控管理模块正常运行,SERVICE模块使用高级语言实现。SERVICE模块可以看做是适配层,直接向监控管理模块提供上述服务。当这套硬件监控系统移植到不同平台时,只需要调整SERVICE模块的脚本代码,使其在新的硬件平台也能正确的提供服务即可,无需修改、编译、安装监控管理模块代码。
进一步的,本实施例公开的硬件监控方法还可以包括:
监控管理模块存储基板控制器对应的传感器配置数据,传感器配置数据包括:与基板控制器连接的传感器的名称、类型、故障类型及故障阈值等。
传感器配置数据中包括:所有与基板控制器连接的传感器的相关数据,其中,故障类型及故障阈值是针对每一个传感器可能出现的故障类型及故障阈值。
其中,传感器配置数据为:故障查询表格,当接收到传回的传感器数据时,将传感器数据中针对每一个传感器的数据与传感器配置数据中与该传感器的配置数据进行比对,当传感器数据出现在故障阈值中时,即出现对应类型的故障,具体的:
监控管理模块将SERVICE模块返回的传感器数据与传感器配置数据进行比对,确定是否有传感器数据发生异常,根据发生异常的传感器数据确定发生异常的传感器的故障类型。
例如:与基板控制器连接的其中一个传感器为传感器A,基板控制器返回的传感器A的数据为a,查询传感器配置数据中传感器A的故障阈值,发现a处于故障B的故障阈值范围内,那么,可以确定传感器A发生故障,且其故障类型为故障B。
进一步的,传感器配置数据中还可以包括:不同故障类型的处理措施,此时,监控管理模块还用于根据发生异常的传感器的故障类型及不同故障类型的处理措施发送故障处理指令。SERVICE模块接收该故障处理指令,将故障处理指令发送至基板控制器,基板控制器根据故障处理指令对发生故障的传感器进行处理。
其中,不同故障类型的处理措施可以包括:设置传感器的阈值,还可以包括重启出现异常的传感器数据所表示的硬件,还可以为:重启基板控制器。
进一步的,监控管理模块可以为:建立传感器数据模型,创建传感器数据数组,用于保存所有传感器的数据信息;建立故障模型,创建故障数组,用于保存所有故障类型的信息,其中,故障类型的信息包括:故障类型,故障恢复手段,故障产生标志,用于指向触发该故障的传感器的指针。
系统初始化时,通过INIT操作获取当前传感器的配置信息,包括:传感器类型、对应的故障类型及判断故障产生的方式,并保存在传感器数据数组中。系统初始化时,故障数组清零。通过READ操作,获取当前各传感器的读数信息,并更新到传感器数据数组中,遍历故障数组中的故障,根据触发该故障的传感器数据,判断是否仍然存在故障,如果故障已经消除,则将故障产生标志清除。遍历传感器数据数组中的传感器,根据最新的数据判断对应的故障是否发生,如果发生,则将故障数组中的相应故障标志置位,指针赋值,并根据故障恢复手段写下WRITE操作。
本实施例公开的硬件监控方法,应用于硬件监控系统,硬件监控系统包括:监控管理模块,SERVICE模块及基板控制器,其中,监控管理模块用于定时发送数据读取指令,并对SERVICE模块返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型,SERVICE模块接收数据读取指令,并发送至基板控制器,SERVICE模块还用于接收基板控制器返回的传感器数据,并发送至监控管理模块,基板控制器接收数据读取指令,读取对应的传感器的数据。本方案通过监控管理模块、SERVICE模块及基板控制器实现对硬件的监控管理,避免了人工监控硬件状态,节约了人力财力,提高了用户体验。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种硬件监控系统,其特征在于,包括:监控管理模块,SERVICE模块及基板控制器,其中:
监控管理模块用于定时发送数据读取指令,并对SERVICE模块返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型;
所述SERVICE模块用于接收所述监控管理模块发送的数据读取指令,并将接收到数据读取指令发送至所述基板控制器,所述SERVICE模块还用于接收所述基板控制器返回的传感器数据,并将所述基板控制器返回的传感器数据发送至所述监控管理模块;
所述基板控制器用于接收所述SERVICE模块发送的数据读取指令,根据所述数据读取指令对所述基板控制器对应的传感器进行数据读取。
2.根据权利要求1所述的系统,其特征在于,所述监控管理模块还用于:
存储所述基板控制器对应的传感器配置数据,所述传感器配置数据包括:与所述基板控制器连接的传感器的名称、类型、故障类型及故障阈值。
3.根据权利要求2所述的系统,其特征在于,所述监控管理模块对SERVICE模块返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型,包括:
所述监控管理模块将所述SERVICE模块返回的传感器数据与所述传感器配置数据进行比对,确定是否有传感器数据发生异常,根据发生异常的传感器数据确定所述发生异常的传感器的故障类型。
4.根据权利要求3所述的系统,其特征在于,所述传感器配置数据还包括:不同故障类型的处理措施;所述监控管理模块还用于:
根据所述发生异常的传感器的故障类型及不同故障类型的处理措施发送故障处理指令;
所述SERVICE模块还用于:接收所述故障处理指令,并将所述故障处理指令发送至所述基板控制器;
所述基板控制器还用于:根据所述故障处理指令对发生故障的传感器进行处理。
5.根据权利要求4所述的系统,其特征在于,所述SERVICE模块将接收到数据读取指令及故障处理指令发送至所述基板控制器,包括:
所述SERVICE模块将接收到的数据读取指令及故障处理指令转换成ipmitool命令发送至所述基板控制器。
6.一种硬件监控方法,应用于硬件监控系统,其特征在于,所述硬件监控系统包括:监控管理模块,SERVICE模块及基板控制器,其中,硬件监控方法包括:
所述监控管理模块定时发送数据读取指令;
所述SERVICE模块接收所述数据读取指令,并将所述数据读取指令发送至所述基板控制器;
所述基板控制器接收所述数据读取指令,读取对应传感器的传感器数据,并发送至所述SERVICE模块;
所述SERVICE模块将所述传感器数据发送至所述监控管理模块;
所述监控管理模块接收所述传感器数据,并对所述传感器数据进行逻辑判断,确定是否有传感器发生故障以及故障类型。
7.根据权利要求6所述的方法,其特征在于,还包括:
所述监控管理模块存储所述基板控制器对应的传感器配置数据,所述传感器配置数据包括:与所述基板控制器连接的传感器的名称、类型、故障类型及故障阈值。
8.根据权利要求7所述的方法,其特征在于,所述监控管理模块对SERVICE模块返回的传感器数据进行逻辑判断,确定是否发生故障以及故障类型,包括:
所述监控管理模块将接收到的传感器数据与所述传感器配置数据进行比对,确定是否有传感器数据发生异常,根据发生异常的传感器数据确定所述发生异常的传感器的故障类型。
9.根据权利要求8所述的方法,其特征在于,传感器配置数据还包括:不同故障类型的处理措施,所述方法还包括:
所述监控管理模块根据所述发生异常的传感器的故障类型及不同故障类型的处理措施发送故障处理指令;
所述SERVICE模块接收所述故障处理指令,并将所述故障处理指令发送至所述基板控制器;
所述基板控制器根据所述故障处理指令对发生故障的传感器进行处理。
10.根据权利要求9所述的方法,其特征在于,SERVICE模块将接收到数据读取指令及故障处理指令发送至所述基板控制器,包括:
所述SERVICE模块将接收到的数据读取指令及故障处理指令转换成ipmitool命令发送至所述基板控制器。
CN201710854574.9A 2017-09-20 2017-09-20 一种硬件监控系统及方法 Pending CN107590053A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710854574.9A CN107590053A (zh) 2017-09-20 2017-09-20 一种硬件监控系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710854574.9A CN107590053A (zh) 2017-09-20 2017-09-20 一种硬件监控系统及方法

Publications (1)

Publication Number Publication Date
CN107590053A true CN107590053A (zh) 2018-01-16

Family

ID=61048353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710854574.9A Pending CN107590053A (zh) 2017-09-20 2017-09-20 一种硬件监控系统及方法

Country Status (1)

Country Link
CN (1) CN107590053A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109257248A (zh) * 2018-08-20 2019-01-22 郑州云海信息技术有限公司 一种服务器电压传感器测试方法、装置、终端及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794251A (zh) * 2010-01-18 2010-08-04 浪潮(北京)电子信息产业有限公司 一种计算机健康监控管理系统及方法
CN102271062A (zh) * 2011-07-19 2011-12-07 浪潮(北京)电子信息产业有限公司 一种服务器监控方法及系统
CN104639380A (zh) * 2013-11-07 2015-05-20 英业达科技有限公司 服务器监控方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794251A (zh) * 2010-01-18 2010-08-04 浪潮(北京)电子信息产业有限公司 一种计算机健康监控管理系统及方法
CN102271062A (zh) * 2011-07-19 2011-12-07 浪潮(北京)电子信息产业有限公司 一种服务器监控方法及系统
CN104639380A (zh) * 2013-11-07 2015-05-20 英业达科技有限公司 服务器监控方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109257248A (zh) * 2018-08-20 2019-01-22 郑州云海信息技术有限公司 一种服务器电压传感器测试方法、装置、终端及存储介质

Similar Documents

Publication Publication Date Title
CN104170323B (zh) 基于网络功能虚拟化的故障处理方法及装置、系统
CN104685830B (zh) 故障管理的方法、实体和系统
TWI282228B (en) Method and apparatus for autonomic failover
CN107544839B (zh) 虚拟机迁移系统、方法及装置
CN105187249B (zh) 一种故障恢复方法及装置
US10175973B2 (en) Microcode upgrade in a storage system
CN103631666B (zh) 数据冗余容错的适配管理设备、服务设备、系统及方法
CN105677500A (zh) 一种实时服务器故障诊断的方法
CN103368768A (zh) 混合云环境中具有启发式监视的自动缩放网络覆盖
US9043658B1 (en) Automatic testing and remediation based on confidence indicators
CN105653329A (zh) 一种应用管理的方法、装置及系统
US20110258302A1 (en) System And Method For Remotely Determining Identification And Physical Location Of Equipment In A Rack
US7937481B1 (en) System and methods for enterprise path management
US10255124B1 (en) Determining abnormal conditions of host state from log files through Markov modeling
CN110750213A (zh) 一种硬盘管理方法及装置
CN109947585A (zh) Pcie设备故障的处理方法及装置
CN114127757A (zh) 容器化应用服务的基于风险的调度
CN109271172A (zh) 一种swarm集群的宿主机性能扩展方法及装置
CN101689114A (zh) 用于集群软件实体的动态cli映射
CN106814977A (zh) 基于多存储厂商的多路径软件的管理方法及系统
CN111522499B (zh) 运维数据读取装置及其读取方法
WO2024113780A1 (zh) 一种fc链路管理方法、装置、设备及可读存储介质
CN105897933A (zh) 业务请求的处理方法及装置
US8688830B2 (en) Abstracting storage views in a network of computing systems
CN105119765B (zh) 一种智能处理故障体系架构

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180116

RJ01 Rejection of invention patent application after publication