CN101794251A - 一种计算机健康监控管理系统及方法 - Google Patents

一种计算机健康监控管理系统及方法 Download PDF

Info

Publication number
CN101794251A
CN101794251A CN201010034348A CN201010034348A CN101794251A CN 101794251 A CN101794251 A CN 101794251A CN 201010034348 A CN201010034348 A CN 201010034348A CN 201010034348 A CN201010034348 A CN 201010034348A CN 101794251 A CN101794251 A CN 101794251A
Authority
CN
China
Prior art keywords
hardware
running parameter
module
monitoring
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201010034348A
Other languages
English (en)
Inventor
王洪亮
朱锦雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201010034348A priority Critical patent/CN101794251A/zh
Publication of CN101794251A publication Critical patent/CN101794251A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种计算机健康监控管理系统及方法,扩大了计算机健康监控范围,其中该系统主要包括通讯模块,用于接收用户设置的监控策略以及用户发送的搜集指令,并用于向用户反馈分析模块获得的分析结果;采集模块,与计算机硬件对象连接,根据搜集指令获取硬件对象当前的工作参数;分析模块,用于根据监控策略对工作参数进行分析,获得分析结果。本发明技术方案解决了现有技术中带外管理技术监控对象有限的技术缺陷,扩展了监控范围。

Description

一种计算机健康监控管理系统及方法
技术领域
本发明涉及硬件设备监控领域,尤其涉及一种计算机健康监控管理系统及方法。
背景技术
计算机硬件设备是计算机技术得以应用的载体,是用户的物质财富。经常出现的情况是计算机硬件设备已经发生故障、已经损坏或者无法正常工作时,用户才得知计算机出现了问题,结果是用户往往需要为获得信息与处理问题的滞后性付出惨重的代价。
随着计算机技术与智能技术的发展,特别是基于纯硬件形式的带外管理形式的出现,为保障计算机硬件系统的安全稳定运行提供了新的契机。
但是,发明人在研究本发明的过程中发现,现有的带外管理至少存在如下局限:
(1)监控对象有限,仅注重较少的诸如温度、电压、风扇转速等硬件监控项,对用户实际使用有着显著影响的磁盘阵列监控、内存状态等却未涉及;
(2)仅能获取一些简单的硬件信息,对异常的分析处理能力十分有限,严重影响了嵌入式系统发挥带外监控的能力。
发明内容
本发明所要解决的技术问题是需要提供一种计算机健康监控管理系统及方法,以扩大计算机健康监控范围。
为了解决上述技术问题,本发明提供了一种计算机健康监控管理系统,包括采集模块、分析模块以及通讯模块,其中:
所述通讯模块,用于接收用户设置的监控策略以及用户发送的搜集指令,并用于向用户反馈所述分析模块获得的分析结果;
所述采集模块,与计算机硬件对象连接,根据所述搜集指令获取所述硬件对象当前的工作参数;
所述分析模块,用于根据所述监控策略对所述工作参数进行分析,获得所述分析结果。
优选地,所述采集模块用于通过局部总线,与南北桥芯片和传感器芯片中至少其一,与所述硬件对象连接。
优选地,所述分析模块用于根据所述监控策略中的告警条件,对符合所述告警条件的所述工作参数,产生告警信息包含在所述分析结果中。
优选地,与所述采集模块连接的所述硬件对象,包括电源、系统温度传感器、风扇转速传感器、内存、CPU、硬盘以及磁盘阵列中的一种或几种。
为了解决上述技术问题,本发明还提供了一种计算机健康监控管理方法,包括:
接收用户设置的监控策略以及发送的搜集指令;
根据所述搜集指令,获取计算机硬件对象当前的工作参数;
根据所述监控策略对所述工作参数进行分析,获得分析结果;
向用户反馈所述分析结果。
优选地,所述搜集指令包含所述硬件对象的标识。
优选地,通过局部总线与南北桥芯片和传感器芯片中至少其一,与所述硬件对象连接后,根据所述搜集指令获取所述工作参数。
优选地,所述硬件对象,包括电源、系统温度传感器、风扇转速传感器、内存、CPU、硬盘以及磁盘阵列中的一种或几种。
优选地,所述工作参数,包括电源电压,系统温度,风扇转速,内存利用率,CPU的数量、温度及利用率,硬盘数量及硬盘工作状态以及磁盘阵列工作状态中的一种或几种。
本发明技术方案的至少一个实施例,至少解决了现有技术中带外管理技术监控对象有限的技术缺陷,扩展了监控范围,且注重对硬件健康状况进行分析。本发明技术方案的至少另一个实施例,至少解决了现有的带外管理技术对计算机硬件设备异常分析能力有限的技术缺陷。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
图1为本发明系统实施例的组成示意图;
图2为本发明方法实施例的流程示意图;
图3为本发明方法应用实例的流程示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。
需要说明的是,如果不冲突,本发明实施例以及实施例中的各个特征可以相互结合,均在本发明的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明技术方案的核心思想是,在电子设备的主板上植入嵌入式电路,将该嵌入式电路通过南北桥芯片和/或传感器芯片等与其它需要监控的硬件对象直接和/或间接连接,搜集并整理分析对硬件对象进行监控获得的监控数据,根据该监控数据完成对电子设备的健康监控管理。本发明技术方案不依赖于电子设备的操作系统,并且可通过通信端口与远程处理设备进行交互,实现对电子设备的远程健康监控管理。
图1为本发明计算机健康监控管理系统实施例的组成示意图,本系统实施例在应用时以嵌入式电路的形式具体实现。如图1所示,本发明的系统实施例主要包括采集模块110、分析模块120以及通讯模块130,其中:
采集模块110,根据计算机主板的结构,通过局部总线(如I2C或SMBus)与南北桥芯片和传感器芯片中至少其一,与计算机硬件对象连接,根据通讯模块130接收的搜集指令,获取计算机硬件对象当前的工作参数,该搜集指令中包含有硬件对象的标识;
分析模块120,与该采集模块110相连,用于根据通讯模块130接收的监控策略对采集模块110获取的硬件对象当前的工作参数进行健康分析,获得分析结果;该监控策略中包含有告警条件,对于符合监控策略中告警条件的工作参数,则产生告警信息并包含在该分析结果中,发送给通讯模块130;
通讯模块130,分别与该采集模块110及分析模块120相连,用于接收用户通过本地或远端设备设置的监控策略,并接收用户通过本地或远端设备发送的搜集指令,其中该搜集指令包含有所要监控的硬件对象的标识;接收分析模块120发送的分析结果,并将其中的告警信息或者整个分析结果反馈给本地或远端设备,或者用户通过本地或远端设备指定的其他设备。
上述的硬件对象比如包括电源、系统温度传感器、风扇转速传感器、内存、CPU、硬盘以及磁盘阵列(RAID)等中的一种或一种以上的组合;
上述采集模块110获取的计算机硬件对象当前的工作参数,比如对于电源则为电源电压,对于系统温度传感器则为系统温度,对于风扇转速传感器则为风扇转速,对于内存则为内存利用率,对于CPU则为CPU的数量,温度及利用率,对于硬盘则为硬盘数量及硬盘工作状态(硬盘工作与否),对于磁盘阵列则为磁盘阵列工作状态(硬盘阵列工作与否)等;
上述的监控策略主要分为两大类,一类是阈值类型,一类是状态类型;比如对于电源、系统温度传感器、风扇转速传感器、内存、CPU等的工作参数对应于阈值类型,硬盘以及磁盘阵列的工作参数对应于状态类型。更具体的,以CPU温度为例说明阈值类型,以磁盘阵列工作状态为例说明状态类型;预设CPU的正常工作温度范围为大于0度小于等于60度,危险工作范围为大于60度小于等于90度,损坏工作范围为大于90度;磁盘阵列的工作状态集合为{正常、掉盘但仍能正常工作,不能正常工作}。
在计算机加电状态下,无论操作系统是否启动,获取BIOS数据并从中解析出所加载的存储介质是否发生变化,包括新存储介质的植入以及存储介质的丢失等,比如从BIOS系统引导介质的优先级中,可以获得所加载的硬盘信息,通过这个硬盘信息可以获得存储介质的数量等是否发生了变化。
图2为本发明计算机健康监控管理方法实施例的流程示意图,结合图1所示的系统实施例,图2所示的方法实施例主要包括如下步骤:
步骤S210,接收用户通过本地或远端设备设置的监控策略,以及通过本地或远端设备发送的搜集指令;其中该搜集指令包含有所要监控的硬件对象的标识;
步骤S220,根据该搜集指令,获取计算机硬件对象当前的工作参数;该搜集指令中包含有硬件对象的标识;其中执行该搜集指令的执行单元通过局部总线(如I2C或SMBus)与南北桥芯片和传感器芯片中至少其一,与计算机硬件对象连接;
步骤S230,根据该监控策略对该工作参数进行健康分析,获得分析结果;该监控策略中包含有告警条件,对于符合监控策略中告警条件的工作参数,则产生告警信息并包含在该分析结果;
步骤S240,将分析结果中的告警信息或者整个分析结果反馈给用户,比如反馈给本地或远端设备,或者用户通过本地或远端设备指定的其他设备。
其中,硬件对象,包括电源、系统温度传感器、风扇转速传感器、内存、CPU、硬盘以及磁盘阵列中的一种或几种。相应的,其中的工作参数,包括电源电压,系统温度,风扇转速,内存利用率,CPU的数量、温度及利用率,硬盘数量及硬盘工作状态以及磁盘阵列工作状态中的一种或几种。
图3为本发明方法应用实例的流程示意图,其中的硬件对象为硬盘。结合图1所示的系统实施例和图2所示的方法实施例,图3所示的应用实例主要包括如下步骤:
步骤S310,用户通过远端设备配置分析结果接收地址(IP和端口),启动硬盘监控项,并记录此时的硬盘信息;
步骤S320,以较短周期对硬盘信息进行扫描获得扫描数据即硬盘的工作参数;
步骤S330,根据扫描数据判断硬盘是否丢失,是则转步骤S340,否则转步骤S320;
步骤S340,产生硬盘丢失告警信息并根据步骤S310中用户配置的分析结果接收地址发送告警信息,以向用户告警。
上述步骤S320、步骤S330以及步骤S340中,用户都可以通过远方设备查看硬盘的当前工作状态。
本发明技术方案不依赖计算机所安装的具体的操作系统,直接在主板上植入硬件电路对计算机硬件系统进行监控,并对监控结果进行分析整理,通过通信端口与本地或外部设备进行通信,必要时发出硬件告警信息。本发明技术方案与目前已经存在的带外监控的技术方案相比实现了内存监控、CPU监控、硬盘工作状态监控、磁盘阵列监控等,如本发明技术方案中的存储介质监控技术,在非开机状态(即计算机加电状态下,无论操作系统是否启动)下,当新的存储介质植入或已经存储介质丢失时,可以迅速发出告警信息。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。另外,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (9)

1.一种计算机健康监控管理系统,其特征在于,包括采集模块、分析模块以及通讯模块,其中:
所述通讯模块,用于接收用户设置的监控策略以及用户发送的搜集指令,并用于向用户反馈所述分析模块获得的分析结果;
所述采集模块,与计算机硬件对象连接,根据所述搜集指令获取所述硬件对象当前的工作参数;
所述分析模块,用于根据所述监控策略对所述工作参数进行分析,获得所述分析结果。
2.根据权利要求1所述的系统,其特征在于:
所述采集模块用于通过局部总线,与南北桥芯片和传感器芯片中至少其一,与所述硬件对象连接。
3.根据权利要求1所述的系统,其特征在于:
所述分析模块用于根据所述监控策略中的告警条件,对符合所述告警条件的所述工作参数,产生告警信息包含在所述分析结果中。
4.根据权利要求1所述的系统,其特征在于:
与所述采集模块连接的所述硬件对象,包括电源、系统温度传感器、风扇转速传感器、内存、CPU、硬盘以及磁盘阵列中的一种或几种。
5.一种计算机健康监控管理方法,其特征在于,包括:
接收用户设置的监控策略以及发送的搜集指令;
根据所述搜集指令,获取计算机硬件对象当前的工作参数;
根据所述监控策略对所述工作参数进行分析,获得分析结果;
向用户反馈所述分析结果。
6.根据权利要求5所述的方法,其特征在于:
所述搜集指令包含所述硬件对象的标识。
7.根据权利要求5所述的方法,其特征在于:
通过局部总线与南北桥芯片和传感器芯片中至少其一,与所述硬件对象连接后,根据所述搜集指令获取所述工作参数。
8.根据权利要求5所述的方法,其特征在于:
所述硬件对象,包括电源、系统温度传感器、风扇转速传感器、内存、CPU、硬盘以及磁盘阵列中的一种或几种。
9.根据权利要求8所述的方法,其特征在于:
所述工作参数,包括电源电压,系统温度,风扇转速,内存利用率,CPU的数量、温度及利用率,硬盘数量及硬盘工作状态以及磁盘阵列工作状态中的一种或几种。
CN201010034348A 2010-01-18 2010-01-18 一种计算机健康监控管理系统及方法 Pending CN101794251A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010034348A CN101794251A (zh) 2010-01-18 2010-01-18 一种计算机健康监控管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010034348A CN101794251A (zh) 2010-01-18 2010-01-18 一种计算机健康监控管理系统及方法

Publications (1)

Publication Number Publication Date
CN101794251A true CN101794251A (zh) 2010-08-04

Family

ID=42586961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010034348A Pending CN101794251A (zh) 2010-01-18 2010-01-18 一种计算机健康监控管理系统及方法

Country Status (1)

Country Link
CN (1) CN101794251A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004680A (zh) * 2010-11-23 2011-04-06 山东中创软件商用中间件股份有限公司 一种动态跟踪程序运行状态的方法及一种背板装置
CN102262579A (zh) * 2011-08-05 2011-11-30 浪潮(北京)电子信息产业有限公司 一种计算机监控方法及系统
CN102495784A (zh) * 2011-11-16 2012-06-13 浪潮(北京)电子信息产业有限公司 硬盘监控管理方法和系统
CN103246551A (zh) * 2012-02-07 2013-08-14 北京糯米网科技发展有限公司 用于管理后台定时任务的设备和方法
CN106326075A (zh) * 2016-11-25 2017-01-11 湖南长城银河科技有限公司 一种电子设备、操作系统及其状态监控平台及方法
CN107092551A (zh) * 2017-06-22 2017-08-25 郑州云海信息技术有限公司 一种服务器系统性能优化方法及装置
CN107590053A (zh) * 2017-09-20 2018-01-16 郑州云海信息技术有限公司 一种硬件监控系统及方法
CN109460340A (zh) * 2018-10-22 2019-03-12 重庆电子工程职业学院 计算机硬件监控方法及装置
CN109933489A (zh) * 2019-03-08 2019-06-25 国网福建省电力有限公司 应用于类unix系统的硬件监控体系

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004680A (zh) * 2010-11-23 2011-04-06 山东中创软件商用中间件股份有限公司 一种动态跟踪程序运行状态的方法及一种背板装置
CN102262579A (zh) * 2011-08-05 2011-11-30 浪潮(北京)电子信息产业有限公司 一种计算机监控方法及系统
CN102495784A (zh) * 2011-11-16 2012-06-13 浪潮(北京)电子信息产业有限公司 硬盘监控管理方法和系统
CN103246551A (zh) * 2012-02-07 2013-08-14 北京糯米网科技发展有限公司 用于管理后台定时任务的设备和方法
CN106326075A (zh) * 2016-11-25 2017-01-11 湖南长城银河科技有限公司 一种电子设备、操作系统及其状态监控平台及方法
CN107092551A (zh) * 2017-06-22 2017-08-25 郑州云海信息技术有限公司 一种服务器系统性能优化方法及装置
CN107590053A (zh) * 2017-09-20 2018-01-16 郑州云海信息技术有限公司 一种硬件监控系统及方法
CN109460340A (zh) * 2018-10-22 2019-03-12 重庆电子工程职业学院 计算机硬件监控方法及装置
CN109933489A (zh) * 2019-03-08 2019-06-25 国网福建省电力有限公司 应用于类unix系统的硬件监控体系

Similar Documents

Publication Publication Date Title
CN101794251A (zh) 一种计算机健康监控管理系统及方法
CN100565470C (zh) 一种日志管理方法和装置
CN106339058A (zh) 动态管理电力供应的方法和系统
CN102597912B (zh) 用于平台功率节省的协调设备和应用程序中断事件
CN114328102B (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
CN105527878A (zh) 一种数据采集方法、装置及数据采集调试系统
CN109240966A (zh) 一种基于cpld的加速卡、数据采集方法及装置
CN104410512A (zh) 一种适用于云计算的资源监控告警框架及其方法
CN105429791A (zh) 一种分布式服务状态检测器及方法
CN103200199A (zh) 一种带外数据采集系统
CN107038104A (zh) 一种远程监控异构加速卡的方法
CN113691722A (zh) 一种控制方法、装置及电子设备
CN105204981A (zh) 应用性能测试方法和装置
CN112261603B (zh) 一种基于电力物联网的边缘物联代理装置
CN100555260C (zh) 主控底层管理平面的集成装置及方法
CN102480396A (zh) 一种服务器系统及其连接方法
CN102681650B (zh) 一种电源控制节能方法及其对应的存储系统
CN108647124A (zh) 一种存储跳变信号的方法及其装置
CN101788841A (zh) 一种集群散热系统及散热方法
CN109936528B (zh) 监测方法、装置、设备及系统
CN115543746A (zh) 图形处理器监测方法、系统、装置及电子设备
CN109542732A (zh) 一种集群日志收集方法、装置和计算机可读存储介质
CN110147379B (zh) 基于数据锁的信息采集方法、装置、计算机设备
CN111459768A (zh) 一种硬盘管理方法、装置、设备及机器可读存储介质
CN109460139A (zh) 一种电源保障的方法以及相关装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20100804

RJ01 Rejection of invention patent application after publication