CN101582046B - 一种高可用的系统状态监控、预测以及智能管理方法 - Google Patents

一种高可用的系统状态监控、预测以及智能管理方法 Download PDF

Info

Publication number
CN101582046B
CN101582046B CN2009100164496A CN200910016449A CN101582046B CN 101582046 B CN101582046 B CN 101582046B CN 2009100164496 A CN2009100164496 A CN 2009100164496A CN 200910016449 A CN200910016449 A CN 200910016449A CN 101582046 B CN101582046 B CN 101582046B
Authority
CN
China
Prior art keywords
data
module
computer
external unit
intelligent management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009100164496A
Other languages
English (en)
Other versions
CN101582046A (zh
Inventor
潘岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Langchao Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Langchao Electronic Information Industry Co Ltd filed Critical Langchao Electronic Information Industry Co Ltd
Priority to CN2009100164496A priority Critical patent/CN101582046B/zh
Publication of CN101582046A publication Critical patent/CN101582046A/zh
Application granted granted Critical
Publication of CN101582046B publication Critical patent/CN101582046B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种高可用的系统状态监控、预测以及智能管理方法,属于计算机状态监控、预警以及计算机硬件的自我管理应用领域,通过硬件装置对计算机内部芯片以及外部设备运行状态进行监控,预测事故的发生,并做出响应;硬件装置的结构包括状态监控模块、智能管理模块、数据记录以及保护模块和数据镜像库模块。本发明的一种高可用的系统状态监控、预测以及智能管理方法和现有技术相比,为用户以及主板开发人员提供了丰富的数据,并降低了由于计算机故障给用户造成的损失。

Description

一种高可用的系统状态监控、预测以及智能管理方法
技术领域
本发明涉及计算机状态监控、预警以及计算机硬件的自我管理应用领域,具体地说是一种高可用的系统状态监控、预测以及智能管理方法。
背景技术
计算机领域,目前的系统状态监控多是以附件的监控设备来监视目标系统的运行,而监控的参数多是系统或者部件的温度,风扇转速等。但是通过监视系统的温度和风扇状态,我们无法知道计算机中,每个具体部件的工作状态,对于它们的运行趋势就更无法获取了。只有当某个零件出现问题,系统无法正常运行,我们才知道。可是在某些应用中,如果出现计划外的计算机死机、系统崩溃、某个设备失去响应、突然关机等情况,将带来巨大的损失。
在计算机领域,对于以上问题,现有的解决方案只能做到使用软件,对当前的数据进行保存,对事故发生无法进行预警。并且保存的数据只是计算机处理的数据,在事故发生时计算机本身的信息确无法记录,事后很难精确定位事故发生的部位,以及原因。
发明内容
本发明的技术任务是针对以上不足,提供一种可以针对系统内部各芯片以及外设的工作状态,在问题发生之前就自动做出响应处理问题的一种高可用的系统状态监控、预测以及智能管理方法。
本发明的技术任务是按以下方式实现的,通过硬件装置对计算机内部芯片以及外部设备运行状态进行监控,预测事故的发生,并做出响应;硬件装置的结构包括状态监控模块、智能管理模块、数据记录以及保护模块和数据镜像库模块;状态监控模块与数据记录以及保护模块连接,智能管理模块与数据记录以及保护模块和数据镜像库模块连接,状态监控模块、智能管理模块和数据镜像库模块通过通用总线连接到计算机内部芯片以及外部设备,具体流程为:
(1)数据镜像库模块记录计算机内部芯片以及外部设备在测试时运行状态的相关数据,根据此数据得到标准的运行趋势的性能曲线;
(2)状态监控模块负责监控计算机内部芯片以及外部设备的工作状态,将监控到的数据记录在数据记录以及保护模块,并且根据计算机内部芯片以及外部设备的工作状态随时对数据记录以及保护模块内的数据进行更新;
(3)智能管理模块根据数据记录以及保护模块内记录的数据绘制出计算机内部芯片以及外部设备使用时的运行趋势的性能曲线,并将此性能曲线与数据镜像模块中预设的标准的运行趋势的性能曲线进行对比评估;
(4)当使用时的运行趋势的性能曲线在标准的运行趋势的性能曲线范围内,则表明计算机内部芯片以及外部设备运行正常;智能管理模块将不会作出报警或处理的相关工作;
(5)使用时的运行趋势的性能曲线在标准的运行趋势的性能曲线的临界值时,智能管理模块会对这部分计算机内部芯片或者外部设备进行处理,且智能管理模块将继续对数据记录以及保护模块内记录的数据进行跟踪对比;
(6)如果接下来状态监控模块得到的数据显示计算机内部芯片或者外部设备的性能回升,智能管理模块根据数据记录以及保护模块内记录的数据绘制出的计算机内部芯片以及外部设备使用时的运行趋势的性能曲线接近数据镜像模块中预设的标准的运行趋势的性能曲线,那么智能管理模块将不报警,并停止处理刚出现问题的计算机内部芯片或外部设备;
(7)如果接下来状态监控模块得到的数据显示,计算机内部芯片或者外部设备运行状态没有改变或性能更加下降,即使用时的运行趋势的性能曲线仍处于临界值或者更加远离数据镜像模块中预设的标准的运行趋势的性能曲线,智能管理模块就会判定这部分计算机内部芯片或者外部设备将会有问题发生;
(8)此时智能管理模块将启动数据记录以及保护模块对状态监控模块进行保护,并锁定记录状态临控模块此时监控到的状态;一方面保护计算机当前正在进行处理的数据,一方面报警通知计算机管理员要对被预测到的计算机内部芯片或者外部设备进行维护和更换;
(9)当被预测到的计算机内部芯片或者外部设备进行维护和更换以后,智能管理模块解除锁定。
状态监控模块通过通用总线连接到计算机内部芯片以及外部设备,负责监控计算机内部芯片以及外部设备的工作状态,并将监控到的数据记录在数据记录以及保护模块;数据记录以及保护模块记录数据,并且提供对状态监控模块的保护功能;数据镜像库模块通过通用总线连接到计算机内部芯片以及外部设备,记录计算机内部芯片以及外部设备在测试时运行状态的相关数据;智能管理模块对数据记录以及保护模块记录的数据进行处理,并与数据镜像模块里面的数据进行比对,根据对比结果对计算机内部芯片以及外部设备进行管理。
智能管理模块根据数据记录以及保护模块记录的值,把它们填写成一个计算机内部芯片以及外部设备使用时的运行趋势的性能曲线,该性能曲线分别以计算机内部芯片或者外部设备的功耗和数据吞吐速度或响应速度作为坐标轴;数据镜像库模块记录了计算机内部芯片以及外部设备标准的运行趋势的性能曲线,该性能曲线分别以计算机内部芯片或者外部设备的功耗和数据吞吐速度或响应速度作为坐标轴,并记录了计算机内部芯片以及外部设备在正常运行状态下的性能的上限曲线和下限曲线;当智能管理模块绘制的性能曲线落在数据镜像库模块记录的标准性能曲线的上限曲线和下限曲线之间时,可以判定,计算机内部芯片或者外部设备运行正常,当智能管理模块绘制的性能曲线落在数据镜像库模块记录的标准性能曲线的上限曲线和下限曲线之外时,可以判定,计算机内部芯片或者外部设备运行异常。
计算机内部芯片以及外部设备包括中央处理器、北桥、南桥、内存、硬盘、显卡/图形处理设备、网卡等网络连接设备、IO控制器、鼠标键盘。
数据记录以及保护模块中的数据记录部分,采用新型存储材料,在纳秒级的时间内记录数据;数据记录以及保护模块中的保护模块在感受到周围环境温度剧烈上升后,会释放阻燃材料,覆盖在数据记录以及保护模块中的数据记录部分的数据存储体上,防止记录数据部分被烧毁。
数据记录以及保护模块中的保护模块设置有备用电源,当发生计划外的重启或者停电等事故时,备用电源可以继续给状态监控模块和数据记录以及保护模块中的数据记录部分供电5-10s,这个时间内,状态监控模块将正在传输的数据,保存在数据记录以及保护模块中,以达到数据保护的作用。
数据镜像库模块可进行升级,数据镜像库模块的存储数据也可以更新资料。
状态监控模块和智能管理模块可以选用CPLD芯片。
本发明的一种高可用的系统状态监控、预测以及智能管理方法具有以下优点。
1、可以针对计算机内部芯片以及外部设备的工作状态,在问题发生之前就自动做出响应处理问题,并且会根据计算的运行趋势提示用户,应该对哪个设备进行维护和更换;
2、开发人员可以根据记录的监控信息,很快的改进设计,让产品更加完美,具很高的实用价值和商业价值;
3、本发明对事故的预测算法,可以不断升级,以求达到更加完美的效果,并且客户使用不同的外部设备时,可以对数据镜像库模块进行修改,以符合客户的硬件配置,使控制更具有弹性;
4、基于模块化部件灵活扩展的特性,可以移植到各种计算机系统中去,在硬件设计时加入相关部分即可;
5、当发生计划外的重启或者停电等事故时,备用电源可以继续供电5-10s,这个时间内,状态监控模块将正在传输的数据,保存在数据记录以及保护模块中,达到了数据保护的作用。
本发明的一种高可用的系统状态监控、预测以及智能管理方法所具有的上述优点,使得其弥补了传统的监控方法的不足,为用户以及主板开发人员提供了丰富的数据,并降低了由于计算机故障给用户造成的损失;因而具有非常广阔的发展前景。
附图说明
下面结合附图对本发明进一步说明。
附图1为一种高可用的系统状态监控、预测以及智能管理方法的硬件装置的结构框图;
附图2为一种高可用的系统状态监控、预测以及智能管理方法的硬件装置的使用状态结构连接框图;
附图3为一种高可用的系统状态监控、预测以及智能管理方法的性能曲线的坐标示意图。
具体实施方式
参照说明书附图和具体实施例对本发明的一种高可用的系统状态监控、预测以及智能管理方法作以下详细地说明。
实施例:
如图1、图2所示,本发明的一种高可用的系统状态监控、预测以及智能管理方法,通过硬件装置对计算机内部芯片以及外部设备运行状态进行监控,预测事故的发生,并做出响应;硬件装置的结构包括状态监控模块、智能管理模块、数据记录以及保护模块和数据镜像库模块;状态监控模块与数据记录以及保护模块连接,智能管理模块与数据记录以及保护模块和数据镜像库模块连接,状态监控模块、智能管理模块和数据镜像库模块通过通用总线连接到计算机内部芯片以及外部设备。
状态监控模块通过通用总线连接到计算机内部芯片以及外部设备,负责监控计算机内部芯片以及外部设备的工作状态,并将监控到的数据记录在数据记录以及保护模块;数据记录以及保护模块记录数据,并且提供对状态监控模块的保护功能;数据镜像库模块通过通用总线连接到计算机内部芯片以及外部设备,记录计算机内部芯片以及外部设备在测试时运行状态的相关数据;智能管理模块对数据记录以及保护模块记录的数据进行处理,并与数据镜像模块里面的数据进行比对,根据对比结果对计算机内部芯片以及外部设备进行管理。
具体流程为:
(1)数据镜像库模块记录计算机内部芯片以及外部设备在测试时运行状态的相关数据,根据此数据得到标准的运行趋势的性能曲线;
(2)状态监控模块负责监控计算机内部芯片以及外部设备的工作状态,将监控到的数据记录在数据记录以及保护模块,并且根据计算机内部芯片以及外部设备的工作状态随时对数据记录以及保护模块内的数据进行更新;
(3)智能管理模块根据数据记录以及保护模块内记录的数据绘制出计算机内部芯片以及外部设备使用时的运行趋势的性能曲线,并将此性能曲线与数据镜像模块中预设的标准的运行趋势的性能曲线进行对比评估;
(4)当使用时的运行趋势的性能曲线在标准的运行趋势的性能曲线范围内,则表明计算机内部芯片以及外部设备运行正常;智能管理模块将不会作出报警或处理的相关工作;
(5)当对比结果为,使用时的运行趋势的性能曲线在标准的运行趋势的性能曲线的临界值时,智能管理模块会对这部分计算机内部芯片或者外部设备进行处理,且智能管理模块将继续对数据记录以及保护模块内记录的数据进行跟踪对比;
(6)如果接下来状态监控模块得到的数据显示计算机内部芯片或者外部设备的性能回升,智能管理模块根据数据记录以及保护模块内记录的数据绘制出的计算机内部芯片以及外部设备使用时的运行趋势的性能曲线接近数据镜像模块中预设的标准的运行趋势的性能曲线,那么智能管理模块将不报警,并停止处理刚出现问题的计算机内部芯片或外部设备;
(7)如果接下来状态监控模块得到的数据显示,计算机内部芯片或者外部设备运行状态没有改变或性能更加下降,即使用时的运行趋势的性能曲线仍处于临界值或者更加远离数据镜像模块中预设的标准的运行趋势的性能曲线,智能管理模块就会判定这部分计算机内部芯片或者外部设备将会有问题发生;
(8)此时智能管理模块将启动数据记录以及保护模块对状态监控模块进行保护,并锁定记录状态监控模块此时监控到的状态;一方面保护计算机当前正在进行处理的数据,一方面报警通知计算机管理员要对被预测到的计算机内部芯片或者外部设备进行维护和更换;
(9)当被预测到的计算机内部芯片或者外部设备进行维护和更换以后,智能管理模块解除锁定。
智能管理模块根据数据记录以及保护模块记录的值,把它们填写成一个计算机内部芯片以及外部设备使用时的运行趋势的性能曲线,该性能曲线分别以计算机内部芯片或者外部设备的功耗和数据吞吐速度或响应速度作为坐标轴;数据镜像库模块记录了计算机内部芯片以及外部设备标准的运行趋势的性能曲线,该性能曲线分别以计算机内部芯片或者外部设备的功耗和数据吞吐速度或响应速度作为坐标轴,并记录了计算机内部芯片以及外部设备在正常运行状态下的性能的上限曲线和下限曲线;当智能管理模块绘制的性能曲线落在数据镜像库模块记录的标准性能曲线的上限曲线和下限曲线之间时,可以判定,计算机内部芯片或者外部设备运行正常,当智能管理模块绘制的性能曲线落在数据镜像库模块记录的标准性能曲线的上限曲线和下限曲线之外时,可以判定,计算机内部芯片或者外部设备运行异常。
计算机内部芯片以及外部设备包括中央处理器、北桥、南桥、内存、硬盘、显卡/图形处理设备、网卡等网络连接设备、IO控制器、鼠标键盘。
数据记录以及保护模块中的数据记录部分,采用新型存储材料,可短时间(纳秒级)记录数据;数据记录以及保护模块中的保护模块在感受到周围环境温度剧烈上升后,会释放阻燃材料,覆盖在数据记录以及保护模块中的数据记录部分的数据存储体上,防止记录数据部分被烧毁。
数据记录以及保护模块中的保护模块设置有备用电源,当发生计划外的重启或者停电等事故时,备用电源可以继续给状态监控模块和数据记录以及保护模块中的数据记录部分供电5-10s,这个时间内,状态监控模块将正在传输的数据,保存在数据记录以及保护模块中,以达到数据保护的作用。
数据镜像库模块可以根据需要进行升级,存储数据部分也可以根据需要更新资料。、
状态监控模块和智能管理模块可以选用CPLD芯片。
下面以计算机内部芯片以及外部设备中的硬盘作为具体的使用例子进行说明,将状态监控模块、智能管理模块和数据镜像库模块通过通用总线连接到计算机南桥和硬盘上。
目前的计算机架构,南桥支持SPI或者LPC接口,并且硬盘的IO控制器在南桥中。我们通过使用CPLD芯片,通过SPI/LPC接口协议,读去南桥寄存器里面的数据。每个南桥,其硬盘IO控制器以及对应寄存器的地址是一定的,只要在CPLD编程时去定义就可以。从南桥的寄存器中可以读取到硬盘的读写数据的速度,硬盘磁头的响应时间等数据。状态监控模块得到这些数据后,将数据写入数据记录以及保护模块。在状态监控模块中,我们可以定义抓取数据的时间间隔,比如可以每5秒去读一次南桥里面的值。
智能管理模块,会根据数据记录以及保护模块记录的值,把它们填写成一个性能曲线。该曲线分别以南桥的硬盘的IO控制器的功耗和硬盘吞吐速度已及磁头响应速度作为坐标轴。智能管理模块在画好曲线后,会将它与事先存放在数据镜像库模块里面的性能曲线进行对比,如图3所示。
在数据镜像库模块中,存放了该系列硬盘的测试数据,即为标准性能曲线,该性能曲线分别记录了这一系列硬盘在正常运行状态下,性能的上限曲线和下限曲线。
当智能管理模块绘制的性能曲线落在标准性能曲线之间时,我们可以判定,设备运行正常。
当智能管理模块绘制的性能曲线落在标准性能曲线之外时,我们可以判定,设备运行异常。
对于判定标准的说明,当我们有大量数据进行读写时,必须通过南桥的硬盘的IO控制器才可以完成,当这个IO控制器达到一个重载的情况,此时它的功耗就会较高,说明它目前处于繁忙的工作状态,与之相对应,硬盘也应该有较大量的数据吞吐才符合正常情况。如果IO控制器一直在运算,可是硬盘的信息确显示磁头没有响应或者响应很慢或者响应出现变慢的趋势,即运行的性能曲线斜率变成负值,说明硬盘性能在降低,可以遇见事故将要发生。
这个曲线的坐标引入了南桥硬盘的IO控制器的参数,可以避免在系统没有对硬盘读写时会出现的误判断。
在发现运行曲线有下降趋势时,智能管理模块会首先采取以下措施,首先会给硬盘的IO控制器发出一个Reset信号(这个信号仅仅是reset南桥里面一个控制器,不会对系统造成影响),之后如果运行曲线正常,不再动作,如果仍然不合乎要求,则提示用户,更换硬盘,并将问题硬盘的数据以镜像方式备份。
这样就完成了对事故的预测,同样,这一方法可以通过通用总线,读取计算机其它各部分的芯片和外部设备的信息,并绘制相对应的运行曲线,在发现不良趋势后,可以自行做出响应,并提示用户。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (8)

1.一种高可用的系统状态监控、预测以及智能管理方法,其特征在于,通过硬件装置对计算机内部芯片以及外部设备运行状态进行监控,预测事故的发生,并做出响应;硬件装置的结构包括状态监控模块、智能管理模块、数据记录以及保护模块和数据镜像库模块;状态监控模块与数据记录以及保护模块连接,智能管理模块与数据记录以及保护模块和数据镜像库模块连接,状态监控模块、智能管理模块和数据镜像库模块通过通用总线连接到计算机内部芯片以及外部设备,具体流程为:
(1)数据镜像库模块记录计算机内部芯片以及外部设备在测试时运行状态的相关数据,根据此数据得到标准的运行趋势的性能曲线;
(2)状态监控模块负责监控计算机内部芯片以及外部设备的工作状态,将监控到的数据记录在数据记录以及保护模块,并且根据计算机内部芯片以及外部设备的工作状态随时对数据记录以及保护模块内的数据进行更新;
(3)智能管理模块根据数据记录以及保护模块内记录的数据绘制出计算机内部芯片以及外部设备使用时的运行趋势的性能曲线,并将此性能曲线与数据镜像模块中预设的标准的运行趋势的性能曲线进行对比评估;
(4)当使用时的运行趋势的性能曲线在标准的运行趋势的性能曲线范围内,则表明计算机内部芯片以及外部设备运行正常;智能管理模块将不会作出报警或处理的相关工作;
(5)使用时的运行趋势的性能曲线在标准的运行趋势的性能曲线的临界值时,智能管理模块会对这部分计算机内部芯片或者外部设备进行处理,且智能管理模块将继续对数据记录以及保护模块内记录的数据进行跟踪对比;
(6)如果接下来状态监控模块得到的数据显示计算机内部芯片或者外部设备的性能回升,智能管理模块根据数据记录以及保护模块内记录的数据绘制出的计算机内部芯片以及外部设备使用时的运行趋势的性能曲线接近数据镜像模块中预设的标准的运行趋势的性能曲线,那么智能管理模块将不报警,并停止处理刚出现问题的计算机内部芯片或外部设备;
(7)如果接下来状态监控模块得到的数据显示,计算机内部芯片或者外部设备运行状态没有改变或性能更加下降,即使用时的运行趋势的性能曲线仍处于临界值或者更加远离数据镜像模块中预设的标准的运行趋势的性能曲线,智能管理模块就会判定这部分计算机内部芯片或者外部设备将会有问题发生;
(8)此时智能管理模块将启动数据记录以及保护模块对状态监控模块进行保护,并锁定记录状态临控模块此时监控到的状态;一方面保护计算机当前正在进行处理的数据,一方面报警通知计算机管理员要对被预测到的计算机内部芯片或者外部设备进行维护和更换;
(9)当被预测到的计算机内部芯片或者外部设备进行维护和更换以后,智能管理模块解除锁定。
2.根据权利要求1所述的一种高可用的系统状态监控、预测以及智能管理方法,其特征在于状态监控模块通过通用总线连接到计算机内部芯片以及外部设备,负责监控计算机内部芯片以及外部设备的工作状态,并将监控到的数据记录在数据记录以及保护模块;数据记录以及保护模块记录数据,并且提供对状态监控模块的保护功能;数据镜像库模块通过通用总线连接到计算机内部芯片以及外部设备,记录计算机内部芯片以及外部设备在测试时运行状态的相关数据;智能管理模块对数据记录以及保护模块记录的数据进行处理,并与数据镜像模块里面的数据进行比对,根据对比结果对计算机内部芯片以及外部设备进行管理。
3.根据权利要求1所述的方法,其特征在于,智能管理模块根据数据记录以及保护模块记录的值,把它们填写成一个计算机内部芯片以及外部设备使用时的运行趋势的性能曲线,该性能曲线分别以计算机内部芯片或者外部设备的功耗和数据吞吐速度或响应速度作为坐标轴;数据镜像库模块记录了计算机内部芯片以及外部设备标准的运行趋势的性能曲线,该性能曲线分别以计算机内部芯片或者外部设备的功耗和数据吞吐速度或响应速度作为坐标轴,并记录了计算机内部芯片以及外部设备在正常运行状态下的性能的上限曲线和下限曲线;当智能管理模块绘制的性能曲线落在数据镜像库模块记录的标准性能曲线的上限曲线和下限曲线之间时,可以判定,计算机内部芯片或者外部设备运行正常,当智能管理模块绘制的性能曲线落在数据镜像库模块记录的标准性能曲线的上限曲线和下限曲线之外时,可以判定,计算机内部芯片或者外部设备运行异常。
4.根据权利要求1所述的方法,其特征在于,计算机内部芯片以及外部设备包括中央处理器、北桥、南桥、内存、硬盘、显卡/图形处理设备、网卡等网络连接设备、IO控制器、鼠标键盘。
5.根据权利要求1所述的一种高可用的系统状态监控、预测以及智能管理方法,其特征在于数据记录以及保护模块中的数据记录部分,采用新型存储材料,在纳秒级的时间内记录数据;数据记录以及保护模块中的保护模块在感受到周围环境温度剧烈上升后,会释放阻燃材料,覆盖在数据记录以及保护模块中的数据记录部分的数据存储体上,防止记录数据部分被烧毁。
6.根据权利要求1、2或5所述的方法,其特征在于,数据记录以及保护模块中的保护模块设置有备用电源,当发生计划外的重启或者停电等事故时,备用电源可以继续给状态监控模块和数据记录以及保护模块中的数据记录部分供电5-10s,这个时间内,状态监控模块将正在传输的数据,保存在数据记录以及保护模块中,以达到数据保护的作用。
7.根据权利要求1所述的方法,其特征在于数据镜像库模块可进行升级,数据镜像库模块的存储数据也可以更新资料。
8.根据权利要求1所述的方法,其特征在于状态监控模块和智能管理模块可以选用CPLD芯片。
CN2009100164496A 2009-06-26 2009-06-26 一种高可用的系统状态监控、预测以及智能管理方法 Active CN101582046B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100164496A CN101582046B (zh) 2009-06-26 2009-06-26 一种高可用的系统状态监控、预测以及智能管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100164496A CN101582046B (zh) 2009-06-26 2009-06-26 一种高可用的系统状态监控、预测以及智能管理方法

Publications (2)

Publication Number Publication Date
CN101582046A CN101582046A (zh) 2009-11-18
CN101582046B true CN101582046B (zh) 2011-12-07

Family

ID=41364200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100164496A Active CN101582046B (zh) 2009-06-26 2009-06-26 一种高可用的系统状态监控、预测以及智能管理方法

Country Status (1)

Country Link
CN (1) CN101582046B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999448B (zh) * 2011-09-14 2018-07-06 奇智软件(北京)有限公司 一种外部设备检测的处理方法及装置
CN102650903A (zh) * 2012-04-20 2012-08-29 浪潮电子信息产业股份有限公司 一种存储服务器备用电源的设计方法
CN103886384B (zh) * 2012-12-20 2018-10-19 伊姆西公司 用于数据保护的方法和系统
KR101410837B1 (ko) * 2013-09-10 2014-06-24 이에스이 주식회사 비디오 메모리의 모니터링을 이용한 영상 처리 장치
CN104809051B (zh) * 2014-01-28 2017-11-14 国际商业机器公司 用于预测计算机应用中的异常和故障的方法和装置
CN104182328A (zh) * 2014-08-18 2014-12-03 深圳市杰和科技发展有限公司 一种显示卡工作状态记录和管理系统及方法
CN108292256A (zh) * 2015-11-12 2018-07-17 戴弗西公司 预测性维护
CN105554080A (zh) * 2015-12-09 2016-05-04 小米科技有限责任公司 信息推送方法及装置
CN107526671A (zh) * 2017-09-04 2017-12-29 安徽爱她有果电子商务有限公司 一种基于数据云的计算机状态监测系统
CN109101358A (zh) * 2018-07-27 2018-12-28 郑州云海信息技术有限公司 服务器系统及其硬件日志记录装置及方法
CN112255939A (zh) * 2020-09-22 2021-01-22 中国电子科技集团公司第五十二研究所 一种mxm显示单元的独立监测装置及方法

Also Published As

Publication number Publication date
CN101582046A (zh) 2009-11-18

Similar Documents

Publication Publication Date Title
CN101582046B (zh) 一种高可用的系统状态监控、预测以及智能管理方法
CN102591591B (zh) 磁盘检测系统、磁盘检测方法以及网络存储系统
US9195561B2 (en) System and method for proactive management of an information handling system with in-situ measurement of end user actions
US8181161B2 (en) System for automatically collecting trace detail and history data
JP3927532B2 (ja) 情報処理装置、情報処理装置の制御方法、プログラム及び記録媒体
US20050283673A1 (en) Information processing apparatus, information processing method, and program
JP4438010B2 (ja) 中継装置、中継方法および中継制御プログラム
CN102880522A (zh) 面向硬件故障的系统关键文件故障纠正方法及装置
CN108319525A (zh) 开关装置及检测集成电路总线的方法
WO2023226380A1 (zh) 一种磁盘处理方法、系统及电子设备
JP2002529853A (ja) 大容量メモリを備えたサブシステムのハードディスクのために書き込みを保護したディスクキャッシュ装置と方法
CN102929761B (zh) 一种应对崩溃性错误的系统及方法
JP2008027240A (ja) ディスクアレイ装置及びパトロール診断方法及びパトロール診断制御プログラム
CN114218037A (zh) 一种硬盘管理方法、装置、设备及机器可读存储介质
CN202713533U (zh) 电视机的诊断和维护系统与电视机
JP4798037B2 (ja) ハードディスクドライブ状態監視装置およびハードディスクドライブ状態監視方法
CN102662787A (zh) 一种保护系统盘raid的方法
WO1999023562A1 (en) Automatic backup based on disk drive condition
JP5440073B2 (ja) 情報処理装置,情報処理装置の制御方法および制御プログラム
US6182244B1 (en) System and method for automatically initiating a tracing facility and dynamically changing the levels of tracing currently active
CN115061641B (zh) 一种磁盘故障处理方法、装置、设备以及存储介质
CN101741600B (zh) 服务器系统与其记录装置
JP3733737B2 (ja) プログラマブルコントローラおよび記録媒体
CN101071396A (zh) 一种设置系统复位原因监控信息的方法以及监控方法
JP2002229867A (ja) ディスク装置の故障予知装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant