CN1251085C - 机群系统运行过程监控的方法和监控管理装置 - Google Patents

机群系统运行过程监控的方法和监控管理装置 Download PDF

Info

Publication number
CN1251085C
CN1251085C CN 03146284 CN03146284A CN1251085C CN 1251085 C CN1251085 C CN 1251085C CN 03146284 CN03146284 CN 03146284 CN 03146284 A CN03146284 A CN 03146284A CN 1251085 C CN1251085 C CN 1251085C
Authority
CN
China
Prior art keywords
sign indicating
indicating number
power
self
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN 03146284
Other languages
English (en)
Other versions
CN1475911A (zh
Inventor
程菊生
崔吉顺
彭涛
田宏萍
金正操
蒋晓华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN 03146284 priority Critical patent/CN1251085C/zh
Publication of CN1475911A publication Critical patent/CN1475911A/zh
Application granted granted Critical
Publication of CN1251085C publication Critical patent/CN1251085C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种监控机群系统运行过程的监控管理装置和方法。装置包括:监控主机,通过安装监控管理软件,实现人机接口和控制装置,用于监控所述机群系统的信息,实现故障分析、报警和机群上下电控制;采集装置,用于采集所述机群系统各结点机的状态信息;汇集装置,用于通过通信网络将所述采集装置采集的状态信息汇集,并传送给所述监控主机。利用本发明,使监控系统能够完整地监控机群系统的所有运行过程和运行状态。

Description

机群系统运行过程监控的方法和监控管理装置
技术领域
本发明涉及计算机机群监控领域,具体涉及机群系统全过程监控的方法和监控管理装置;更具体涉及监控结点机POST过程,Linux启动过程和系统运行中健康信息。
背景技术
机群系统是多台服务器(结点机)机器的聚合。这些服务器通过专用高速网络聚合在一起,通过中间交互件等软件系统构成一个单一映像的超级服务器。机群系统运行过程中,需要随时监测其硬件健康状态和运行状态。这样,管理员能够及时了解机群的运行状况,及时发现运行过程中出现的异常情况,并进行相应处理,保证机群系统的正常运行。每个结点都有自己的存储器、I/O设备和操作系统。这些结点机通过高速网络连接在一起,在中间件等配合下,形成一个超级服务器。机群服务器在大规模科学计算,比如石油地质等方面发挥着重要作用。
在机群系统中,面对一两百台服务器,甚至上千台服务器的情形,如何快速准确的监控结点的运行状况,是对机群系统进行监控和维护的一个重要而紧迫的问题。机群的运行过程大致可以分为POST过程、OS启动过程和正常运行过程,目前业界对正常运行过程的监控已经有很好的实现,但是对POST过程和OS启动过程却没有能够很好的进行监控。因此,本专利提出了一种机群系统全过程监控的方法和实现,通过这种方式,用户不但可以监控机群系统正常运行时的硬件健康信息,而且可以对机群的POST过程、OS启动过程进行快速准确的监控。
中国专利申请97192599.2“用于远程诊断与维修的扩充基本输入输出系统”和美国专利5,615,331“System and method fordebugging a computing system(用于调试计算系统的方法和系统)”中公开了一种开机自检(POST)和启动功能包括确定计算机是否启动的代码。当启动失败时,在扩充基本输入输出系统中直接与远程诊断与维修计算机建立通信链路检测,以在修复后重启计算机。和直接调试输出码到调试工具,调试工具发送输出的码到远方的主机的方法。这些专利申请或专利不涉及计算机POST(Power On Self Test上电自检)的监控和机群上对结点LINUX启动过程的全程监控。
为了使监控系统能够完整地监控机群系统的所有运行过程和运行状态,对机群系统的POST过程和OS(Operating System操作系统)启动过程进行监控,使用户可以快速及时的了解机群系统在各种运行过程时的状态,及时处理运行中的故障,从而保证机群系统的正常安全运行,因此,希望能可以实现机群系统全过程监控的方法和装置。
发明内容
本发明的目的是针对机群系统现有技术中的监控问题,提供解决方案,本发明采用远程控制端实现对任何一个结点机LINUX操作系统启动过程进行全部监控,如果启动过程中结点机存在问题则可以进行方便的故障定位,实现全程监控。
本发明提供一种监控机群系统运行过程的监控管理装置,包括:
监控主机,通过安装监控管理软件,实现人机接口和控制装置,用于监控所述机群系统的信息,实现故障分析、报警和机群上下电控制;
采集装置,用于采集所述机群系统各结点机的状态信息;
汇集装置,用于通过通信网络将所述采集装置采集的状态信息汇集,并传送给所述监控主机;
其中,所述采集装置在获得所述各结点的上电自检(POST)的信息和/或操作系统(OS)信息后,将所述POST信息和OS信息通过汇集装置发往监控主机,以监控所述POST过程和OS启动过程中的状态信息。
可选地,所述通信网络为485串行网络。
优选地,所述采集装置包括存储器,用于存储采集的POST码和OS码,所述监控主机中的控制装置包括基本服务提供者(BSP)装置,用于控制所述各结点机,通过中断获取所述各结点机的所述存储的POST码和OS码,并由所述汇集装置将所述各结点机的所述存储的POST码和OS码汇集后存储于所述监控主机中数据存储装置。
可选地,所述控制装置还包括:POST判断装置,用于判断是否采集POST码过程已完成,以在完成采集POST码后通过所述BSP控制采集OS码,在未完成时向所述BSP报告POST码的状态;和OS判断装置,用于判断是否采集OS码过程已完成,完成时所述机群进入正常工作过程,未完成时向所述BSP报告OS码的状态。
本发明还提供一种监控机群系统运行过程的方法,包括步骤:
设置是否要检测POST过程和/或OS过程;
如果要检测POST过程:
    上电所述机群系统的需要上电的结点机,启动所述上电
的结点机的POST过程;
    采集装置获取所述POST过程中的状态码并存储之;
    BSP发出收集POST命令,收集采集卡存储的POST码;
    根据所述POST码,确定系统的上电过程是否正常;
完成所述POST检测过程后要检测OS过程:
    采集卡获取并分析所述OS的启动过程的状态信息码;
    BSP发出收集OS码命令,收集采集卡存储的OS码;
    BSP根据所述OS码,确定启动所述OS过程是否正常;
如果不要检测POST过程和OS过程,执行正常的开机过程。
可选地,所述获取所述POST过程中的状态码的步骤还包括:确定POST过程的状态,根据预定规则编码所述状态的状态码。
优选地,所述获取并分析所述OS的启动过程的状态信息码的步骤还包括:确定OS启动所处的阶段,根据预定规则编码代表该阶段的码。
可选地,方法还包括步骤:传送各结点的所述获取的OS码或POST码到汇集装置,以将其在汇集装置中汇集。
优选地,所述获取POST状态码的步骤包括采集卡收集POST状态码,并执行BSP收集POST状态码命令,通过第一串行接口发送POST状态码到BSP;
所述获取OS的启动过程的状态信息码的步骤包括采集卡收集OS码,并执行BSP收集OS码命令,通过第一串行接口发送OS码到BSP。
可选地,所述通过第一串行接口发送采集装置采集的POST状态数据的步骤包括:
当BSP发出命令后,由汇集卡转发至采集卡,采集卡收到汇集卡发送来的命令后,发出所述第一串口的中断请求;
进入所述中断,接收控制装置的命令,如果是收集POST码命令,发送POST码;如果是收集OS码命令,发送OS码;如果不是收集POST码命令和收集OS码命令,记录所述接收的命令,结束中断,返回。
优选地,所述通过第二串行接口读取采集装置采集的OS状态数据的步骤包括:启动所述第二串行接口中断,接收所述第一串口的数据,以确定OS启动码;存储所述OS启动码;结束中断,返回。
可选地,所述确定系统的上电过程是否正常的步骤包括:在不正常时,传送POST码给控制装置;所述确定启动所述OS过程是否正常的步骤包括:在不正常时,传送OS码给控制装置。
利用本发明,使监控系统能够完整地监控机群系统的所有运行过程和运行状态,特别对机群系统的POST过程和OS启动过程进行监控,使用户可以快速及时的了解机群系统在各种运行过程时的状态,及时处理运行中的故障,从而保证机群系统的正常安全运行。
附图说明
图1示出了本发明的机群监控系统的原理框图;
图2描绘了本发明实施例的机群系统全过程监控方法的流程图;
图3描绘了本发明实施例的机群系统全过程监控方法中采集卡的流程图,其中,(A)为串口2中断处理流程图,(B)为串口1中断处理流程图。
具体实施方式
机群系统的全过程监控主要通过采集卡、汇集卡和控制台来共同完成。在本发明的实施例中,采集卡安装在机群系统的每个结点内部,汇集卡安装在每个机柜的电源箱内,控制台即监控主机,为了实现不同的控制功能,通过安装不同的控制软件构成不同的控制装置实现这些不同的控制功能,在系统中,这些控制装置主要是通过软件设置而改变控制装置的结构的。
为了便于本领域一般技术人员理解和实现本发明,现结合附图描绘本发明的实施例。
首先参照图1,图1示出了本发明的机群监控系统的原理框图。结合该原理图描绘实现监控各运行过程的方法
机群系统的POST过程监控如下。机群系统POST过程开始后,安装在每个结点内部的采集卡即通过80端口(未示出)实时的获取每个结点的POST码,并存放于采集卡的缓存区中,然后通过串行总线发送到机柜的监控系统汇集装置汇集卡,由汇集卡将机柜内所有结点的POST信息汇总后发送给机群系统的控制台。控制台统一分析处理这些POST码,并通过进度条的方式显示机群系统中所有结点的POST过程进度。如果某个结点的POST过程停止了,则可以通过界面看出停止前的POST码,通过POST码即可确定问题所在,从而提示用户解决。
机群系统的OS启动过程监控方法如下。由于Linux OS下可以将启动过程的输出重定向到串口输出,这样置于结点内的采集卡即可通过串口获取结点OS启动的信息。采集卡通过判断获取的POST码为0xff可知POST过程结束,OS启动过程开始,即通过串口获取OS的启动信息并进行分析,判断OS启动处于哪个阶段,并将阶段对应的代码通过串行总线发送汇集卡,由汇集卡将机柜内所有结点的OS启动阶段代码汇总后发送给机群系统的控制台。控制台统一分析处理这些代码,并通过进度条的方式显示机群系统中所有结点的OS启动过程进度。
机群系统正常运行后,置于每个结点内的采集卡定时从主板采集结点的各种硬件健康信息,并通过串行总线最终发送到控制台,控制台将这些信息分析处理以图形界面方式显示。
下面以实际的一个机群系统为例进行进一步说明。
该机群系统有8个结点,1个监控主机(控制台)都置于1个机柜中。结点内部都安装有采集卡,机柜底部安装有电源箱,电源箱内有汇集卡1块。采集卡,汇集卡和监控主机通过485串行网络连接。机群系统POST过程、Linux启动过程和系统正常运行过程中硬件信息的监控都是通过485串行网络来实现的。
首先,启动监控主机,从监控系统界面中可以选择对机群系统的上/下电,根据系统提示选择机群系统中需要上电的结点,即可实现机群系统的上电。以选择所有8个结点上电为例,系统选择8个结点上电后,运行在监控主机端的监控程序BSP模块即通过485串行通信网络通过通信协议和命令发送对8个结点机的开机命令,采集卡接收到开机命令后对结点机进行开机,同时从80端口(IO端口,地址为0x080)读取POST码进行保存。BSP模块执行完开机命令后,立即执行收集POST码命令,采集卡即将缓冲区中保存的POST码发送给BSP,BSP轮循各采集卡获取POST码并进行分析,并插入数据库中,GCM则访问数据库根据规则在界面显示各个结点POST过程进度。当BSP分析到采集卡获取的POST码为0xff后,可知POST过程结束,并发命令开始收集Linux启动过程的代码。采集卡发现获取的POST码为0xff后,即使能采集卡与主板相连的串口,开始收集Linux启动过程信息,并按照规则进行分析,确定Linux启动过程的几个阶段,形成Linux启动过程阶段代码,并保存,当BSP发送收集Linux启动过程的代码命令给采集卡后,采集卡即将启动过程的阶段代码发送给BSP。同样,BSP收集此代码,并分析插入数据库,GCM则访问数据库根据规则在界面显示各个结点Linux启动过程进度。
虽然本发明的实施例中,POST码和OS码是不断传送给监控主机的,实际上也可以在出现故障时才传送POST码或OS码,这时,需要POST判断装置,用于判断是否采集POST码过程已完成,以在完成采集POST码后通过BSP控制采集OS码,在未完成时向BSP报告POST码的状态;和OS判断装置,用于判断是否采集OS码过程已完成,完成时所述机群进入正常工作过程,未完成时向所述BSP报告OS码的状态。
图2和图3描述了安装在结点机内部的采集卡软件工作原理,通过描述其在获取POST码和Linux启动过程的工作原理,基本就可以了解整个系统的工作原理。
首先,监控主机选择的结点上电,运行在监控主机端的监控程序BSP模块即通过485串行通信网络通过通信协议和命令发送到结点机内部的采集卡,由采集卡执行开机命令。(未示出)
在步骤210,判断是否有监控命令,如果没有,在步骤215,判断是否要获取POST码?如果要获取,进入步骤218,收集POST码并缓存,然后,进入步骤220,判断是否需要搜集Linux阶段码。
如果在步骤215判断不要获取POST码,直接进入步骤220,判断是否要获取Linux阶段码?如果需要,进入步骤225,启动串口2信息采集,具体的采集过程参照图3(A);然后,跳转进入201步骤。如果不需要,直接跳转进入201步骤。
如果在步骤210判断有监控命令,进入步骤228,开始判断是什么命令,同时执行对应的命令子程序。例如,如果是开机命令,则执行结点机开机操作。如果不是开机命令,则判断是否其它命令,所有的命令判断完毕后,则跳转到201步骤。
应该知道,传送POST和OS码的步骤可以在出现这些码时就传送,不论其是否正确,也可以在POST过程或OS启动过程中出现问题时才将这些码传送给监控主机。因此,本发明还可包括步骤:判断POST与OS过程是否正常,及在POST过程不正常时,传送POST码给BSP;在OS启动过程不正常时,传送OS码给BSP;在它们都正常时,系统不传送POST码和OS码。因此,所附的权利要求包括这些变化和其等效变化。
图3描绘了本发明实施例的机群系统全过程监控方法中采集卡的流程图,其中,(A)为串口2中断处理流程图,(B)为串口1中断处理流程图。
对于图3(A),如果结点机在启动的过程中,则需要采集Linux的启动过程,POST码采集完成后,即启动串口2,开始采集Linux启动过程。进入串口2中断后,先执行步骤301,接收串口1数据并分析以确定Linux启动码,然后执行步骤302,将Linux启动码缓存,处理结束后返回被中断的主程序,继续执行主程序。
对于图3(B),采集卡是通过串口1来收集BSP发送来的命令的,有些命令在串口1中断服务程序中执行,有些命令只是记录命令码,在主程序中执行。其中收集POST码命令的收集是在主程序中进行,Linux启动码收集命令是在串口1中断服务程序中执行的。当BSP发出命令后,由汇集卡转发至采集卡,采集卡收到汇集卡发送来的命令后,即进入串口1中断后,执行步骤401,分析并接收汇集卡发送来的命令,然后进入步骤402,判断是否收集POST码命令,如果是则执行步骤501,发送POST码到汇集卡,如果不是,这进入步骤403,判断是否收集Linux启动码命令,如果是则执行步骤502,发送Linux启动码到汇集卡,如果不是,则进入步骤404,判断是否其它命令,如果是则执行步骤503,记录命令码(中断跳出后在主程序中执行这些命令),如果不是,则中断返回。返回被中断的主程序,继续执行主程序。
在一个机群中,远程控制端可以实现对任何一个结点机LINUX操作系统启动过程进行全部监控,如果启动过程中结点机存在问题则可以进行方便的故障定位。
采用的方法是:修改结点机的BIOS重定向和修改LINUX的部分内核,使得在启动过程中能够将启动信息从串口输出,从串口的信息转换成485通信,送到主控机。
同时可以获取结点机的POST代码进行启动过程和错误的定位。获取结点机的POST配置信息存在两种方法:从PCI上读取80H端口的POST代码,可以通过分析代码获得计算机启动自检的进程;另一种方法是通过计算机系统的BIOS设置从串口将系统启动过程中的配置信息输出。第一种方法从80H端口获取代码都是主板厂家公认的业界标准,第二种方法也是主板厂家BIOS设置的一项功能。
虽然通过实施例描绘了本发明,本领域普通技术人员知道,本发明有许多变形和变化而不脱离本发明的精神,希望所附的权利要求包括这些变形和变化而不脱离本发明的精神。

Claims (12)

1.一种监控机群系统运行过程的监控管理装置,包括:
监控主机,通过安装监控管理软件,实现人机接口和控制装置,用于监控所述机群系统的信息,实现故障分析、报警和机群上下电控制;
采集装置,用于采集所述机群系统各结点机的状态信息;
汇集装置,用于通过通信网络将所述采集装置采集的状态信息汇集,并传送给所述监控主机;
其中,所述采集装置在获得所述各结点的上电自检的信息和/或操作系统信息后,将所述上电自检信息和操作系统信息通过汇集装置发往监控主机,以监控所述上电自检过程和操作系统启动过程中的状态信息。
2.如权利要求1所述的装置,其中,所述通信网络为485串行网络。
3.如权利要求1所述的装置,其中,所述采集装置包括存储器,用于存储采集的上电自检码和操作系统码,所述监控主机中的控制装置包括基本服务提供者装置,用于控制所述各结点机,通过中断获取所述各结点机的所述存储的上电自检码和操作系统码,并由所述汇集装置将所述各结点机的所述存储的上电自检码和操作系统码汇集后存储于所述监控主机中数据存储装置。
4.如权利要求1所述的装置,其中,所述控制装置还包括:上电自检判断装置,用于判断是否采集上电自检码过程已完成,以在完成采集上电自检码后通过所述基本服务提供者装置控制采集操作系统码,在未完成时向所述基本服务提供者装置报告上电自检码的状态;和操作系统判断装置,用于判断是否采集操作系统码过程已完成,完成时所述机群进入正常工作过程,未完成时向所述基本服务提供者装置报告操作系统码的状态。
5.一种监控机群系统运行过程的方法,包括步骤:
设置是否要检测上电自检过程和/或操作系统过程;
如果要检测上电自检过程:
上电所述机群系统的需要上电的结点机,启动所述上电的结点机的上电自检过程;
采集装置获取所述上电自检过程中的状态码并存储之;
基本服务提供者装置发出收集上电自检命令,收集采集卡存储的上电自检码;
根据所述上电自检码,确定系统的上电过程是否正常;完成所述上电自检检测过程后要检测操作系统过程:
采集卡获取并分析所述操作系统的启动过程的状态信息码;
基本服务提供者装置发出收集操作系统码命令,收集采集卡存储的操作系统码;
基本服务提供者装置根据所述操作系统码,确定启动所述操作系统过程是否正常;
如果不要检测上电自检过程和操作系统过程,执行正常的开机过程。
6.如权利要求5所述的方法,其中,所述获取所述上电自检过程中的状态码的步骤还包括:确定上电自检过程的状态,根据预定规则编码所述状态的状态码。
7.如权利要求5所述的方法,其中,所述获取并分析所述操作系统的启动过程的状态信息码的步骤还包括:确定操作系统启动所处的阶段,根据预定规则编码代表该阶段的码。
8.如权利要求7所述的方法,其中,还包括步骤:传送各结点的所述获取的操作系统码或上电自检码到汇集装置,以将其在汇集装置中汇集。
9.如权利要求5所述的方法,其中,所述获取上电自检状态码的步骤包括采集卡收集上电自检状态码,并执行基本服务提供者装置收集上电自检状态码命令,通过第一串行接口发送上电自检状态码到基本服务提供者装置;
所述获取操作系统的启动过程的状态信息码的步骤包括采集卡收集操作系统码,并执行基本服务提供者装置收集操作系统码命令,通过第一串行接口发送操作系统码到基本服务提供者装置。
10.如权利要求9所述的方法,所述通过第一串行接口发送采集装置采集的上电自检状态数据的步骤包括:
当基本服务提供者装置发出命令后,由汇集卡转发至采集卡,采集卡收到汇集卡发送来的命令后,发出所述第一串口的中断请求;
进入所述中断,接收控制装置的命令,如果是收集上电自检码命令,发送上电自检码;如果是收集操作系统码命令,发送操作系统码;如果不是收集上电自检码命令和收集操作系统码命令,记录所述接收的命令,结束中断,返回。
11.如权利要求10所述的方法,其中,所述通过第二串行接口读取采集装置采集的操作系统状态数据的步骤包括:启动所述第二串行接口中断,接收所述第一串口的数据,以确定操作系统启动码;存储所述操作系统启动码;结束中断,返回。
12.如权利要求5所述的方法,其中,所述确定系统的上电过程是否正常的步骤包括:在不正常时,传送上电自检码给控制装置;所述确定启动所述操作系统过程是否正常的步骤包括:在不正常时,传送操作系统码给控制装置。
CN 03146284 2003-07-08 2003-07-08 机群系统运行过程监控的方法和监控管理装置 Expired - Lifetime CN1251085C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 03146284 CN1251085C (zh) 2003-07-08 2003-07-08 机群系统运行过程监控的方法和监控管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 03146284 CN1251085C (zh) 2003-07-08 2003-07-08 机群系统运行过程监控的方法和监控管理装置

Publications (2)

Publication Number Publication Date
CN1475911A CN1475911A (zh) 2004-02-18
CN1251085C true CN1251085C (zh) 2006-04-12

Family

ID=34156024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 03146284 Expired - Lifetime CN1251085C (zh) 2003-07-08 2003-07-08 机群系统运行过程监控的方法和监控管理装置

Country Status (1)

Country Link
CN (1) CN1251085C (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7493300B2 (en) * 2004-09-30 2009-02-17 International Business Machines Corporation Model and system for reasoning with N-step lookahead in policy-based system management
CN102313506B (zh) * 2010-07-09 2013-12-25 联想(北京)有限公司 一种检测设备物理位置的方法、机柜以及设备
CN103188091A (zh) * 2011-12-28 2013-07-03 英业达股份有限公司 云端服务系统的管理方法及管理系统
CN103905566A (zh) * 2014-04-22 2014-07-02 浪潮电子信息产业股份有限公司 一种服务器启动信息远程查看及导出方法
CN108388191A (zh) * 2018-05-22 2018-08-10 郑州云海信息技术有限公司 一种基于模块化数据中心的设备监控装置及方法
CN112069020B (zh) * 2020-08-13 2023-09-15 中国航空无线电电子研究所 基于嵌入式操作系统的机载航电设备软件故障监控系统

Also Published As

Publication number Publication date
CN1475911A (zh) 2004-02-18

Similar Documents

Publication Publication Date Title
CN1300694C (zh) 基于故障树分析的系统故障定位方法及装置
CN1129857C (zh) 多处理器转换装置和主处理器转换方法
JP6461246B2 (ja) インダストリアル・インターネットオペレーションシステムに基づく安全性の検査方法と装置
CN101197621B (zh) 一种对网管系统故障进行远程诊断定位的方法及其系统
CN103873279B (zh) 一种服务器管理方法,及装置
CN111209131A (zh) 一种基于机器学习确定异构系统的故障的方法和系统
CN101060436A (zh) 一种用于通信设备的故障分析方法及装置
CN1695282A (zh) 用于管理基于对象的群集的系统与方法
CN113836044B (zh) 一种软件故障采集和分析的方法及系统
CN111459782B (zh) 监控业务系统的方法、装置、云平台系统和服务器
CN109462490B (zh) 视频监控系统及故障分析方法
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN102075368A (zh) 一种业务故障诊断方法、装置和系统
CN112819640B (zh) 一种面向微服务的金融回测容错系统及方法
CN1251085C (zh) 机群系统运行过程监控的方法和监控管理装置
CN115858221A (zh) 存储设备的管理方法、装置、存储介质及电子设备
US8949669B1 (en) Error detection, correction and triage of a storage array errors
CN202150114U (zh) 一种Oracle监控系统
CN102170368B (zh) 一种面向大尺寸构件的分布式测量系统的智能故障定位方法
CN1466095A (zh) 采集机群中节点的软件和硬件信息的方法与系统
CN113591951A (zh) 一种智能电视远程运维方法及系统
CN112100019B (zh) 面向大规模系统的多源故障协同分析定位方法
CN109597389A (zh) 一种嵌入式控制系统的测试系统
CN110955551A (zh) 一种基于tomcat中间件的故障智能诊断装置
CN115757045A (zh) 一种交易日志分析方法、系统及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20060412

CX01 Expiry of patent term