CN104639352A - 监控装置以及监控方法 - Google Patents

监控装置以及监控方法 Download PDF

Info

Publication number
CN104639352A
CN104639352A CN201310559797.4A CN201310559797A CN104639352A CN 104639352 A CN104639352 A CN 104639352A CN 201310559797 A CN201310559797 A CN 201310559797A CN 104639352 A CN104639352 A CN 104639352A
Authority
CN
China
Prior art keywords
abnormal
anomaly
similar
exception
abnormality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310559797.4A
Other languages
English (en)
Inventor
李军
张涛
单纯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to CN201310559797.4A priority Critical patent/CN104639352A/zh
Publication of CN104639352A publication Critical patent/CN104639352A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种监控装置以及监控方法,用于对被监控对象进行监控。监控装置包括:异常感知单元,其用于感知所述被监控对象是否发生了异常;异常记录单元,其在所述异常感知单元感知到发生了异常时,将规定时间内所发生的异常设为同一异常现象编号,作为同一异常现象在存储部中记录所述被监控对象出现异常时的异常数据信息;相似异常判断单元,其在从所述异常感知单元感知到发生了异常时起经过了所述规定时间后,利用所述存储部中所存储的异常数据信息判断是否之前发生过相似的异常现象;和异常处理与再现单元,其根据所述相似异常判断单元的判断结果,提示之前发生过的相似异常现象,并且对异常进行修复。

Description

监控装置以及监控方法
技术领域
本发明涉及一种用于对被监控对象进行监控的监控装置以及方法,尤其涉及一种能够自动记录、并辅助分析和处理异常情况的监控装置以及监控方法。
背景技术
在IT领域,监控装置普遍用于监控大型机房中的各台设备。随着云计算时代的到来,监控装置又被越来越多应用于监控分布于不同地理位置的各个机房中的设备。在目前普遍存在的各种监控系统中,被检测对象的状态由监控系统实时取得,如果有设备故障发生就记录到监控系统的监控日志中,方便管理员在故障发生之后定位故障原因。
虽然这种方法有效,但并不利于管理员以最快的方法定位故障的原因。一是因为管理员需要花费很多时间去检查大量的监控日志文字和图片,二是因为有些故障出现的频率很大,比如有些故障几乎每周都会出现,其实对于有经验的管理员来说通过对常见的故障现象的判断就可以推断出常见故障发生的原因。
针对这个问题,目前已经有一些发明专利用来记录监控系统中的故障现象便于管理员快速定位故障原因。中国专利(申请)号:200810187991.3,公开了一种视频监控系统中前端录像的定制方法和装置,该系统能够将被监控对象出现异常的过程录制下来,用于辅助管理员定位被监控对象发生异常的原因。但是,此发明虽然能记录故障现象但还是需要通过管理员来分析、处理故障原因,并不能由计算机自动分析并处理异常情况。
专利文献1:中国专利(申请)号:200810187991.3
发明内容
为了解决这个问题,提出了本发明。本发明的目的是提供一种能够辅助管理员分析并处理异常情况的监控装置以及监控方法。此装置以及方法能够实时检测被监控对象的状态,当发现被监控对象出现异常时,会自动记录异常现象、分析判断异常类型,进而能够记录异常的解决流程。当相似的异常现象再次出现时,监控装置能够自动提示管理员上次发生相似异常的时间和相似度,管理员可以根据相似度选择回放相似异常现象,并根据相似异常的异常原因分析备注,确认是否是同一故障原因引起的。如果确认是由同一故障原因引起的,则管理员可以进一步选择回放上次异常解决方法的录像,甚至可以自动执行根据上次的异常解决流程生成的脚本来自动修复异常。
为了实现上述目的,本发明提出一种用于对被监控对象进行监控的监控装置,其特征在于,包括:异常感知单元,其用于感知所述被监控对象是否发生了异常;异常记录单元,其在所述异常感知单元感知到发生了异常时,将规定时间内所发生的异常设为同一异常现象编号,作为同一异常现象在存储部中记录所述被监控对象出现异常时的异常数据信息;相似异常判断单元,其在从所述异常感知单元感知到发生了异常时起经过了所述规定时间后,利用所述存储部中所存储的异常数据信息判断是否之前发生过相似的异常现象;和异常处理与再现单元,其根据所述相似异常判断单元的判断结果,提示之前发生过的相似异常现象,并且对异常进行修复。
根据该监控装置,通过相似异常判断单元,能够在从异常感知单元感知到发生了异常时起经过了规定时间后,利用存储部中所存储的由异常记录单元记录的异常现象判断是否之前发生过相似的异常现象,并且通过异常处理与再现单元,提示之前发生过的相似异常现象,辅助管理员定位故障原因,并且对新发生的异常进行修复。因为提示之前发生过的相似异常现象,提供相似异常的异常原因分析备注,所以能够有助于快速定位被监控对象发生异常的原因。并且,通过提示之前发生过的相似异常现象,提供相似异常的异常修复过程,所以能够有助于管理员快速找到异常修复方法。
此外,本发明的监控装置,优选所述异常感知单元设置在B/S系统的前端页面和/或后端应用中。
此外,本发明的监控装置,优选在所述异常处理与再现单元对异常进行修复时,使所述异常记录单元将表示异常的发生原因的异常原因分析备注和/或对异常进行修复的异常修复过程记录到所述存储部中,所述异常修复过程是一段异常修复视频,或者是一段记录了异常修复处理过程中的操作序列的可执行脚本,所述异常处理与再现单元在提示之前发生过的相似异常现象时,提供所述异常原因分析备注和/或所述异常修复过程。
此外,本发明的监控装置,优选所述异常数据信息除了包括所述异常现象编号之外,还包括:发生了异常的所述被监控对象的编号、异常类型、异常发生的开始时刻。
此外,本发明的监控装置,优选所述相似异常判断单元在判断是否之前发生过相似的异常现象时,根据异常发生的开始时刻,依次判断异常现象编号相同的本次异常现象与所述存储部中存储的每一个异常现象这两次异常现象的异常类型序列是否相同,如果不同则将这两次异常现象的相似度设为代表不相似的值,如果相同则判断这两次异常现象的被监控对象的编号序列是否相同,如果不同则将这两次异常现象的相似度设为代表可能相似的第一设定值,如果相同则将这两次异常现象的相似度设为代表非常相似的第二设定值,若相似度为第一设定值或第二设定值的异常现象存在,则判断为之前发生过相似的异常现象。
此外,本发明的监控装置,优选在所述相似异常判断单元判断出存在相似异常现象时,在前端页面显示相似异常现象列表,按照相似度列出所有的相似异常现象。
此外,本发明的监控装置,优选在所述相似异常判断单元判断出存在相似异常现象时,在前端页面显示相似异常现象列表,按照相似度仅列出带有异常原因分析备注和/或异常修复过程的相似异常现象。
此外,本发明的监控装置,优选在与之前发生过的相似异常现象对应的所述异常修复过程是一段记录了异常修复处理过程中的操作序列的可执行脚本时,利用该可执行脚本,自动修复由所述异常感知单元感知到的新发生的异常。
为了解决上述技术问题,本发明的另一方式提出一种用于对被监控对象进行监控的监控方法,其特征在于,包括:异常感知步骤,感知所述被监控对象是否发生了异常;异常记录步骤,在所述异常感知步骤中感知到发生了异常时,将规定时间内所发生的异常设为同一异常现象编号,作为同一异常现象在存储部中记录所述被监控对象出现异常时的异常数据信息;相似异常现象判断步骤,在从所述异常感知步骤感知到发生了异常时起经过了所述规定时间后,利用所述存储部中所存储的异常数据信息判断是否之前发生过相似的异常现象;和异常处理与再现步骤,根据所述相似异常现象判断步骤的判断结果,提示之前发生过的相似异常现象,并且对异常进行修复。
根据本发明,当相似的异常现象再次出现时,监控装置能够自动提示管理员上次发生相似异常的时间和相似度,管理员可以根据相似度选择回放相似异常现象,进而可以进一步选择回放上次异常解决方法的录像和/或脚本,甚至可以自动执行根据上次的异常解决流程生成的脚本来自动修复异常。
附图说明
附图用来对本发明做进一步理解,构成说明书的一部分,与优选实施例一起用于对本发明进行详细的解释,并不构成对本发明的限制。其中:
图1是监控系统的整体结构图。
图2是示意性表示异常感知单元的工作原理图。
图3是监控装置对检测出的异常进行记录和重放,并最终进行处理的原理示意图。
图4是相似异常判断的工作流程图。
图5是一种带有自动记录、分析和处理异常的监控系统的使用示例图。
具体实施方式
下面将参考附图来对本发明的实施方式进行详细说明。在附图中,相同的元件将由相同的参考符号或数字表示。此外,在本发明的下列描述中,将省略对已知功能和配置的具体描述,以避免使本发明的主题不清楚。
图1是监控系统的整体结构图,其中,实线框中的部分为传统的监控系统,实线框以外的部分为本发明在传统监控系统基础之上所添加的单元模块。
如图1所示,本发明的监控装置主要包括:异常感知单元101、异常现象以及修复过程记录单元102、相似异常判断单元103、异常修复单元104和相似异常回放单元105。其中,异常现象以及修复过程记录单元102相当于“异常记录单元”,异常修复单元104和相似异常回放单元105相当于“异常处理与再现单元”。
异常感知单元101能够根据脚本的设定自动识别系统前端和后端所检测出的异常情况。
异常现象以及修复过程记录单元102(相当于“异常记录单元”)能够在监控系统检测到有异常发生时,自动记录相关异常信息,例如,被监控对象编号,时间,错误画面编号等。
相似异常判断单元103能够在监控系统检测到有异常发生时,判断是否之前发生过相似的异常。
异常处理与再现单元能够在相似异常判断单元判断出之前有相似异常发生过时,播放该相似异常的异常现象和异常修复过程录像,并根据上次异常修复过程生产的脚本来自动修复该新发生的异常。
图2是异常感知单元的工作原理图。
如图2所示,异常感知单元101有两种工作模式,第一种是监控系统的前端页面,例如通过脚本设置在前端页面感知异常,例如颜色变化;而另一种是监控系统的后端(服务器),例如利用警报事件日志感知异常。用户可以选择其中之一也可以选择全部。如果选择监控系统的后台,则本发明装置可以在服务器端添加一些监控函数用于获取系统异常发生的信息,从而对异常进行分析。然而,在有些情况下,用户是无法更改系统的后台设置的,这时用户可以对系统的前端页面插入一些脚本用于对系统的监控。
图3是监控装置对检测出的异常进行记录和重放,并最终进行处理的原理示意图。
如图3所示,在异常记录与再现时,使用三张表来存放有关异常的信息。
其一为被监控对象状态表,此表用于实时记录被监控对象在各个时刻的状态。
其二为异常事件表,此表用于记录被检测对象出现异常时的异常数据信息。主要数据包括:异常显示页面地址url(网页url),用于回放异常现象;异常现象编号,同一异常现象包括从第一次异常发生到设定时间段△T1内的不同设备上发生的不同异常事件;发生异常的被监控对象编号(设备编号);异常类型,异常类型可以由用户在监控系统应用中自己定义,比如数据库异常、网络异常、服务器CPU或DISK异常等;异常发生的开始时刻;异常原因分析备注;以及异常对应的修复记录编号。
其中,异常事件表中的“发生异常的被监控对象编号”、“异常类型”、以及“异常发生的开始时刻”将会在相似异常判断单元中用于判断是否为相似异常。对于“异常原因分析备注”,在由相似异常判断单元判断出相似异常现象时,能够通过提示与相似异常现象相对应的异常原因分析备注,来辅助管理员确认本次异常的故障原因。
其三为异常处理记录表,此表用于记录管理员对异常处理的过程。该修复过程记录包括两种类型,一是异常修复视频,用于下次发生类似异常时回放给管理员以提示;另一种记录类型是过程修复自动化脚本,管理员可以把经常的一些异常基于自动化工具(比如GUI自动化工具)把修复过程转换为可以自动执行的自动化脚本。等下次发生相似异常时就可以自动修复。
图4是相似异常判断的工作流程图。在图4中例示如下三种现象的情况:
现象P1:(T1,D1,S1)->(T2,D2,S2)->(T3,D3,S3)
现象P2:(T1,D1,S1)->(T2’,D2,S2)->(T3’,D3,S3)相似度100%
现象P3:(T1’,D4,S1)->(T2’,D5,S2)->(T4’,D6,S3)相似度50%
其中,T表示时刻,D表示设备(被监控对象),S表示异常类型。
在监控系统中一个异常或异常发生时它并不是一个孤立的事件,比如在一台机器D1上在T1时刻发生了异常类型为S1的异常A,而异常A可能会导致与D1连接的机器D2上的在T2时刻发送异常类型为S2异常B的发生,而这种异常发生连锁反应现象,可以用以下三元组模型来表示,(T1,D1,S1)->(T2,D2,S2)。用T1,T2表示异常发生的时间和先后顺利,D1,D2表示异常发生的设备,S1,S2表示异常发生的类型。这些异常信息都可以从图3的三种异常记录表中找到。
等下次异常现象再次发生时用图4表示的方式来判断异常现象之间的相似度。首先判断两次异常现象是否用相同的异常类型序列,比如异常类型是否都是S1->S2->S3,如果相同则定义这两次异常现象相似度为50%;如果不同则两次异常之间相似度为0。如果两次异常现象相似度为50%,则进一步判断这两次异常的发生的设备,比如判断异常设备是否都是D1->D2->D3,如果异常都发生在同样序列的设备上,就定义这两次异常现象相似度为100%。其中,相似度为0,表示这两个异常现象不相似;相似度为50%,表示这两个异常现象可能相似;相似度为100%,表示这两个异常现象非常相似。数值0、50%、100%仅仅是例示,也可以采用其他数值,除了数值以外,还可以采用其他的能够将相似度区别开的值。另外,即使两个异常现象完全相同,本发明中也用表示非常相似的相似度来表现,例如,在本实施例中相似度为100%。
当然这里的异常相似规则也可以由管理员根据系统的掌握自己定义,比如可以手动添加(T1,D1,S1)->(T2,D2,S2)和(T3,D1,S3)->(T4,D2,S2)为相似度为100%。
在由计算机计算出相似异常之后,就会在前端页面显示出一个相似异常列表,按照相似度列出所有的相似异常,管理员可以选择回放某些相似异常来进一步确定是否是同一异常。
回放之前记录的异常处理过程的录像只是用来给管理员提供参考。了解他人或自己在上次遇到类似异常时是如何处理的,被记录的异常处理过程可以是一段视频,也可以是一段记录了处理过程中的操作序列生成的脚本,比如设置某个页面的某个参数值或点击某个按钮。如果是后者,则管理员可以选择再次执行此脚本去处理此次异常。
下面,以图5为示例说明如何在实际项目中使用本说明的带有自动记录、分析和处理异常的监控系统。
图5中被监控设备包括机房中若干台PC,这里主要关注设备1~设备5,这5台PC分别对应不同的应用目的,其中设备1、设备2、设备3分别用于web应用程序A的DB服务器、应用服务器、web服务器,设备1、设备4、设备5分别用于web应用程序B的DB服务器、应用服务器、web服务器。
监控系统后台实时采集设备1~设备5的状态数据,包括服务器监控(CPU、DISK等)、网络监控(网络使用状况,网络连接数、吞吐率等)、数据库监控(数据库空间的使用情况、并发连接数、缓存命中率等)。D1~D5设备的实时状态数据都保存在如图3所示的监控数据表(也称为“被监控对象状态表”)中,包括被监控对象编号、被监控对象的各种状态数值(包括服务器监控数据、网络监控数据、数据库监控数据等)、以及对应时间等。
在监控系统的前端以web页面的形式显示整个系统的运行状况,在主页是网络的拓扑结构图,图中每个设备例如用不同颜色的图标表示不同设备的运行健康状态,比如绿色表示健康良好,黄色表示警告,红色表示有严重异常发生。当有异常发生时在设备的图标上方会弹出一些具体的异常信息比如DISK空间不足等。点击不同设备图标可以查看到该设备具体的状态信息和报警信息。
这里监控系统中的异常感知单元101包括2个模块,一个是位于前端的异常感知模块1011,一个是位于后端的异常感知模块1012。这里采用位于前端的异常感知模块,在web页面中采用一些的动态语言比如JavaScript语言去做一些状态判断,比如判断页面内的D1~D5设备图标颜色是否有变化,是否有报警信息弹出等。根据页面的状态变化来判断异常发生的时刻并且记录一段时间内的页面状态。假如采用后端感知方式,在异常发生之后监控系统会生成监控日志,监控日志包含异常发生的设备信息和异常时间信息等,后端的感知模块实时解析日志信息判断有无监控事件发生,如果发生则触发异常记录模块开始记录。
现在假设在每月的中旬访问web应用程序A的用户比较多,在某一时刻D1设备由于数据库空间不足发生了异常,Web页面内的异常感知单元101可以捕获到D1设备的图标颜色变为红色,通知监控系统后台异常记录模块开始记录异常现象数据,包括发生异常Web页面ID、异常发生的设备D1、设备异常类型S1数据库空间不足、异常发生的时刻T1。紧接着在异常设定持续有效时间△T1之间内由于在D1上数据库DB空间不足引起DB操作缓慢,导致在D2设备上的应用服务器程序阻塞并不断尝试重新连接,从而导致D2设备上的CPU利用率超出阀值异常S2,同时D3设备上的应用服务器上的用户连接数不断增加导致出现网络连接网络异常S3。异常记录单元102最终记录下异常链现象P1=(T1,D1,S1)->(T2,D2,S2)->(T3,D3,S3),其中T3-T1<=△T(同一异常链持续有效时间),△T1可以由管理员根据自己系统经验进行设定比如从第一个异常发生之后的3分钟之内属于事件同一个异常现象。这些异常数据数据一方面用于还原异常现象,另一方面用于后续的相似异常判断。
在异常发生之后固定时间间隔△T1之后,会自动触发相似异常判断单元103,判断是否之前有类似的异常发生。这里假定这样的异常是第一次出现,即相似的异常数量为0。这时在前端页面会自动弹出是否开始异常修复按钮即图5中的异常修复单元104。
由于之前没有类似的异常出现过,为了详细的诊断异常原因和做出异常修复,根据异常提示信息,管理员需要详细检查DB数据库内的运行状况,并最终发现异常原因是数据库事务日志表太大导致的。找到异常原因之后,管理员开始修复异常,这时管理员可以点击异常修复按钮,这时会弹出两种修复记录方法,一是触发前端的录像装置开始记录异常修复录像,二是采用自动修复技术,把修复的过程基于一些自动化工具用自动化脚本实现,比如Pywinauto,AutoIT等。这里管理员选择采用第二种方式,于是管理员写了自动化脚本用来备份和删除数据库事务日志。并在异常记录表P1对应的修复记录中填写异常修复备注和修复自动化脚本。
在异常现象P1发生的一个月之后,在某一时刻D1设备出现同样的报警信息数据库空间不足(异常S1),但是后续的异常现象是在D4设备上出现上CPU利用率超出阀值(异常S2)以及设备D5上出现网络连接失败(异常S3)。异常发生的原因是web应用A和web应用B的数据库都放在D1设备上,等数据库空间不足时web应用A和web应用B运行速度都显著下降。而在数据库发生异常之后Web应用A的用户数量较少,而web应用B的用户数量很大。虽然设备D2和D4都是应用服务器,设备D3和D5都是web服务器,但由于web应用程序B的数量很大,所以和web应用程序B相关联的设备会出现以下异常现象P2=(T4,D1,S1)->(T5,D4,S2)->(T6,D5,S3)。和异常现象P2一样异常记录单元102会记录整个异常现象的信息,便于后续的异常重现和相似异常判断。
在异常发生之后固定时间间隔ΔT1之后,会自动触发相似异常判断单元103,根据图4所示的算法,由于异常现象P1和P2有相同的异常类型序列S1->S2->S3,但是异常发生的设备不同,P1是D1->D2->D3而P2是D1->D4->D5,所以计算出相似度是50%。
监控系统是通过检索异常记录表中的以前异常数据来计算查找所有相似异常数据,注意这里的要查找的异常数据包括2种:一种是查找相似异常的全部数量以及最近相似异常发生的时间,方便管理员对相似异常发生的频率有整体了解,二是重点查找带有异常原因分析备注和异常修复的相似异常信息,这种异常信息用于异常回放并帮助管理员进行异常修复。
在全部检索所有相似异常现象之后,在Web页面的主页面即网络拓扑页面会自动弹出图5中所示的相似异常弹出框。
在相似异常弹出框内按照相似度的大小自动排列所有的相似异常现象列表,管理员可以选择其中的异常现象进行回放,目的一是进一步通过异常现象确认新旧异常是不是同一种异常现象,二是通过查看异常原因分析备注和异常修复方法帮助管理员尽快的定位异常原因并快速的修复异常。这里异常修复采用的是通过自动化脚本来删除数据库事务日志表,当然也可以是一段录像记录异常修复过程。管理员在进一步确认异常后可以点击执行异常修复脚本来恢复系统,并判断修复结果是否正确。如果正确就异常修复到此结束,如果执行脚本删除数据库事务日志表后异常仍然存在管理员需要继续一方面诊断设备D1上数据库其他状况,二是继续回放其他的相似异常,查看其他的异常可能原因并最终修复异常。
这里本发明的监控系统(监控装置)通过异常感知单元101感知异常发生,并通知异常记录单元102开始记录异常现象,在设定的异常链有效时间ΔT1之后,由监控系统后台相似异常判断单元103判断是否之前已经有类似的异常,如果没有相似异常记录管理员需要手动修需并记录修复的过程,如果有相似的异常现象,则先回放相似异常现象,进一步确定异常原因,再回放异常修复录像或直接执行修复脚本来快速的修复异常恢复系统。
本发明的监控系统(监控装置)通过自动记录分析异常现象和管理员再次确认、手动触发修复相结合,由系统智能的给出异常发生的潜在原因和不同的解决方法,对于管理员单凭异常解决经验或每次查看日志分析异常原因方法相比较,这种提供异常分析和修复的监控系统的效率更高更快速,减少管理员人工作业时间并提供了良好的人机交互体验。
尽管以上已经结合本发明的优选实施例示出了本发明,但是本领域的技术人员将会理解,在不脱离本发明的精神和范围的情况下,可以对本发明进行各种修改、替换和改变。因此,本发明不应由上述实施例来限定,而应由所附权利要求及其等价物来限定。

Claims (9)

1.一种用于对被监控对象进行监控的监控装置,其特征在于,包括:
异常感知单元,其用于感知所述被监控对象是否发生了异常;
异常记录单元,其在所述异常感知单元感知到发生了异常时,将规定时间内所发生的异常设为同一异常现象编号,作为同一异常现象在存储部中记录所述被监控对象出现异常时的异常数据信息;
相似异常判断单元,其在从所述异常感知单元感知到发生了异常时起经过了所述规定时间后,利用所述存储部中所存储的异常数据信息判断是否之前发生过相似的异常现象;和
异常处理与再现单元,其根据所述相似异常判断单元的判断结果,提示之前发生过的相似异常现象,并且对异常进行修复。
2.根据权利要求1所述的监控装置,其特征在于,
所述异常感知单元设置在B/S系统的前端页面和/或后端应用中。
3.根据权利要求1所述的监控装置,其特征在于,
在所述异常处理与再现单元对异常进行修复时,使所述异常记录单元将表示异常的发生原因的异常原因分析备注和/或对异常进行修复的异常修复过程记录到所述存储部中,
所述异常修复过程是一段异常修复视频,或者是一段记录了异常修复处理过程中的操作序列的可执行脚本,
所述异常处理与再现单元在提示之前发生过的相似异常现象时,提供所述异常原因分析备注和/或所述异常修复过程。
4.根据权利要求1所述的监控装置,其特征在于,
所述异常数据信息除了包括所述异常现象编号之外,还包括:发生了异常的所述被监控对象的编号、异常类型、异常发生的开始时刻。
5.根据权利要求4所述的监控装置,其特征在于,
所述相似异常判断单元在判断是否之前发生过相似的异常现象时,根据异常发生的开始时刻,依次判断异常现象编号相同的本次异常现象与所述存储部中存储的每一个异常现象这两次异常现象的异常类型序列是否相同,如果不同则将这两次异常现象的相似度设为代表不相似的值,如果相同则判断这两次异常现象的被监控对象的编号序列是否相同,如果不同则将这两次异常现象的相似度设为代表可能相似的第一设定值,如果相同则将这两次异常现象的相似度设为代表非常相似的第二设定值,
若相似度为第一设定值或第二设定值的异常现象存在,则判断为之前发生过相似的异常现象。
6.根据权利要求1所述的监控装置,其特征在于,
在所述相似异常判断单元判断出存在相似异常现象时,在前端页面显示相似异常现象列表,按照相似度列出所有的相似异常现象。
7.根据权利要求3所述的监控装置,其特征在于,
在所述相似异常判断单元判断出存在相似异常现象时,在前端页面显示相似异常现象列表,按照相似度仅列出带有异常原因分析备注和/或异常修复过程的相似异常现象。
8.根据权利要求3所述的监控装置,其特征在于,
在与之前发生过的相似异常现象对应的所述异常修复过程是一段记录了异常修复处理过程中的操作序列的可执行脚本时,利用该可执行脚本,自动修复由所述异常感知单元感知到的新发生的异常。
9.一种用于对被监控对象进行监控的监控方法,其特征在于,包括:
异常感知步骤,感知所述被监控对象是否发生了异常;
异常记录步骤,在所述异常感知步骤中感知到发生了异常时,将规定时间内所发生的异常设为同一异常现象编号,作为同一异常现象在存储部中记录所述被监控对象出现异常时的异常数据信息;
相似异常现象判断步骤,在从所述异常感知步骤感知到发生了异常时起经过了所述规定时间后,利用所述存储部中所存储的异常数据信息判断是否之前发生过相似的异常现象;和
异常处理与再现步骤,根据所述相似异常现象判断步骤的判断结果,提示之前发生过的相似异常现象,并且对异常进行修复。
CN201310559797.4A 2013-11-12 2013-11-12 监控装置以及监控方法 Pending CN104639352A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310559797.4A CN104639352A (zh) 2013-11-12 2013-11-12 监控装置以及监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310559797.4A CN104639352A (zh) 2013-11-12 2013-11-12 监控装置以及监控方法

Publications (1)

Publication Number Publication Date
CN104639352A true CN104639352A (zh) 2015-05-20

Family

ID=53217705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310559797.4A Pending CN104639352A (zh) 2013-11-12 2013-11-12 监控装置以及监控方法

Country Status (1)

Country Link
CN (1) CN104639352A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404581A (zh) * 2015-12-25 2016-03-16 北京奇虎科技有限公司 一种数据库的评测方法和装置
CN105490868A (zh) * 2015-11-17 2016-04-13 世纪龙信息网络有限责任公司 异地机房数据双向同步监控方法与系统
CN106202535A (zh) * 2016-07-25 2016-12-07 浪潮(北京)电子信息产业有限公司 一种rrd数据库的检测的方法及系统
CN107040742A (zh) * 2017-03-10 2017-08-11 浙江宇视科技有限公司 一种异常检测方法及网络硬盘录像机nvr
CN107291044A (zh) * 2017-06-23 2017-10-24 深圳市盛路物联通讯技术有限公司 一种机床运行状态的智能监控方法及系统
CN109669402A (zh) * 2018-09-25 2019-04-23 平安普惠企业管理有限公司 异常监控方法、设备、装置及计算机可读存储介质
CN110134029A (zh) * 2018-02-09 2019-08-16 凌华科技股份有限公司 撷取设备数据的方法
CN114281446A (zh) * 2021-11-26 2022-04-05 上海闪马智能科技有限公司 异常事件的显示方法及装置、存储介质、电子装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105490868A (zh) * 2015-11-17 2016-04-13 世纪龙信息网络有限责任公司 异地机房数据双向同步监控方法与系统
CN105404581B (zh) * 2015-12-25 2019-03-05 北京奇虎科技有限公司 一种数据库的评测方法和装置
CN105404581A (zh) * 2015-12-25 2016-03-16 北京奇虎科技有限公司 一种数据库的评测方法和装置
CN106202535A (zh) * 2016-07-25 2016-12-07 浪潮(北京)电子信息产业有限公司 一种rrd数据库的检测的方法及系统
CN106202535B (zh) * 2016-07-25 2020-03-27 浪潮(北京)电子信息产业有限公司 一种rrd数据库的检测的方法及系统
CN107040742A (zh) * 2017-03-10 2017-08-11 浙江宇视科技有限公司 一种异常检测方法及网络硬盘录像机nvr
CN107040742B (zh) * 2017-03-10 2019-10-18 浙江宇视科技有限公司 一种异常检测方法及网络硬盘录像机nvr及视频服务器
US11039126B2 (en) 2017-03-10 2021-06-15 Zhejiang Uniview Technologies Co., Ltd. Abnormality detection method, network video recorder (NVR), and video server
CN107291044A (zh) * 2017-06-23 2017-10-24 深圳市盛路物联通讯技术有限公司 一种机床运行状态的智能监控方法及系统
CN110134029A (zh) * 2018-02-09 2019-08-16 凌华科技股份有限公司 撷取设备数据的方法
CN109669402A (zh) * 2018-09-25 2019-04-23 平安普惠企业管理有限公司 异常监控方法、设备、装置及计算机可读存储介质
CN109669402B (zh) * 2018-09-25 2022-08-19 平安普惠企业管理有限公司 异常监控方法、设备、装置及计算机可读存储介质
CN114281446A (zh) * 2021-11-26 2022-04-05 上海闪马智能科技有限公司 异常事件的显示方法及装置、存储介质、电子装置

Similar Documents

Publication Publication Date Title
CN104639352A (zh) 监控装置以及监控方法
EP3373516B1 (en) Method and device for processing service calling information
CN110928772B (zh) 一种测试方法及装置
US20190228296A1 (en) Significant events identifier for outlier root cause investigation
CN111209131A (zh) 一种基于机器学习确定异构系统的故障的方法和系统
KR102118670B1 (ko) Ict 인프라 관리 시스템 및 이를 이용한 ict 인프라 관리 방법
CN101632093A (zh) 用于使用统计学分析来管理性能故障的系统和方法
CN110516971A (zh) 异常检测的方法、装置、介质和计算设备
EP3663919B1 (en) System and method of automated fault correction in a network environment
JP2015028700A (ja) 障害検知装置、障害検知方法、障害検知プログラム及び記録媒体
CN103324565B (zh) 日志监控方法
JP2009238010A (ja) Itシステムのトラブル対処装置、トラブル対処方法およびそのためのプログラム
JP2010049532A (ja) 運転監視支援装置
CN112219175A (zh) 用于管理技术安装的方法和系统
CN111865673A (zh) 一种自动化故障管理方法、装置及系统
CN104765672A (zh) 错误码监控方法、装置及设备
US11887465B2 (en) Methods, systems, and computer programs for alarm handling
CN110000705A (zh) 一种磨机异常加工操作的检测方法、系统及相关组件
CN104123217A (zh) 一种业务服务器执行命令的捕获方法及系统
CN115102838B (zh) 服务器宕机风险的应急处理方法和装置、电子设备
US20220147039A1 (en) Event analytics in modular industrial plants
US20220035359A1 (en) System and method for determining manufacturing plant topology and fault propagation information
CN114915541A (zh) 系统故障排除方法及装置、电子设备及存储介质
JP6622040B2 (ja) 分析システム、及び、分析方法
CN113065001A (zh) 一种故障止损方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150520