CN102216908A - 支援执行对应于检测事件的动作的系统、支援执行对应于检测事件的动作的方法、支援装置以及计算机程序 - Google Patents

支援执行对应于检测事件的动作的系统、支援执行对应于检测事件的动作的方法、支援装置以及计算机程序 Download PDF

Info

Publication number
CN102216908A
CN102216908A CN2009801460940A CN200980146094A CN102216908A CN 102216908 A CN102216908 A CN 102216908A CN 2009801460940 A CN2009801460940 A CN 2009801460940A CN 200980146094 A CN200980146094 A CN 200980146094A CN 102216908 A CN102216908 A CN 102216908A
Authority
CN
China
Prior art keywords
action
incident
emergence pattern
pattern
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801460940A
Other languages
English (en)
Other versions
CN102216908B (zh
Inventor
西村康孝
秋山一人
津村直史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN102216908A publication Critical patent/CN102216908A/zh
Application granted granted Critical
Publication of CN102216908B publication Critical patent/CN102216908B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

提供一种支援执行对应于检测事件的动作的系统、支援执行对应于检测事件的动作的方法、中央装置以及计算机程序,其即使是没有始终连接的监视对象资源,也能够支援为在发生故障时尽可能在早期执行适当的动作。支援装置将与用于判定是否具备规定的条件的多个任务和应在装置中执行的动作有关的信息,与事件的发生模式相关联地存储在存储装置中。计算用于判断产生事件的发生模式的概率的高低的指标值,并判断计算出的指标值是否大于规定值。将判断为大于规定值的事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息,发送到应执行动作的装置中。

Description

支援执行对应于检测事件的动作的系统、支援执行对应于检测事件的动作的方法、支援装置以及计算机程序
技术领域
本发明涉及一种支援执行对应于检测事件的动作的系统、支援执行对应于检测事件的动作的方法、支援装置以及计算机程序,其即使是在经由网络、以一定的时间间隔检测出事件发生的情况下,也能够没有延迟地执行与检测出的发生事件对应的动作。
背景技术
随着目前的计算机技术的急速的发展,计算机系统理所当然地嵌入到构筑社会结构的基础系统中。为了稳定且正常地应用社会结构,产生相当的运用成本。作为即使是少量也要减少这样的运用成本,并且提高系统的稳定度的技术,自律计算系统(autonomic computing system)受到关注。
自律计算系统是构筑系统规模的自管理型环境的全部技术的总称,意味着检测出包括在系统中产生的问题、故障等的各种事件并自律地控制动作的系统整体。例如,作为监视与在系统上产生的问题、故障等对应的事件的方法,公开了如下的多种方法。
在专利文献1中,公开了如下的目标(object)监视方法:启动用于对成为监视对象的多个节点的每个节点监视故障等的事件发生的监视目标,并根据需要,对管理节点发送事件发生信息。在专利文献2中,公开了如下的网络监视系统:收集成为监视对象的网络装置的连续量信息,并从检测出异常的举动的网络装置收集监视信息来确定故障原因。在专利文献3中,公开了如下的自律服务器固件:检测出管理多个节点的服务器中的故障发生,并自己修复。
专利文献1:特开平10-91482号公报
专利文献2:特开2005-285040号公报
专利文献3:特开2004-110790号公报
发明内容
发明要解决的课题
在上述的以往的故障事件监视方法中,以什么都成为监视对象的计算机始终连接到网络作为前提来构筑了系统。但是,实际上,为了检测故障发生而每隔一定时间轮询(polling)等,从故障发生时起服务器检测出故障发生为止产生一定的时间差,难以大致实时地检测故障发生。
尤其在分散型网络中,从监视对象资源侧,每隔一定时间对管理服务器侧发送错误、日志等的历史信息,在管理服务器侧进行事件分析,从而确定监视对象资源应执行的动作。因此,执行动作为止的时间依赖于监视对象资源和管理服务器之间的线路连接间隔,存在即使是在早期检测出故障发生的情况下,在监视对象资源中执行适当的动作为止还是需要相当长的时间,产生应对变得延迟的顾虑的问题点。
本发明是鉴于这样的情况而完成的,其目的在于,提供一种支援执行对应于检测事件的动作的系统、支援执行对应于检测事件的动作的方法、支援装置以及计算机程序,其即使是没有始终连接的监视对象资源,也能够支援为在发生故障时尽可能在早期执行适当的动作。
用于解决课题的手段
为了达到上述目的,在第1发明的具有支援装置的系统中,所述支援装置以能够进行数据通信的方式连接到多个装置,所述支援装置包括:存储装置,将与用于判定是否具备规定的条件的多个任务和应在所述装置中执行的动作有关的信息,与事件的发生模式相关联地存储;指标值计算部件,计算用于判断产生事件的发生模式的概率的高低的指标值;判断部件,判断计算出的指标值是否大于规定值;以及发送部件,将在该判断部件中判断为大于规定值的所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息,发送到应执行所述动作的装置中。
此外,第2发明的支援执行对应于检测事件的动作的系统在第1发明中,所述发送部件将与时期有关的信息发送到应执行所述动作的装置中,在该时期删除所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息。
此外,第3发明的支援执行对应于检测事件的动作的系统在第1或第2发明中,所述指标值计算部件包括:条件判定部件,对每个所述任务判定是否具备规定的条件;以及计数部件,对在该条件判定部件中判定为不具备的任务数目进行计数,所述判断部件包括:任务数目判断部件,判断在所述计数部件中计数的任务数目是否小于规定值。
此外,第4发明的支援执行对应于检测事件的动作的系统在第1或第2发明中,所述指标值计算部件包括:事件串提取部件,提取从规定的时刻起在一定时间内发生的多个事件串;模式取得部件,对事件的每个出现模式,取得该出现模式的出现频度和该出现模式所包含的动作的发生次数;以及乘法部件,将取得的出现模式的出现频度和动作的发生次数相乘而计算指标值。
此外,第5发明的支援执行对应于检测事件的动作的系统在第1至第4发明的任一项中,所述装置包括:接收部件,从所述支援装置中接收所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息;存储部件,将接收到的所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息存储在存储装置中;发生模式确定部件,基于与发生的事件有关的信息,确定所述发生模式;以及动作执行部件,基于与对应于确定的发生模式的动作有关的信息,执行动作。
此外,第6发明的支援执行对应于检测事件的动作的系统在第5发明中,所述接收部件接收与时期有关的信息,在该时期删除所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息,所述装置包括:删除部件,基于接收到的与删除的时期有关的信息,从所述存储装置中删除所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息。
接着,为了达到上述目的,第7发明的具有支援装置的系统中执行的方法中,所述支援装置以能够进行数据通信的方式连接到多个装置,所述方法包括:将与用于判定是否具备规定的条件的多个任务和应在所述装置中执行的动作有关的信息,与事件的发生模式相关联地存储到存储装置的步骤;计算用于判断产生事件的发生模式的概率的高低的指标值的步骤;判断计算出的指标值是否大于规定值的步骤;以及将判断为大于规定值的所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息,发送到应执行所述动作的装置中的步骤。
接着,为了达到上述目的,第8发明的支援装置以能够进行数据通信的方式连接到多个装置,所述支援装置包括:存储装置,将与用于判定是否具备规定的条件的多个任务和应在所述装置中执行的动作有关的信息,与事件的发生模式相关联地存储;指标值计算部件,计算用于判断产生事件的发生模式的概率的高低的指标值;判断部件,判断计算出的指标值是否大于规定值;以及发送部件,将在该判断部件中判断为大于规定值的所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息,发送到应执行所述动作的装置中。
接着,为了达到上述目的,第9发明的计算机程序能够在支援装置中执行,该支援装置以能够进行数据通信的方式连接到多个装置且包括存储装置,该存储装置将与用于判定是否具备规定的条件的多个任务和应在所述装置中执行的动作有关的信息,与事件的发生模式相关联地存储,其中,所述计算机程序使所述支援装置作为如下部件起作用:指标值计算部件,计算用于判断产生事件的发生模式的概率的高低的指标值;判断部件,判断计算出的指标值是否大于规定值;以及发送部件,将在该判断部件中判断为大于规定值的所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息,发送到应执行所述动作的装置中。
发明效果
根据本发明,由于将判断为产生在外部发生的事件的发生模式的概率高的发生模式以及与对应于该发生模式的多个任务和动作有关的信息事先发送到执行动作的装置中,所以即使在执行动作的装置没有连接到支援装置的时间段发生了事件的情况下,也能够没有延迟地执行应在该装置中执行的动作。因此,例如在装置中产生了故障发生事件的情况下,也能够在早期执行适当的动作,能够将故障的发生所引起的影响抑制为最小限度。
附图说明
图1是表示本发明的实施方式1的故障检测系统的结构例的方框图。
图2是本发明的实施方式1的故障检测系统的症状数据库的数据结构的例示图。
图3是本发明的实施方式1的症状数据库中的具体的任务定义的例示图。
图4是表示本发明的实施方式1的终端装置的结构的方框图。
图5是本发明的实施方式1的中央装置和终端装置的功能方框图。
图6是表示本发明的实施方式1的故障检测系统的中央装置的CPU的处理步骤的流程图。
图7是表示本发明的实施方式1的故障检测系统的中央装置的CPU的症状信息删除处理的步骤的流程图。
图8是本发明的实施方式2的中央装置和终端装置的功能方框图。
图9是表示本发明的实施方式2的故障检测系统的中央装置的CPU的处理步骤的流程图。
图10是根据在每个症状信息中包含的任务的执行结果来计算指标值的方法的说明图。
图11是本发明的实施方式3的中央装置和终端装置的功能方框图。
图12是表示本发明的实施方式3的故障检测系统的中央装置的CPU的处理步骤的流程图。
图13是根据在每个症状信息中包含的任务的执行结果,通过顺序模式匹配来计算事件串的发生频度的方法的说明图。
具体实施方式
以下,基于附图具体说明本发明的实施方式的支援执行对应于检测事件的动作的系统。当然,以下的实施方式并非限定在权利要求的范围所记载的发明,在实施方式中说明的特征事项的组合的全部并非作为解决手段的必须事项。
此外,本发明可通过多种不同的方式实施,不应限定于实施方式的记载内容来解释。在实施方式中,对相同的元件赋予了相同的标号。
在以下的实施方式中,说明由在计算机系统中导入了计算机程序的中央装置和以能够进行数据通信地连接的多个终端装置构成的系统,但本领域的技术人员应该理解本发明也可以将其一部分作为能够在支援装置等的计算机中执行的计算机程序来实施。因此,本发明能够采取作为中央装置和终端装置的硬件的实施方式、作为软件的实施方式、或者软件和硬件的组合的实施方式。计算机程序能够记录在硬盘、DVD、CD、光存储装置、磁存储装置等的任意的计算机可读取的记录介质中。
在本发明的实施方式中,由于将判断为产生在外部发生的事件的发生模式的概率高的发生模式以及与对应于该发生模式的多个任务和动作有关的信息事先发送到执行动作的装置中,所以即使在执行动作的装置没有连接到支援装置的时间段发生了事件的情况下,也能够没有延迟地执行应在该装置中执行的动作。因此,例如在装置中产生了故障发生事件的情况下,也能够在早期执行适当的动作,能够将故障的发生所引起的影响抑制为最小限度。
此外,由于将在执行动作的装置、例如终端装置的存储装置中存储的发生模式以及与对应于该发生模式的多个任务和动作有关的信息(以下,称为症状信息)在规定的定时删除,并从支援装置(中央装置)接收并存储新的症状信息,从而能够反映最近的事件发生状况的同时能够存储发生概率高的症状信息,不对支援装置发送有关发生事件的信息也能够执行适当的动作。
(实施方式1)
图1是表示本发明的实施方式1的故障检测系统的结构例的方框图。本发明的实施方式1的故障检测系统包括:作为支援装置起作用的中央装置1;以及经由网络2以能够与中央装置1进行数据通信地连接的多个终端装置3、3......。
中央装置1至少包括:CPU(中央运算装置)11、存储器12、存储装置13、I/O接口14、通信接口15、视频接口16、可移动盘驱动器17以及连接上述的硬件的内部总线18。
CPU11经由内部总线18而连接到中央装置1的如上所述的硬件的各个部分,控制上述的硬件的各个部分的动作,且根据在存储装置13中存储的计算机程序100而执行各种软件功能。存储器12由SRAM、SDRAM等易失性存储器构成,在计算机程序100的执行时展开加载模块,且存储在计算机程序100的执行时产生的暂时性的数据等。
存储装置13由内置的固定型存储装置(硬盘)、ROM等构成。在存储装置13中存储的计算机程序100,通过可移动盘驱动器17而从记录了程序和数据等的信息的DVD、CD-ROM等的可移动记录介质90下载,并在执行时从存储装置13对存储器12展开而执行。当然,也可以是经由通信接口15而从连接到网络2的外部的计算机下载的计算机程序。
此外,存储装置2包括症状(symptom)数据库131。在症状数据库131中,存储有表示事件发生的模式的发生模式数据、对应于该发生模式的多个任务、症状的详细数据以及表示动作的动作数据等。另外,也可以是多个任务作为时间序列任务而构成判定工作流程,对每个任务判定是否满足规定的条件。
图2是本发明的实施方式1的故障检测系统的症状数据库131的数据结构的例示图。症状数据库131对于应检测的事件的每个发生模式存储症状信息60。
症状信息60的组合因每个终端装置3而不同。在作为产品的系统交货时或者导入了自律管理软件的时刻,中央装置1存储规定的症状信息60、60、......。
症状信息60包括发生模式数据600、症状详细数据610以及动作数据620。发生模式数据600表示应对每个终端装置3检测的事件的发生模式。具体地说,多个任务605-1、605-2、605-3、......、605-M与管理各个任务的终端装置3的识别信息(ID)608-1、608-2、608-3、......、608-M相关联地存储。
例如,任务605-1是判定规定的条件的任务,对于要执行处理的终端装置3,与识别信息608-1相关联地存储。当然,也可以如任务605-2那样,仅存储有关任务的信息,而不与终端装置3的识别信息相关联。
接着,症状详细数据610表示在由各个任务具备判定的条件的情况下,与出现在终端装置3中的症状有关的信息。症状详细数据610既可以在判定为具备条件的情况下输出,也可以设定为只有在系统管理者保养/检查时参照。
动作数据620表示在事件以规定的发生模式发生的情况下应执行的处理。例如,“将组件A的动作优先度设定为2”所示,存储具体的设定处理的内容。另外,作为存储的信息,并不限定于具体的设定处理的内容,也可以表示如“显示与发生的事件有关的信息”所示的对用户唤起注意的处理。
此外,在本实施方式1中,为了容易说明而用自然语言表示了设定处理的内容,但也可以是用于设定的命令、参数等。此外,也可以将执行动作的终端装置3的识别信息622与动作数据620相关联地存储。由此,中央装置1能够把握应在哪个终端装置3中执行动作,能够可靠地发送动作执行指示。
图3是本发明的实施方式1的症状数据库131中的具体的任务定义的例示图。例如,任务605-1由部分式630和输出定义640构成。部分式630是实质性的判定处理的记载部分。例如,部分式630对多个事件的每个事件判定发生的事件的识别信息(ID)、属性等是否为规定值,并对表示判定结果的逻辑值进行“与”运算或“或”运算而计算评价值。输出定义640表示与评价值不同地、应对其他的任务605-2输出的数值的运算方法。
任务605-2由部分式650构成。部分式650与部分式630相同地,对多个事件的每个事件判定发生的事件的识别信息(ID)、属性等是否为规定值,并对表示判定结果的逻辑值进行“与”运算或“或”运算而计算评价值。在部分式650中,记载了在运算过程中参照在输出定义640中计算出的输出值的情况。
判定各个任务的条件并不限定于基于各个事件的识别信息(ID)、属性等的条件。例如,也可以根据事件的发生次数、多个事件的发生顺序、在一定时间内是否发生了规定组合的事件、是否发生事件、或者这些条件的组合来进行判定。
返回到图1,通信接口15连接到内部总线18,且连接到因特网、LAN、WAN等的外部网络2,所以能够与外部的计算机等进行数据发送接收。此外,通信接口15经由网络2与成为监视对象的终端装置3、3、......连接,能够取得与故障发生事件有关的信息等。
I/O接口14连接到键盘21、鼠标22等的数据输入介质,接受数据的输入。此外,视频接口16连接到CRT监视器、LCD等的显示装置23,显示规定的图像。
图4是表示本发明的实施方式1的终端装置3的结构的方框图。终端装置3至少包括:CPU(中央运算装置)31、存储器32、存储装置33、I/O接口34、通信接口35、视频接口36、可移动盘驱动器37以及连接上述的硬件的内部总线38。
CPU31经由内部总线38而连接到终端装置3的如上所述的硬件的各个部分,控制上述的硬件的各个部分的动作,且根据在存储装置33中存储的计算机程序101而执行各种软件功能。存储器32由SRAM、SDRAM等易失性存储器构成,在计算机程序101的执行时展开加载模块,且存储在计算机程序101的执行时产生的暂时性的数据等。
存储装置33由内置的固定型存储装置(硬盘)、ROM等构成。在存储装置33中存储的计算机程序101,通过可移动盘驱动器37而从记录了程序和数据等的信息的DVD、CD-ROM等的可移动记录介质91下载,并在执行时从存储装置33对存储器32展开而执行。当然,也可以是经由通信接口35而从连接到网络2的外部的计算机下载的计算机程序。
此外,存储装置33包括症状信息存储部331。在症状信息存储部331中,存储有表示事件发生的模式的发生模式数据、对应于发生模式的时间序列任务、症状的详细数据以及表示动作的动作数据等。时间序列任务构成判定工作流程,判定是否满足规定的条件。
通信接口35连接到内部总线38,且连接到因特网、LAN、WAN等的外部网络2,所以能够与外部的计算机等进行数据发送接收。此外,还经由网络2连接到中央装置1,能够发送与故障发生事件有关的信息等。
I/O接口34连接到键盘41、鼠标42等的数据输入介质,接受数据的输入。此外,视频接口46连接到CRT监视器、LCD等的显示装置43,显示规定的图像。
图5是本发明的实施方式1的中央装置1和终端装置3的功能方框图。中央装置1的事件日志信息取得部501取得作为在连接到中央装置1的终端装置3中发生的事件的历史信息的事件日志信息。取得事件日志信息的定时没有特别限定,既可以是终端装置3连接到中央装置1的定时,也可以是每次发生新的事件时,也可以是以一定的时间间隔。
指标值计算部502基于取得的事件日志信息,计算用于判断产生事件的发生模式的概率的高低的指标值。计算的指标值没有特别限定。例如,计算在判定工作流程中包含的多个任务中判定结果为“伪”的任务数目、通过顺序模式匹配求出的事件串的发生频度等。
判断部503判断在指标值计算部502中计算出的指标值是否大于规定值。例如在计算出的指标值大于规定值的情况下,能够判断为产生事件的发生模式的概率高,而在规定值以下的情况下,判断为产生事件的发生模式的概率低。
发送部504将在判断部503中判断为产生的概率高的事件的发生模式、以及与对应于该发生模式的多个任务和动作有关的信息、即存储在症状数据库131的症状信息中判断为产生的概率高的症状信息发送到终端装置3。
终端装置3的接收部505从中央装置1接收判断为产生的概率高的事件的发生模式、以及与对应于该发生模式的多个任务和动作有关的信息、即症状信息,并存储在症状信息存储部331中。
事件检测部506检测在终端装置3中发生的事件,发生模式确定部507基于与检测出的发生事件有关的信息来确定发生模式,动作执行部508轮询症状信息存储部331,并基于与对应于确定的发生模式的动作有关的信息来执行动作。
由于判断为产生事件的发生模式的概率高的症状信息事先存储在终端装置3的症状信息存储部331中,所以即使在终端装置3和中央装置1没有连接的情况下,对应于发生模式的症状信息存储在症状信息存储部331中的可能性也高,大部分情况下能够基于存储的症状信息来执行适当的动作。
在终端装置3没有与中央装置1连接的情况下,以往的终端装置3在以一定的时间间隔发送事件日志信息的定时接收动作的执行指示信息,执行动作。因此,在发生了具有规定的发生模式的事件的情况下,执行动作为止需要相当长的时间。
相对于此,根据本实施方式1,由于能够基于在症状信息存储部331中存储的症状信息来执行适当的动作,所以能够降低从发生具有规定的发生模式的事件到执行动作为止产生时间差的可能性,能够在早期执行适当的动作。
另外,优选地,发送部504在症状信息的发送时一并对终端装置3发送与时期有关的信息,在该时期删除事件的发生模式、以及与对应于该发生模式的多个任务和动作有关的信息、即症状信息。通过能够防止压迫终端装置3的计算机资源的同时,将判断为产生事件的发生模式的概率高的症状信息不断地更新为最新的信息,所以能够进一步提高不需要与中央装置1进行数据通信、仅由终端装置3执行动作的可能性。
图6是表示本发明的实施方式1的故障检测系统的中央装置1的CPU11的处理步骤的流程图。中央装置1的CPU11从连接到中央装置1的终端装置3接收作为发生的事件的历史信息的事件日志信息(步骤S601)。接收事件日志信息的定时没有特别限定,既可以是终端装置3连接到中央装置1的定时,也可以是每次发生新的事件时,也可以是以一定的时间间隔。
CPU11切断与成为监视对象的终端装置3的连接(步骤S602),从在存储装置13的症状数据库131中存储的多个症状信息中选择一个症状信息(步骤S603)。CPU11执行与选择的症状信息相关联地存储的任务(步骤S604),并基于任务的执行结果,计算用于判断产生事件的发生模式的概率的高低的指标值(步骤S605)。计算出的指标值没有特别限定。例如,计算在如判定工作流程这样按时序执行的多个任务中判定结果为“伪”的任务数目、通过顺序模式匹配求出的事件串的发生频度等。
CPU11判定计算出的指标值是否具备规定的条件(步骤S606)。例如,判定计算出的指标值是否大于规定值。在CPU11判定为指标值具备规定的条件的情况下(步骤S606:是),CPU11将选择的症状信息暂时存储在症状信息存储部331中(步骤S607)。
在CPU11判定为指标值不具备规定的条件的情况下(步骤S606:否),CPU11判断是否选择了在症状信息存储部131中存储的全部症状信息(步骤S608),在CPU11判定为还存在没有选择的症状信息的情况下(步骤S608:否),CPU11选择下一个症状信息(步骤S609),并将处理返回至步骤S604,重复上述的处理。
在CPU11判断为选择了全部的症状信息的情况下(步骤S608:是),CPU11对在症状信息存储部331中暂时存储的症状信息赋予优先顺序(步骤S610)。基于计算出的指标值而决定优先顺序的赋予方法。
CPU11与成为监视对象的终端装置3连接(步骤S611),将优先顺序最高的症状信息发送到终端装置3(步骤S612),并将处理返回至步骤S601,重复上述的处理。当然,并不限定于发送优先顺序最高的症状信息,既可以发送全部暂时存储的症状信息,也可以发送优选顺序的上位的多个症状信息。
图7是表示本发明的实施方式1的故障检测系统的中央装置1的CPU11的症状信息删除处理的步骤的流程图。中央装置1的CPU11在将优先顺序最高的症状信息发送到终端装置3之后(步骤S612),基于与将接收到的症状信息删除的时期有关的信息,判断是否删除在症状信息存储部331中暂时存储的症状信息(步骤S701)。在CPU11判断为删除症状信息的情况下(步骤S701:是),CPU11删除暂时存储的症状信息(步骤S702)。在CPU11判断为不删除症状信息的情况下(步骤S701:否),CPU11将处理返回至步骤S601,重复上述的处理。
如上所述,根据本实施方式1,由于能够基于在症状信息存储部331中存储的症状信息来执行适当的动作,所以能够降低从发生具有规定的发生模式的事件到执行动作为止产生时间差的可能性,能够在早期执行适当的动作。因此,例如在发生了故障发生事件的情况下,也能够在早期执行适当的动作,能够将故障的发生所引起的影响抑制为最小限度。
(实施方式2)
由于本发明的实施方式2的故障检测系统的结构与实施方式1相同,所以赋予相同的标号,省略详细的说明。在本实施方式2中,与实施方式1的不同点在于,将计算的指标值作为在事件串中包含的多个任务的执行结果为“伪”的事件数目。
图8是本发明的实施方式2的中央装置1和终端装置3的功能方框图。中央装置1的事件日志信息取得部501取得作为在连接到中央装置1的终端装置3中发生的事件的历史信息的事件日志信息。取得事件日志信息的定时没有特别限定,既可以是终端装置3连接到中央装置1的定时,也可以是每次发生新的事件时,也可以是以一定的时间间隔。
指标值计算部502包括:条件判定部801,依次执行在事件日志信息中包含的事件串中所包含的任务,并判定是否具备规定的条件;以及计数部802,对判定为不具备规定的条件的任务数目进行计数。在条件判断部801中,对发生的多个事件的每个事件,判断发生的事件的识别信息(ID)、属性等是否为规定的值,并将表示判断结果的逻辑值进行“与”运算或“或”运算而计算出评价值。因此,逻辑值具有“真(T)”、“伪(F)”的其中一个值。在计算部802中,将逻辑值为“伪(F)”的任务数目进行计数并设为指标值。
判断部503判断在指标值计算部502中计算出的指标值、即在计数部802中的计数值是否小于规定值。在本实施方式2中,在计数值小于规定值的情况下,判断为产生事件的发生模式的概率高,而在规定值以上的情况下,判断为产生事件的发生模式的概率低。
发送部504将在判断部503中判断为产生的概率高的事件的发生模式、以及与对应于该发生模式的多个任务和动作有关的信息、即存储在症状数据库131的症状信息中判断为产生的概率高的症状信息发送到终端装置3。
终端装置3的接收部505从中央装置1接收判断为产生的概率高的事件的发生模式、以及与对应于该发生模式的多个任务和动作有关的信息、即症状信息,并存储在症状信息存储部331中。
事件检测部506检测在终端装置3中发生的事件,发生模式确定部507基于与检测出的发生事件有关的信息来确定发生模式,动作执行部508轮询症状信息存储部331,并基于与确定的发生模式对应的动作有关的信息来执行动作。
由于判断为产生事件的发生模式的概率高的症状信息事先存储在终端装置3的症状信息存储部331中,所以即使在终端装置3和中央装置1没有连接的情况下,对应于发生模式的症状信息存储在症状信息存储部331中的可能性也高,大部分情况下能够基于存储的症状信息来执行适当的动作。
另外,与实施方式1相同地,优选地,发送部504在症状信息的发送时一并对终端装置3发送与时期有关的信息,在该时期删除事件的发生模式、以及与对应于该发生模式的多个任务和动作有关的信息、即症状信息。通过能够防止压迫终端装置3的计算机资源的同时,将判断为产生事件的发生模式的概率高的症状信息不断地更新为最新的信息,所以能够进一步提高不需要与中央装置1进行数据通信、仅由终端装置3执行动作的可能性。
图9是表示本发明的实施方式2的故障检测系统的中央装置1的CPU11的处理步骤的流程图。中央装置1的CPU11从连接到中央装置1的终端装置3接收作为发生的事件的历史信息的事件日志信息(步骤S901)。接收事件日志信息的定时没有特别限定,既可以是终端装置3连接到中央装置1的定时,也可以是每次发生新的事件时,也可以是以一定的时间间隔。
CPU11切断与成为监视对象的终端装置3的连接(步骤S902),从在存储装置13的症状数据库131中存储的多个症状信息中选择一个症状信息(步骤S903)。CPU11执行与选择的症状信息相关联地存储的任务(步骤S904),并将执行结果为“伪”的任务数作为判断产生事件的发生模式的概率的高低的指标值来计数(步骤S905)。
图10是根据对每个症状信息相关联地存储的任务的执行结果来计算指标值的方法的说明图。如图10所示,对于选择的一个症状信息,相关联地存储多个任务A、B、C、D、......。
依次执行各个任务,并作为逻辑值“真(T)”或“伪(F)”来计算执行结果。在图10中,按照任务A、B、C、D、......的顺序,计算出执行结果T、T、T、F、......。并且,将执行结果为“伪(F)”的任务数目计数并设为指标值。
返回到图9,中央装置1的CPU11判断执行结果为“伪(F)”的任务数目是否小于规定值(步骤S906),在CPU11判断为执行结果为“伪(F)”的任务数目小于规定值的情况下(步骤S906:是),CPU11将选择的症状信息暂时存储在症状信息存储部331中(步骤S907)。
在CPU11判定为执行结果为“伪(F)”的任务数目在规定值以上的情况下(步骤S906:否),CPU11判断是否选择了在症状信息存储部131中存储的全部症状信息(步骤S908),在CPU11判定为还存在没有选择的症状信息的情况下(步骤S908:否),CPU11选择下一个症状信息(步骤S909),并将处理返回至步骤S904,重复上述的处理。
在CPU11判断为选择了全部的症状信息的情况下(步骤S908:是),CPU11对在症状信息存储部331中暂时存储的症状信息,按照执行结果为“伪(F)”的任务数目少的顺序赋予优先顺序(步骤S910)。
CPU11与成为监视对象的终端装置3连接(步骤S911),将优先顺序最高的症状信息发送到终端装置3(步骤S912),并将处理返回至步骤S901,重复上述的处理。当然,并不限定于发送优先顺序最高的症状信息,既可以发送全部暂时存储的症状信息,也可以发送优选顺序的上位的多个症状信息。
如上所述,根据本实施方式2,由于任务的执行结果为“伪(F)”的任务数目少的症状信息能够判断为是产生事件的发生模式的概率高的症状信息,所以通过将任务的执行结果为“伪(F)”的任务数目少的症状信息存储在终端装置3的症状信息存储部331中,能够降低从发生具有规定的发生模式的事件到执行动作为止产生时间差的可能性,能够在早期执行适当的动作。因此,例如在发生了故障发生事件的情况下,也能够在早期执行适当的动作,能够将故障的发生所引起的影响抑制为最小限度。
另外,并不限定于将执行结果为“伪(F)”的任务数目少的症状信息发送到终端装置3,例如也可以仅将执行结果为“伪(F)”的任务发送到终端装置3。由此,还能够实现症状信息的发送接收引起的网络负荷的降低。
(实施方式3)
由于本发明的实施方式3的故障检测系统的结构与实施方式1和2相同,所以赋予相同的标号,省略详细的说明。在本实施方式3中,与实施方式1和2的不同点在于,将计算的指标值作为从发生了动作的时刻起在一定时间内发生的事件串的发生频度。
图11是本发明的实施方式3的中央装置1和终端装置3的功能方框图。中央装置1的事件日志信息取得部501取得作为在连接到中央装置1的终端装置3中发生的事件的历史信息的事件日志信息。取得事件日志信息的定时没有特别限定,既可以是终端装置3连接到中央装置1的定时,也可以是每次发生新的事件时,也可以是以一定的时间间隔。
指标值计算部502通过顺序模式匹配(sequential pattern mapping),计算在事件日志信息中包含的事件串的发生频度。即,包括:事件串提取部1101,提取从规定的动作发生的时刻起在之前的一定时间内发生的多个事件串;模式取得部1102,对事件的每个出现模式,取得该出现模式的出现频度和该出现模式所包含的动作的发生次数;以及乘法部1103,将取得的出现模式的出现频度和动作的发生次数相乘而计算指标值。
判断部503判断在指标值计算部502中计算出的指标值,即判断在乘法部1103中计算出的乘法值是否为规定值以上。在本实施方式3中,在计算出的乘法值为规定值以上的情况下,能够判断为产生事件的发生模式的概率高,而在小于规定值的情况下,判断为产生事件的发生模式的概率低。
发送部504将在判断部503中判断为产生的概率高的事件的发生模式、以及与对应于该发生模式的多个任务和动作有关的信息、即存储在症状数据库131的症状信息中判断为产生的概率高的症状信息发送到终端装置3。
终端装置3的接收部505从中央装置1接收判断为产生的概率高的事件的发生模式、以及与对应于该发生模式的多个任务和动作有关的信息、即症状信息,并存储在症状信息存储部331中。
事件检测部506检测在终端装置3中发生的事件,发生模式确定部507基于与检测出的发生事件有关的信息来确定发生模式,动作执行部508轮询症状信息存储部331,并基于与确定的发生模式对应的动作有关的信息来执行动作。
由于判断为产生事件的发生模式的概率高的症状信息事先存储在终端装置3的症状信息存储部331中,所以即使在终端装置3和中央装置1没有连接的情况下,对应于发生模式的症状信息存储在症状信息存储部331中的可能性也高,大部分情况下能够基于存储的症状信息来执行适当的动作。
另外,与实施方式1和2相同地,优选地,发送部504在症状信息的发送时一并对终端装置3发送与时期有关的信息,在该时期删除事件的发生模式、以及与对应于该发生模式的多个任务和动作有关的信息、即症状信息。通过能够防止压迫终端装置3的计算机资源的同时,将判断为产生事件的发生模式的概率高的症状信息不断地更新为最新的信息,所以能够进一步提高不需要与中央装置1进行数据通信、仅由终端装置3执行动作的可能性。
图12是表示本发明的实施方式3的故障检测系统的中央装置1的CPU11的处理步骤的流程图。中央装置1的CPU11从连接到中央装置1的终端装置3接收作为发生的事件的历史信息的事件日志信息(步骤S1201)。接收事件日志信息的定时没有特别限定,既可以是终端装置3连接到中央装置1的定时,也可以是每次发生新的事件时,也可以是以一定的时间间隔。
CPU11切断与成为监视对象的终端装置3的连接(步骤S1202),从在存储装置13的症状数据库131中存储的多个症状信息中选择一个症状信息(步骤S1203)。CPU11执行与选择的症状信息相关联地存储的任务(步骤S1204),取得事件串的每个出现模式的出现频度和动作的发生次数(步骤S1205)。
图13是根据与每个症状信息相关联地存储的任务的执行结果,通过顺序模式匹配来计算事件串的发生频度的方法的说明图。图13(a)是表示发生的动作和在发生该动作之前的一定时间内发生的事件串的图表。对发生的每个动作示出表示一定的出现模式的事件串。
图13(b)是通过顺序模式匹配,按照事件串的每个出现模式表示在发生的动作中包含的出现频度和动作的发生次数的图表。通过公知方法来计算图13(b)所示的出现模式在图13(a)的事件串中包含的出现频度,求出事件串的出现模式所包含的动作的发生次数。
返回到图12,中央装置1的CPU11通过将出现频度和发生次数相乘而计算出指标值(步骤S1206),并判断指标值是否为规定值以上(步骤S1207)。在CPU11判定为指标值为规定值以上的情况下(步骤S1207:是),CPU11将选择的症状信息暂时存储在症状信息存储部331中(步骤S1208)。
在CPU11判定为指标值小于规定值的情况下(步骤S1207:否),CPU11判断是否选择了在症状信息存储部131中存储的全部症状信息(步骤S1209),在CPU11判定为还存在没有选择的症状信息的情况下(步骤S1209:否),CPU11选择下一个症状信息(步骤S1210),并将处理返回至步骤S1204,重复上述的处理。
在CPU11判断为选择了全部的症状信息的情况下(步骤S1209:是),CPU11对在症状信息存储部331中暂时存储的症状信息,按照指标值由大到小的顺序赋予优先顺序(步骤S1211)。
CPU11与成为监视对象的终端装置3连接(步骤S1212),将优先顺序最高的症状信息发送到终端装置3(步骤S1213),并将处理返回至步骤S1201,重复上述的处理。当然,并不限定于发送优先顺序最高的症状信息,既可以发送全部暂时存储的症状信息,也可以发送优选顺序的上位的多个症状信息。
如上所述,根据本实施方式3,由于包括出现频度高、发生次数多的动作中包含的事件串的症状信息能够判断为是产生事件的发生模式的概率高的症状信息,所以通过将出现频度和发生次数的乘法值大的症状信息存储在终端装置3的症状信息存储部331中,能够降低从发生具有规定的发生模式的事件到执行动作为止产生时间差的可能性,能够在早期执行适当的动作。因此,例如在发生了故障发生事件的情况下,也能够在早期执行适当的动作,能够将故障的发生所引起的影响抑制为最小限度。
另外,本发明并不限定于上述实施例,在本发明的意旨的范围内可进行各种变更、改进等。例如,并不限定于在症状数据库中存储的症状信息中包括有关动作的信息的结构,也可以将有关动作的信息与症状相关联地作为其他的数据库。此外,事件的发生地点并不限定于终端装置,终端装置只要能够执行与发生的事件对应的动作即可。
标号说明
1中央装置
2网络
3终端装置
11、31CPU
12、32存储器
13、33存储装置
14、34I/O接口
15、35通信接口
16、36视频接口
17、37可移动盘驱动器
18、38内部总线
23、43显示装置
90、91可移动记录介质
100、101计算机程序
131症状数据库
331症状信息存储部

Claims (9)

1.一种具有支援装置的系统,其中所述支援装置以能够进行数据通信的方式连接到多个装置,所述支援装置包括:
存储装置,将与用于判定是否具备规定的条件的多个任务和应在所述装置中执行的动作有关的信息,与事件的发生模式相关联地存储;
指标值计算部件,计算用于判断产生事件的发生模式的概率的高低的指标值;
判断部件,判断计算出的指标值是否大于规定值;以及
发送部件,将在该判断部件中判断为大于规定值的所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息,发送到应执行所述动作的装置中。
2.如权利要求1所述的系统,其中,
所述发送部件将与时期有关的信息发送到应执行所述动作的装置中,在该时期删除所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息。
3.如权利要求1或2所述的系统,其中,
所述指标值计算部件包括:
条件判定部件,对每个所述任务判定是否具备规定的条件;以及
计数部件,对在该条件判定部件中判定为不具备的任务数目进行计数,
所述判断部件包括:
任务数目判断部件,判断在所述计数部件中计数的任务数目是否小于规定值。
4.如权利要求1或2所述的系统,其中,
所述指标值计算部件包括:
事件串提取部件,提取从规定的时刻起在一定时间内发生的多个事件串;
模式取得部件,对事件的每个出现模式,取得该出现模式的出现频度和该出现模式所包含的动作的发生次数;以及
乘法部件,将取得的出现模式的出现频度和动作的发生次数相乘而计算指标值。
5.如权利要求1至4的任一项所述的系统,其中,
所述装置包括:
接收部件,从所述支援装置中接收所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息;
存储部件,将接收到的所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息存储在存储装置中;
发生模式确定部件,基于与发生的事件有关的信息,确定所述发生模式;以及
动作执行部件,基于与对应于确定的发生模式的动作有关的信息,执行动作。
6.如权利要求5所述的系统,其中,
所述接收部件接收与时期有关的信息,在该时期删除所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息,
所述装置包括:
删除部件,基于接收到的与删除的时期有关的信息,从所述存储装置中删除所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息。
7.一种在具有支援装置的系统中执行的方法,其中所述支援装置以能够进行数据通信的方式连接到多个装置,所述方法包括:
将与用于判定是否具备规定的条件的多个任务和应在所述装置中执行的动作有关的信息,与事件的发生模式相关联地存储到存储装置的步骤;
计算用于判断产生事件的发生模式的概率的高低的指标值的步骤;
判断计算出的指标值是否大于规定值的步骤;以及
将判断为大于规定值的所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息,发送到应执行所述动作的装置中的步骤。
8.一种支援装置,以能够进行数据通信的方式连接到多个装置,所述支援装置包括:
存储装置,将与用于判定是否具备规定的条件的多个任务和应在所述装置中执行的动作有关的信息,与事件的发生模式相关联地存储;
指标值计算部件,计算用于判断产生事件的发生模式的概率的高低的指标值;
判断部件,判断计算出的指标值是否大于规定值;以及
发送部件,将在该判断部件中判断为大于规定值的所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息,发送到应执行所述动作的装置中。
9.一种计算机程序,能够在支援装置中执行,该支援装置以能够进行数据通信的方式连接到多个装置且包括存储装置,该存储装置将与用于判定是否具备规定的条件的多个任务和应在所述装置中执行的动作有关的信息,与事件的发生模式相关联地存储,其中,所述计算机程序使所述支援装置作为如下部件起作用:
指标值计算部件,计算用于判断产生事件的发生模式的概率的高低的指标值;
判断部件,判断计算出的指标值是否大于规定值;以及
发送部件,将在该判断部件中判断为大于规定值的所述事件的发生模式以及与对应于该发生模式的多个任务和动作有关的信息,发送到应执行所述动作的装置中。
CN200980146094.0A 2008-11-27 2009-11-13 支援执行对应于检测事件的动作的系统、方法和装置 Active CN102216908B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008302673 2008-11-27
JP2008-302673 2008-11-27
PCT/JP2009/069324 WO2010061735A1 (ja) 2008-11-27 2009-11-13 検出イベントに応じたアクション実行を支援するシステム、検出イベントに応じたアクション実行を支援する方法、支援装置及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
CN102216908A true CN102216908A (zh) 2011-10-12
CN102216908B CN102216908B (zh) 2015-10-14

Family

ID=42197573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980146094.0A Active CN102216908B (zh) 2008-11-27 2009-11-13 支援执行对应于检测事件的动作的系统、方法和装置

Country Status (6)

Country Link
US (1) US8516499B2 (zh)
EP (1) EP2357562A4 (zh)
JP (1) JP5285084B2 (zh)
KR (1) KR101547721B1 (zh)
CN (1) CN102216908B (zh)
WO (1) WO2010061735A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113661483A (zh) * 2019-04-12 2021-11-16 三菱电机株式会社 执行监视装置、执行监视方法和执行监视程序

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8943364B2 (en) * 2010-04-30 2015-01-27 International Business Machines Corporation Appliance for storing, managing and analyzing problem determination artifacts
US8364813B2 (en) * 2010-11-02 2013-01-29 International Business Machines Corporation Administering incident pools for event and alert analysis
KR101440299B1 (ko) * 2010-11-16 2014-09-17 한국전자통신연구원 자가 치유 시스템 및 그 방법
US8799927B1 (en) * 2012-03-15 2014-08-05 Emc Corporation Techniques for use with repetitive event occurrences
US9262253B2 (en) 2012-06-28 2016-02-16 Microsoft Technology Licensing, Llc Middlebox reliability
US9229800B2 (en) 2012-06-28 2016-01-05 Microsoft Technology Licensing, Llc Problem inference from support tickets
US9298538B2 (en) * 2012-08-16 2016-03-29 Vmware, Inc. Methods and systems for abnormality analysis of streamed log data
US9325748B2 (en) * 2012-11-15 2016-04-26 Microsoft Technology Licensing, Llc Characterizing service levels on an electronic network
US9565080B2 (en) 2012-11-15 2017-02-07 Microsoft Technology Licensing, Llc Evaluating electronic network devices in view of cost and service level considerations
US9350601B2 (en) 2013-06-21 2016-05-24 Microsoft Technology Licensing, Llc Network event processing and prioritization
US8826308B1 (en) * 2013-07-09 2014-09-02 Sap Ag Programming language conditional event dispatcher
US10013238B2 (en) * 2013-08-12 2018-07-03 Telefonaktiebolaget Lm Ericsson (Publ) Predicting elements for workflow development
US9372898B2 (en) * 2014-07-17 2016-06-21 Google Inc. Enabling event prediction as an on-device service for mobile interaction
US9594624B2 (en) * 2015-06-12 2017-03-14 International Business Machines Corporation Resolving and preventing computer system failures caused by changes to the installed software
JP6571046B2 (ja) * 2016-06-21 2019-09-04 株式会社東芝 サーバ装置、情報処理方法及びプログラム
JP7036106B2 (ja) * 2017-02-22 2022-03-15 日本電気株式会社 情報処理装置、情報処理システム、監視方法、及び、プログラム
US10152432B1 (en) 2017-07-26 2018-12-11 Dell Products L.P. Support information provisioning system
WO2021219468A1 (en) * 2020-04-30 2021-11-04 British Telecommunications Public Limited Company Network anomaly identification

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07282089A (ja) * 1994-04-05 1995-10-27 Hitachi Ltd 携帯型故障診断装置
JPH08331125A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp ネットワークras装置
US5692156A (en) 1995-07-28 1997-11-25 International Business Machines Corp. Computer program product for overflow queue processing
AU7448996A (en) * 1995-10-18 1997-05-07 Systemsoft Corporation System and method for digital data processor diagnostics
JP3422400B2 (ja) 1996-03-28 2003-06-30 三菱電機株式会社 分散処理システム
US6446070B1 (en) 1998-02-26 2002-09-03 Sun Microsystems, Inc. Method and apparatus for dynamic distributed computing over a network
FR2750517B1 (fr) 1996-06-27 1998-08-14 Bull Sa Procede de surveillance d'une pluralite de types d'objets d'une pluralite de noeuds a partir d'un noeud d'administration dans un systeme informatique
JP3884821B2 (ja) 1997-03-27 2007-02-21 株式会社日立製作所 分散情報の統合方法及び装置
JPH10334058A (ja) 1997-05-27 1998-12-18 Shikoku Nippon Denki Software Kk オンラインシステムと負荷分散方式
US6049776A (en) 1997-09-06 2000-04-11 Unisys Corporation Human resource management system for staffing projects
JPH11224214A (ja) 1998-02-05 1999-08-17 Fujitsu Ltd イベント分類装置およびそのプログラム記録媒体
US6189141B1 (en) 1998-05-04 2001-02-13 Hewlett-Packard Company Control path evaluating trace designator with dynamically adjustable thresholds for activation of tracing for high (hot) activity and low (cold) activity of flow control
US6260048B1 (en) * 1998-10-27 2001-07-10 Hewlett-Packard Company Resolution of incidents which occur during the use of a product
US6742141B1 (en) * 1999-05-10 2004-05-25 Handsfree Networks, Inc. System for automated problem detection, diagnosis, and resolution in a software driven system
JP2000330912A (ja) 1999-05-18 2000-11-30 Yokogawa Electric Corp イベントサービス装置
WO2001013185A2 (en) * 1999-08-17 2001-02-22 Microsoft Corporation Architectur for automation system
JP2001101108A (ja) 1999-10-04 2001-04-13 Meidensha Corp 分散型監視システム
JP3577714B2 (ja) * 2000-05-26 2004-10-13 横河電機株式会社 プログラム実行方法を用いたシステム
US20020083018A1 (en) * 2000-12-27 2002-06-27 Pitney Bowes Incorporated Method and system for batch mail processing utilizing a web browser in a postal or shipping system
US7269640B2 (en) * 2002-01-23 2007-09-11 Ge Fanuc Automation North America, Inc. Methods and systems for management and control of an automation control module
TW200303690A (en) 2002-02-18 2003-09-01 Empower Interactive Group Ltd Distributed message transmission system and method
JP2003296129A (ja) 2002-03-29 2003-10-17 Fujitsu Ltd 情報処理プログラムおよび情報処理装置
JP4143335B2 (ja) * 2002-05-27 2008-09-03 Necフィールディング株式会社 顧客システムの保守方式、保守装置、保守方法、及びプログラム
US7657779B2 (en) 2002-09-18 2010-02-02 International Business Machines Corporation Client assisted autonomic computing
WO2004061681A1 (ja) 2002-12-26 2004-07-22 Fujitsu Limited 運用管理方法および運用管理サーバ
KR100605896B1 (ko) 2003-10-07 2006-08-01 삼성전자주식회사 모바일 애드 혹 네트워크에서 부분 경로 탐색을 이용하여 라우트 경로를 설정하는 방법 및 이동통신 단말기
US7089250B2 (en) * 2003-10-08 2006-08-08 International Business Machines Corporation Method and system for associating events
US7216021B2 (en) 2003-10-30 2007-05-08 Hitachi, Ltd. Method, system and computer program for managing energy consumption
JP4509536B2 (ja) 2003-11-12 2010-07-21 株式会社日立製作所 情報管理を支援する情報処理装置、情報管理方法、プログラム、および記録媒体
JP2005182364A (ja) 2003-12-18 2005-07-07 Canon Software Inc Www中継サーバおよび情報閲覧時間計測方法およびプログラムおよび記録媒体
JP2005222216A (ja) 2004-02-04 2005-08-18 Mitsubishi Electric Corp システム監査方法、およびシステム監査装置
US8224937B2 (en) 2004-03-04 2012-07-17 International Business Machines Corporation Event ownership assigner with failover for multiple event server system
JP4412031B2 (ja) 2004-03-31 2010-02-10 日本電気株式会社 ネットワーク監視システム及びその方法、プログラム
JP2006209206A (ja) 2005-01-25 2006-08-10 Nec Corp 自動アクション実行システム
US7873694B2 (en) * 2005-02-10 2011-01-18 Nec Corporation Information system management unit
JP4170302B2 (ja) 2005-03-10 2008-10-22 富士通株式会社 負荷制御装置および負荷制御プログラム
JP4317828B2 (ja) 2005-03-15 2009-08-19 富士通株式会社 ネットワーク監視装置およびネットワーク監視方法
JP4386011B2 (ja) 2005-08-09 2009-12-16 日本電信電話株式会社 Webページ再編集方法及びシステム
US20070088914A1 (en) 2005-10-14 2007-04-19 Soman Anuradha K Method and electronic device for selective transfer of data from removable memory element
US7389453B2 (en) 2005-10-20 2008-06-17 Jon Udell Queuing methods for distributing programs for producing test data
US7506212B2 (en) 2005-11-17 2009-03-17 Microsoft Corporation Distributed exception handling testing
JP4661667B2 (ja) 2006-04-11 2011-03-30 ソニー株式会社 オーディオ信号処理装置,オーディオ信号処理方法,プログラムおよび記憶媒体
JP4983795B2 (ja) 2006-07-27 2012-07-25 富士通株式会社 システム管理プログラム、システム管理装置およびシステム管理方法
WO2008085205A2 (en) * 2006-12-29 2008-07-17 Prodea Systems, Inc. System and method for providing network support services and premises gateway support infrastructure
US20080183307A1 (en) 2007-01-26 2008-07-31 Autani Corporation Upgradeable Automation Devices, Systems, Architectures, and Methods
JP4367962B2 (ja) 2007-06-19 2009-11-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報システムに発生したイベントのパターンを検出する技術
JP4400834B2 (ja) 2007-06-20 2010-01-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報システムに発生したイベントのパターンを検出する技術
US8108711B2 (en) 2007-10-30 2012-01-31 Microsoft Corporation Systems and methods for hosting and testing services over a network
JP5008006B2 (ja) 2007-12-27 2012-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション シンプトンの検証を可能にするためのコンピュータ・システム、方法及びコンピュータ・プログラム
US8413204B2 (en) * 2008-03-31 2013-04-02 At&T Intellectual Property I, Lp System and method of interacting with home automation systems via a set-top box device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113661483A (zh) * 2019-04-12 2021-11-16 三菱电机株式会社 执行监视装置、执行监视方法和执行监视程序

Also Published As

Publication number Publication date
US8516499B2 (en) 2013-08-20
WO2010061735A1 (ja) 2010-06-03
KR101547721B1 (ko) 2015-08-26
US20100131952A1 (en) 2010-05-27
EP2357562A4 (en) 2014-03-05
JP5285084B2 (ja) 2013-09-11
KR20110091776A (ko) 2011-08-12
JPWO2010061735A1 (ja) 2012-04-26
CN102216908B (zh) 2015-10-14
EP2357562A1 (en) 2011-08-17

Similar Documents

Publication Publication Date Title
CN102216908B (zh) 支援执行对应于检测事件的动作的系统、方法和装置
JP4717945B2 (ja) 業務分析プログラムおよび業務分析装置
CN111581054B (zh) 一种基于elk的日志埋点的业务分析告警系统及方法
CN108537544A (zh) 一种交易系统实时监控方法及其监控系统
JP5245211B2 (ja) 監視システム
CN102597966B (zh) 运行管理装置以及运行管理方法
CN111339175B (zh) 数据处理方法、装置、电子设备及可读存储介质
CN102231673B (zh) 用于监控业务服务器的系统和方法
CN102138130A (zh) 检测规则生成装置、检测规则生成方法和计算机程序
CN102096688A (zh) 数据报表的生成方法及装置
CN102567185B (zh) 一种应用服务器的监控方法
CN104424539A (zh) 维护信息管理系统及方法、以及维护信息显示方法
CN114124743B (zh) 一种数据应用全链路检查规则执行方法及系统
JPWO2020202433A1 (ja) 情報処理装置およびapi使用履歴表示プログラム
JP5423427B2 (ja) 情報管理プログラム、情報管理装置、および情報管理方法
CN117077847A (zh) 一种基于业务模型的在线推演及推演可视化实现方法
CN113901092B (zh) 一种用于赛场运行监测的文件管理方法及系统
JP6920235B2 (ja) 障害影響調査装置および障害影響調査方法
JP2013037478A (ja) 作業工数算出装置、作業工数算出方法、およびプログラム
JP2009134535A (ja) ソフトウェア開発支援装置、ソフトウェア開発支援方法及びソフトウェア開発支援プログラム
CN118585654A (zh) 一种基于知识图谱的节点推荐方法、系统、存储介质及处理器
JP6286204B2 (ja) 振り返りデータ生成システムおよび振り返りデータ生成方法
WO2013190627A1 (ja) 相関分析装置及びその方法
CN117745221A (zh) 一种产品预警事件的配置方法及装置
CN117670291A (zh) 事件处置系统接数可视化方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant