CN104794013A - 定位系统运行状态、建立系统运行状态模型的方法及装置 - Google Patents

定位系统运行状态、建立系统运行状态模型的方法及装置 Download PDF

Info

Publication number
CN104794013A
CN104794013A CN201510125064.9A CN201510125064A CN104794013A CN 104794013 A CN104794013 A CN 104794013A CN 201510125064 A CN201510125064 A CN 201510125064A CN 104794013 A CN104794013 A CN 104794013A
Authority
CN
China
Prior art keywords
event
data
node
digraph
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510125064.9A
Other languages
English (en)
Other versions
CN104794013B (zh
Inventor
刘禹辰
王肇刚
陈宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510125064.9A priority Critical patent/CN104794013B/zh
Publication of CN104794013A publication Critical patent/CN104794013A/zh
Application granted granted Critical
Publication of CN104794013B publication Critical patent/CN104794013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供了一种定位系统运行状态、建立系统运行状态模型的方法及装置。一种用于定位系统运行状态的方法,包括:获取关于发生事件的事件实例数据,所述事件实例数据包括发生的第一事件的标识以及发生所述第一事件的实体的数据;从预先建立的系统事件关系有向图获取与所述第一事件相应的第一事件节点,其中,所述系统事件关系有向图中的每个第一事件节点相应于第二事件的标识以及发生所述第二事件的实体的数据;在运行发生事件有向图中添加与获取的第一事件节点相应的第二事件节点。通过对目标系统可能发生的各种事件获得的多条事件关系数据进行分析及处理,绘制较准确地反映事件关系的部分系统或完整系统的系统事件关系有向图。

Description

定位系统运行状态、建立系统运行状态模型的方法及装置
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种通过计算机实现的用于定位系统运行状态的方法、建立系统运行状态模型的方法及装置。
背景技术
近年来,国内外的互联网公司在致力于提升网络应用系统的基础质量,由此产生了各种具有很强定制化的故障分析系统。现有的故障定位分析技术主要依赖于各种来源的报警短信、邮件以及质量相关人员的经验。此外,一些定制化的故障分析系统还依赖于特定场景和特定信息来源进行故障分析。
如何能够更好地抽象出故障定位分析模型,将大量的纷繁复杂的异常信息整合到故障定位分析模型中也是需要解决的问题。
发明内容
本发明实施例的目的在于,提供一种通过计算机实现的用于定位系统运行状态的方法、建立系统运行状态模型的方法及装置,以通过获得的系统运行状态的信息来自动地并较为准确地定位软件系统中发生的故障。
为实现上述发明目的,本发明的实施例提供了一种通过计算机实现的用于定位系统运行状态的方法,所述方法包括:获取关于发生事件的事件实例数据,所述事件实例数据包括发生的第一事件的标识以及发生所述第一事件的实体的数据;从预先建立的系统事件关系有向图获取与所述第一事件相应的第一事件节点,其中,所述系统事件关系有向图中的每个第一事件节点相应于第二事件的标识以及发生所述第二事件的实体的数据,并且在所述系统事件关系有向图中,第一原因事件节点指向其第一结果事件节点;在运行发生事件有向图中添加与获取的第一事件节点相应的第二事件节点。
优选地,所述在运行发生事件有向图中添加与获取的第一事件节点相应的第二事件节点的处理还包括:在所述运行发生事件有向图中查找与所述获取的第一事件节点的第一原因事件节点相应的第二原因事件节点;如果找到所述第二原因事件节点,则将所述第二原因事件节点指向所述添加的第二事件节点。
优选地,所述事件实例数据还包括发生所述第一事件的时间的数据,所述在运行发生事件有向图中添加与获取的第一事件节点相应的第二事件节点的处理还包括:为所述第二事件节点相应地存储所述发生所述第一事件的时间的数据。
优选地,所述方法还包括:从所述运行发生事件有向图中去除发生的时间晚于其结果事件的事件关联,其中,所述结果事件相应于所述系统事件关系有向图中与所述第二事件节点相应的第一事件节点的第一结果事件节点。
可选地,所述方法还包括:输出所述运行发生事件有向图。
优选地,所述方法还包括:获取在预定时间长度内采集的多条事件实例数据,并且去除具有相同第一事件的标识、且发生的时间在后的事件实例数据。
为实现上述发明目的,本发明的实施例还提供了一种通过计算机实现的用于建立系统运行状态模型的方法,所述方法包括:获取事件关系数据,所述事件关系数据包括原因事件数据和结果事件数据,所述原因事件数据包括原因事件的标识和发生所述原因事件的第一实体的数据,所述结果事件数据包括结果事件的标识和发生所述结果事件的第二实体的数据;根据预先设置的事件限制条件数据对所述事件关系数据进行验证;如果所述验证成功,则在系统事件关系有向图中添加与所述事件关系数据相应的事件节点以及有向连接。
可选地,所述预先设置的事件限制条件数据包括发生事件的模块关系限制条件数据和事件类型的限制条件数据当中的至少一种。
可选地,所述根据预先设置的事件限制条件数据对所述事件关系数据进行验证的处理包括:从预先建立的模块实体对照数据分别获取所述第一实体所属的第一功能模块的数据和所述第二实体所属的第二功能模块的数据;根据在预先建立的模块关系数据中所述第一功能模块和第二功能模块之间是否存在关联来确定所述验证是否成功。
可选地,所述根据预先设置的事件限制条件数据对所述事件关系数据进行验证的处理包括:从预先建立的事件类型对照数据分别获取所述原因事件所属的第一事件类型的数据和所述结果事件所属的第二事件类型的数据;根据在预先建立的事件类型关系数据中所述第一事件类型和第二事件类型之间是否存在正确关联来确定所述验证是否成功。
优选地,所述在系统事件关系有向图中添加与所述事件关系数据相应的事件节点以及有向连接的处理包括:在所述系统事件关系有向图中分别获取与所述原因事件数据相应的原因事件节点和与所述结果事件数据相应的结果事件节点;将所述原因事件节点指向所述结果事件节点。
优选地,所述在所述系统事件关系有向图中分别获取与所述原因事件数据相应的原因事件节点和与所述结果事件数据相应的结果事件节点的处理包括:如果在所述系统事件关系有向图中不存在与所述原因事件数据相应的原因事件节点,则在所述系统事件关系有向图中添加与所述原因事件数据相应的原因事件节点;如果在所述系统事件关系有向图中不存在与所述结果事件数据相应的结果事件节点,则在所述系统事件关系有向图中添加与所述结果事件数据相应的结果事件节点。
为实现上述发明目的,本发明的实施例还提供了一种用于定位系统运行状态的装置,所述装置包括:事件实例获取单元,用于获取关于发生事件的事件实例数据,所述事件实例数据包括发生的第一事件的标识以及发生所述第一事件的实体的数据;关联事件获取单元,用于从预先建立的系统事件关系有向图获取与所述第一事件相应的第一事件节点,其中,所述系统事件关系有向图中的每个第一事件节点相应于第二事件的标识以及发生所述第二事件的实体的数据,并且在所述系统事件关系有向图中,第一原因事件节点指向其第一结果事件节点;运行状态有向图绘制单元,用于在运行发生事件有向图中添加与获取的第一事件节点相应的第二事件节点。
优选地,所述运行状态有向图绘制单元还用于在所述运行发生事件有向图中查找与所述获取的第一事件节点的第一原因事件节点相应的第二原因事件节点,并且如果找到所述第二原因事件节点,则将所述第二原因事件节点指向所述添加的第二事件节点。
优选地,所述事件实例数据还包括发生所述第一事件的时间的数据,所述运行状态有向图绘制单元还用于为所述第二事件节点相应地存储所述发生所述第一事件的时间的数据,并且所述装置还包括:事件关系校正单元,用于从所述运行发生事件有向图中去除发生的时间晚于其结果事件的事件关联,其中,所述结果事件相应于所述系统事件关系有向图中与所述第二事件节点相应的第一事件节点的第一结果事件节点。
优选地,所述装置还包括:事件实例过滤单元,用于获取在预定时间长度内采集的多条事件实例数据,并且去除具有相同第一事件的标识、且发生的时间在后的事件实例数据。
为实现上述发明目的,本发明的实施例还提供了一种用于建立系统运行状态模型的装置,所述装置包括:事件关系数据获取单元,用于获取事件关系数据,所述事件关系数据包括原因事件数据和结果事件数据,所述原因事件数据包括原因事件的标识和发生所述原因事件的第一实体的数据,所述结果事件数据包括结果事件的标识和发生所述结果事件的第二实体的数据;事件关系数据验证单元,用于根据预先设置的事件限制条件数据对所述事件关系数据进行验证;事件关系有向图绘制单元,用于如果所述事件关系数据验证单元进行的所述验证成功,则在系统事件关系有向图中添加与所述事件关系数据相应的事件节点以及有向连接。
可选地,所述预先设置的事件限制条件数据包括发生事件的模块关系限制条件数据和事件类型的限制条件数据当中的至少一种。
优选地,所述事件关系有向图绘制单元包括:节点获取单元,用于在所述系统事件关系有向图中分别获取与所述原因事件数据相应的原因事件节点和与所述结果事件数据相应的结果事件节点;节点连接单元,用于将所述原因事件节点指向所述结果事件节点。
优选地,所述节点获取单元用于:如果在所述系统事件关系有向图中不存在与所述原因事件数据相应的原因事件节点,则所述节点获取单元在所述系统事件关系有向图中添加与所述原因事件数据相应的原因事件节点;如果在所述系统事件关系有向图中不存在与所述结果事件数据相应的结果事件节点,则所述节点获取单元在所述系统事件关系有向图中添加与所述结果事件数据相应的结果事件节点。
根据本发明的通过计算机实现的用于定位系统运行状态的方法、建立系统运行状态模型的方法及装置通过对目标系统可能发生的各种事件获得的多条事件关系数据进行分析及处理,绘制较准确地反映事件关系的部分系统或完整系统的系统事件关系有向图。之后,参照绘制的系统事件关系有向图对实际发生的事件实例数据进行分析,绘制反映系统实际运行状态的运行发生事件有向图,从而当系统发生故障时,可通过绘制的运行发生事件有向图自动地且较为准确地定位系统发生故障的事件路线以及发生的根因。
附图说明
图1是示出反映本发明总体发明构思的用于定位系统运行状态的方法和用于建立系统运行状态模型的方法的示意图;
图2是示出根据本发明示例性实施例一的用于建立系统运行状态模型的方法的流程图;
图3是示出根据本发明示例性实施例二的用于定位系统运行状态的方法的流程图;
图4是示出根据本发明示例性实施例二中的步骤S340的处理的流程图;
图5~图9示出根据本发明示例性实施例一的用于建立系统运行状态模型的方法的处理的示例;
图10示出根据本发明示例性实施例二的定位系统运行状态的方法的处理结果的示例;
图11是示出根据本发明示例性实施例三的用于建立系统运行状态模型的装置的逻辑框图;
图12是示出根据本发明示例性实施例四的用于定位系统运行状态的装置的逻辑框图。
具体实施方式
下面结合附图对本发明的示例性实施例进行详细描述。
为了较为准确地获取作为目标系统的如软件系统、网络应用系统等的运行状态,本发明的总体发明构思分为两个方面的处理:用于建立系统运行状态模型的处理以及用于定位系统运行状态的处理。其中,在用于建立系统运行状态模型的处理中,线下通过绘制能够正确地反映目标系统的系统事件关系有向图来建立系统运行状态模型;在用于定位系统运行状态的处理中,根据在前述线下绘制的系统事件关系有向图对系统在实际运行中产生的事件进行分析,来绘制实际发生的运行发生事件有向图,从而在发生异常事件时,可自动且较为准确地定位系统发生故障的事件路线以及发生的根因。需要指出,在此所述的“绘制”并非特指实际绘出系统事件关系有向图或运行发生事件有向图,而还可以是,产生在逻辑上反映所述系统事件关系有向图或运行发生事件有向图中的事件关系的数据。
图1是示出反映本发明总体发明构思的用于定位系统运行状态的方法和用于建立系统运行状态模型的方法的示意图。
参照图1,可在线下对目标系统可能发生的各种事件进行分析,初步获取事件关系数据并抽象出发生事件的实体(如发生事件的插件、类、脚本文件等)。此外,可将所述实体分别归类到相应的功能模块,生成模块实体对照数据,并根据系统的运行逻辑配置各个功能模块之间的关联关系,生成模块关系数据;可将发生的事件分别归类到相应的事件类型,生成事件类型对照数据,并根据系统的运行逻辑配置各个事件类型之间关联关系,生成事件类型关系数据。图5示出对目标系统可能发生的各种事件进行分析后,从事件A、B、C、D、E和F抽象出发生所述事件的实体(A、B)~~E1、(C、D、E)~~(E2、E3)和F~~E4的示例;生成的模块实体对照数据E1~~M1、(E2、E3)~~M2以及E4~~M3。图7示出生成的模块关系数据和事件类型关系数据的示例。其中,功能模块M1和M2之间有关联关系,而功能模块M3与其他功能模块都无关联关系;升级类的事件引起报警类的事件,而报警类的事件不会导致发生升级类的事件。
所述实体对照数据和模块关系数据可作为模块关系限制条件数据,所述事件类型对照数据和事件类型关系数据作为事件类型的限制条件数据。可通过模块关系限制条件数据和事件类型的限制条件数据之一或两者对初步获取的事件关系数据进行验证。将验证成功的事件关系数据绘制到作为系统运行状态模型的系统事件关系有向图中。
此后,可在线上实时获取实际发生的事件实例数据,将所述事件实例数据与预先建立的所述系统事件关系有向图进行匹配,从而绘制反映实际发生的事件走向的运行发生事件有向图。根据绘制的运行发生事件有向图,可直观地获取系统运行状态的信息,并且在系统发生故障时,可通过绘制的运行发生事件有向图较为准确地定位系统发生故障的事件路线以及发生的根因。
实施例一
图2是示出根据本发明示例性实施例一的用于建立系统运行状态模型的方法的流程图。如前所述,可在线下对目标系统可能发生的各种事件进行分析,初步获取事件关系数据并抽象出发生事件的实体。根据实施例一的方法用于对前述对目标系统进行分析初步获取的事件关系数据以及限制条件数据进行处理,从而生成系统事件关系有向图。图7示出所述初步获取的多条事件关系数据的示例,这些事件关系数据从逻辑上初步形成一个有向图。其中,在任一条事件关系数据(如A->C)中,处于引出箭头的一侧的事件是原因事件,处于箭头指向的一侧的事件是结果事件。
参照图2,在步骤S210,获取事件关系数据,所述事件关系数据包括原因事件数据和结果事件数据,所述原因事件数据包括原因事件的标识和发生所述原因事件的第一实体的数据,所述结果事件数据包括结果事件的标识和发生所述结果事件的第二实体的数据。所述原因事件的标识和结果事件的标识可以是,但不限于,相应事件的名称或编号。所述第一实体和第二实体可以分别是发生所述原因事件和结果事件的插件、类、脚本文件等。
在步骤S220,根据预先设置的事件限制条件数据对所述事件关系数据进行验证,从而确定所述事件关系数据是否符合系统设计和运行逻辑。
具体地,所述预先设置的事件限制条件数据可包括,但不限于,例如发生事件的模块关系限制条件数据和事件类型的限制条件数据当中的至少一种。
在所述事件限制条件数据是模块关系限制条件数据的情况下,步骤S220可包括:从预先建立的模块实体对照数据分别获取所述第一实体所属的第一功能模块的数据和所述第二实体所属的第二功能模块的数据,并且根据在预先建立的模块关系数据中所述第一功能模块和第二功能模块之间是否存在关联来确定所述验证是否成功。也就是说,如果发生原因事件和结果事件的实体所属的功能模块之间无关联,那么所述事件关系数据不符合设计逻辑。例如,如图8所示,在对事件关系数据(C->F)进行验证的处理中,由于事件C对应于功能模块M2,而事件F对应于功能模块M3,而功能模块M2和功能模块M3之间无关联关系,因此对事件关系数据(C->F)进行的验证失败。
在所述事件限制条件数据是事件类型的限制条件数据的情况下,步骤S220可包括:从预先建立的事件类型对照数据分别获取所述原因事件所属的第一事件类型的数据和所述结果事件所属的第二事件类型的数据,并且根据在预先建立的事件类型关系数据中所述第一事件类型和第二事件类型之间是否存在正确关联来确定所述验证是否成功。也就是说,如果发生的原因事件的第一事件类型和发生结果事件的第二事件类型之间无关联或关联关系不正确,那么所述事件关系数据不符合设计逻辑。
通过对所述事件关系数据进行验证,可确定滤除不符合设计和运行逻辑的事件关系数据,从而获得准确反映目标系统的事件关系的数据。
在步骤S230,确定对所述事件关系数据进行的验证是否成功。
如果在步骤S230,确定对所述事件关系数据进行的验证成功,则在步骤S240,在系统事件关系有向图中添加与所述事件关系数据相应的事件节点以及有向连接。例如,在系统事件关系有向图中绘制反映事件因果关系的事件节点,并且绘制所述由与所述原因事件相应的事件节点指向与所述结果事件相应的事件节点的箭头。
图3示出根据本发明示例性实施例二中的步骤S240的示例性处理。
参照图3,在步骤S242,在所述系统事件关系有向图中分别获取与所述原因事件数据相应的原因事件节点和与所述结果事件数据相应的结果事件节点。
具体地,在步骤S242,如果在所述系统事件关系有向图中不存在与所述原因事件数据相应的原因事件节点,则在所述系统事件关系有向图中添加与所述原因事件数据相应的原因事件节点;如果在所述系统事件关系有向图中不存在与所述结果事件数据相应的结果事件节点,则在所述系统事件关系有向图中添加与所述结果事件数据相应的结果事件节点。
此后,在步骤S245,将所述原因事件节点指向所述结果事件节点。例如,绘制所述原因事件节点指向所述结果事件节点的箭头。
如果在步骤S230,确定对所述事件关系数据进行的验证失败,在结束对所述事件关系数据的处理。
前述描述了针对任一条事件关系数据的处理。通过对目标系统可能发生的各种事件获得的多条事件关系数据进行前述处理,绘制部分系统或完整系统的系统事件关系有向图。图9示出根据前述的方法对图6所示的事件关系数据进行处理后得到的系统事件关系有向图的示例。
之后,在实施例二示出的用于定位系统运行状态的方法中,可参照绘制的系统事件关系有向图对实际发生的事件实例数据进行分析,绘制反映系统实际运行状态的运行发生事件有向图,从而当系统发生故障时,可通过绘制的运行发生事件有向图较为准确地定位系统发生故障的事件路线以及发生的根因。
实施例二
图4是示出根据本发明示例性实施例二的用于定位系统运行状态的方法的流程图。所述方法用于根据前述生成的系统事件关系有向图对实际发生的事件实例数据进行分析,以绘制反映系统实际运行状态的运行发生事件有向图的处理。
参照图4,在步骤S310,获取关于发生事件的事件实例数据,所述事件实例数据包括发生的第一事件的标识以及发生所述第一事件的实体的数据。所述事件实例数据可来自系统运行日志,也可以来自系统运行时实时产生的运行记录。所述第一事件的标识可以是,但不限于,相应事件的名称或编号。所述第一事件的实体可以是发生所述事件的插件、类、脚本文件等。
在步骤S320,从预先建立的系统事件关系有向图获取与所述第一事件相应的第一事件节点,其中,所述系统事件关系有向图中的每个第一事件节点相应于第二事件的标识以及发生所述第二事件的实体的数据,并且在所述系统事件关系有向图中,第一原因事件节点指向其第一结果事件节点。
在步骤S330,在运行发生事件有向图中添加与获取的第一事件节点相应的第二事件节点。
具体地,根据本发明的示例性实施例,步骤S330还包括:在所述运行发生事件有向图中查找与所述获取的第一事件节点的第一原因事件节点相应的第二原因事件节点;如果找到所述第二原因事件节点,则将所述第二原因事件节点指向所述添加的第二事件节点。
前述描述了针对任一条事件实例数据的处理。通过对目标系统实际发生事件的多条事件实例数据进行前述处理,可绘制反映系统实际运行状态的运行发生事件有向图,从而当系统发生故障时,可通过绘制的运行发生事件有向图较为准确地定位系统发生故障的事件路线以及发生的根因。图10示出通过对事件实例数据A、B和C进行处理后得到的运行发生事件有向图的示例。
根据本发明的示例性实施例,所述事件实例数据可还包括,但不限于,发生所述第一事件的时间的数据等;步骤S330还包括,为所述第二事件节点相应地存储所述发生所述第一事件的时间的数据。
优选地,所述方法还包括:从所述运行发生事件有向图中去除发生的时间晚于其结果事件的事件关联,其中,所述结果事件相应于所述系统事件关系有向图中与所述第二事件节点相应的第一事件节点的第一结果事件节点。从而,从绘制的运行发生事件有向图中去除从发生时间上不符合逻辑的事件节点,对所述运行发生事件有向图进行校正。例如,死机事件具有不可预见性,如果在绘制的运行发生事件有向图中先绘制了报警事件的事件节点,而之后又绘制了
可选地,所述用于定位系统运行状态的方法可还包括:输出所述运行发生事件有向图。
根据本发明的优选实施例,所述用于定位系统运行状态的方法还包括:在执行步骤S310前,获取在预定时间长度内采集的多条事件实例数据,并且去除具有相同第一事件的标识、且发生的时间在后的事件实例数据。
实施例三
图11是示出根据本发明示例性实施例三的的逻辑框图。
参照图11,所述用于建立系统运行状态模型的装置包括:事件关系数据获取单元510、事件关系数据验证单元520和事件关系有向图绘制单元530。
事件关系数据获取单元510用于获取事件关系数据,所述事件关系数据包括原因事件数据和结果事件数据,所述原因事件数据包括原因事件的标识和发生所述原因事件的第一实体的数据,所述结果事件数据包括结果事件的标识和发生所述结果事件的第二实体的数据。
事件关系数据验证单元520用于根据预先设置的事件限制条件数据对所述事件关系数据进行验证。
所述预先设置的事件限制条件数据可包括发生事件的模块关系限制条件数据和事件类型的限制条件数据当中的至少一种。
根据本发明的可选实施例,所述事件关系数据验证单元可包括:模块数据获取单元(未示出),用于从预先建立的模块实体对照数据分别获取所述第一实体所属的第一功能模块的数据和所述第二实体所属的第二功能模块的数据;模块关系验证单元(未示出),用于根据在预先建立的模块关系数据中所述第一功能模块和第二功能模块之间是否存在关联来确定所述验证是否成功。
根据本发明的可选实施例,所述事件关系数据验证单元可包括:事件类型获取单元(未示出),用于从预先建立的事件类型对照数据分别获取所述原因事件所属的第一事件类型的数据和所述结果事件所属的第二事件类型的数据;事件类型关系验证单元(未示出),用于根据在预先建立的事件类型关系数据中所述第一事件类型和第二事件类型之间是否存在正确关联来确定所述验证是否成功。
事件关系有向图绘制单元530用于如果事件关系数据验证单元520进行的所述验证成功,则在系统事件关系有向图中添加与所述事件关系数据相应的事件节点以及有向连接。
具体地,所述事件关系有向图绘制单元包括:节点获取单元532,用于在所述系统事件关系有向图中分别获取与所述原因事件数据相应的原因事件节点和与所述结果事件数据相应的结果事件节点;节点连接单元535,用于将所述原因事件节点指向所述结果事件节点。
进一步地,所述节点获取单元532用于,如果在所述系统事件关系有向图中不存在与所述原因事件数据相应的原因事件节点,则节点获取单元532在所述系统事件关系有向图中添加与所述原因事件数据相应的原因事件节点;如果在所述系统事件关系有向图中不存在与所述结果事件数据相应的结果事件节点,则节点获取单元532在所述系统事件关系有向图中添加与所述结果事件数据相应的结果事件节点。
所述用于建立系统运行状态模型的装置通过对目标系统可能发生的各种事件获得的多条事件关系数据进行前述处理,绘制部分系统或完整系统的系统事件关系有向图。
实施例四
图12是示出根据本发明示例性实施例四的用于定位系统运行状态的装置的逻辑框图。
参照图12,所述用于定位系统运行状态的装置包括事件实例获取单元610、关联事件获取单元620和运行状态有向图绘制单元630。
事件实例获取单元610用于获取关于发生事件的事件实例数据,所述事件实例数据包括发生的第一事件的标识以及发生所述第一事件的实体的数据;
关联事件获取单元620用于从预先建立的系统事件关系有向图获取与所述第一事件相应的第一事件节点,其中,所述系统事件关系有向图中的每个第一事件节点相应于第二事件的标识以及发生所述第二事件的实体的数据,并且在所述系统事件关系有向图中,第一原因事件节点指向其第一结果事件节点;
运行状态有向图绘制单元630用于在运行发生事件有向图中添加与获取的第一事件节点相应的第二事件节点。
具体地,运行状态有向图绘制单元630还用于在所述运行发生事件有向图中查找与所述获取的第一事件节点的第一原因事件节点相应的第二原因事件节点,并且如果找到所述第二原因事件节点,则将所述第二原因事件节点指向所述添加的第二事件节点。
根据本发明的示例性实施例,所述事件实例数据还包括发生所述第一事件的时间的数据,并且运行状态有向图绘制单元630还用于为所述第二事件节点相应地存储所述发生所述第一事件的时间的数据。
优选地,所述装置还包括:事件关系校正单元640,用于从所述运行发生事件有向图中去除发生的时间晚于其结果事件的事件关联,其中,所述结果事件相应于所述系统事件关系有向图中与所述第二事件节点相应的第一事件节点的第一结果事件节点。
优选地,所述装置还包括:事件实例过滤单元(未示出),用于获取在预定时间长度内采集的多条事件实例数据,并且去除具有相同第一事件的标识、且发生的时间在后的事件实例数据。
优选地,所述装置还包括:运行状态有向图输出单元(未示出),用于输出所述运行发生事件有向图。
综上所述,根据本发明的通过计算机实现的用于定位系统运行状态的方法、建立系统运行状态模型的方法及装置通过对目标系统可能发生的各种事件获得的多条事件关系数据进行分析及处理,绘制较准确地反映事件关系的部分系统或完整系统的系统事件关系有向图。之后,参照绘制的系统事件关系有向图对实际发生的事件实例数据进行分析,绘制反映系统实际运行状态的运行发生事件有向图,从而当系统发生故障时,可通过绘制的运行发生事件有向图自动地且较为准确地定位系统发生故障的事件路线以及发生的根因。
在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (20)

1.一种通过计算机实现的用于定位系统运行状态的方法,其特征在于,所述方法包括:
获取关于发生事件的事件实例数据,所述事件实例数据包括发生的第一事件的标识以及发生所述第一事件的实体的数据;
从预先建立的系统事件关系有向图获取与所述第一事件相应的第一事件节点,其中,所述系统事件关系有向图中的每个第一事件节点相应于第二事件的标识以及发生所述第二事件的实体的数据,并且在所述系统事件关系有向图中,第一原因事件节点指向其第一结果事件节点;
在运行发生事件有向图中添加与获取的第一事件节点相应的第二事件节点。
2.根据权利要求1所述的方法,其特征在于,所述在运行发生事件有向图中添加与获取的第一事件节点相应的第二事件节点的处理还包括:
在所述运行发生事件有向图中查找与所述获取的第一事件节点的第一原因事件节点相应的第二原因事件节点,
如果找到所述第二原因事件节点,则将所述第二原因事件节点指向所述添加的第二事件节点。
3.根据权利要求2所述的方法,其特征在于,所述事件实例数据还包括发生所述第一事件的时间的数据,并且
所述在运行发生事件有向图中添加与获取的第一事件节点相应的第二事件节点的处理还包括:
为所述第二事件节点相应地存储所述发生所述第一事件的时间的数据。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
从所述运行发生事件有向图中去除发生的时间晚于其结果事件的事件关联,其中,所述结果事件相应于所述系统事件关系有向图中与所述第二事件节点相应的第一事件节点的第一结果事件节点。
5.根据权利要求1~4中任一项所述的方法,其特征在于,所述方法还包括:
输出所述运行发生事件有向图。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取在预定时间长度内采集的多条事件实例数据,并且去除具有相同第一事件的标识、且发生的时间在后的事件实例数据。
7.一种通过计算机实现的用于建立系统运行状态模型的方法,其特征在于,所述方法包括:
获取事件关系数据,所述事件关系数据包括原因事件数据和结果事件数据,所述原因事件数据包括原因事件的标识和发生所述原因事件的第一实体的数据,所述结果事件数据包括结果事件的标识和发生所述结果事件的第二实体的数据;
根据预先设置的事件限制条件数据对所述事件关系数据进行验证;
如果所述验证成功,则在系统事件关系有向图中添加与所述事件关系数据相应的事件节点以及有向连接。
8.根据权利要求7所述的方法,其特征在于,所述预先设置的事件限制条件数据包括发生事件的模块关系限制条件数据和事件类型的限制条件数据当中的至少一种。
9.根据权利要求8所述的方法,其特征在于,所述根据预先设置的事件限制条件数据对所述事件关系数据进行验证的处理包括:
从预先建立的模块实体对照数据分别获取所述第一实体所属的第一功能模块的数据和所述第二实体所属的第二功能模块的数据,
根据在预先建立的模块关系数据中所述第一功能模块和第二功能模块之间是否存在关联来确定所述验证是否成功。
10.根据权利要求8所述的方法,其特征在于,所述根据预先设置的事件限制条件数据对所述事件关系数据进行验证的处理包括:
从预先建立的事件类型对照数据分别获取所述原因事件所属的第一事件类型的数据和所述结果事件所属的第二事件类型的数据,
根据在预先建立的事件类型关系数据中所述第一事件类型和第二事件类型之间是否存在正确关联来确定所述验证是否成功。
11.根据权利要求7~10中任一项所述的方法,其特征在于,所述在系统事件关系有向图中添加与所述事件关系数据相应的事件节点以及有向连接的处理包括:
在所述系统事件关系有向图中分别获取与所述原因事件数据相应的原因事件节点和与所述结果事件数据相应的结果事件节点,
将所述原因事件节点指向所述结果事件节点。
12.根据权利要求10所述的方法,其特征在于,所述在所述系统事件关系有向图中分别获取与所述原因事件数据相应的原因事件节点和与所述结果事件数据相应的结果事件节点的处理包括:
如果在所述系统事件关系有向图中不存在与所述原因事件数据相应的原因事件节点,则在所述系统事件关系有向图中添加与所述原因事件数据相应的原因事件节点,
如果在所述系统事件关系有向图中不存在与所述结果事件数据相应的结果事件节点,则在所述系统事件关系有向图中添加与所述结果事件数据相应的结果事件节点。
13.一种用于定位系统运行状态的装置,其特征在于,所述装置包括:
事件实例获取单元,用于获取关于发生事件的事件实例数据,所述事件实例数据包括发生的第一事件的标识以及发生所述第一事件的实体的数据;
关联事件获取单元,用于从预先建立的系统事件关系有向图获取与所述第一事件相应的第一事件节点,其中,所述系统事件关系有向图中的每个第一事件节点相应于第二事件的标识以及发生所述第二事件的实体的数据,并且在所述系统事件关系有向图中,第一原因事件节点指向其第一结果事件节点;
运行状态有向图绘制单元,用于在运行发生事件有向图中添加与获取的第一事件节点相应的第二事件节点。
14.根据权利要求13所述的装置,其特征在于,所述运行状态有向图绘制单元还用于在所述运行发生事件有向图中查找与所述获取的第一事件节点的第一原因事件节点相应的第二原因事件节点,并且如果找到所述第二原因事件节点,则将所述第二原因事件节点指向所述添加的第二事件节点。
15.根据权利要求14所述的装置,其特征在于,所述事件实例数据还包括发生所述第一事件的时间的数据,
所述运行状态有向图绘制单元还用于为所述第二事件节点相应地存储所述发生所述第一事件的时间的数据,并且
所述装置还包括:
事件关系校正单元,用于从所述运行发生事件有向图中去除发生的时间晚于其结果事件的事件关联,其中,所述结果事件相应于所述系统事件关系有向图中与所述第二事件节点相应的第一事件节点的第一结果事件节点。
16.根据权利要求13~15中任一项所述的装置,其特征在于,所述装置还包括:
事件实例过滤单元,用于获取在预定时间长度内采集的多条事件实例数据,并且去除具有相同第一事件的标识、且发生的时间在后的事件实例数据。
17.一种用于建立系统运行状态模型的装置,其特征在于,所述装置包括:
事件关系数据获取单元,用于获取事件关系数据,所述事件关系数据包括原因事件数据和结果事件数据,所述原因事件数据包括原因事件的标识和发生所述原因事件的第一实体的数据,所述结果事件数据包括结果事件的标识和发生所述结果事件的第二实体的数据;
事件关系数据验证单元,用于根据预先设置的事件限制条件数据对所述事件关系数据进行验证;
事件关系有向图绘制单元,用于如果所述事件关系数据验证单元进行的所述验证成功,则在系统事件关系有向图中添加与所述事件关系数据相应的事件节点以及有向连接。
18.根据权利要求17所述的装置,其特征在于,所述预先设置的事件限制条件数据包括发生事件的模块关系限制条件数据和事件类型的限制条件数据当中的至少一种。
19.根据权利要求17或18所述的装置,其特征在于,所述事件关系有向图绘制单元包括:
节点获取单元,用于在所述系统事件关系有向图中分别获取与所述原因事件数据相应的原因事件节点和与所述结果事件数据相应的结果事件节点,
节点连接单元,用于将所述原因事件节点指向所述结果事件节点。
20.根据权利要求19所述的装置,其特征在于,所述节点获取单元用于:
如果在所述系统事件关系有向图中不存在与所述原因事件数据相应的原因事件节点,则所述节点获取单元在所述系统事件关系有向图中添加与所述原因事件数据相应的原因事件节点,
如果在所述系统事件关系有向图中不存在与所述结果事件数据相应的结果事件节点,则所述节点获取单元在所述系统事件关系有向图中添加与所述结果事件数据相应的结果事件节点。
CN201510125064.9A 2015-03-20 2015-03-20 定位系统运行状态、建立系统运行状态模型的方法及装置 Active CN104794013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510125064.9A CN104794013B (zh) 2015-03-20 2015-03-20 定位系统运行状态、建立系统运行状态模型的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510125064.9A CN104794013B (zh) 2015-03-20 2015-03-20 定位系统运行状态、建立系统运行状态模型的方法及装置

Publications (2)

Publication Number Publication Date
CN104794013A true CN104794013A (zh) 2015-07-22
CN104794013B CN104794013B (zh) 2018-03-13

Family

ID=53558823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510125064.9A Active CN104794013B (zh) 2015-03-20 2015-03-20 定位系统运行状态、建立系统运行状态模型的方法及装置

Country Status (1)

Country Link
CN (1) CN104794013B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512210A (zh) * 2015-11-27 2016-04-20 网神信息技术(北京)股份有限公司 关联事件类型的检测方法及装置
CN109710813A (zh) * 2018-12-14 2019-05-03 成都四方伟业软件股份有限公司 数据处理方法和数据处理装置
CN110245237A (zh) * 2018-03-09 2019-09-17 北京国双科技有限公司 事件预测方法及装置
CN110309313A (zh) * 2018-03-09 2019-10-08 北京国双科技有限公司 生成事件转移图谱的方法及装置
WO2021052380A1 (zh) * 2019-09-17 2021-03-25 华为技术有限公司 提取故障传播条件的方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5963545A (en) * 1995-12-04 1999-10-05 Nec Corporation Fault evaluating system for transmission apparatus
CN1993721A (zh) * 2004-06-28 2007-07-04 Abb研究有限公司 用于抑制冗余报警的系统和方法
CN102158360A (zh) * 2011-04-01 2011-08-17 华中科技大学 一种基于时间因子因果关系定位的网络故障自诊断方法
CN103713628A (zh) * 2013-12-31 2014-04-09 上海交通大学 基于符号有向图和数据重构的故障诊断方法
CN104252401A (zh) * 2014-08-29 2014-12-31 北京阅联信息技术有限公司 一种基于权重的设备状态判断方法及其系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5963545A (en) * 1995-12-04 1999-10-05 Nec Corporation Fault evaluating system for transmission apparatus
CN1993721A (zh) * 2004-06-28 2007-07-04 Abb研究有限公司 用于抑制冗余报警的系统和方法
CN102158360A (zh) * 2011-04-01 2011-08-17 华中科技大学 一种基于时间因子因果关系定位的网络故障自诊断方法
CN103713628A (zh) * 2013-12-31 2014-04-09 上海交通大学 基于符号有向图和数据重构的故障诊断方法
CN104252401A (zh) * 2014-08-29 2014-12-31 北京阅联信息技术有限公司 一种基于权重的设备状态判断方法及其系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512210A (zh) * 2015-11-27 2016-04-20 网神信息技术(北京)股份有限公司 关联事件类型的检测方法及装置
CN110245237A (zh) * 2018-03-09 2019-09-17 北京国双科技有限公司 事件预测方法及装置
CN110309313A (zh) * 2018-03-09 2019-10-08 北京国双科技有限公司 生成事件转移图谱的方法及装置
CN110309313B (zh) * 2018-03-09 2022-04-22 北京国双科技有限公司 生成事件转移图谱的方法及装置
CN109710813A (zh) * 2018-12-14 2019-05-03 成都四方伟业软件股份有限公司 数据处理方法和数据处理装置
WO2021052380A1 (zh) * 2019-09-17 2021-03-25 华为技术有限公司 提取故障传播条件的方法、装置及存储介质

Also Published As

Publication number Publication date
CN104794013B (zh) 2018-03-13

Similar Documents

Publication Publication Date Title
CN104794013A (zh) 定位系统运行状态、建立系统运行状态模型的方法及装置
CN102436376B (zh) 用于分布式应用确认的模型检查
JP2019502191A (ja) サービス呼び出し情報処理の方法及びデバイス
CN103562863A (zh) 创建定义事件类型之间关系的相关规则
CN105095048A (zh) 一种基于业务规则的监控系统告警关联处理方法
CN103049354B (zh) 数据修复方法、数据修复装置以及存储系统
CN109005162B (zh) 工控系统安全审计方法及装置
CN109960690A (zh) 一种大数据集群的运行维护方法及装置
CN103401698A (zh) 用于服务器集群运算中对服务器状况报警的监控系统
CN109284331B (zh) 基于业务数据资源的制证信息获取方法、终端设备及介质
CN110245077A (zh) 一种程序异常的响应方法及设备
CN105260290A (zh) 应用异常信息收集方法和装置
CN111181775B (zh) 基于自动发现主机资产的一体化运维管理告警方法
CN105468511A (zh) 网页脚本错误定位方法及装置
CN111865673A (zh) 一种自动化故障管理方法、装置及系统
JP2019049802A (ja) 障害解析支援装置、インシデント管理システム、障害解析支援方法及びプログラム
US20190236223A1 (en) Identification of changes in functional behavior and runtime behavior of a system during maintenance cycles
CN106201887A (zh) 一种离线数据任务的验证方法及装置
CN114172921A (zh) 一种调度录音系统的日志审计方法及装置
CN104539449A (zh) 一种故障信息处理方法与相关装置
CN109582504A (zh) 一种用于苹果设备的数据恢复方法和装置
CN102929729A (zh) 故障跟踪的方法及装置
CN105843941B (zh) 日志校验方法及装置
CN109190146B (zh) 一种bim模型信息检验方法、系统、终端及存储介质
CN116756021A (zh) 基于事件分析的故障定位方法、装置、电子设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant