CN105653419B

CN105653419B - 基于监控点的溯源实现方法及系统

Info

Publication number: CN105653419B
Application number: CN201410632616.0A
Authority: CN
Inventors: 张华�
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2014-11-11
Filing date: 2014-11-11
Publication date: 2018-10-09
Anticipated expiration: 2034-11-11
Also published as: CN105653419A

Abstract

本申请适用于计算机智能监控技术领域，提供了一种基于监控点的溯源实现方法，包括有：采集各监控点的异常因果关系；根据每个所述监控点的所述异常因果关系建立单向网溯源模型；当监控到至少一个所述监控点成为异常点后，根据所述单向网溯源模型确定出所述异常点对应的异常源。相应地，本申请还提供一种基于监控点的溯源实现系统。借此，本申请的单向网溯源模型是一种预判式的溯源模型，通过对预判的结果与实际情况相结合进行落地，来保证自动快速地定位出问题的根本原因，具有直观可视化、虚拟现实程度高、支持复杂的逻辑关系描述、溯源运算方便、监控管理能力强的优点。

Description

基于监控点的溯源实现方法及系统

技术领域

本申请涉及计算机智能监控技术领域，尤其涉及一种基于监控点的溯源实现方法及系统。

背景技术

目前计算机智能监控领域非常需一种能够快速构造监控资源之间逻辑关系的资源关系模型，并且能够根据资源关系模型算法，快速计算出监控资源中发生异常时的真实源头，这样才能准确执行预案，达到从监视到智能控制的效果。特别是针对数据中心各设施(包含硬件和软件)监控点进行监控时，当某监控点报出警告时，由于各设施之间存在错综复杂的关系，通常很难快速的定位其原因，因为原来简单的通过编写组合ifelse(如果…否则)的方式已经无法很好列举错综复杂的上千万的监控资源的关系了。随着IDC(InternetData Center，互联网数据中心)、LDC(Linguistic data Consortium，语言数据联盟)的发展，监控资源越来越丰富，关系越来越复杂。建立什么样溯源模型、如何自动快速地计算出问题的根本原因，并能够直接表达根源路径是行业关注重点。数据中心涉及大中小型数据中心、互联网数据中心等，主要包括提供数据存储以及数据服务的计算机机房的载体，包含：计算机设备、存储设备、网络设备、环境调控设备及运行在各设备上的应用软件等。

随着计算机的快速发展，为了保证数据中心的稳定可靠的提供信息化服务，而孕育了许许多多的数据中心监控以及楼宇监控相关的管理系统，所述系统能够使用先进的图形化技术来进行虚拟现实相结合的方式，以360度全方位的监控管理人们所关心的重要事物与设施的运作情况，主要涉及到：1)电力方面动能系统监控，例如市电电力提供、燃油发电机电力提供、UPS(Uninterruptible Power Supply，不间断电源)电力储备系统等；2)环境调控系统的监控，例如精密空调、普通空调、新风机、通风管等；3)网络通讯设备的监控，例如三层交换机、路由器、负载均衡器、光纤线路连通情况等。4)计算机设备以及软件的监控，例如高性能网络存储设备、千兆网卡、CPU(Central Processing Unit，中央处理器)负载、内存使用情况、存储介质容量及I/O(Input/Output，输入/输出)情况、以及提供服务的中间件系统等。

所述各种监控事物均含有各种各样的监控点，目前传统的做法不外乎是通过穷举方式来进行封装识别逻辑。例如穷举如下例子：如果精密空调A出现制冷问题时，温湿度(1-20号)会出现高温报警，机柜(1-4列)上的服务器，因为机箱外部温度过高，散热器无法获取很好的冷热置换，会持续高温，致使其运行不稳定，有可能会自我保护关机。然而往往这种方式涉及到数据中心运维人员必须具备良好的编程能力，同时这样更是导致了一个不友好和不全面的结果，穷举没法做到全面的控制，对于小监控数据点的情况下可穷举到位，当涉及到的监控事物非常多的时候，就没办法一一明细，而且也不能直观的看出整个监控事物之间的物理和逻辑关系，也就是说通常情况下不知道分析结果是如何产生的，非常的不友好，这种方式能达到的监控管理能力是非常有限的。

日本管理大师石川馨先生申请的因果鱼骨图。在因果分析中，把产生事故的原因及造成的结果所构成错综复杂的因果关系，采用简明文字和线条加以全面表示的方法称为因果分析法。用于表述事故发生的原因与结果关系的图形为因果分析图。因果分析图的形状像鱼骨，故也叫因果鱼骨图。

因果鱼骨图是由原因和结果两部分组成的。一般情况下，可从人的不安全行为(安全管理、设计者、操作者等)和物质条件构成的不安全状态(设备缺陷、环境不良等)两大因素中从大到小，从粗到细，由表及里，深人分析，则可得出类似如图1所示的因果鱼骨图，所述因果鱼骨图的绘制步骤包括有：

1)确定要分析的某个特定问题或事故，写在图的右边，画出主干表示，主干的箭头指向右端；

2)确定造成事故的因素分类项目，如安全管理、操作者、材料、方法、环境等，画大枝表示；

3)将上述项目深入发展，中枝表示对应项目造成事故的原因，一个原因画出一中枝，文字记在中枝线上下；

4)将上述原因层层展开，一直到不能再分为止；

5)确定因果鱼骨图中的主要原因，并标上符号，作为重点控制对象；6)注明因果鱼骨图的名称。

所述因果鱼骨图可总结为：针对结果，分析原因；先主后次，层层深入。在计算机领域中使用因果鱼骨图虽然在理论上是可行的，但对于人工智能分析与推断过程来说过于复杂，并且表达的因果关系不够丰富。

综上可知，现有技术在实际使用上显然存在不便与缺陷，所以有必要加以改进。

发明内容

针对上述的缺陷，本申请的目的在于提供一种基于监控点的溯源实现方法及系统，本申请建立的单向网溯源模型是一种预判式的溯源模型，通过对预判的结果与实际情况相结合进行落地，来保证自动快速地定位出问题的根本原因，具有直观可视化、虚拟现实程度高、支持复杂的逻辑关系描述、溯源运算方便、监控管理能力强的优点。

为了实现上述目的，本申请提供一种基于监控点的溯源实现方法，包括有：

采集各监控点的异常因果关系；

根据每个所述监控点的所述异常因果关系建立单向网溯源模型；

当监控到至少一个所述监控点成为异常点后，根据所述单向网溯源模型确定出所述异常点对应的异常源。

根据本申请所述的溯源实现方法，所述当监控到至少一个所述监控点成为异常点后，根据所述单向网溯源模型确定出所述异常点对应的异常源的步骤之后包括：

根据所述异常点和所述异常源显示对应的因果溯源路径。

分析所述异常源并生成对应的处理预案。

根据本申请所述的溯源实现方法，所述根据每个所述监控点的所述异常因果关系建立单向网溯源模型的步骤包括：

通过点、线和方向建立所述单向网溯源模型，所述点表示所述监控点，所述线表示各所述监控点之间有关系，所述方向表示所述监控点之间的异常因果关系。

根据本申请所述的溯源实现方法，所述单向网溯源模型包括单向非闭环网结构，所述单向非闭环网结构包括由所述点和带有单一方向的所述线组成的网状结构，并且所述网状结构中无同向闭环。

根据本申请所述的溯源实现方法，所述根据每个所述监控点的所述异常因果关系建立单向网溯源模型的步骤还包括：

在所述单向网溯源模型中为每个所述监控点生成对应的标识、异常名称和/或一个或多个因果推断路径。

根据本申请所述的溯源实现方法，所述监控点的所述因果推断路径用X→…→S表示；其中所述S表示所述监控点自身的标识，所述X表示所述监控点的最初原因异常点的标识，所述…表示异常因果关系推断过程中的各原因异常点及其关系。

根据本申请所述的溯源实现方法，所述当监控到至少一个所述监控点成为异常点后，根据所述单向网溯源模型确定出所述异常点对应的异常源的步骤包括：

在预定时间段内监控到至少一个所述监控点成为所述异常点；

获取所有的所述异常点的所述因果推断路径并按照字符串长度进行升序排序，得到对应的升序结构数组；

按照所述升序排序依次将所述升序结构数组中的每个所述因果推断路径与所述单向网溯源模型中其他监控点的因果推断路径进行字符串匹配，匹配出的监控点为推断结果异常点；

将匹配出的所述推断结果异常点与所述升序结构数组进行比较，在所述升序结构数组中移除在本次匹配结果中存在的所述推断结果异常点；

当所述升序结构数组匹配完毕后，收集进行字符串匹配的所述因果推断路径对应的所述异常点；

将收集的所述异常点与所述升序结构数组中剩余的所述异常点确定为所述异常源。

根据本申请所述的溯源实现方法，所述将匹配出的所述推断结果异常点与所述升序结构数组进行比较，在所述升序结构数组中移除在本次匹配结果中存在的所述推断结果异常点的步骤还包括：

在本次匹配结果中移除所述升序结构数组中不存在的所述推断结果异常点。

本申请还提供一种基于监控点的溯源实现系统，包括有：

关系采集模块，用于采集各监控点的异常因果关系；

模型建立模块，用于根据每个所述监控点的所述异常因果关系建立单向网溯源模型；

溯源处理模块，用于当监控到至少一个所述监控点成为异常点后，根据所述单向网溯源模型确定出所述异常点对应的异常源。

根据本申请所述的溯源实现系统，还包括：

路径显示模块，用于根据所述异常点和确定出的所述异常源显示对应的因果溯源路径。

根据本申请所述的溯源实现系统，还包括：

预案生成模块，用于分析所述异常源并生成对应的处理预案。

根据本申请所述的溯源实现系统，所述模型建立模块用于通过点、线和方向建立所述单向网溯源模型，所述点表示所述监控点，所述线表示各所述监控点之间有关系，所述方向表示所述监控点之间的异常因果关系。

根据本申请所述的溯源实现系统，所述单向网溯源模型包括单向非闭环网结构，所述单向非闭环网结构包括由所述点和带有单一方向的所述线组成的网状结构，并且所述网状结构中无同向闭环。

根据本申请所述的溯源实现系统，所述模型建立模块还用于在所述单向网溯源模型中为每个所述监控点生成对应的标识、异常名称和/或一个或多个因果推断路径。

根据本申请所述的溯源实现系统，所述监控点的所述因果推断路径用X→…→S表示；其中所述S表示所述监控点自身的标识，所述X表示所述监控点的最初原因异常点的标识，所述…表示异常因果关系推断过程中的各原因异常点及其关系。

根据本申请所述的溯源实现系统，所述溯源处理模块包括：

监控子模块，用于在预定时间段内监控到至少一个所述监控点成为所述异常点；

排序子模块，用于获取所有的所述异常点的所述因果推断路径并按照字符串长度进行升序排序，得到对应的升序结构数组；

匹配子模块，用于按照所述升序排序依次将所述升序结构数组中的每个所述因果推断路径与所述单向网溯源模型中其他监控点的因果推断路径进行字符串匹配，匹配出的监控点为推断结果异常点；

移除子模块，用于将匹配出的所述推断结果异常点与所述升序结构数组进行比较，在所述升序结构数组中移除在本次匹配结果中存在的所述推断结果异常点；

收集子模块，用于当所述升序结构数组匹配完毕后，收集进行字符串匹配的所述因果推断路径对应的所述异常点；

确定子模块，用于将收集的所述异常点与所述升序结构数组中剩余的所述异常点确定为所述异常源。

根据本申请所述的溯源实现系统，所述移除子模块还用于在本次匹配结果中移除所述升序结构数组中不存在的所述推断结果异常点。

本申请基于监控点建立溯源模型，先采集各监控点的异常因果关系，然后根据每个监控点的异常因果关系建立单向网溯源模型，在对监控点进行监控时检测到至少一个异常点后，根据单向网溯源模型确定出所述异常点对应的异常源。借此，本申请的单向网溯源模型是一种预判式的溯源模型，通过对预判的结果与实际情况相结合进行落地，来保证快速智能地识别出复杂事物之间的因果关系，具有直观可视化、虚拟现实程度高、支持复杂的逻辑关系描述、溯源运算方便、监控管理能力强的优点。优选的是，可以显示对应的因果溯源路径，从而可以自动快速地定位出问题的根本原因。更好的是，可根据异常源生成对应的处理预案以自动化规避问题的扩大化和恶性化发展。

附图说明

图1是现有技术中因果鱼骨图的绘制原理图；

图2是本申请优选基于监控点的溯源实现系统的结构示意图；

图3是直线型溯源模型的结构实例图；

图4是树型溯源模型的结构实例图；

图5是单向网型溯源模型的结构实例图之一；

图6是单向闭环网的结构实例图之二；

图7是单向网型溯源模型的结构实例图之一；

图8是单向闭环网的结构实例图之二；

图9是单向网型溯源模型的异常溯源显示实例图；

图10是本申请基于监控点的溯源实现方法的流程图；

图11是本申请第一实施例中基于监控点的溯源实现方法的流程图；

图12是本申请第二实施例中基于溯源模型的溯源流程图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在本申请一个典型的配置中，终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

图2是本申请优选基于监控点的溯源实现系统的结构示意图，所述溯源实现系统100至少包括有关系采集模块10、模型建立模块20以及溯源处理模块30，其中：

所述关系采集模块10，用于采集各监控点的异常因果关系。所述异常因果关系是指一个监控点发生异常是由另一个或另几个监控点导致的。

所述模型建立模块20，用于根据每个监控点的异常因果关系建立单向网溯源模型。优选的是，模型建立模块20用于通过点、线和方向建立单向网溯源模型，所述点表示监控点，所述线表示各监控点之间有关系，所述方向表示监控点之间的异常因果关系。所述单向网溯源模型包括单向非闭环网结构，所述单向非闭环网结构包括由所述点和带有单一方向的所述线组成的网状结构，并且所述网状结构中无同向闭环，即所述网状结构中相同方向不会形成闭环状。

所述溯源处理模块30，用于当监控到至少一个监控点成为异常点后，根据单向网溯源模型确定出异常点对应的异常源。

优选的是，所述溯源实现系统100还少包括有路径显示模块40和/或预案生成模块50。

所述路径显示模块40，用于根据异常点和确定出的异常源显示对应的因果溯源路径。

所述预案生成模块50，用于分析异常源并生成对应的处理预案。

本申请优选针对数据中心各设施(包含硬件和软件)的监控点进行监控，当某监控点报出警告时，由于各设施之间存在错综复杂的关系，现有技术很难快速的定位其原因。如何自动的快速定位出问题的根本原因，并能够直接表达根源路径是本申请的重点。

通过在分析异常因果关系与推断问题，建立溯源模型时，使用点、线和方向来描述问题与问题之间的关系。所述点表示问题点，所述线表示问题点之间有关系，所述方向表示问题点之间的异常因果关系。本文用到符号○表示点，用符号→表示线与方向，值得注意的是，每根线当且仅当只有一个箭头方向，不可出现两个箭头方向。这种线称为单向连线，这也是后面对于单向网的取名之因。

溯源模型由简单到复杂依次出现：直线型溯源模型、树型溯源模型、单向网溯源模型。

一、直线型溯源模型：是最简单的溯源模型，也称为链条式问题。例如A、B、C、D、E、F前后各为异常因果关系，A是B的因，A导致B，以此类推。最后A、B、C、D、E、F连成链条型直线，以箭头方向为导向，如图3。

二、树型溯源模型：其在直线型溯源模型上，添加了分支，使得可表示异常因果关系是一对多的情况，这里称之为树形问题。例如有A、B、C、D、E、F、G、H、I九个因果点。异常因果关系是：A导致B、D和C；B导致E和F；D导致G；C导致H和I。最后九个因果点按照箭头方向为导向的模式，连接成一颗树型的因果图。如图4，B、E、F在一个大分支中，D、G在一个大分支中，C、H、I在一个大分支中，且每个分支之间互相独立，不存在交叉关系。

三、单向网溯源模型：往往现实中的因果问题要比链条式问题和树形问题复杂得多。问题与问题之间存在交叉的情况。单由一颗树型的因果图是无法表达其关系的，直线型就更不用说了。这时就衍生出了单向网溯源模型(简称网型)。例如在所述树型溯源模型基础之上，加上一个这样的异常因果关系：D除了导致G外，D也导致F。那么异常因果关系图就变成了图5：由原来的树型分支B、E、F与分支D、G出现交叉现象，使得A、B、F、D出现了网状结构。

所述单向网溯源模型包括单向非闭环网和单向闭环网。网是指由节点和连接线组成的网状结构。有向网是指由节点和带有方向的连接线组成的网状结构。单向网是指由节点和带有单一方向的连接线组成的网状结构。单向非闭环网是指由节点和带有单一方向的连接线组成的网状结构，且网结构中相同方向的不会形成闭环状，如图5所示的单向非闭环网。单向闭环网就是在连续相同箭头方向上出现网状结构，如图6所示。生活当中类如出现恶性循环的因果关系或良性循环的因果关系，用网型因果表示时，就会出现单向闭环网。例如：A导致B，B导致C，C导致A，这类循环因果则导致了单向闭环网。在计算机领域进行模型计算时，必须避免出现这类单向闭环网。

本申请通过点、线和方向的建模方式分析因果关系，是一种以现状分析其可能出现的结果，是一种预测型的推断模式。这种思路正好与因果鱼骨图相反，且表达的因果关系比因果鱼骨图更为丰富。

本申请会避免不友好、只能处理简单因果逻辑、无法直接获得因果逻辑的输出路径等问题。单向非闭环网可由设计者根据本原理结合实际情况，设计出复杂的推断逻辑模型，并能够快速交由计算机进行运算分析，输出推断路径和推断结果。为了能够快速进行推断数据中心的各监控点数据异常之间的关系，应先就各监控点所有的异常因果关系推断过程进行建模。某异常点发生异常时，同时导致其他的异常点也发生异常，如异常点A发生异常，同时导致异常点B发生异常，即是说异常点B发生异常，有可能是由于异常点A导致的。

所述溯源是指当某事物发生问题或异常情况时，寻找问题和异常发生的根本原因或者说寻找其问题源头。所述溯源模型是指针对异常问题来建立的事物与事物的关系模型，或者说是用于维护各事物之间发生问题或异常的关系所建立的模型。通过单向网建模来表示各监控点的异常因果关系并进行溯源。其中箭头方向表示异常导致的结果，对于“异常点A→异常点D”表示异常点A导致异常点D，即异常D可能由异常A导致的(还可能是其他异常导致的，因为有网状结构的情况存在)。若某一个数据中心含有A、B、C、D、E、F、G、H、I异常点。用单向网因果关系推断建模，如图7：A导致D、H、C；D导致E、B；H导致F；C导致I；B导致I；E导致F；I导致G。注意：在建立单向网溯源模型时，必须保证是单向非闭环的，连线的相同方向不能出现闭环网，即不能出现如下图8的网模型。

当接收到实际存在的单一异常时，根据单向网溯源模型快速显示真正的异常源。并能够对异常源进行报警发出以及一些其他的处理行为。异常溯源显示如图9，在设定的时间段(例如1分钟)内出现了异常D、异常B、异常E、异常点F、异常点I、异常点G。通过单向网溯源模型自动找到真正事件源异常点D，同时高亮显示因果溯源路径。

注意：可能会由于在建模时出现错误，或者其异常点在上报时出现问题，导致在进行异常推断溯源时，并没有收到某一个或几个应该要产生的异常点。这种问题应该进行日志报告，并进行运算忽略。以便后续相关人员能够进行很好的跟踪，到底是模型配置问题，还是数据上报问题。比如：若图9中没有收到异常点G产生，同样要能推断溯源出异常点D，并对异常点G进行记录，表示其特殊情况。

所述模型建立模块20，还用于在所述单向网溯源模型中为每个监控点生成对应的标识(ID)、异常名称(name)和/或因果推断路径(x_Path)等属性。

单向网溯源模型的建模过程：建立单向网模型简表，将所有异常点之间的关系，通过一端带箭头方向的线进行关联，箭头方向表示异常的导致方向。异常A→异常B，即表示异常A导致异常B发生。

定义每一个异常点都包含ID、name、x_Path等属性。如下表1：

表1异常点属性表。

定义每一个异常点都有至少一个因果推断路径xPath。每一个异常点在没有和其他异常点建立因果关系时，其本身独立存在，它的xPath就是其自身ID。例如某异常点A，ID为A，目前还未和其他异常点建立关系，那么其xPath就是A。当异常点与异常点连线表示出其因果关系后，箭头指向方异常点(即结果方异常点)与其本身后续箭头指向方得相关的异常点的xPath均会发生变化。

监控点的因果推断路径xPath值用X→…→S|X→…→S表示；其中“ID”表示监控点自身的标识，“X”表示监控点的最初原因异常点的标识，“…”表示异常因果关系推断过程中的各原因异常点及其关系，“|”表示连接符，若造成监控点异常的因果推断路径有多个，通过连接符将多个因果推断路径连在一起。在这里将对图7的xPath进行说明，用异常点后的英文字母作为其ID，所有的异常点的xPath如下表2：

表2异常点xPath表

所述溯源处理模块30包括：

监控子模块31，用于在预定时间段内监控到至少一个监控点成为异常点。

排序子模块32，用于获取所有的异常点的因果推断路径并按照字符串长度进行升序排序，得到对应的升序结构数组。

匹配子模块33，用于按照升序排序依次将升序结构数组中的每个因果推断路径与单向网溯源模型中其他监控点的因果推断路径进行字符串匹配，匹配出的监控点为推断结果异常点。

移除子模块34，用于将匹配出的推断结果异常点与升序结构数组进行比较，在升序结构数组中移除在本次匹配结果中存在的推断结果异常点。移除子模块34还用于在本次匹配结果中移除升序结构数组中不存在的推断结果异常点。

收集子模块35，用于当升序结构数组匹配完毕后，收集进行字符串匹配的因果推断路径对应的异常点。

确定子模块36，用于将收集的异常点与升序结构数组中剩余的异常点确定为异常源。

一、如何获取某异常点的推断结果异常点？

有了xPath表示因果推断路径，其实溯源求解的方案就非常简单了，不难看出通过以“|”分组后的xPath的与其他xPath进行字符串匹配，即可找出所有的推断结果异常点。

例1：上表2中，需要查找异常点D的推断结果异常点，因为异常点D的xPath只有一个，并没有出现“|”进行xPath的连接，所以直接获取异常点D的xPath，并用其与单向网溯源模型中已存在的其他异常点的xPath进行字符串匹配，便可匹配出异常点B、异常点E、异常点F、异常点I来。推到过程如下所示，下划线部分为推到时匹配到的XPath子串。

D：A→D

根据‘A→D’进行XPath字符串匹配，匹配到B、E、F、I。

D：A→D；

B：A→D→B；

E：A→D→E；

F：A→D→E→F|A→H→F；

I：A→C→I|A→D→B→I。

例2：上表2中，需要查找异常点I的推断结果异常点，先对异常点I进行按“|”进行分组获得[“A→C→I”,“A→D→B→I”]数组，并用数组类的每一个值按字符串匹配原则，与单向网溯源模型中已存在的其他异常点的xPath进行匹配，匹配出所有相关的异常点。这里能够匹配出来的异常点就是异常点G。推断过程如下所示：

I：[“A→C→I”,“A→D→B→I”]

第一步用‘A→C→I’进行XPath字符串匹配，能够匹配到G。

I：A→C→I；G：A→C→I→G|A→D→B→I→G

第二步用‘A→D→B→I’进行XPath字符串匹配，匹配结果为空。

I：A→D→B→I

二、如何求解多个异常点的真正异常源？

例如：在某微小时间段内(30秒)收到异常点D、异常点B、异常点I、异常点E、异常点F、异常点H，求其异常源。求解步骤如下：

1)对收到的异常点按xPath进行字符串长度的升序排序，得到顺序为异常点D、异常点H、异常点B、异常点E、异常点F、异常点I的升序结构数组如下：

D：A→D；

H：A→H；

B：A→D→B；

E：A→D→E；

F：A→H→F；

I：A→C→I；

F：A→D→E→F；

I：A→D→B→I；

2)对于1)中得到的升序结构数组，根据其顺序进行按照(一)中举例说明的方式，求解其推断结果异常点。即按照所述升序排序依次将升序结构数组中的每个xPath与单向网溯源模型中其他监控点的xPath进行字符串匹配，匹配出的监控点为推断结果异常点。

3)并对本次匹配结果与升序结构数组进行比较，将匹配出的推断结果异常点与升序结构数组进行比较，在升序结构数组中移除在本次匹配结果中存在的推断结果异常点，以防止这些异常点在后续过程中再次多余的求解推断结果，于此同时，还要单独用一个数组空间记录在本次匹配结果中存在，而在升序结构中不存在的异常点，这些异常点记录为数据接收异常或者模型配置问题导致的异常集合。另外，还需在本次匹配结果中移除升序结构数组中不存在的推断结果异常点。

4)持续2)和3)的匹配过程，直到1)中得到的升序结构数组匹配求解完为止。当升序结构数组匹配完毕后，收集进行字符串匹配的因果xPath对应的异常点；将收集的异常点与升序结构数组中剩余的异常点(对于每次能够进入求解过程的异常点就是要找的异常源)确定为异常源。

通过上面的运算能够进入求解过程的异常点只有异常点D和异常点H，而同时出现了一个并没有在升序结构数组的异常点G(需删除)，因此通过本次求解结果D和H为异常源，具体求解步骤如下：

按照排序顺序进行求解：第一步按D的XPath进行字符串匹配，结果如下：

D：A→D；

B：A→D→B；

E：A→D→E；

F：A→D→E→F；

I：A→D→B→I

移除本次求解结果已存在的异常点和自身，原来的排序数组变成了：

H：A→H

由于只剩一个异常点，没有可匹配的其他异常点Xpath，结束XPath匹配过程，收集到D和H为异常源。

本申请主要针对如何将现实世界中的事物与事物之间的因果关系建立为模型，通过计算机来运行模型计算，快速定位出问题发生时的根本原因，这样则能够结合应急预案处理来自动化的规避问题的扩大化和恶性化发展。

图10是本申请基于监控点的溯源实现方法的流程图，其可通过如图2所示的溯源实现系统100实现，所述方法包括有：

步骤S101，采集各监控点的异常因果关系。

步骤S102，根据每个监控点的异常因果关系建立单向网溯源模型。

步骤S103，当监控到至少一个监控点成为异常点后，根据单向网溯源模型确定出异常点对应的异常源。

图11是本申请第一实施例中基于监控点的溯源实现方法的流程图，其可通过如图2所示的溯源实现系统100实现，所述方法包括有：

步骤S111，采集各监控点的异常因果关系。

步骤S112，根据每个监控点的异常因果关系建立单向网溯源模型。

优选的是，通过点、线和方向建立单向网溯源模型，点表示监控点，线表示各监控点之间有关系，方向表示监控点之间的异常因果关系。所述单向网溯源模型包括单向非闭环网结构，所述单向非闭环网结构包括由所述点和带有单一方向的所述线组成的网状结构，并且所述网状结构中无同向闭环。

更好的是，在所述单向网溯源模型中为每个监控点生成对应的标识、异常名称和/或至少一个因果推断路径。所述监控点的因果推断路径用X→…→S|X→…→S表示。其中S表示监控点自身的标识，X表示监控点的最初原因异常点的标识，…表示异常因果关系推断过程中的各原因异常点及其关系，|表示连接符，若造成监控点异常的因果推断路径有多个，通过连接符将多个因果推断路径连在一起。

步骤S113，当监控到至少一个监控点成为异常点后，根据单向网溯源模型确定出异常点对应的异常源。

步骤S114，根据异常点和异常源显示对应的因果溯源路径。

步骤S115，分析异常源并生成对应的处理预案。

本申请的单向溯源网模型是一种预判式的溯源模型，通过对预判的结果与实际情况相结合进行落地，来保证快速智能的识别出复杂事物之间的因果关系，给应急预案处理来自动化的规避问题的扩大化和恶性化提供依据。单向溯源网模型有几个优秀特点：可视化直观、虚拟现实程度高、支持复杂的逻辑关系描述、溯源运算方便。

图12是本申请第二实施例中基于溯源模型的溯源流程图，其可通过如图2所示的溯源实现系统100实现，所述方法包括有：

步骤S121，在预定时间段内监控到至少一个监控点成为异常点。

步骤S122，获取所有的异常点的因果推断路径并按照字符串长度进行升序排序，得到对应的升序结构数组。

步骤S123，按照升序排序依次将升序结构数组中的每个因果推断路径与单向网溯源模型中其他监控点的因果推断路径进行字符串匹配，匹配出的监控点为推断结果异常点。

步骤S124，将匹配出的推断结果异常点与升序结构数组进行比较，在升序结构数组中移除在本次匹配结果中存在的推断结果异常点。优选的是，在本次匹配结果中移除升序结构数组中不存在的推断结果异常点。

步骤S125，当升序结构数组匹配完毕后，收集进行字符串匹配的因果推断路径对应的异常点。

步骤S126，将收集的异常点与升序结构数组中剩余的异常点确定为异常源。

综上所述，本申请基于监控点建立溯源模型，先采集各监控点的异常因果关系，然后根据每个监控点的异常因果关系建立单向网溯源模型，在对监控点进行监控时检测到至少一个异常点后，根据单向网溯源模型确定出所述异常点对应的异常源。借此，本申请的单向网溯源模型是一种预判式的溯源模型，通过对预判的结果与实际情况相结合进行落地，来保证快速智能地识别出复杂事物之间的因果关系，具有直观可视化、虚拟现实程度高、支持复杂的逻辑关系描述、溯源运算方便、监控管理能力强的优点。优选的是，可以显示对应的因果溯源路径，从而可以自动快速地定位出问题的根本原因。更好的是，可根据异常源生成对应的处理预案以自动化规避问题的扩大化和恶性化发展。

当然，本申请还可有其它多种实施例，在不背离本申请精神及其实质的情况下，熟悉本领域的技术人员当可根据本申请作出各种相应的改变和变形，但这些相应的改变和变形都应属于本申请所附的权利要求的保护范围。

Claims

1.一种基于监控点的溯源实现方法，其特征在于，包括有：

采集各监控点的异常因果关系；

根据每个所述监控点的所述异常因果关系建立单向网溯源模型，所述单向网溯源模型用于表示监控点的异常因果关系；

当监控到至少一个所述监控点成为异常点后，根据所述单向网溯源模型确定出所述异常点对应的异常源；

其中，所述当监控到至少一个所述监控点成为异常点后，根据所述单向网溯源模型确定出所述异常点对应的异常源的步骤包括：

获取所有的所述异常点的因果推断路径并按照字符串长度进行升序排序，得到对应的升序结构数组，其中，所述监控点的所述因果推断路径用X→…→S表示；其中所述S表示所述监控点自身的标识，所述X表示所述监控点的最初原因异常点的标识，所述…表示异常因果关系推断过程中的各原因异常点及其关系；

2.根据权利要求1所述的溯源实现方法，其特征在于，所述当监控到至少一个所述监控点成为异常点后，根据所述单向网溯源模型确定出所述异常点对应的异常源的步骤之后包括：

根据所述异常点和所述异常源显示对应的因果溯源路径。

3.根据权利要求2所述的溯源实现方法，其特征在于，所述当监控到至少一个所述监控点成为异常点后，根据所述单向网溯源模型确定出所述异常点对应的异常源的步骤之后包括：

分析所述异常源并生成对应的处理预案。

4.根据权利要求1所述的溯源实现方法，其特征在于，所述根据每个所述监控点的所述异常因果关系建立单向网溯源模型的步骤包括：

5.根据权利要求4所述的溯源实现方法，其特征在于，所述单向网溯源模型包括单向非闭环网结构，所述单向非闭环网结构包括由所述点和带有单一方向的所述线组成的网状结构，并且所述网状结构中无同向闭环。

6.根据权利要求1～5任一项所述的溯源实现方法，其特征在于，所述根据每个所述监控点的所述异常因果关系建立单向网溯源模型的步骤还包括：

7.根据权利要求1所述的溯源实现方法，其特征在于，所述将匹配出的所述推断结果异常点与所述升序结构数组进行比较，在所述升序结构数组中移除在本次匹配结果中存在的所述推断结果异常点的步骤还包括：

8.一种基于监控点的溯源实现系统，其特征在于，包括有：

关系采集模块，用于采集各监控点的异常因果关系；

模型建立模块，用于根据每个所述监控点的所述异常因果关系建立单向网溯源模型，所述单向网溯源模型用于表示监控点的异常因果关系；

溯源处理模块，包括：

监控子模块，用于在预定时间段内监控到至少一个所述监控点成为异常点；

排序子模块，用于获取所有的所述异常点的因果推断路径并按照字符串长度进行升序排序，得到对应的升序结构数组，其中，所述监控点的所述因果推断路径用X→…→S表示；其中所述S表示所述监控点自身的标识，所述X表示所述监控点的最初原因异常点的标识，所述…表示异常因果关系推断过程中的各原因异常点及其关系；

确定子模块，用于将收集的所述异常点与所述升序结构数组中剩余的所述异常点确定为异常源。

9.根据权利要求8所述的溯源实现系统，其特征在于，还包括：

10.根据权利要求9所述的溯源实现系统，其特征在于，还包括：

11.根据权利要求8所述的溯源实现系统，其特征在于，所述模型建立模块用于通过点、线和方向建立所述单向网溯源模型，所述点表示所述监控点，所述线表示各所述监控点之间有关系，所述方向表示所述监控点之间的异常因果关系。

12.根据权利要求11所述的溯源实现系统，其特征在于，所述单向网溯源模型包括单向非闭环网结构，所述单向非闭环网结构包括由所述点和带有单一方向的所述线组成的网状结构，并且所述网状结构中无同向闭环。

13.根据权利要求8～12任一项所述的溯源实现系统，其特征在于，所述模型建立模块还用于在所述单向网溯源模型中为每个所述监控点生成对应的标识、异常名称和/或一个或多个因果推断路径。

14.根据权利要求8所述的溯源实现系统，其特征在于，所述移除子模块还用于在本次匹配结果中移除所述升序结构数组中不存在的所述推断结果异常点。