CN117376092A - 故障根因定位方法、装置、设备及存储介质 - Google Patents
故障根因定位方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117376092A CN117376092A CN202311385545.4A CN202311385545A CN117376092A CN 117376092 A CN117376092 A CN 117376092A CN 202311385545 A CN202311385545 A CN 202311385545A CN 117376092 A CN117376092 A CN 117376092A
- Authority
- CN
- China
- Prior art keywords
- alarm
- fault
- resource information
- resource
- information table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000000875 corresponding effect Effects 0.000 claims description 37
- 230000000694 effects Effects 0.000 claims description 17
- 238000010276 construction Methods 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 abstract description 26
- 238000003745 diagnosis Methods 0.000 abstract description 4
- 238000004519 manufacturing process Methods 0.000 description 12
- 230000001364 causal effect Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000009825 accumulation Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000004807 localization Effects 0.000 description 4
- 238000005065 mining Methods 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011418 maintenance treatment Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/0636—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis based on a decision tree analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请提供一种故障根因定位方法、装置、设备及存储介质,通过获取当前告警,所述当前告警包括有资源信息,构建与所述当前告警关联的资源拓扑信息集合;基于所述资源信息,从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表;基于所述目标资源信息生成该当前告警的告警依赖关系集合,确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树;将所述当前告警所在故障树的根节点作为故障根因。通过将图表化存储的资源故障信息与故障森林进行关联,实现故障信息的快速检索、故障依赖关系的快速识别、建立,极大提高了故障分析效率。该方法能够支撑复杂资源结构、海量故障信息的综合识别、诊断。
Description
技术领域
本申请涉及通信技术领域,尤其涉及一种故障根因定位方法、装置、设备及存储介质。
背景技术
随着5G建设,以5GC为代表的核心网开启了云化进程,但云化部署、服务化网络架构和复杂业务形态和通信控制策略,也为网络生产、运营保障带来新的挑战。如何在故障发生时,快速、高效、准确进行告警的分析和根因定位,成为通信运营亟需解决的首要问题。目前主要有基于因果图实现的故障根因定位技术,和基于故障特征进行故障匹配技术。
目前有基于因果图的故障根因定位技术,针对不同场景和数据特性,首先构建不同类型的因果图,然后使用不同类型的算法从因果图中搜索根因告警。但由于目前通信网络业务形态多样、网络连接关系复杂、告警类型多样,为满足生产覆盖要求,系统要处理的故障关联规则多、告警数据多、资源拓扑复杂,常规的资源依赖、告警依赖判断需要消耗大量算力,且难以形成故障经验积累,因果图无法适应于愈发复杂的故障场景。
为了满足复杂、多样的网络业务环境和和告警类型,也有基于故障特征进行故障匹配的根因分析方法,该方法先采集故障信息,然后基于所述故障信息提取出故障关键描述,接着根据所述故障关键描述在故障库中确定出候选故障集。但挑战在于:事件的累积往往是基于专家判断而非现网生产环境,事件积累、有效性判定需要一个较为漫长的时间过程;同时,生产环境可能发生的故障多样,跨专业跨网元情况较为常见,各域专家目前的经验库很难满足生产环境需要,基于这种方法构建的机制对于实际生产故障的覆盖度及判定准确性方面,面临较多挑战,需要较多的辅助性提升。
发明内容
本申请提供一种故障根因定位方法、装置、设备及存储介质,用以解决现有技术对于实际生产故障的覆盖度不足,在面对复杂资源结构、海量故障信息的场景下,故障根因效率低,判定准确性较有待提高的问题。
第一方面,本申请提供一种故障根因定位方法,包括:
获取当前告警,所述当前告警包括有资源信息,构建与所述当前告警关联的资源拓扑信息集合;
基于所述资源信息,从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表,所述故障资源信息表库用于存储各故障资源信息表,所述故障资源信息表存储有至少一个告警及与各告警对应的资源信息集;
若该当前告警的所述资源拓扑信息集合包含有与所述目标故障资源信息表中的目标资源信息集中相同的目标资源信息,基于所述目标资源信息生成该当前告警的告警依赖关系集合,所述告警依赖关系集合包括至少一组告警与目标资源信息对应的各资源类型告警的依赖关系,确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树;
将所述当前告警所在故障树的根节点作为故障根因。
可选地,如上所述的方法,所述构建与所述当前告警关联的资源拓扑信息集合,包括:
根据网络的业务逻辑关系和资源部署关系,生成资源拓扑连接关系;
获取所述资源拓扑连接关系与所述当前告警的资源信息相连接的关联资源;
基于所述关联资源生成资源拓扑信息集合。
可选地,如上所述的方法,所述从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表,包括:
对所述故障资源信息表库中的各故障资源信息表进行资源信息查询,判断是否有故障资源信息表中包含该资源信息;
若是,将包含该资源信息的故障资源信息表作为目标故障资源信息表;
若否,基于所述当前告警生成新增故障资源信息表,将所述新增故障资源信息表存入故障资源信息表库,并将新增故障资源信息表作为目标故障资源信息表。
可选地,如上所述的方法,所述告警包括告警时间,在所述将包含该资源信息的故障资源信息表作为目标故障资源信息表之后,还包括:
基于所述资源信息确认该当前告警在所述目标故障资源信息表中对应的活动告警,所述活动告警包括活动告警数量、活动告警时间;
判断所述告警时间与所述活动告警时间的差值是否符合预设时长范围;
若是,将所述当前告警并入所述目标故障资源信息表,更新所述活动告警数量和所述活动告警时间。
可选地,如上所述的方法,所述基于所述目标资源信息生成该当前告警的告警依赖关系集合,包括:
获取所述目标资源信息的目标告警集合;
从所述目标告警集合中获取与当前告警具有父子告警关系的目标父告警和目标子告警;
构建当前告警-父告警集合-子告警集合的告警依赖关系集合。
可选地,如上所述的方法,所述目标资源信息的父告警集合和子告警集合均包括多个关联告警,所述目标故障资源信息表中包括各告警的故障树指针,所述确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树,包括:
遍历各关联告警,判断所述关联告警与所述当前告警的父子关系;
若所述关联告警为所述当前告警的父告警,根据目标故障资源信息表中该关联告警的故障树指针,找到该关联告警指向的所有树节点,将所述当前告警作为子节点进行挂载;
若所述关联告警为所述当前告警的子告警,根据目标故障资源信息表中该关联告警的故障树指针,判断所述是否有父节点;
若是,新建所述当前告警的树节点,并新增所述当前告警与该关联告警的故障树指针;
若否,将所述当前告警作为该关联告警的父节点进行挂载。
可选地,如上所述的方法,若该当前告警的所述资源拓扑信息集合不包含有与所述目标故障资源信息表中的目标资源信息集中相同的目标资源信息,该方法还包括:
基于所述当前告警构建故障树,该当前告警为所述故障树的根节点。
第二方面,本申请提供一种故障根因定位装置,包括:
告警获取模块,用于获取当前告警,所述当前告警包括有资源信息,构建与所述当前告警关联的资源拓扑信息集合;
故障资源信息表获取模块,用于基于所述资源信息,从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表,所述故障资源信息表库用于存储各故障资源信息表,所述故障资源信息表存储有至少一个告警及与各告警对应的资源信息集;
故障树构建模块,用于若该当前告警的所述资源拓扑信息集合包含有与所述目标故障资源信息表中的目标资源信息集中相同的目标资源信息,基于所述目标资源信息生成该当前告警的告警依赖关系集合,所述告警依赖关系集合包括至少一组告警与目标资源信息对应的各资源类型告警的依赖关系,确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树;
故障根因定位模块,用于将所述当前告警所在故障树的根节点作为故障根因。
第三方面,本申请提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机执行指令,所述处理器执行所述计算机执行指令时实现上述第一方面中任一项所述的故障根因定位方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一项所述的故障根因定位方法。
本申请提供的故障根因定位方法、装置、设备及存储介质,通过获取当前告警,所述当前告警包括有资源信息,构建与所述当前告警关联的资源拓扑信息集合;基于所述资源信息,从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表,所述故障资源信息表库用于存储各故障资源信息表,所述故障资源信息表存储有至少一个告警及与各告警对应的资源信息集;若该当前告警的所述资源拓扑信息集合包含有与所述目标故障资源信息表中的目标资源信息集中相同的目标资源信息,基于所述目标资源信息生成该当前告警的告警依赖关系集合,所述告警依赖关系集合包括至少一组告警与目标资源信息对应的各资源类型告警的依赖关系,确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树;将所述当前告警所在故障树的根节点作为故障根因。通过对资源故障信息进行图表化存储,可以对故障按照分区域、分专业等需求进行分析,将分析结果以树结构进行存储;通过将图表化存储的资源故障信息与故障森林进行关联,实现故障信息的快速检索、故障依赖关系的快速识别、建立,极大提高了故障分析效率。该方法能够支撑复杂资源结构、海量故障信息的综合识别、诊断。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的故障根因定位方法的应用场景示意图。
图2为本申请实施例提供的故障根因定位方法的流程图。
图3为本申请实施例提供的故障根因定位装置的示意图。
图4为本申请实施例提供的基于故障根因定位装置的电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
首先对本申请所涉及的名词进行解释:
故障树分析,是由上往下的演绎式失效分析法,利用布林逻辑组合低阶事件,分析系统中不希望出现的状态;故障树分析时从根节点(顶事件)开始的,根节点的选取可以根据该系统中要关注的某些特性指标故障来确定(比如资源类型),对不同的特性指标故障进行分析可以得到多个不同的特性指标故障树,构成故障森林。
在相关技术中,对故障根因定位主要包括基于因果图进行根因定位和基于故障特征进行故障匹配。基于因果图进行根因定位需要首先构建不同类型的因果图,然后使用不同类型的算法从因果图中搜索根因告警,比较典型的有基于条件概率或共现率特征,使用PC算法构建因果图模型;以及基于调用链特征构建因果图模型,这种方式在复杂的场景中,难以形成故障经验积累。而基于故障特征进行故障匹配先采集故障信息,然后基于所述故障信息提取出故障关键描述,接着根据所述故障关键描述在故障库中确定出候选故障集。相关技术包括Apriori算法为典型算法的从历史告警中挖掘关联规则的挖掘方法,包括以以DBSCAN算法为典型算法的告警数据聚类方法。最后基于所述候选故障集确定出故障原因以及处理方案,以确定出通信设备的故障,其事件积累、有效性判定需要一个较为漫长的时间过程;同时,生产环境可能发生的故障多样,跨专业跨网元情况较为常见,各域专家目前的经验库很难满足生产环境需要,基于这种方法构建的机制对于实际生产故障的覆盖度及判定准确性方面,面临较多挑战,需要较多的辅助性提升。
针对上述技术问题,本申请实施例旨在提出一种故障根因定位方法、装置、设备及存储介质,该方法的核心构思为通过对资源故障信息进行图表化存储,可以对故障按照分区域、分专业等需求进行分析,将分析结果以树结构进行存储;通过将图表化存储的资源故障信息与故障森林进行关联,实现故障信息的快速检索、故障依赖关系的快速识别、建立,极大提高了故障分析效率。该方法能够支撑复杂资源结构、海量故障信息的综合识别、诊断。
为了更好地理解本申请实施例的方案,下面先对本申请实施例所涉及的一种应用场景进行介绍。
在网络系统中,节点在网络系统中可以定位为PC物理机、软件服务、组件实例等,网络系统拓扑图中的边则可以定义节点间的服务调用或者数据流向中的一种关系,在复杂的网络系统中,通常存在站点间、系统间、服务器间、应用组件间的服务交互调用,系统动辄成千上万个模块节点,当系统中服务节点发生故障时,故障会沿着系统节点间的调用链路进行传播,从而产生大量的告警信息。请参阅图1,图1为本申请实施例提供的故障根因定位方法的应用场景示意图,如图1所示,包括告警节点100和服务器200,告警节点100可以是生成告警的网络系统中的某一节点,服务器200可以用于接收告警节点100发出的告警信息,并根据告警信息进行故障根因定位分析。
具体地,服务器200中包括有用于存储多个故障资源信息表的故障资源信息表库,告警信息包括资源类型和告警类型,告警信息进入服务器200中后,首先根据其资源类型和告警类型判断故障资源信息表中是否已经记载有这一告警信息,若是,则对故障资源信息表中的告警信息进行告警次数等属性的更新,若否,则根据该告警信息的资源类型获取其资源拓扑关系,结合告警依赖关系,在故障资源信息表中新增这一告警信息。具体的在故障资源信息表中新增告警信息的过程,可以通过结合故障树的节点的多维信息指针而实现。在通过告警依赖关系集合构建故障树之后,则可以通过故障树的根节点来进行故障根因定位。
下面以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图2为本申请实施例提供的故障根因定位方法的流程图。如图2所示,本实施例的方法,包括:
S201:获取当前告警,所述当前告警包括有资源信息,构建与所述当前告警关联的资源拓扑信息集合。
本申请实施例的执行主体可以是服务器,也可以是服务器中的故障根因定位系统,其中,故障根因定位系统可以通过软件实现。
在该步骤中,可以基于链路层发现协议(Link Layer Discovery Protocol,LLDP)、网元链路关系、专家设置等多种方式生成与当前告警关联的资源拓扑关系,将与当前告警有拓扑关系的资源作为一个集合,与当前告警对应。
S202:基于所述资源信息,从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表,所述故障资源信息表库用于存储各故障资源信息表,所述故障资源信息表存储有至少一个告警及与各告警对应的资源信息集。
在本实施例中,构建故障资源信息表,目的在于记录资源的故障信息,并关联故障树节点,实现故障信息关系的快速判断、以及依赖树的快速建立。
对于故障资源信息表的构建方法,可以是判断在故障资源信息表中是否有与当前告警相同的资源信息和告警类型,若有,则只需要在已有的记录中更新告警次数等信息,若没有,则需要根据当前告警相同的资源信息在故障资源信息表新建一类告警信息。
S203:若该当前告警的所述资源拓扑信息集合包含有与所述目标故障资源信息表中的目标资源信息集中相同的目标资源信息,基于所述目标资源信息生成该当前告警的告警依赖关系集合,所述告警依赖关系集合包括至少一组告警与目标资源信息对应的各资源类型告警的依赖关系,确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树。
在该步骤中,基于所述目标资源信息生成该当前告警的告警依赖关系集合,也就是获取与当前告警所属资源有依赖关系的资源集合,并根据故障资源关系判断当前告警与所述各资源类型告警之间的父子关系,构建故障树,并将故障树中节点关系用多维资源信息指针记录在故障资源信息表中,从而将故障资源信息表与故障森林进行关联。
S204:将所述当前告警所在故障树的根节点作为故障根因。
可以理解的是,在故障树分析法中,根节点也就是顶事件,通过分析当前告警所在的故障树即可以追溯到故障根因,从而实现故障根因定位。
本实施例提供的故障根因定位方法,通过获取当前告警,所述当前告警包括有资源信息,构建与所述当前告警关联的资源拓扑信息集合;基于所述资源信息,从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表,所述故障资源信息表库用于存储各故障资源信息表,所述故障资源信息表存储有至少一个告警及与各告警对应的资源信息集;若该当前告警的所述资源拓扑信息集合包含有与所述目标故障资源信息表中的目标资源信息集中相同的目标资源信息,基于所述目标资源信息生成该当前告警的告警依赖关系集合,所述告警依赖关系集合包括至少一组告警与目标资源信息对应的各资源类型告警的依赖关系,确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树;将所述当前告警所在故障树的根节点作为故障根因。通过对资源故障信息进行图表化存储,可以对故障按照分区域、分专业等需求进行分析,将分析结果以树结构进行存储;通过将图表化存储的资源故障信息与故障森林进行关联,实现故障信息的快速检索、故障依赖关系的快速识别、建立,极大提高了故障分析效率。该方法能够支撑复杂资源结构、海量故障信息的综合识别、诊断。
下面对上述故障根因定位方法的技术方案进行详细介绍。
在一种可能的实施方式中,本实施例提供的故障根因定位方法通过资源拓扑连接关系获取与当前告警的资源信息相连接的关联资源,并进一步生成资源拓扑信息集合。
具体地,所述构建与所述当前告警关联的资源拓扑信息集合,包括:根据网络的业务逻辑关系和资源部署关系,生成资源拓扑连接关系;获取所述资源拓扑连接关系与所述当前告警的资源信息相连接的关联资源;基于所述关联资源生成资源拓扑信息集合。
可以理解的是,可以根据网络的业务逻辑关系和资源部署关系,生成资源拓扑连接关系,该关系用于故障根因定位的资源条件约束。资源拓扑关系的生成方式包括基于LLDP协议、网元链路关系、专家设置等多种方式。关系类型包括业务网元与云资源的关系,业务网元与DC内数通设备、城域/广域承载网络之间的关系,云资源设备与局房、电源设备关系等。
在本实施例中,可以将与当前告警有拓扑关系的资源作为一个集合,与当前告警对应,例如,若当前告警的资源类型为zy1,则与zy1具备拓扑关系的资源可以为集合B1,记录方式为(zy1,集合B1)。进一步地,集合信息可以进行拓展标识,如相邻承载依赖、业务承载逻辑依赖等依赖类型;通过连接跳数进行影响紧密性标识等。
本实施例中,通过资源拓扑连接关系获取与当前告警的资源信息相连接的关联资源,并进一步生成资源拓扑信息集合,具有良好的灵活性与扩展性。
在一种可能的实施方式中,本实施例提供的故障根因定位方法通过将故障资源信息表与当前告警的资源类型和告警类型进行比对,判断当前告警是否已经存在于故障资源信息表中,从而获取当前告警对应的目标故障资源信息表。
具体地,所述从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表,包括:对所述故障资源信息表库中的各故障资源信息表进行资源信息查询,判断是否有故障资源信息表中包含该资源信息;若是,将包含该资源信息的故障资源信息表作为目标故障资源信息表;若否,基于所述当前告警生成新增故障资源信息表,将所述新增故障资源信息表存入故障资源信息表库,并将新增故障资源信息表作为目标故障资源信息表。
可以理解的是,故障资源信息表中包括有多个告警的信息,比如在资源类型为zy1的故障资源信息表中,可以包括告警(zy1-gj1)和告警(zy1-gj2)等。若当前告警为(zy1-gj1),则其已经被该故障资源信息表记录过,此时,只需要将告警(zy1-gj1)的信息进行更新,比如该告警出现的次数+1等;若当前告警为(zy1-gj3),未曾被该故障资源信息表记录过,则需要增加告警(zy1-gj3)至该故障资源信息表,并根据后续构建的故障树完善其多维资源信息指针信息(如父子关系指针、树节点指针等)。
进一步地,考虑到数据的时效性,可以基于预设的时长范围对故障分析进行时间切片,以避免海量数据造成的数据冗余,因此,在所述将包含该资源信息的故障资源信息表作为目标故障资源信息表之后,还包括:基于所述资源信息确认该当前告警在所述目标故障资源信息表中对应的活动告警,所述活动告警包括活动告警数量、活动告警时间;判断所述告警时间与所述活动告警时间的差值是否符合预设时长范围;若是,将所述当前告警并入所述目标故障资源信息表,更新所述活动告警数量和所述活动告警时间。
也就是说,若当前告警为(zy1-gj1),目标故障资源信息表也存在告警(zy1-gj1),此时判断故障资源信息表中告警(zy1-gj1)的活动告警时间与当前告警的告警时间的差值,从而判断是否将挡前告警并入所述目标故障资源信息表,由此实现对于告警信息的基于时间流水窗的有效性管控。
本实施例中,通过将故障资源信息表与当前告警的资源类型和告警类型进行比对,判断当前告警是否已经存在于故障资源信息表中,从而获取当前告警对应的目标故障资源信息表,通过信息表的独立性,实现了对故障信息分区域、分专业、分场景的标识和管控,为故障并行处置提供了一种便捷、有效的方法。
在一种可能的实施方式中,本实施例提供的故障根因定位方法通过获取目标资源信息的父告警集合和子告警集合,从而构建当前告警与目标资源信息的父告警集合、目标资源信息的子告警集合的告警依赖关系集合。
具体地,基于所述目标资源信息生成该当前告警的告警依赖关系集合,包括:获取所述目标资源信息的目标告警集合;从所述目标告警集合中获取与当前告警具有父子告警关系的目标父告警和目标子告警,构建当前告警-父告警集合-子告警集合的告警依赖关系集合。
在本实施例中,告警依赖关系主要指两个告警的父子关系,每一个告警的父子关系可以通过专家经验、AI告警关联规则挖掘生成。告警依赖关系可以采用(zy1-gj1,zy2-gj2)进行记录,该记录表达告警(zy1-gj1)是告警(zy2-gj2)的父告警。告警依赖关系集合的记录方式可以为:((zy1-gj1,zy2-gj2),(zy1-gj1,zy2-gj3),(zy1-gj1,zy3-gj1),…)。
当与当前告警(比如zy1-gj1)关联的资源拓扑信息集合B1与该当前告警的告警依赖关系集合B2的资源类型有交集(比如包括资源类型zy2和资源类型zy3),则构建(zy1-gj1,目标父告警集合,目标子告警集合)的告警依赖关系集合,也就是说,对于目标资源信息zy2,获取zy2的目标告警集合,分析zy2的目标告警集合中,哪些是当前告警(比如zy1-gj1)的父告警,哪些是当前告警(比如zy1-gj1)的子告警,分别汇总至上述告警依赖关系集合中;对于目标资源信息zy3,也同样的获取zy3的目标告警集合,分析zy3的目标告警集合中,哪些是当前告警(比如zy1-gj1)的父告警,哪些是当前告警(比如zy1-gj1)的子告警,分别汇总至上述告警依赖关系集合中。
进一步地,所述目标资源信息的父告警集合和子告警集合均包括多个关联告警,所述目标故障资源信息表中包括各告警的故障树指针,所述确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树,包括以下步骤:
遍历各关联告警,判断所述关联告警与所述当前告警的父子关系:
若所述关联告警为所述当前告警的父告警,根据目标故障资源信息表中该关联告警的故障树指针,找到该关联告警指向的所有树节点,将所述当前告警作为子节点进行挂载。示例性的,如告警zy2-gj1是告警zy1-gj1的父告警,根据将该告警关系,在故障资源信息表的告警zy2-gj1和告警zy1-gj1的“父子关系指针”中,进行相应的指向,然后根据故障资源信息表中告警zy2-gj1的故障树指针,找到该告警指向的所有树节点,将告警zy1-gj1作为子节点进行挂载。
若所述关联告警为所述当前告警的子告警,根据目标故障资源信息表中该关联告警的故障树指针,判断所述是否有父节点;若是,新建所述当前告警的树节点,并新增所述当前告警与该关联告警的故障树指针;若否,将所述当前告警作为该关联告警的父节点进行挂载。示例性的,如告警zy2-gj1是告警zy1-gj1的子告警,根据将该告警关系,在故障资源信息表的告警zy2-gj1和告警zy1-gj1的“父子关系指针”中,进行相应的指向;根据故障资源信息表中zy2-gj1的故障树指针,找到所有树节点:若如告警zy2-gj1指向的树节点无父节点,告警zy1-gj1作为父节点挂入,并增加的故障资源信息表中zy1-gj1的指针指向;如告警zy2-gj1指向的树节点有父节点,新建告警zy1-gj1的树节点,增加的故障资源信息表中zy1-gj1的指针指向,并将告警zy2-gj1指向的树节点作为根节点的子树,进行复制,挂入该节点。
可以理解的是,若该当前告警的所述资源拓扑信息集合不包含有与所述目标故障资源信息表中的目标资源信息集中相同的目标资源信息,该方法还包括:基于所述当前告警构建故障树,该当前告警为所述故障树的根节点。也就是说,在故障资源信息表中,告警(如zy1-gj1)信息中新增树的根节点,并增加相应的指针。
本实施例中,通过获取目标资源信息的父告警集合和子告警集合,从而构建当前告警与目标资源信息的父告警集合、目标资源信息的子告警集合的告警依赖关系集合,通过信息表的独立性,可以实现对故障信息分区域、分专业、分场景的标识和管控,为故障并行处置提供了一种便捷、有效的方法;通过信息表的关联性,实现了故障多维度数据的关联分析能力,有效提升了告警检索、告警关联比对效率;通过多维信息指针,将故障资源信息表与故障森林进行关联,实现了故障树的快速构建。
因此,本申请提出了基于多维资源信息指针及故障森林的海量数据并行分析方法,创新性的综合了资源拓扑关系、告警依赖关系、活动资源告警信息、故障森林构建方法,实现了高效率处置、低算力消耗的故障根因分析体系构建。该体系可以用于云化核心网、云资源池、基础承载网络和业务平台等进行跨专业、跨区域的告警根因分析,为大规模组网、多故障并发情况下的复杂运营维护处置提供了方向、方法和实践依据。
需要说明的是,在通信生产运营中,需要进行跨专业故障分析,如核心网故障原因可能涉及云资源、承载网、传输、局房等专业,并对影响业务平台系统。如果将多个专业的告警进行跨专业的整体性分析,则任何一个告警都需要与时间窗内所有告警做关联分析,存在资源消耗、处置失效等方面的问题。通过分专业并行进行告警关联,可以有效提升故障关联效率。并且,通信生产运营也存在跨区域、或者基于跨专业结果的跨区域故障分析的需求。在系统处置分析中,一级系统汇聚了所有区域的告警,如果不进行分区域处理,则任何1个告警都需要与时间窗内所有区域告警做关联分析,这种方式的算力需求大、处置效率低。分区域并行进行告警关联,可以有效提升故障关联效率。
本申请的故障根因定位方法还可以根据需求对故障信息进行不同专业、不同区域的划分,实现跨专业、跨区域故障根因定位。
具体地,针对于跨专业故障根因定位:分别进行各相关专业的故障分析,各相关专业经过故障分析,生成各专业的故障资源信息表和故障森林,如故障资源信息表1至表n,故障森林ZYSL1至ZYSLn;根据专业之间的故障关联度进行排序,将可能的根因专业排序在最前,之后根据专业关联度进行依次排序,并进行标识;从排序在最后的专业开始向前遍历:对于该专业所有故障树的根节点,根据其对应的故障信息表单元,获取资源类型、所属告警类型信息,与排序在前面专业的故障信息表,通过查询告警依赖关系集合,进行故障依赖关系比对,根据故障依赖关系,进行父子关系指针指向处理、故障树变更,直到完成所有专业的关联分析,生成最终的跨专业故障森林,及标识关联关系后的各专业的故障信息表。此时故障森林中各个树,即为故障根因分析的各个故障场景,每个树的根节点,即为该故障树场景下的故障根因。
具体地,针对于跨区域故障根因定位:经过告警关联,对不同区域,生成不同的故障资源信息表和故障森林,如故障资源信息表1至表m,故障森林QYSL1至QYSLm;对各区域内的故障树的根节点,查找其故障信息表,根据数据单元的告警信息,查询告警中对端故障资源信息,如对端资源属于另外一个区域,则根据故障信息表中资源类型、所属告警类型,相关区域的故障信息表比对,查询故障依赖关系,进行故障资源信息表父子关系指针指向处理、故障树变更,生成最终的跨区域的故障森林,及标识关联关系后的各区域的故障信息表。最终故障森林中存在跨区域关系的树,即为故障根因分析的跨区域故障场景,树的根节点即为该跨区域故障树场景下的故障根因。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
进一步需要说明的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
图3为本申请实施例提供的故障根因定位装置的示意图。如图3所示,该故障根因定位装置包括:
告警获取模块31,用于获取当前告警,所述当前告警包括有资源信息,构建与所述当前告警关联的资源拓扑信息集合;
故障资源信息表获取模块32,用于基于所述资源信息,从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表,所述故障资源信息表库用于存储各故障资源信息表,所述故障资源信息表存储有至少一个告警及与各告警对应的资源信息集;
故障树构建模块33,用于若该当前告警的所述资源拓扑信息集合包含有与所述目标故障资源信息表中的目标资源信息集中相同的目标资源信息,基于所述目标资源信息生成该当前告警的告警依赖关系集合,所述告警依赖关系集合包括至少一组告警与目标资源信息对应的各资源类型告警的依赖关系,确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树;
故障根因定位模块34,用于将所述当前告警所在故障树的根节点作为故障根因。
在一种可能的设计中,告警获取模块31具体用于:
根据网络的业务逻辑关系和资源部署关系,生成资源拓扑连接关系;
获取所述资源拓扑连接关系与所述当前告警的资源信息相连接的关联资源;
基于所述关联资源生成资源拓扑信息集合。
在一种可能的设计中,故障资源信息表获取模块32具体用于:
对所述故障资源信息表库中的各故障资源信息表进行资源信息查询,判断是否有故障资源信息表中包含该资源信息;
若是,将包含该资源信息的故障资源信息表作为目标故障资源信息表;
若否,基于所述当前告警生成新增故障资源信息表,将所述新增故障资源信息表存入故障资源信息表库,并将新增故障资源信息表作为目标故障资源信息表。
在一种可能的设计中,故障资源信息表获取模块32具体用于:
基于所述资源信息确认该当前告警在所述目标故障资源信息表中对应的活动告警,所述活动告警包括活动告警数量、活动告警时间;
判断所述告警时间与所述活动告警时间的差值是否符合预设时长范围;
若是,将所述当前告警并入所述目标故障资源信息表,更新所述活动告警数量和所述活动告警时间。
在一种可能的设计中,故障树构建模块33具体用于:
获取所述目标资源信息的父告警集合和子告警集合;
对于每一组当前告警-目标资源信息,构建当前告警-目标资源信息的父告警集合-目标资源信息的子告警集合的告警依赖关系;
将各组当前告警-目标资源信息的告警依赖关系进行汇总,生成该当前告警的告警依赖关系集合。
在一种可能的设计中,所述目标资源信息的父告警集合和子告警集合均包括多个关联告警,所述目标故障资源信息表中包括各告警的故障树指针,故障树构建模块33具体用于:
遍历各关联告警,判断所述关联告警与所述当前告警的父子关系;
若所述关联告警为所述当前告警的父告警,根据目标故障资源信息表中该关联告警的故障树指针,找到该关联告警指向的所有树节点,将所述当前告警作为子节点进行挂载;
若所述关联告警为所述当前告警的子告警,根据目标故障资源信息表中该关联告警的故障树指针,判断所述是否有父节点;
若是,新建所述当前告警的树节点,并新增所述当前告警与该关联告警的故障树指针;若否,将所述当前告警作为该关联告警的父节点进行挂载
在一种可能的设计中,故障树构建模块33还具体用于:
基于所述当前告警构建故障树,该当前告警为所述故障树的根节点。
应该理解,上述的装置实施例仅是示意性的,本申请的装置还可通过其它的方式实现。例如,上述实施例中单元/模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如,多个单元、模块或组件可以结合,或者可以集成到另一个系统,或一些特征可以忽略或不执行。
另外,若无特别说明,在本申请各个实施例中的各功能单元/模块可以集成在一个单元/模块中,也可以是各个单元/模块单独物理存在,也可以两个或两个以上单元/模块集成在一起。上述集成的单元/模块既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
图4为本申请实施例提供的基于故障根因定位装置的电子设备的结构示意图。如图4所示,该实施例的电子设备包括:至少一个处理器40(图4中仅示出一个)处理器、存储器41以及存储在存储器41中并可在至少一个处理器40上运行的计算机程序,处理器40执行计算机程序时实现上述任意各个方法实施例中的步骤。
该电子设备可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是电子设备的举例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),该处理器40还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
处理器401的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
存储器41在一些实施例中可以是电子设备的内部存储单元,例如电子设备的内存。存储器41在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器41还可以既包括电子设备的内部存储单元也包括外部存储设备。存储器41用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如计算机程序的程序代码等。存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于上述电子设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。上述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。
Claims (10)
1.一种故障根因定位方法,其特征在于,包括:
获取当前告警,所述当前告警包括有资源信息,构建与所述当前告警关联的资源拓扑信息集合;
基于所述资源信息,从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表,所述故障资源信息表库用于存储各故障资源信息表,所述故障资源信息表存储有至少一个告警及与各告警对应的资源信息集;
若该当前告警的所述资源拓扑信息集合包含有与所述目标故障资源信息表中的目标资源信息集中相同的目标资源信息,基于所述目标资源信息生成该当前告警的告警依赖关系集合,所述告警依赖关系集合包括至少一组告警与目标资源信息对应的各资源类型告警的依赖关系,确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树;
将所述当前告警所在故障树的根节点作为故障根因。
2.根据权利要求1所述的方法,其特征在于,所述构建与所述当前告警关联的资源拓扑信息集合,包括:
根据网络的业务逻辑关系和资源部署关系,生成资源拓扑连接关系;
获取所述资源拓扑连接关系与所述当前告警的资源信息相连接的关联资源;
基于所述关联资源生成资源拓扑信息集合。
3.根据权利要求1所述的方法,其特征在于,所述从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表,包括:
对所述故障资源信息表库中的各故障资源信息表进行资源信息查询,判断是否有故障资源信息表中包含该资源信息;
若是,将包含该资源信息的故障资源信息表作为目标故障资源信息表;
若否,基于所述当前告警生成新增故障资源信息表,将所述新增故障资源信息表存入故障资源信息表库,并将新增故障资源信息表作为目标故障资源信息表。
4.根据权利要求3所述的方法,其特征在于,所述告警包括告警时间,在所述将包含该资源信息的故障资源信息表作为目标故障资源信息表之后,还包括:
基于所述资源信息确认该当前告警在所述目标故障资源信息表中对应的活动告警,所述活动告警包括活动告警数量、活动告警时间;
判断所述告警时间与所述活动告警时间的差值是否符合预设时长范围;
若是,将所述当前告警并入所述目标故障资源信息表,更新所述活动告警数量和所述活动告警时间。
5.根据权利要求1所述的方法,其特征在于,所述基于所述目标资源信息生成该当前告警的告警依赖关系集合,包括:
获取所述目标资源信息的目标告警集合;
从所述目标告警集合中获取与当前告警具有父子告警关系的目标父告警和目标子告警,构建当前告警-父告警集合-子告警集合的告警依赖关系集合。
6.根据权利要求5所述的方法,其特征在于,所述目标资源信息的父告警集合和子告警集合均包括多个关联告警,所述目标故障资源信息表中包括各告警的故障树指针,所述确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树,包括:
遍历各关联告警,判断所述关联告警与所述当前告警的父子关系;
若所述关联告警为所述当前告警的父告警,根据目标故障资源信息表中该关联告警的故障树指针,找到该关联告警指向的所有树节点,将所述当前告警作为子节点进行挂载;
若所述关联告警为所述当前告警的子告警,根据目标故障资源信息表中该关联告警的故障树指针,判断所述是否有父节点;
若是,新建所述当前告警的树节点,并新增所述当前告警与该关联告警的故障树指针;
若否,将所述当前告警作为该关联告警的父节点进行挂载。
7.根据权利要求1所述的方法,其特征在于,若该当前告警的所述资源拓扑信息集合不包含有与所述目标故障资源信息表中的目标资源信息集中相同的目标资源信息,该方法还包括:
基于所述当前告警构建故障树,该当前告警为所述故障树的根节点。
8.一种故障根因定位装置,其特征在于,包括:
告警获取模块,用于获取当前告警,所述当前告警包括有资源信息,构建与所述当前告警关联的资源拓扑信息集合;
故障资源信息表获取模块,用于基于所述资源信息,从预设的故障资源信息表库中获取与该当前告警对应的目标故障资源信息表,所述故障资源信息表库用于存储各故障资源信息表,所述故障资源信息表存储有至少一个告警及与各告警对应的资源信息集;
故障树构建模块,用于若该当前告警的所述资源拓扑信息集合包含有与所述目标故障资源信息表中的目标资源信息集中相同的目标资源信息,基于所述目标资源信息生成该当前告警的告警依赖关系集合,所述告警依赖关系集合包括至少一组告警与目标资源信息对应的各资源类型告警的依赖关系,确认所述当前告警与所述各资源类型告警之间的父子关系,构建故障树;
故障根因定位模块,用于将所述当前告警所在故障树的根节点作为故障根因。
9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311385545.4A CN117376092A (zh) | 2023-10-24 | 2023-10-24 | 故障根因定位方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311385545.4A CN117376092A (zh) | 2023-10-24 | 2023-10-24 | 故障根因定位方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117376092A true CN117376092A (zh) | 2024-01-09 |
Family
ID=89407360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311385545.4A Pending CN117376092A (zh) | 2023-10-24 | 2023-10-24 | 故障根因定位方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117376092A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117596126A (zh) * | 2024-01-19 | 2024-02-23 | 合肥先进计算中心运营管理有限公司 | 一种针对高性能集群中高速网络异常的监控方法 |
-
2023
- 2023-10-24 CN CN202311385545.4A patent/CN117376092A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117596126A (zh) * | 2024-01-19 | 2024-02-23 | 合肥先进计算中心运营管理有限公司 | 一种针对高性能集群中高速网络异常的监控方法 |
CN117596126B (zh) * | 2024-01-19 | 2024-03-26 | 合肥先进计算中心运营管理有限公司 | 一种针对高性能集群中高速网络异常的监控方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109634561B (zh) | 一种在线可视化编程方法及装置 | |
US9612892B2 (en) | Creating a correlation rule defining a relationship between event types | |
CN111459766A (zh) | 一种面向微服务系统的调用链跟踪与分析方法 | |
CN113111129B (zh) | 数据同步方法、装置、设备及存储介质 | |
CN105095048A (zh) | 一种基于业务规则的监控系统告警关联处理方法 | |
CN109871290B (zh) | 应用于Java的调用堆栈追踪方法、装置和存储介质 | |
US8762417B2 (en) | Event impact analysis | |
CN111737033A (zh) | 一种基于运行时图谱分析的微服务故障定位方法 | |
CN117376092A (zh) | 故障根因定位方法、装置、设备及存储介质 | |
CN104636130A (zh) | 用于生成事件树的方法和系统 | |
CN111258798A (zh) | 监控数据的故障定位方法、装置、计算机设备及存储介质 | |
CN116629015A (zh) | 数字孪生任务的处理方法、装置、设备及存储介质 | |
CN112819176B (zh) | 一种适用于机器学习的数据管理方法和数据管理装置 | |
CN112395339B (zh) | 系统间数据准入校验方法、装置、计算机设备和存储介质 | |
CN115065558A (zh) | Apt攻击的攻击流程溯源方法及装置 | |
US11372832B1 (en) | Efficient hashing of data objects | |
CN109309576B (zh) | 一种故障社群检测方法及管理节点 | |
CN113254269A (zh) | 一种存储系统异常事件修复的方法、系统、设备和介质 | |
CN108737522B (zh) | 一种消息的处理方法、装置和系统 | |
CN117389908B (zh) | 接口自动化测试用例的依赖关系分析方法、系统及介质 | |
CN117149587B (zh) | 监控台账管理方法、装置、存储介质及设备 | |
CN111917599B (zh) | 一种云平台主机状态的管理系统与方法 | |
CN117453577B (zh) | 基于流量录制生成接口自动化用例的方法、装置和计算机设备 | |
CN112051985B (zh) | 事件触发方法、装置、电子设备及可读存储介质 | |
Tang et al. | A Discovery Method for Hierarchical Software Execution Behavior Models Based on Components |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |