CN116723090A - 告警根因的定位方法、装置、电子设备及可读存储介质 - Google Patents

告警根因的定位方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN116723090A
CN116723090A CN202310919638.4A CN202310919638A CN116723090A CN 116723090 A CN116723090 A CN 116723090A CN 202310919638 A CN202310919638 A CN 202310919638A CN 116723090 A CN116723090 A CN 116723090A
Authority
CN
China
Prior art keywords
target
alarm data
node
current alarm
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310919638.4A
Other languages
English (en)
Inventor
石英伟
王志刚
雷霆
王杰
欧阳晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asiainfo Technologies China Inc
Original Assignee
Asiainfo Technologies China Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asiainfo Technologies China Inc filed Critical Asiainfo Technologies China Inc
Priority to CN202310919638.4A priority Critical patent/CN116723090A/zh
Publication of CN116723090A publication Critical patent/CN116723090A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请实施例提供了一种告警根因的定位方法、装置、电子设备及可读存储介质,涉及通信领域中智能运维技术领域。该方法包括:当前周期获得的各个当前告警数据,将各个当前告警数据划分为各个当前告警事件,并生成了各个当前告警事件的有向图,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,将目标节点对应的当前告警数据作为当前告警事件的告警根因,可实现快速、准确地定位各个当前告警事件的告警根因,进而基于该根因消除导致产生当前告警事件中至少一个当前告警数据的故障,提升了消除故障的速度。

Description

告警根因的定位方法、装置、电子设备及可读存储介质
技术领域
本申请涉及通信领域中智能运维技术领域,具体而言,本申请涉及一种告警根因的定位方法、装置、电子设备及可读存储介质。
背景技术
随着网络云技术的发展,越来越多的软件系统部署在云环境上,通信类业务较高的稳定性要求给网络云的运维带来了三大挑战。第一,故障在某一时刻大量发生,运维人员查看海量的告警数据耗时耗力,不利于迅速处置业务系统故障;第二,大量告警数据同时发生,数据之间关联关系复杂庞大、互相交织,难以迅速找到真正的告警根因;第三,网络云环境下,环境复杂,告警信息多种多样,即使是最有经验的运维人员也不能保证对所有告警完全掌握,面对网络云告警,人工专家经验有限。
现有方案通常通过对告警数据进行分类、确定告警数据的影响力打分的方式定位告警根因,然而这些方式需要运维专家对告警数据进行分析、预处理、标注,这需要耗费大量的专家经验和人力成本,且无法避免主观性。同时,这些方法无法应对告警风暴,不能针对大量告警进行告警压缩和告警分割,通常无法有效的定位到准确的告警根因。
发明内容
本申请实施例提供了一种告警根因的定位方法、装置、电子设备、计算机可读存储介质及计算机程序产品,可以解决背景技术中的问题。所述技术方案如下:
根据本申请实施例的第一方面,提供了一种告警根因的定位方法,该方法包括:
在当前周期内,从网络云中确定至少一个目标网元,目标网元为产生当前告警数据的网元;获取各个目标网元的当前告警数据;
获取网络云的拓扑图,拓扑图包括用于表征网元的节点,节点之间的连线用于表征网元之间的连接关系,对拓扑图进行分割,得到至少一个目标子拓扑图;目标子拓扑图中包括至少一个用于表征目标网元的节点;两两目标子拓扑图之间以预设数量的正常网元为间隔,正常网元为未产生当前告警数据的网元;
对于每个目标子拓扑图,将目标子拓扑图中各个目标网元的当前告警数据作为一个当前告警事件;当前告警事件包括至少一个当前告警数据;
对于每个当前告警事件,生成当前告警事件对应的目标有向图,并确定有向图中各个有向边的权重;目标有向图的节点表征当前告警事件中的当前告警数据,有向边的起始节点和终止节点之间的方向表征起始节点对应的当前告警数据的产生导致终止节点对应的当前告警数据的产生;有向边的权重用于表征:产生有向边的起始节点所表征的当前告警数据,对产生有向边终止节点表征的当前告警数据的影响概率;
对于每个目标有向图,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,将目标节点对应的当前告警数据作为当前告警事件的告警根因。
根据本申请实施例的第二方面,提供了一种告警根因的定位装置,该装置包括:
当前告警数据获取模块,用于在当前周期内,从网络云中确定至少一个目标网元,目标网元为产生当前告警数据的网元;获取各个目标网元的当前告警数据;
拓扑图分割模块,用于获取网络云的拓扑图,拓扑图包括用于表征网元的节点,节点之间的连线用于表征网元之间的连接关系,对拓扑图进行分割,得到至少一个目标子拓扑图;目标子拓扑图中包括至少一个用于表征目标网元的节点;两两目标子拓扑图之间以预设数量的正常网元为间隔,正常网元为未产生当前告警数据的网元;
当前告警事件生成模块,用于对于每个目标子拓扑图,将目标子拓扑图中各个目标网元的当前告警数据作为一个当前告警事件;当前告警事件包括至少一个当前告警数据;
有向图确定模块,用于对于每个当前告警事件,生成当前告警事件对应的目标有向图,并确定有向图中各个有向边的权重;目标有向图的节点表征当前告警事件中的当前告警数据,有向边的起始节点和终止节点之间的方向表征起始节点对应的当前告警数据的产生导致终止节点对应的当前告警数据的产生;有向边的权重用于表征:产生有向边的起始节点所表征的当前告警数据,对产生有向边终止节点表征的当前告警数据的影响概率;
告警根因定位模块,用于对于每个目标有向图,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,将目标节点对应的当前告警数据作为当前告警事件的告警根因。
根据本申请实施例的第三方面,提供了一种电子设备,该电子设备包括存储器、处理器及存储在存储器上的计算机程序,处理器执行程序时实现如第一方面所提供的方法的步骤。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
根据本申请实施例的第五方面,提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中,当计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行实现如第一方面所提供的方法的步骤。
本申请实施例提供的技术方案带来的有益效果是:
本申请实施例对于当前周期获得的各个当前告警数据,将各个当前告警数据划分为各个当前告警事件,并生成了各个当前告警事件的有向图,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,将目标节点对应的当前告警数据作为当前告警事件的告警根因,可实现快速、准确地定位各个当前告警事件的告警根因,进而基于该根因消除导致产生当前告警事件中至少一个当前告警数据的故障,提升了消除故障的速度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种告警根因的定位方法的流程示意图;
图2为本申请实施例提供的一种网络云的拓扑图;
图3为本申请实施例提供的对网络云的拓扑图进行分割后得到的至少一个目标子拓扑的示意图;
图4为本申请实施例提供的基于某当前告警事件的目标子拓扑图生成该当前告警事件的目标有向图;
图5为本申请实施例提供的一种目标有向图中各条有向边的权重以及获得的权重矩阵的示意图;;
图6为本申请实施例提供的一种又一种告警根因的定位方法的流程图;
图7为本申请实施例提供的一种告警根因的定位装置的结构示意图;
图8为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面结合本申请中的附图描述本申请的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本申请实施例的技术方案的示例性描述,对本申请实施例的技术方案不构成限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“A和/或B”可以实现为“A”,或者实现为“B”,或者实现为“A和B”。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先对本申请涉及的几个名词进行介绍和解释:
网络拓扑图(Network Topology),简称拓扑图,给出网络服务器、终端、工作站的网络配置和相互间的连接,它的结构主要有星型结构、环型结构、总线结构、分布式结构、树型结构、网状结构、蜂窝状结构等,拓扑图的节点表征的是网络设备,网络设备可以是终端、服务器、交换机等等,拓扑图的边表征网络设备之间的连接关系,该连接关系可以是物理连接,也可以是逻辑连接。
关联规则分析(Association Rule Analysis)是为了发掘数据背后的关联关系而诞生的。定义一个关联规则:
其中,X,Y分别表示两个数据,Y看作前因,X看作后果,上述的关联规则表示Y会导致X。通过频繁项集的评估标准来进一步分析这两个事件之间的关系强弱。
在常用的频繁项集的评估标准中有支持度、置信度和提升度三个。
频繁项集:频繁模式是指数据集中频繁出现的项集、序列或子结构。本申请实施例的一个告警事件为一个数据集,频繁项集是指支持度大于等于最小支持度(min_sup)的集合。
支持度:几个关联的数据在数据集中出现的次数占总数据集的比重,或者说几个数据关联出现的概率。如果我们有两个要分析关联性的数据X和Y,则对应的支持度为:
一般来说,支持度高的数据不一定构成频繁项集,但是支持度太低的数据肯定不构成频繁项集。
置信度:一个数据出现后,另一个数据出现的概率,或者说数据的条件概率。如果我们有两个想分析关联性的数据X和Y,X对Y的置信度为:
提升度:表示含有Y的条件下,同时含有X的概率,与X总体发生的概率之比:
提升度体现了X和Y之间的关联关系,可以表示Y的出现对X出现的概率提升的程度:
提升度则/>是有效的强关联规则;
提升度则/>是无效的强关联规则。
本申请提供的告警根因的定位方法、装置、电子设备、计算机可读存储介质以及计算机程序产品,旨在解决现有技术的如上技术问题。
下面通过对几个示例性实施方式的描述,对本申请实施例的技术方案以及本申请的技术方案产生的技术效果进行说明。需要指出的是,下述实施方式之间可以相互参考、借鉴或结合,对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等,不再重复描述。
本申请实施例中提供了一种告警根因的定位方法,该方法由计算机设备执行,该计算机设备可以是终端或者服务器。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例在此不做限制。
如图1所示,其示例性示出了本申请实施例提供的一种告警根因的定位方法的流程示意图,该方法包括:
步骤S101,在当前周期内,从网络云中确定至少一个目标网元,目标网元为产生当前告警数据的网元;获取各个目标网元的当前告警数据。
本申请实施例每个周期对应预设时间间隔,比如1个周期为5分钟,那么0:00—0:05为一个周期,0:05-0:10是一个周期等,该预设时间间隔可以基于实际情况进行设置,本申请实施例对此不作限制。
本申请实施例网络云中包括至少一个网元,网元即为网络设备,可周期性获取网络云中各网络设备产生的至少一个告警数据,每个当前周期产生的告警数据称为当前告警数据,产生当前告警数据的网元称为目标网元。
目标网元可产生至少一个当前告警数据,同一目标网元产生的多个当前告警数据是不同的,若同一目标网元在当前周期内,两次产生当前告警数据A,一次产生告警数据B,那么可将该两次产生的当前告警数据A看做一个当前告警数据A,即该目标网元在该当前周期内产生的当前告警数据包括当前告警数据A和当前告警数据B。
在获取到多个当前告警数据后,可以先对这些当前告警数据进行预处理,预处理即数据清洗,其中,预处理包括但不限于告警数据关键字段提取、去除关键字段空值数据等,该关键字可以是告警级别、网页名称、网元名称、位置等,对于某当前告警数据,若该当前告警数据中关键字段为空,则说明该当前告警数据中缺乏关键字段,可删除该当前告警数据,也可为该当前告警数据填充该关键字段,以实现数据清洗。
步骤S102,获取网络云的拓扑图,拓扑图包括用于表征网元的节点,节点之间的连线用于表征网元之间的连接关系,对拓扑图进行分割,得到至少一个目标子拓扑图;目标子拓扑图中包括至少一个用于表征目标网元的节点。
若至少一个目标子拓扑图的数量为两个,则两两目标子拓扑图之间以预设数量的正常网元为间隔,至少一个正常网元对应的节点的数量大于第一预设数量或者至少一个正常网元中连续的正常网元的数量大于第二预设数量。
本申请实施例可获取网络云的拓扑图,该拓扑图中包括用于表征网元的节点,节点之间的连线用于表征网元之间的连接关系,该连接关系可以是物理连接关系,也可以是逻辑连接关系,本申请实施例对此不作限制。
本申请实施例在获取网络云的拓扑图之后,对该拓扑图进行分割,可基于未产生当前告警数据的正常网元对应的节点对该拓扑图进行分割,分割后得到至少一个目标子拓扑图,每个目标子拓扑图中包括至少一个用于表征目标网元的节点。
具体的,对于任意的两两目标网元,若确定该两两目标网元在拓扑图中对应的两个节点之间不存在正常网元对应的节点,则确定该两两目标网元对应的两个节点属于同一个目标子拓扑图,若确定该两两目标网元在拓扑图中对应的两个节点之间存在至少一个正常网元,且至少一个正常网元的数量大于第一预设数量(例如为3)或连续正常网元的数量大于第二预设数量(例如为2),则确定该两两目标网元对应的两个节点属于不同的目标子拓扑图;若确定该两两目标网元在拓扑图中对应的两个节点之间存在至少一个正常网元,且至少一个正常网元的数量不大于第一预设数量或连续正常网元的数量不大于第二预设数量,则确定该两两目标网元对应的两个节点属于同一个目标子拓扑图。从划分结果上看,两两目标子拓扑之间的最短距离大于预设距离,可以从两两目标子拓扑图中的一个目标子拓扑图中选择一个第一节点,从另一个目标子拓扑图中选择一个第二节点,确定第一节点和第二节点之间的距离,第一节点和第二节点之间的最短距离即为两两目标子拓扑之间的最短距离。
从上述可以看出,两两目标子拓扑之间存在至少一个正常网元对应的节点,基于未发生故障的正常网元对应的节点将拓扑图划分为各个目标子拓扑图,每个目标子拓扑的至少一个目标网元在该当前周期内产生了当前告警数据,这些当前告警数据之间可能存在关联性,该关联性可能为当前告警数据a导致该当前告警事件中其他的当前告警数据的产生,该关联性也可能为当前告警数据a导致当前告警数据b的产生,当前告警数据b的产生导致当前告警数据c的产生等。
在网络云中产生多个当前告警数据时,基于正常网元对应的节点对网络云的拓扑图进行分割,得到至少一个子拓扑图,其中至少一个子拓扑图中包括至少一个目标子拓扑图,子拓扑图中不包括目标网元,但目标子拓扑图中包含目标网元。
如图2所示,其示例性示出了网络云的拓扑图,其中,网络云对应的拓扑图包括节点1、节点2、节点3、节点4、节点5、节点6、节点7、节点8、节点9、节点10、节点11、节点12、节点13、节点14、节点15、节点16、节点17以及节点18,其中,节点1、节点2、节点3、节点4、节点5、节点7、节点8、节点9、节点10、节点13、节点14以及节点18各自对应的网元为产生告警数据的目标网元,节点6、节点11、节点12、节点15、节点16以及节点17对应的网元为正常网元;
如图3所示,其示例性示出了对网络云的拓扑图进行分割后得到的至少一个目标子拓扑的示意图,假设两两目标子拓扑图之间以2个数量的正常网元为间隔,那么对上述拓扑图进行分割后,可以得到3个目标子拓扑图,其中,节点1、节点2、节点3、节点4、节点5、节点6、节点7、节点8、节点9、节点10对应一个目标子拓扑图;节点13、节点14对应一个目标子拓扑图,节点18单独作为一个目标子拓扑图。
本申请将每个目标子拓扑中的各个目标网元产生的至少一个当前告警数据作为一个当前告警事件,实现对至少一个当前告警数据进行分类,在后续处理过程中,对于每个当前告警事件,需从该当前告警事件包含的各个当前告警数据中找出一个造成该当前告警事件的告警根因。
步骤S103,对于每个目标子拓扑图,将目标子拓扑图中各个目标网元的当前告警数据作为一个当前告警事件;当前告警事件包括至少一个当前告警数据。
本申请实施例对于每个目标子拓扑图,将该目标子拓扑图中各个目标网元的当前告警数据作为一个当前告警事件,一个当前告警事件包括该目标子拓扑图中所有目标网元产生的当前告警数据。
前述实施例已经说明,对于一个目标子拓扑图而言,相较于其他目标子拓扑图中的其他目标网元,该目标子拓扑图中各个目标网元之间的联系性较高,对于每个目标子拓扑图对应的一个当前告警事件而言,该当前告警事件中存在的至少一个当前告警数据之间存在较高的联系性,可能由于一个目标网元由于发生告警而产生告警数据,进而导致该目标子拓扑图中的其他目标网元产生当前告警数据。
具体而言,假设当前告警数据a、当前告警数据b以及当前告警数据c属于一个目标子拓扑图,当前告警数据a、当前告警数据b以及当前告警数据c之间存在较高的联系性,当前告警数据a的产生可能导致当前告警数据b以及当前告警数据c的产生,或者,当前告警数据b的产生可能导致当前告警数据a以及当前告警数据c的产生,或者,当前告警数据c的产生可能导致当前告警数据a以及当前告警数据b的产生,或者当前告警数据a导致当前告警鼠标b的产生,进而导致当前告警数据c的产生等。
步骤S104,对于每个当前告警事件,生成当前告警事件对应的目标有向图,并确定有向图中各个有向边的权重;目标有向图的节点表征当前告警事件中的当前告警数据,有向边的起始节点和终止节点之间的方向表征起始节点对应的当前告警数据的产生导致终止节点对应的当前告警数据的产生;有向边的权重用于表征:产生有向边的起始节点所表征的当前告警数据,对产生有向边终止节点表征的当前告警数据的影响概率。
本申请实施例对于每个当前告警事件,生成了该当前告警事件对应的目标有向图,该目标有向图中的节点表征当前告警事件中当前告警数据,有向边的起始节点和终止节点之间的方向表征起始节点对应的当前告警数据的产生导致终止节点对应的当前告警数据的产生。
目标有向图可基于以下方式生成:对于当前告警事件对应的目标子拓扑图,将目标子拓扑图中除目标网元之外的其他正常网元去除,将去除其他正常网元的目标子拓扑图转换为初始有向图,修改初始有向图中各节点表征的目标网元为目标网元对应的当前告警数据。
如图4所示,其示例性示出了基于某当前告警事件的目标子拓扑图生成该当前告警事件的目标有向图,该目标子拓扑图中,节点A、B、C对应的网元为产生当前告警数据的目标网元,节点D为未产生当前告警数据的正常网元,节点A、B、C对应的目标网元分别产生的当前告警数据为当前告警数据1、当前告警数据2以及当前告警数据3。
该目标子拓扑图去除正常网元对应的节点D后,得到包含节点A、B、C的目标子拓扑图,可将去除其他正常网元的目标子拓扑图转换为初始有向图,目标子拓扑图中的每条无向边都会被转换为两条有向边,将该初始有向图的节点由表征目标网元修改为表征目标网元产生的当前告警数据。
值得注意的是,若待去除的一个正常网元对应的节点位于两个目标网元对应的节点之间,则在去除该正常网元对应的节点后,该两个目标网元对应的节点可以作为相邻节点,即将正常网元对应的节点看做边。比如节点1、节点2以及节点3之间的连接关系为:节点1-节点2-节点3,其中,节点1和节点3对应的网元为目标网元,节点2对应的网元为正常网元,在转换为目标有向图时,节点1-节点2-节点3转换为节点节点3。
本申请实施例在获得该目标有向图之后,确定各个有向边的权重,有向边的权重用于表征:产生有向边的起始节点所表征的当前告警数据,对产生有向边终止节点表征的当前告警数据的影响概率。具体而言,假设有向边A→B的权重为1/3,则说明产生有向边的起始节点A对应的当前告警数据对产生有向边的终止节点B对应的当前告警数据的影响概率为1/3;假设有向边B→A的权重为1/5,则说明产生有向边的起始节点A对应的当前告警数据对产生有向边的终止节点B对应的当前告警数据的影响概率为1/5。
通常情况下,对于目标有向图中的两个节点A和B,A→B的权重和B→A的权重通常是不相同的,各个有向边的权重是基于两个当前告警数据之间的置信度、支持度以及提升度确定的,详细内容见后续部分。
步骤S105,对于每个目标有向图,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,将目标节点对应的当前告警数据作为当前告警事件的告警根因。
本申请实施例对于每个目标有向图对应的是一个当前告警事件,每个当前告警事件中包括至少一个当前告警数据,一个当前告警事件的产生必定有告警根因,可根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,将目标节点对应的当前告警数据作为当前告警事件的告警根因。另外,本申请实施例定位告警根因是周期性的,在当前周期内定位各个当前告警事件的告警根因。
本申请实施例对于当前周期获得的各个告警数据,将各个告警数据划分为告警事件,并生成了各个告警事件的有向图,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,将目标节点对应的当前告警数据作为当前告警事件的告警根因,可实现快速、准确地定位各个当前告警事件的告警根因,进而基于该告警根因消除导致产生当前告警事件中至少一个当前告警数据的故障,提升了消除故障的速度。
本申请实施例中提供了一种可能的实现方式,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,包括:
若确定目标有向图中包括1个节点,则将1个节点作为目标节点;
若确定目标有向图中包括2个节点,则比较2个节点之间的两条有向边各自的权重,将权重最大的有向边的起始节点作为目标节点。
若目标有向图中包括1个节点,那么可直接将该1个节点作为目标节点,该1个节点对应的当前告警数据即为该当前告警事件的告警根因。
若目标有向图中包括2个节点,则可以比较2个节点之间的两条有向边各自的权重,比如有向边A→B的权重为1/3,则说明产生有向边的起始节点A对应的当前告警数据对产生有向边的终止节点B对应的当前告警数据的影响概率为1/3;假设有向边B-→A的权重为1/5,则说明产生有向边的起始节点A对应的当前告警数据对产生有向边的终止节点B对应的当前告警数据的影响概率为1/5,从上述权重可以确定,两个节点之间的关联性应为:权重最大的有向边的起始节点对应的当前告警数据的产生导致终止节点对应的当前告警数据的产生,因此可以将权重最大的有向边的起始节点作为目标节点,即该权重最大的有向边的起始节点对应的当前告警数据即为该当前告警事件的告警根因。
本申请实施例中提供了一种可能的实现方式,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,还包括:
若确定目标有向图中包括至少3个节点,则基于各个有向边的权重确定各个节点的目标重要程度;
将目标重要程度最大值对应的节点作为目标节点。
前述实施例已经说明目标有向图中包括1个节点以及2个节点时,确定有向图中目标节点的方式,那么在目标有向图中包括3个节点时,可基于各个有向边的权重确定各个节点的目标重要程度,节点的目标重要程度也即节点所表征的当前告警数据的重要程度,一个节点的目标重要程度越高,说明该节点为告警根因的可能性就越大,本申请实施例可将目标重要程度最大值对应的节点作为目标节点。
本申请实施例中提供了一种可能的实现方式,基于各个有向边的权重确定各个节点的目标重要程度,包括:
基于目标有向图中各个有向边的权重,生成权重矩阵;权重矩阵每个位置的元素表征:产生位置的行数对应的当前告警数据,对产生位置的列数对应的当前告警数据的影响概率;
获取目标有向图中每个节点的初始重要程度,生成初始向量矩阵,初始向量矩阵中的每行元素表征对应的节点的初始重要程度;初始重要程度是基于目标有向图中的节点数量确定的;
基于权重矩阵对初始向量矩阵进行迭代更新,将最后一次迭代获得的向量矩阵作为目标向量矩阵,目标向量矩阵中的每行元素表征对应的当前告警数据的目标重要程度。
本申请实施例每个节点的目标重要程度是通过迭代确定的,具体的,基于目标有向图中各个有向边的权重,生成权重矩阵;权重矩阵每个位置的元素是一个概率,即该权重矩阵实际上是一个转移概率矩阵(Transition Probability Matrix)该概率为产生位置的行数对应的当前告警数据,对产生位置的列数对应的当前告警数据的影响概率,该权重矩阵可以用Mn*n表示,矩阵中的第i行j列的元素表征产生第i行的当前告警数据对产生第j列的当前告警数据的影响概率。
同时,还需获取目标有向图中每个节点的初始重要程度,每个节点的初始重要程度是基于该目标有向图中的节点的数量确定的,可默认每个节点的初始重要程度为1/n,其中,n为目标有向图中节点的数量。
本申请实施了在获得每个初始重要程度后,生成初始向量矩阵,初始向量矩阵中每行元素表征的事对应的节点的初始重要程度,在获得权重矩阵和初始向量矩阵后,对基于权重矩阵对初始向量矩阵进行迭代更新,在每次迭代中,将本次迭代的向量矩阵和权重矩阵相乘,将乘积结果作为下一次迭代的向量矩阵;若确定本次迭代的向量矩阵和下一次迭代的向量矩阵的差值矩阵的行列式值小于预设阈值,则停止迭代,将最后一次迭代获得的向量矩阵作为目标向量矩阵,其中,目标向量矩阵中的每行元素表征的是对应的当前告警数据的目标重要程度。该每次迭代获得的向量矩阵可以表示为Rt,其中,t表示第t次迭代,其中,Vi表示第i个节点,PR(vi)表示第i个节点的重要程度,具体而言,若权重矩阵M,则下一次迭代即t+1次迭代获得的向量矩阵为Rt+1=M*Rt。从第0次迭代直第t次迭代可获得的各个向量矩阵为R0、R1、R2......Rt,其中,R1=MR0,R2=M2R0,......,Rt=MtR0,即从第0次迭代直第t次迭代可获得的各个向量矩阵为R0,MR0,M2R0,…,MtR0
本申请实施例中提供了一种可能的实现方式,基于权重矩阵对初始向量矩阵进行迭代更新,包括:
在每次迭代中,将本次迭代的向量矩阵和权重矩阵相乘,将乘积结果作为下一次迭代的向量矩阵;
其中,若确定本次迭代的向量矩阵和下一次迭代的向量矩阵的差值矩阵的行列式值小于预设阈值,则停止迭代。
前述实施例已经说明,若权重矩阵为M,本次迭代的向量矩阵为Rt,则下一次迭代即t+1次迭代获得的向量矩阵为Rt+1=M*Rt,二者之间的差值矩阵△R=Rt+1-Rt,若△R的行列式值|△R|小于预设阈值ε,即:
|△R|=|Mt+1*R0-Mt*R0|<ε时,迭代停止。
在一具体实施例中,如图5所示,其示例性示出了目标有向图中各条有向边的权重以及获得的权重矩阵的示意图,其中,a-->b的权重为1/5,b-->d的权重为2/3,d-->c的权重为1/3,c-->a的权重为2/3,b-->a的权重为1/3,a-->c的权重为4/5,c-->d的权重为1/3,d-->b的权重为1/2,那么可以确定该有向图的权重矩阵为该有向图的初始向量矩阵为/>第t次迭代获得的向量矩阵为/>第t+1次迭代获得的向量矩阵为/>若第t+1次迭代获得的向量矩阵和第t次迭代获得的向量矩阵的差值矩阵的行列式值小于预设阈值ε,则确定迭代停止。
本申请实施例中提供了一种可能的实现方式,确定有向图中各个有向边的权重,包括:
对于每条有向边,确定产生有向边的起始节点所表征的当前告警数据,对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度;
获取支持度、置信度以及提升度各自对应的权重;
基于支持度、置信度以及提升度各自对应的权重,对支持度、置信度以及提升度进行加权求和,得到有向边的权重。
本申请实施例每条有向边的权重是基于产生有向边的起始节点所表征的当前告警数据,对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度确定的。
支持度、置信度以及提升度是频繁项集中三个常用的评估标准,两个告警数据之间的支持度、置信度以及提升度是基于海量的告警数据确定的,基于一个当前告警事件中的各个当前告警数据无法准确的确定两个当前告警数据之间的支持度、置信度和提升度,当前告警数据之间的支持度、置信度和提升度是基于海量的历史告警事件确定的,详细过程见后续内容。
确定产生有向边的起始节点所表征的当前告警数据,对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度,并获取支持度、置信度以及提升度各自对应的权重,并基于支持度、置信度以及提升度各自对应的权重,对支持度、置信度以及提升度进行加权求和,得到有向边的权重。
具体而言,假设的支持度、置信度以及提升度分别为90%、90%以及1,支持度、置信度以及提升度的权重分别为1/3,那么可以确定有向边的权重w=1/3*90%+1/3*90%+1/3*1=93.33%。/>
本申请实施例中提供了一种可能的实现方式,确定产生有向边的起始节点所表征的当前告警数据,对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度,包括:
确定当前周期之前的各个历史周期,获取各个历史周期的历史告警事件;历史告警事件中包括至少两个历史告警数据,每个历史告警事件中的至少两个历史告警数据是同一历史周期内、网络云中不同的网元产生的、不同的告警数据;
确定每个历史告警数据在所有历史告警事件中的发生次数,基于各个历史告警数据的发生次数,从各个历史告警事件所包括的各个历史告警数据中确定至少一个目标历史告警数据;至少一个目标历史告警数据组成的集合为各个历史告警事件的最大频繁项集;
若确定各个目标历史告警数据中存在第一目标历史告警数据和第二目标历史告警数据,第一目标历史告警数据和有向边的起始节点表征的当前告警数据相同,第二目标历史告警数据和有向边的终止节点表征的当前告警数据相同,则基于第一目标告警数据的发生次数和第二目标历史告警数据的发生次数,确定产生第一目标历史告警数据对产生第二目标历史告警数据的支持度、置信度以及提升度;
将产生第一目标历史告警数据对产生第二目标历史告警数据的支持度、置信度以及提升度,分别作为产生有向边的起始节点所表征的当前告警数据对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度。
本申请实施例各个当前告警数据是在当前周期内采集的,仅基于当前周期采集的各个当前告警数据无法准确的确定两两当前告警数据之间的支持度、置信度以及提升度,本申请实施例可确定该当前周期之前的海量历史周期,比如获取当前周期之前的100个历史周期,获取每个历史周期的历史告警事件,每个历史告警事件中的至少两个历史告警数据是同一历史周期内、网络云中不同的网元产生的、不同的告警数据,即每个历史告警事件是网络云中各历史告警数据的集合。
本申请实施例确定每个历史告警数据在所有历史告警事件中的发生次数,基于各个历史告警数据的发生次数,从各个历史告警事件所包括的各个历史告警数据中确定至少一个目标历史告警数据;至少一个目标历史告警数据组成的集合为各个历史告警事件的最大频繁项集,具体的,将每个历史告警事件看作一个数据集合,搜索出候选1项集及对应的支持度,剪枝去掉低于支持度的1项集,得到频繁1项集,然后对剩下的频繁1项集进行连接,得到候选的频繁2项集,筛选去掉低于支持度的候选频繁2项集,得到真正的频繁2项集,以此类推,迭代下去,直到无法找到频繁k+1项集为止,对应的频繁k项集的集合即为算法的输出结果,频繁k项集中的各个历史告警数据即为所需的目标历史告警数据。
值得注意的是,每个当前周期的各个历史周期是不同的,因此,各个当前周期确定的最大频繁项集可能是不同的,即确定出的各个目标历史告警数据可能是不同的。
具体的,可通过以下方式确定目标历史告警数据:获取各个历史周期各自对应的各个历史告警事件,每个历史告警事件包括至少一个历史告警数据,同一历史周期内、网络云中不同的网元产生的、不同的告警数据;扫描各个历史告警事件,扫描数据计算候选频繁k项集的支持度;去除候选频繁k项集中支持度低于阈值的数据集,得到频繁k项集。如果得到的频繁k项集为空,则直接返回频繁k-1项集的集合作为算法结果,算法结束。如果得到的频繁k项集只有一项,则直接返回频繁k项集的集合作为算法结果,算法结束。基于频繁k项集,连接生成候选频繁k+1项集。
对于当前告警数据、历史告警数据中任意一种告警数据而言,该告警数据中包括告警名称、产生该告警数据的目标网元的名称或标识、告警数据的内容以及告警数据的类型,对于两个告警数据而言,若该两个告警数据的告警名称、产生该告警数据的目标网元的名称或标识、告警数据的内容以及告警数据的类型均相同,那么可确定该两个告警数据是相同的。
本申请实施例在获得各个目标历史告警数据后,判断各个目标历史告警数据中存在第一目标历史告警数据和第二目标历史告警数据,第一目标历史告警数据和有向边的起始节点表征的当前告警数据相同,第二目标历史告警数据和有向边的终止节点表征的当前告警数据相同。
若确定各个目标历史告警数据中存在第一目标历史告警数据和第二目标历史告警数据,基于各个历史告警事件确定产生第一目标历史告警数据对产生第二目标历史告警数据的支持度、置信度以及提升度;将产生第一目标历史告警数据对产生第二目标历史告警数据的支持度、置信度以及提升度,分别作为产生有向边的起始节点所表征的当前告警数据对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度。
若确定各个目标历史告警数据中不存在第一目标历史告警数据或第二目标历史告警数据,则将第一预设值(例如为0)、第二预设值例如为0)以及第三预设值例如为0)分别作为产生有向边的起始节点所表征的当前告警数据对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度。
基于上述实施例可以发现,本申请实施例有向图中的权重是基于已经存在的历史告警事件中的告警数据确定的,而本申请各个节点的目标重要程度是基于迭代过程确定的,迭代过程涉及的数据是活跃的告警数据,属于实时性数据,即本申请基于历史周期数据、当前周期数据确定的告警根因,大大提升了确定告警根因的准确度。
本申请实施例中提供了一种可能的实现方式,生成当前告警事件对应的目标有向图,包括:
对于当前告警事件对应的目标子拓扑图,将目标子拓扑图中除目标网元之外的其他网元去除;
将去除其他网元的目标子拓扑图转换为初始有向图,修改初始有向图中各节点表征的目标网元为目标网元对应的当前告警数据。
前述实施例已经对此进行说明,本申请实施例在此不再进行赘述。
在一场景中,如图6所示,其示例性示出了又一种告警根因的定位方法的流程图:
在当前周期内,获取网络云中少一个目标网元各自对应的当前告警数据;目标网元为产生当前告警数据的网元;
获取网络云的拓扑图,拓扑图包括用于表征网元的节点,节点之间的连线用于表征网元之间的连接关系,对拓扑图进行分割,得到至少一个目标子拓扑图;
对于每个目标子拓扑图,将目标子拓扑图中各个目标网元的当前告警数据作为一个当前告警事件;当前告警事件包括至少一个当前告警数据,实现将各个当前告警数据划分为各个当前告警事件;
对于每个当前告警事件,生成当前告警事件对应的目标有向图;确定当前周期之前的各个历史周期,获取各个历史周期的历史告警事件;确定每个历史告警数据在所有历史告警事件中的发生次数,基于各个历史告警数据的发生次数,从各个历史告警事件所包括的各个历史告警数据中确定至少一个目标历史告警数据;至少一个目标历史告警数据组成的集合为各个历史告警事件的最大频繁项集;若确定各个目标历史告警数据中存在第一目标历史告警数据和第二目标历史告警数据,第一目标历史告警数据和有向边的起始节点表征的当前告警数据相同,第二目标历史告警数据和有向边的终止节点表征的当前告警数据相同,则基于各个历史告警事件确定产生第一目标历史告警数据对产生第二目标历史告警数据的支持度、置信度以及提升度;将产生第一目标历史告警数据对产生第二目标历史告警数据的支持度、置信度以及提升度,分别作为各个产生有向边的起始节点所表征的当前告警数据对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度;若确定各个目标历史告警数据中不存在第一目标历史告警数据或第二目标历史告警数据,则将第一预设值、第二预设值以及第三预设值分别作为产生有向边的起始节点所表征的当前告警数据对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度;对于每条有向边,基于支持度、置信度以及提升度各自对应的权重,对有向边的支持度、置信度以及提升度进行加权求和,得到有向边的权重;
对于每个目标有向图,
若确定目标有向图中包括1个节点,则将1个节点作为目标节点;
若确定目标有向图中包括2个节点,则比较2个节点之间的两条有向边各自的权重,将权重最大的有向边的起始节点作为目标节点;
若确定目标有向图中包括至少3个节点,基于目标有向图中各个有向边的权重,生成权重矩阵;获取目标有向图中每个节点的初始重要程度,生成初始向量矩阵,基于权重矩阵对初始向量矩阵进行迭代更新,将最后一次迭代获得的向量矩阵作为目标向量矩阵,目标向量矩阵中的每行元素表征对应的当前告警数据的目标重要程度,将目标重要程度最大值对应的节点作为目标节点;
将目标节点对应的当前告警数据作为当前告警事件的告警根因。
本申请实施例提供了一种告警根因的定位装置,如图7所示,该告警根因的定位装置70可以包括:
当前告警数据获取模块710,用于在当前周期内,从网络云中确定至少一个目标网元,目标网元为产生当前告警数据的网元;获取各个目标网元的当前告警数据;
拓扑图分割模块720,用于获取网络云的拓扑图,拓扑图包括用于表征网元的节点,节点之间的连线用于表征网元之间的连接关系,对拓扑图进行分割,得到至少一个目标子拓扑图;目标子拓扑图中包括至少一个用于表征目标网元的节点;两两目标子拓扑图之间以预设数量的正常网元为间隔,正常网元为未产生当前告警数据的网元;
当前告警事件生成模块730,用于对于每个目标子拓扑图,将目标子拓扑图中各个目标网元的当前告警数据作为一个当前告警事件;当前告警事件包括至少一个当前告警数据;
有向图确定模块740,用于对于每个当前告警事件,生成当前告警事件对应的目标有向图,并确定有向图中各个有向边的权重;目标有向图的节点表征当前告警事件中的当前告警数据,有向边的起始节点和终止节点之间的方向表征起始节点对应的当前告警数据的产生导致终止节点对应的当前告警数据的产生;有向边的权重用于表征:产生有向边的起始节点所表征的当前告警数据,对产生有向边终止节点表征的当前告警数据的影响概率;
告警根因定位模块750,用于对于每个目标有向图,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,将目标节点对应的当前告警数据作为当前告警事件的告警根因。
本申请实施例中提供了一种可能的实现方式,告警根因定位模块具体用于:
若确定目标有向图中包括1个节点,则将1个节点作为目标节点;
若确定目标有向图中包括2个节点,则比较2个节点之间的两条有向边各自的权重,将权重最大的有向边的起始节点作为目标节点。
本申请实施例中提供了一种可能的实现方式,告警根因定位模块具体还用于:若确定目标有向图中包括至少3个节点,则基于各个有向边的权重确定各个节点的目标重要程度;将目标重要程度最大值对应的节点作为目标节点。
本申请实施例中提供了一种可能的实现方式,所告警根因定位模块包括:
权重矩阵生成子模块,用于基于目标有向图中各个有向边的权重,生成权重矩阵;权重矩阵每个位置的元素表征:产生位置的行数对应的当前告警数据,对产生位置的列数对应的当前告警数据的影响概率;
初始向量矩阵生成子模块,用于获取目标有向图中每个节点的初始重要程度,生成初始向量矩阵,初始向量矩阵中的每行元素表征对应的节点的初始重要程度;初始重要程度是基于目标有向图中的节点数量确定的;
迭代更新子模块,用于基于权重矩阵对初始向量矩阵进行迭代更新,将最后一次迭代获得的向量矩阵作为目标向量矩阵,目标向量矩阵中的每行元素表征对应的当前告警数据的目标重要程度。
本申请实施例中提供了一种可能的实现方式,迭代更新子模块具体用于在每次迭代中,将本次迭代的向量矩阵和权重矩阵相乘,将乘积结果作为下一次迭代的向量矩阵;
其中,若确定本次迭代的向量矩阵和下一次迭代的向量矩阵的差值矩阵的行列式值小于预设阈值,则停止迭代。
本申请实施例中提供了一种可能的实现方式,有向图确定模块包括:
确定子模块,用于对于每条有向边,确定产生有向边的起始节点所表征的当前告警数据,对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度;
权重获取子模块,用于获取支持度、置信度以及提升度各自对应的权重;
加权子模块,用于基于支持度、置信度以及提升度各自对应的权重,对支持度、置信度以及提升度进行加权求和,得到有向边的权重。
本申请实施例中提供了一种可能的实现方式,确定子模块具体用于:
历史告警数据确定单元,用于确定当前周期之前的各个历史周期,获取各个历史周期的历史告警事件;历史告警事件中包括至少两个历史告警数据,每个历史告警事件中的至少两个历史告警数据是同一历史周期内、网络云中不同的网元产生的、不同的告警数据;
目标历史告警数据确定单元,用于确定每个历史告警数据在所有历史告警事件中的发生次数,基于各个历史告警数据的发生次数,从各个历史告警事件所包括的各个历史告警数据中确定至少一个目标历史告警数据;至少一个目标历史告警数据组成的集合为各个历史告警事件的最大频繁项集;
三度确定单元,用于若确定各个目标历史告警数据中存在第一目标历史告警数据和第二目标历史告警数据,第一目标历史告警数据和有向边的起始节点表征的当前告警数据相同,第二目标历史告警数据和有向边的终止节点表征的当前告警数据相同,则基于各个历史告警事件确定产生第一目标历史告警数据对产生第二目标历史告警数据的支持度、置信度以及提升度;将产生第一目标历史告警数据对产生第二目标历史告警数据的支持度、置信度以及提升度,分别作为产生有向边的起始节点所表征的当前告警数据对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度。
本申请实施例中提供了一种可能的实现方式,三度确定单元还用于若确定各个目标历史告警数据中不存在第一目标历史告警数据或第二目标历史告警数据,则将第一预设值、第二预设值以及第三预设值分别作为产生有向边的起始节点所表征的当前告警数据对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度。
本申请实施例中提供了一种可能的实现方式,有向图确定模块
去除子模块,用于对于当前告警事件对应的目标子拓扑图,将目标子拓扑图中除目标网元之外的其他网元去除;
修改子模块,用于将去除其他网元的目标子拓扑图转换为初始有向图,修改初始有向图中各节点表征的目标网元为目标网元对应的当前告警数据。
本申请实施例的装置可执行本申请实施例所提供的方法,其实现原理相类似,本申请各实施例的装置中的各模块所执行的动作是与本申请各实施例的方法中的步骤相对应的,对于装置的各模块的详细功能描述具体可以参见前文中所示的对应方法中的描述,此处不再赘述。
本申请实施例中提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,该处理器执行上述计算机程序以实现告警根因的定位方法的步骤,与相关技术相比可实现:本申请实施例对于当前周期获得的各个当前告警数据,将各个当前告警数据划分为各个当前告警事件,并生成了各个当前告警事件的有向图,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,将目标节点对应的当前告警数据作为当前告警事件的告警根因,可实现快速、准确地定位各个当前告警事件的告警根因,进而基于该告警根因消除导致产生当前告警事件中至少一个当前告警数据的故障,提升了消除故障的速度。
在一个可选实施例中提供了一种电子设备,如图8所示,图8所示的电子设备8000包括:处理器8001和存储器8003。其中,处理器8001和存储器8003相连,如通过总线8002相连。可选地,电子设备8000还可以包括收发器8004,收发器8004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器8004不限于一个,该电子设备8000的结构并不构成对本申请实施例的限定。
处理器8001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器8001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线8002可包括一通路,在上述组件之间传送信息。总线8002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线8002可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器8003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其他磁存储设备、或者能够用于携带或存储计算机程序并能够由计算机读取的任何其他介质,在此不做限定。
存储器8003用于存储执行本申请实施例的计算机程序,并由处理器8001来控制执行。处理器8001用于执行存储器8003中存储的计算机程序,以实现前述方法实施例所示的步骤。
其中,电子设备包可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图8所示的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。与现有技术相比可实现:本申请实施例对于当前周期获得的各个当前告警数据,将各个当前告警数据划分为各个当前告警事件,并生成了各个当前告警事件的有向图,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,将目标节点对应的当前告警数据作为当前告警事件的告警根因,可实现快速、准确地定位各个当前告警事件的告警根因,进而基于该告警根因消除导致产生当前告警事件中至少一个当前告警数据的故障,提升了消除故障的速度。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
本申请实施例还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。与现有技术相比可实现:本申请实施例对于当前周期获得的各个当前告警数据,将各个当前告警数据划分为各个当前告警事件,并生成了各个当前告警事件的有向图,根据目标有向图中的节点数量以及各条有向边的权重中的至少一种,从目标有向图的各个节点中确定目标节点,将目标节点对应的当前告警数据作为当前告警事件的告警根因,可实现快速、准确地定位各个当前告警事件的告警根因,进而基于该告警根因消除导致产生当前告警事件中至少一个当前告警数据的故障,提升了消除故障的速度。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”、“1”、“2”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除图示或文字描述以外的顺序实施。
应该理解的是,虽然本申请实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本申请实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本申请实施例对此不限制。
以上仅是本申请部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的方案技术构思的前提下,采用基于本申请技术思想的其他类似实施手段,同样属于本申请实施例的保护范畴。

Claims (12)

1.一种告警根因的定位方法,其特征在于,包括:
在当前周期内,从网络云中确定至少一个目标网元,所述目标网元为产生当前告警数据的网元;获取各个目标网元的当前告警数据;
获取所述网络云的拓扑图,所述拓扑图包括用于表征网元的节点,节点之间的连线用于表征网元之间的连接关系,对所述拓扑图进行分割,得到至少一个目标子拓扑图;所述目标子拓扑图中包括至少一个用于表征目标网元的节点;两两目标子拓扑图之间以预设数量的正常网元为间隔,所述正常网元为未产生当前告警数据的网元;
对于每个目标子拓扑图,将所述目标子拓扑图中各个目标网元的当前告警数据作为一个当前告警事件;所述当前告警事件包括至少一个当前告警数据;
对于每个当前告警事件,生成所述当前告警事件对应的目标有向图,并确定所述有向图中各个有向边的权重;所述目标有向图的节点表征所述当前告警事件中的当前告警数据,所述有向边的起始节点和终止节点之间的方向表征起始节点对应的当前告警数据的产生导致终止节点对应的当前告警数据的产生;所述有向边的权重用于表征:产生有向边的起始节点所表征的当前告警数据,对产生有向边终止节点表征的当前告警数据的影响概率;
对于每个目标有向图,根据所述目标有向图中的节点数量以及各条有向边的权重中的至少一种,从所述目标有向图的各个节点中确定目标节点,将所述目标节点对应的当前告警数据作为所述当前告警事件的告警根因。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标有向图中的节点数量以及各条有向边的权重中的至少一种,从所述目标有向图的各个节点中确定目标节点,包括:
若确定所述目标有向图中包括1个节点,则将所述1个节点作为目标节点;
若确定所述目标有向图中包括2个节点,则比较所述2个节点之间的两条有向边各自的权重,将权重最大的有向边的起始节点作为目标节点。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述目标有向图中的节点数量以及各条有向边的权重中的至少一种,从所述目标有向图的各个节点中确定目标节点,还包括:
若确定所述目标有向图中包括至少3个节点,则基于各个有向边的权重确定各个节点的目标重要程度;
将目标重要程度最大值对应的节点作为目标节点。
4.根据权利要求3所述的方法,其特征在于,所述基于各个有向边的权重确定各个节点的目标重要程度,包括:
基于所述目标有向图中各个有向边的权重,生成权重矩阵;所述权重矩阵每个位置的元素表征:产生所述位置的行数对应的当前告警数据,对产生所述位置的列数对应的当前告警数据的影响概率;
获取所述目标有向图中每个节点的初始重要程度,生成初始向量矩阵,所述初始向量矩阵中的每行元素表征对应的节点的初始重要程度;所述初始重要程度是基于所述目标有向图中的节点数量确定的;
基于所述权重矩阵对所述初始向量矩阵进行迭代更新,将最后一次迭代获得的向量矩阵作为目标向量矩阵,所述目标向量矩阵中的每行元素表征对应的当前告警数据的目标重要程度。
5.根据权利要求4所述的方法,其特征在于,所述基于所述权重矩阵对所述初始向量矩阵进行迭代更新,包括:
在每次迭代中,将本次迭代的向量矩阵和所述权重矩阵相乘,将乘积结果作为下一次迭代的向量矩阵;
其中,若确定本次迭代的向量矩阵和下一次迭代的向量矩阵的差值矩阵的行列式值小于预设阈值,则停止迭代。
6.根据权利要求1所述的方法,其特征在于,所述确定所述有向图中各个有向边的权重,包括:
对于每条有向边,确定产生有向边的起始节点所表征的当前告警数据,对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度;
获取所述支持度、所述置信度以及所述提升度各自对应的权重;
基于所述支持度、所述置信度以及所述提升度各自对应的权重,对所述支持度、所述置信度以及所述提升度进行加权求和,得到所述有向边的权重。
7.根据权利要求6所述的方法,其特征在于,所述确定产生有向边的起始节点所表征的当前告警数据,对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度,包括:
确定所述当前周期之前的各个历史周期,获取各个历史周期的历史告警事件;所述历史告警事件中包括至少两个历史告警数据,每个历史告警事件中的至少两个历史告警数据是同一历史周期内、所述网络云中不同的网元产生的、不同的告警数据;
确定每个历史告警数据在所有历史告警事件中的发生次数,基于各个历史告警数据的发生次数,从各个历史告警事件所包括的各个历史告警数据中确定至少一个目标历史告警数据;所述至少一个目标历史告警数据组成的集合为各个历史告警事件的最大频繁项集;
若确定各个目标历史告警数据中存在第一目标历史告警数据和第二目标历史告警数据,所述第一目标历史告警数据和所述有向边的起始节点表征的当前告警数据相同,所述第二目标历史告警数据和所述有向边的终止节点表征的当前告警数据相同,则基于各个历史告警事件确定产生第一目标历史告警数据对产生第二目标历史告警数据的支持度、置信度以及提升度;
将产生第一目标历史告警数据对产生第二目标历史告警数据的支持度、置信度以及提升度,分别作为产生有向边的起始节点所表征的当前告警数据对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度。
8.根据权利要求7所述的方法,其特征在于,所述从各个历史告警事件所包括的各个历史告警数据中确定至少一个目标历史告警数据,之后还包括:
若确定各个目标历史告警数据中不存在所述第一目标历史告警数据或所述第二目标历史告警数据,则将第一预设值、第二预设值以及第三预设值分别作为产生有向边的起始节点所表征的当前告警数据对产生有向边的终止节点表征的当前告警数据的支持度、置信度以及提升度。
9.根据权利要求1所述的方法,其特征在于,所述生成所述当前告警事件对应的目标有向图,包括:
对于所述当前告警事件对应的目标子拓扑图,将所述目标子拓扑图中除目标网元之外的其他网元去除;
将去除其他网元的目标子拓扑图转换为初始有向图,修改所述初始有向图中各节点表征的目标网元为所述目标网元对应的当前告警数据。
10.一种告警根因的定位装置,其特征在于,包括:
当前告警数据获取模块,用于在当前周期内,从网络云中确定至少一个目标网元,所述目标网元为产生当前告警数据的网元;获取各个目标网元的当前告警数据;
拓扑图分割模块,用于获取所述网络云的拓扑图,所述拓扑图包括用于表征网元的节点,节点之间的连线用于表征网元之间的连接关系,对所述拓扑图进行分割,得到至少一个目标子拓扑图;所述目标子拓扑图中包括至少一个用于表征目标网元的节点;两两目标子拓扑图之间以预设数量的正常网元为间隔,所述正常网元为未产生当前告警数据的网元;
当前告警事件生成模块,用于对于每个目标子拓扑图,将所述目标子拓扑图中各个目标网元的当前告警数据作为一个当前告警事件;所述当前告警事件包括至少一个当前告警数据;
有向图确定模块,用于对于每个当前告警事件,生成所述当前告警事件对应的目标有向图,并确定所述有向图中各个有向边的权重;所述目标有向图的节点表征所述当前告警事件中的当前告警数据,所述有向边的起始节点和终止节点之间的方向表征起始节点对应的当前告警数据的产生导致终止节点对应的当前告警数据的产生;所述有向边的权重用于表征:产生有向边的起始节点所表征的当前告警数据,对产生有向边终止节点表征的当前告警数据的影响概率;
告警根因定位模块,用于对于每个目标有向图,根据所述目标有向图中的节点数量以及各条有向边的权重中的至少一种,从所述目标有向图的各个节点中确定目标节点,将所述目标节点对应的当前告警数据作为所述当前告警事件的告警根因。
11.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-9任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-9任一项所述方法的步骤。
CN202310919638.4A 2023-07-25 2023-07-25 告警根因的定位方法、装置、电子设备及可读存储介质 Pending CN116723090A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310919638.4A CN116723090A (zh) 2023-07-25 2023-07-25 告警根因的定位方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310919638.4A CN116723090A (zh) 2023-07-25 2023-07-25 告警根因的定位方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN116723090A true CN116723090A (zh) 2023-09-08

Family

ID=87868080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310919638.4A Pending CN116723090A (zh) 2023-07-25 2023-07-25 告警根因的定位方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN116723090A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116962080A (zh) * 2023-09-19 2023-10-27 中孚信息股份有限公司 基于网络节点风险评估的告警过滤方法、系统及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116962080A (zh) * 2023-09-19 2023-10-27 中孚信息股份有限公司 基于网络节点风险评估的告警过滤方法、系统及介质
CN116962080B (zh) * 2023-09-19 2023-12-15 中孚信息股份有限公司 基于网络节点风险评估的告警过滤方法、系统及介质

Similar Documents

Publication Publication Date Title
US20120150860A1 (en) Clustering with Similarity-Adjusted Entropy
CN112800915A (zh) 建筑物变化检测方法、装置、电子设备以及存储介质
CN110633594A (zh) 一种目标检测方法和装置
CN104008420A (zh) 一种基于自动编码机的分布式离群点检测方法及系统
CN116723090A (zh) 告警根因的定位方法、装置、电子设备及可读存储介质
CN116881430A (zh) 一种产业链识别方法、装置、电子设备及可读存储介质
CN109657060B (zh) 安全生产事故案例推送方法及系统
CN113301673B (zh) 无线传感网络的分布式滤波方法、装置、设备及存储介质
CN113657596B (zh) 训练模型和图像识别的方法和装置
CN113449062B (zh) 轨迹处理方法、装置、电子设备和存储介质
CN114429801A (zh) 数据处理方法、训练方法、识别方法、装置、设备及介质
CN111694995B (zh) 一种关系网络的优化方法、装置及处理设备
CN117271098B (zh) 一种ai模型计算核调度方法、装置、设备及存储介质
CN115391160B (zh) 一种异常变更检测方法、装置、设备及存储介质
CN111309331B (zh) 业务处理方法及装置、电子设备、存储介质
CN113850499B (zh) 一种数据处理方法、装置、电子设备和存储介质
CN115543991B (zh) 基于特征抽样的数据修复方法、装置及相关设备
CN116468985B (zh) 模型训练方法、质量检测方法、装置、电子设备及介质
US20210209625A1 (en) Demand forecasting with large collections of time series data
CN114357783A (zh) 一种半导体生产的仿真方法、装置、设备及介质
CN117935300A (zh) 模型训练、目标检测方法、电子设备及计算机存储介质
CN115204683A (zh) 数字城市全项支撑系统、计算机及数字城市全项支撑设备
CN117649241A (zh) 基于大模型的企业标签预测优化方法、装置、设备及介质
CN116049149A (zh) 风电机组异常数据清洗方法及装置
CN115695542A (zh) 目标信息确定方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination