CN116032725A - 故障根因定位模型的生成方法及装置 - Google Patents
故障根因定位模型的生成方法及装置 Download PDFInfo
- Publication number
- CN116032725A CN116032725A CN202211682658.6A CN202211682658A CN116032725A CN 116032725 A CN116032725 A CN 116032725A CN 202211682658 A CN202211682658 A CN 202211682658A CN 116032725 A CN116032725 A CN 116032725A
- Authority
- CN
- China
- Prior art keywords
- alarm
- root cause
- data
- fault
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000012549 training Methods 0.000 claims abstract description 60
- 238000012545 processing Methods 0.000 claims description 55
- 238000000605 extraction Methods 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000005065 mining Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007418 data mining Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Landscapes
- Alarm Systems (AREA)
Abstract
本发明公开了一种故障根因定位模型的生成方法及装置,该方法包括:获取历史告警数据作为样本数据,构建训练集,其中,历史告警数据与告警对象对应,告警对象包括业务平台中的任意一个或多个网络设备;根据训练集,生成告警关联规则,其中,告警关联规则用于表示多个告警对象生成的告警之间的关联关系;根据告警关联规则,训练得到目标故障根因定位模型,其中,目标故障根因定位模型用于基于告警对象之间的故障传播关系,以定位告警对象发生故障的故障根因。
Description
5技术领域
本发明涉及计算机技术领域,具体涉及一种故障根因定位模型的生成方法、故障根因定位方法、装置、电子设备及计算机可读介质。
背景技术
0随着通信网络的快速发展,大规模的网络中每天都会因为突发故障产生数据量庞大的告警消息,当网络设备突发故障并引发告警时,与之相关联的设备或业务过程都会发出相关的告警信息,大量的告警信息叠加起来使得识别定位故障的根本原因变得十分困难。当前,网络告警的监控和管理主要依靠人工完成,但其维护成本高,处理过程5又十分耗时,在发生大量故障告警时,监控平台派单不精准,人工定位故障困难,定位故障时间久,基本无法保障告警处理的实时性,同时也缺少对历史故障的经验沉淀。
发明内容
0为此,本发明提供一种故障根因定位模型的生成方法,以解决相关技术中可能存在的故障根因定位困难以及准确率低的问题。
为了实现上述目的,本发明第一方面提供一种故障根因定位模型的生成方法,该方法包括:
获取历史告警数据作为样本数据,构建训练集,其中,所述历5史告警数据与告警对象对应,所述告警对象包括业务平台中的任意一个或多个网络设备;
根据所述训练集,生成告警关联规则,其中,所述告警关联规则用于表示多个告警对象生成的告警之间的关联关系;
根据所述告警关联规则,训练得到目标故障根因定位模型,其0中,所述目标故障根因定位模型用于基于告警对象之间的故障传播关系,以定位告警对象发生故障的故障根因。
可选地,所述根据所述训练集,生成告警关联规则,包括:对所述训练集中的样本数据进行标准化处理和预处理,得到目标样本数据,其中,所述标准化处理用于基于所述样本数据对应的标准化规则5对所述样本数据进行资源定位以及对所述样本数据中的告警级别进行归一化处理;对所述目标样本数据进行特征提取处理,得到与所述目标样本数据对应的告警特征值;对所述告警特征值进行打标签处理,其中,所述打标签处理用于对所述告警特征值进行告警归类;根据所述打标签处理后的告警特征值,生成告警项集;根据所述告警项集,0生成所述告警关联规则。
可选地,所述根据所述告警项集,生成所述告警关联规则,包括:根据预设支持度和/或预设置信度,对所述告警项集进行告警关联度挖掘处理,生成告警频繁项集;根据所述告警频繁项集,生成所述告警关联规则。
5可选地,所述对所述目标样本数据进行特征提取处理,得到与所述目标样本数据对应的告警特征值,包括:获取所述目标样本数据所归属的业务系统的系统信息;根据所述系统信息、所述目标样本数据对应的告警资源以及告警标题,生成所述告警特征值。
可选地,所述对所述告警特征值进行打标签处理,包括:获取0每一告警特征值对应的历史告警数据的告警标题,以及获取所述历史告警数据所对应的资源信息;根据所述告警标题和所述资源信息,确定所述告警特征值所属的告警类别,并将所述告警类别作为所述告警特征值的标签。
可选地,所述根据所述告警关联规则,训练得到目标故障根因5定位模型,包括:对所述告警关联规则中的各告警特征值进行特征计算处理,得到第一特征值;以及,对所述告警关联规则对应的文本进行语义特征提取处理,得到第二特征值;对所述第一特征值和所述第二特征值进行特征串联处理,得到目标特征值;使用所述目标特征值训练得到目标故障根因定位模型。
0为了实现上述目的,本发明第二方面提供一种故障根因定位方法,该方法包括:
获取待处理的告警数据;
将所述告警数据输入目标故障根因定位模型中,获得故障定位根因,其中,所述目标故障根因定位模型是根据第一方面任意一项所述的方法生成的。
为了实现上述目的,本发明第三方面还提供一种故障根因定位模型的生成装置,该装置包括:
构建模块,用于获取历史告警数据作为样本数据,构建训练集,其中,所述历史告警数据与告警对象对应,所述告警对象包括业务平台中的任意一个或多个网络设备;
生成模块,用于根据所述训练集,生成告警关联规则,其中,所述告警关联规则用于表示多个告警对象生成的告警之间的关联关系;
训练模块,用于根据所述告警关联规则,训练得到目标故障根因定位模型,其中,所述目标故障根因定位模型用于基于告警对象之间的故障传播关系,以定位告警对象发生故障的故障根因。
为了实现上述目的,本发明第四方面还提供一种故障根因定位装置,该装置包括:
获取模块,用于获取待处理的告警数据;
定位模块,用于将所述告警数据输入目标故障根因定位模型中,获得故障定位根因,其中,所述目标故障根因定位模型是根据第一方面任意一项所述的方法生成的。
为了实现上述目的,本发明第五方面还提供一种电子设备,包括:
一个或多个处理器;
存储器,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明第一方面或第二方面中任意一项所述的方法;
一个或多个I/O接口,连接在所述处理器与存储器之间,配置为实现所述处理器与存储器的信息交互。
为了实现上述目的,本发明第六方面还提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明第一方面或第二方面中任意一项所述的方法。
本发明具有如下优点:根据本发明实施例,通过获取历史告警数据作为样本数据,构建训练集,并根据该训练集进行数据挖掘生成用于表示多个告警对象生成的告警之间的关联关系的告警关联规则,之后,基于该告警关联规则即可训练得到用于基于告警对象之间的故障传播关系以定位故障根因的目标故障根因定位模型,基于该目标故障根因定位模型即可快速且准确的定位告警数据对应的故障根因。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。
图1为本发明实施例提供的一种故障根因定位模型的生成方法的流程示意图;
图2为本发明实施例提供的故障根因定位方法的流程示意图;
图3为本发明实施例提供的一种故障根因定位模型的生成装置的组成方框图;
图4为本发明实施例提供的一种故障根因定位装置的组成方框图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序;并且,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互任意组合。
如本发明所使用的,术语“和/或”包括一个或多个相关列举条目的任何和全部组合。
本发明所使用的术语仅用于描述特定实施例,且不意欲限制本发明。如本发明所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。
当本发明中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或其群组。
除非另外限定,否则本发明所用的全部术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本发明的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本发明明确如此限定。
针对相关技术因为大量告警数据叠加而使得定位故障的根本原因比较耗时、困难且准确度不够高的问题,本发明实施例提供了一种故障根因定位模型的生成方法,以生成用于快速且准确的定位告警数据的根本原因的目标故障根因定位模型。请参看图1,其为本发明实施例提供的一种故障根因定位模型的生成方法的流程示意图。该方法可以由电子设备设施,该电子设备可以为服务器,例如,可以是物理服务器,例如可以为刀片服务器、机架式服务器等,或者也可以是虚拟服务器,例如可以是部署在云端的服务器集群;当然,该电子设备也可以为终端设备,此处不做特殊限定。
如图1所述,本发明实施例提供的故障根因定位模型的生成方法可以包括如下步骤S101-S103,以下予以详细说明。
步骤S101,获取历史告警数据作为样本数据,构建训练集,其中,历史告警数据与告警对象对应,告警对象包括业务平台中的任意一个或多个网络设备。
本发明实施例中的告警数据,可以是通信网络中的告警对象针对发生故障的网络设备而生成的告警类型的数据。告警数据可以包括告警标识、告警标题、告警级别、告警内容、归属业务系统以及归属地域等数据项中的一项或多项。
告警对象可以为通信网络中的一个或多个网络设备,告警对象可以为发生故障的网络设备自身,或者也可以为与发生故障的网络设备存在关联关系,例如,存在业务关联的其他网络设备、检测设备或者业务平台中的某一业务应用,此处不做特殊限定。
在本发明实施例中,为了生成用于快速且准确地定位故障根因的目标故障根因定位模型,可以按照预设机制,例如,按照固定时间间隔抽取业务平台中的各种告警对象生成的历史告警数据作为样本数据,构建用于训练该模型的训练集。
可以理解的是,为了方便后续处理,针对各类不规则的历史告警数据,例如,SNMPTRAP数据、SYSLOG数据以及其他外接告警数据,可以将其进行统一格式转换处理,以转化成方便后续进行处理的标准化格式的数据。
步骤S102,根据训练集,生成告警关联规则,其中,告警关联规则用于表示多个告警对象生成的告警之间的关联关系。
在根据以上步骤S101按照预设机制,例如定期抽取历史告警数据构建训练集之后,可以通过对该训练集中的样本数据进行数据分析和数据挖掘,以生成用于表述多个告警对象生成的告警之间的关联关系的告警关联规则。
例如,告警关联规则可以是表示若网络设备1发生故障并生成告警,则网络设备2和网络设备3也会同时生成同样的告警的规则。当然,此处仅为举例说明,在实际实施时,告警关联规则也可以为其它形式的用于表示告警对象生成的告警之间的关联关系或者传导关系的规则,此处不做特殊限定。
需要说明的是,在本发明实施例中,基于以历史告警数据构建的训练集所生成的告警关联规则可以为多条,该多条告警关联规则可以各自与不同的告警对象对应,或者,也可以与相同的告警对象,此处不做特殊限定。
步骤S103,根据告警关联规则,训练得到目标故障根因定位模型,其中,目标故障根因定位模型用于基于告警对象之间的故障传播关系,以定位告警对象发生故障的故障根因。
在根据步骤S102基于训练集生成一条或者多条告警关联规则之后,可以通过对该一条或者多条告警关联规则进行特征提取处理,并基于提取得到的特征值对初始的故障根因定位模型进行监督训练,即可得到目标故障根因定位模型。
需要说明的是,在本发明实施例中,该目标故障根因定位模型可以表现为一条或者多条故障传播链规则,该故障传播链规则可以基于资源,即导致生成告警的资源之间关联关系生成的、用于表示告警对象之间的故障传播关系的规则数据。
可见,本发明实施例提供的故障根因定位模型的生成方法,通过获取历史告警数据作为样本数据,构建训练集,并根据该训练集进行数据挖掘生成用于表示多个告警对象生成的告警之间的关联关系的告警关联规则,之后,基于该告警关联规则即可训练得到用于基于告警对象之间的故障传播关系以定位故障根因的目标故障根因定位模型,基于该目标故障根因定位模型即可快速且准确的定位告警数据对应的故障根因;同时对其他业务也具有可拓展性,进而还能够提升网络运维的准确性和全面性。
在本发明实施例中,上述步骤S102的根据训练集,生成告警关联规则,包括:对训练集中的样本数据进行标准化处理和预处理,得到目标样本数据,其中,标准化处理用于基于样本数据对应的标准化规则对样本数据进行资源定位以及对样本数据中的告警级别进行归一化处理;对目标样本数据进行特征提取处理,得到与目标样本数据对应的告警特征值;对告警特征值进行打标签处理,其中,打标签处理用于对告警特征值进行告警归类;根据打标签处理后的告警特征值,生成告警项集;根据告警项集,生成告警关联规则。
即,针对抽取历史告警数据作为样本数据构建的训练集,考虑到历史告警数据的来源不同其数据格式可能也不同,因此,针对训练集中的每一样本数据,即每一历史告警数据,可以根据其告警来源获取与该历史告警数据对应的标准化规则,以根据该标准化规则,对其进行标准化格式转换处理,并对其进行资源定位,即,定位该历史告警数据来自哪一资源对象,例如,来自哪一硬件设备资源或者网络资源。当然,考虑到不同数据来源的历史告警数据中的告警级别可能并不统一,因此还可以根据该标准化规则对历史告警数据的告警级别进行统一转换。
在对样本数据进行标准化处理之后,针对告警标准化后的样本数据,可以对其进行预处理以生成目标样本数据。在本发明实施例中,所述预处理可以为告警屏蔽处理,即,针对经过告警标准化后的样本数据,可以依据告警规则,对其进行告警的新增、清除、升降、压制、通知以及存储等处理过程。
其中,告警新增处理,是指将新增的告警导入活动告警,同时新增告警匹配通知规则;
告警清除处理,是指如果存在原来的活动告警,则将原来缓存中的对应告警移除到历史告警中,同时清除该告警;
告警更新处理可以分为告警升级处理和告警降级处理,告警升级处理是指更新缓存中活动告警,同时去匹配通知规则;告警降级处理是指更新缓存中活动告警,如果之前从未升级过,就去匹配通知规则,如果告警级别相同,则判断其是否为可恢复类型,如果是可恢复类型,则只在第一次匹配通知规则,后续仅累加次数;如果是不可恢复类型,则每次都去匹配通知规则,并且每次告警都是不同的。
在对训练集中的样本数据进行标准化处理以及预处理得到目标样本数据之后,所述对目标样本数据进行特征提取处理,得到与目标样本数据对应的告警特征值,可以是对每一目标样本数据中的告警标题、告警资源、资源类型、告警内容、告警级别、发生次数、归属业务系统以及归属地域等数据项中的一项或多项内容均进行特征化处理,以通过特征值表示每一告警到底属于哪一类特征告警。
在本发明实施例中,优选地,所述对目标样本数据进行特征提取处理,得到与目标样本数据对应的告警特征值,可以为:获取目标样本数据所归属的业务系统的系统信息;根据该系统信息、该目标样本数据对应的告警资源以及告警标题,生成告警特征值。
在一些实施例中,所述对告警特征值进行打标签处理,可以为:获取每一告警特征值对应的历史告警数据的告警标题,以及获取历史告警数据所对应的资源信息;根据告警标题和资源信息,确定告警特征值所属的告警类别,并将告警类别作为告警特征值的标签。
即,针对生成的告警特征值,可以获取其对应的告警历史数据的告警标题以及其对应的资源信息,只要是同一个资源产生的告警标题相同的告警,则都将其对应的告警特征值标记为同一类告警。
在对告警特征值进行打标处理之后,可以通过对训练集中的历史告警数据,即样本数据按照其告警时间分片,并将同一时间段内出现过的告警特征值写入同一告警项集中,以得到多个告警项集,例如,可以取时间窗口长度为1小时,窗口按每10分钟滑动一次,将每次滑动得到的时间窗口内的历史告警数据对应的告警特征值写入一告警项集。
在本发明实施例中,所述根据告警项集,生成告警关联规则,包括:根据预设支持度和/或预设置信度,对告警项集进行告警关联度挖掘处理,生成告警频繁项集;根据告警频繁项集,生成告警关联规则。
需要说明的是,为了减少数据处理量,在实施本步骤之前,还可以先对告警项集进行过滤处理,该过滤处理可以为:获取预设资源关联关系数据,根据该预设资源关联关系数据,对告警项集进行过滤处理。
即,可以根据预设的用于表示资源之间的关联关系的资源关联关系数据,判断上述在同一时间段内导致产生告警的各个资源是否存在着关联关系,若在关系深度为预设深度,例如3的情况下,告警项集中的某一资源仍与其他资源无关联性,则可以从该告警项集中删除由该资源所生成的所有告警特征值。
在对告警项集进行过滤处理之后,可以根据过滤后的告警项集,生成告警频繁项集,以根据该告警频繁项集,生成告警关联规则。
具体地,可以以告警项集为数据源,使用关联度挖掘算法,例如Apriori算法计算得到告警频繁项集,进而计算得到告警关联规则。
其中,该预设支持度例如可以为3,该预设置信度例如可以为0.8;当然,此处仅为举例说明,在实际实施时,该些数值可以根据需要进行设置,例如,可以根据实时的运维需求进行调整,此处不做特殊限定。另外,在生成告警频繁项集时,还可以根据预设不平衡比(IR,Imbalance Ratio)度或者其他指标进行该生成处理,此处不做特殊限定。
在生成告警频繁项集之后,可以将得到的每一告警频繁项集和其对应的指标,例如上述预设支持度、预设置信度以及预设IR度作为一条告警关联规则写入数据库进行存储;其中,在每一条告警关联规则入库的同时,还可以同时增加规则写入时间、训练批次、状态等数据项,此处不做特殊限定。
在本发明实施例中,上述步骤S103中所述的根据告警关联规则,训练得到目标故障根因定位模型,包括:对告警关联规则中的各告警特征值进行特征计算处理,得到第一特征值;以及,对告警关联规则对应的文本进行语义特征提取处理,得到第二特征值;对第一特征值和第二特征值进行特征串联处理,得到目标特征值;使用目标特征值进行训练,生成目标故障根因定位模型。
即,可以对告警关联规则中的支持度、置信度以及告警特征值等特征进行特征计算处理,得到一第一特征值,同时还可以对告警关联规则对应的文本,例如其对应的一条或多条样本数据中的文本进行文本匹配,例如,输入预先训练得到的SimCSE模型中进行处理,生成一个多维,例如64维的语义特征作为第二特征值;之后将该第一特征值和该第二特征值串联作为当前告警关联规则的目标特征值,并基于该目标特征值进行监督训练,即可生成目标故障根因定位模型。
与上述实施例相对应,本发明实施例还提供一种故障根因定位方法,请参看图2,其为本发明实施例提供的故障根因定位方法的流程示意图。该方法可以应用于电子设备中,该电子设备可以为服务器,或者也可以为终端设备,此处不做特殊限定。
如图2所示,本发明实施例提供的故障根因定位方法包括如下步骤S201-S202:
步骤S201,获取待处理的告警数据。
该告警数据可以为活动告警消息队列中的任意一告警数据。即,5在本发明实施例中,在进行故障根因定位处理时,为避免单位时间内因为数据处理量大而导致系统堵塞的问题,可以将所有待进行故障根因定位的告警数据放入一消息队列,并由电子设备按照预设机制从该消息队列中获取一告警数据作为当前待处理的告警数据。
步骤S202,将告警数据输入目标故障根因定位模型中,获得故0障定位根因,其中,目标故障根因定位模型是根据以上实施例中的故障根因定位模型的生成方法生成的。
针对待处理的告警数据,可以将该告警数据输入目标故障根因定位模型中,若该目标故障根因定位模型中存在与该告警数据对应的故障传播关系,则可以由该目标故障根因定位模型直接输出故障定位5根因。
可见,本发明实施例提供的故障根因定位方法,针对待进行故障根因定位的告警数据,通过将其输入至预先训练得到的目标故障根因定位模型中,由于该目标故障根因定位模型是通过自动分析告警之间的传导关系而得到的用于基于告警对象之间的故障传播关系,以定0位故障根因的模型,因此,基于该目标故障根因定位模型即可快速且准确地得到故障定位根因。
另外,还需要说明的是,以上各方法实施例中各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专5利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明实施例还提供一种故障根因定位模型的生成装置,如图3所示,该装置300包括:构建模块301、生成模块302和训练模块303。0该构建模块301,用于获取历史告警数据作为样本数据,构建训练集,其中,历史告警数据与告警对象对应,告警对象包括业务平台中的任意一个或多个网络设备。
该生成模块302,用于根据训练集,生成告警关联规则,其中,告警关联规则用于表示多个告警对象生成的告警之间的关联关系。
该训练模块303,用于根据告警关联规则,训练得到目标故障根因定位模型,其中,目标故障根因定位模型用于基于告警对象之间的故障传播关系,以定位告警对象发生故障的故障根因。
在一些实施例中,该生成模块302在根据训练集,生成告警关联规则时,可以用于:对训练集中的样本数据进行标准化处理和预处理,得到目标样本数据,其中,标准化处理用于基于样本数据对应的标准化规则对样本数据进行资源定位以及对样本数据中的告警级别进行归一化处理;对目标样本数据进行特征提取处理,得到与目标样本数据对应的告警特征值;对告警特征值进行打标签处理,其中,打标签处理用于对告警特征值进行告警归类;根据打标签处理后的告警特征值,生成告警项集;根据告警项集,生成告警关联规则。
在一些实施例中,该生成模块302在据告警项集,生成告警关联规则时,可以用于:根据预设支持度和/或预设置信度,对告警项集进行告警关联度挖掘处理,生成告警频繁项集;根据告警频繁项集,生成告警关联规则。
在一些实施例中,该生成模块302在对目标样本数据进行特征提取处理,得到与目标样本数据对应的告警特征值时,可以用于:获取目标样本数据所归属的业务系统的系统信息;根据系统信息、目标样本数据对应的告警资源以及告警标题,生成告警特征值。
在一些实施例中,该生成模块302在对告警特征值进行打标签处理时,可以用于:获取每一告警特征值对应的历史告警数据的告警标题,以及获取历史告警数据所对应的资源信息;根据告警标题和资源信息,确定告警特征值所属的告警类别,并将告警类别作为告警特征值的标签。
在一些实施例中,该训练模块303在根据告警关联规则,训练得到目标故障根因定位模型时,可以用于:对告警关联规则中的各告警特征值进行特征计算处理,得到第一特征值;以及,对告警关联规则对应的文本进行语义特征提取处理,得到第二特征值;对第一特征值和第二特征值进行特征串联处理,得到目标特征值;使用目标特征值训练得到目标故障根因定位模型。
本发明实施例还提供一种故障根因定位装置,如图4所示,该装置400包括:获取模块401和定位模块402。
该获取模块401,用于获取待处理的告警数据。
该定位模块402,用于将告警数据输入目标故障根因定位模型中,获得故障定位根因,其中,目标故障根因定位模型是根据故障根因定位模型的生成方法生成的。
本发明实施例提供的装置具有的功能或包含的模块可以用于执行上文对应方法实施例描述的方法,其具体实现和技术效果可参照上文方法实施例的描述,为了简洁,这里不再赘述。
需要说明的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明实施例提供一种电子设备,其包括:
一个或多个处理器501;
存储器502,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述实施例中任意一项的故障根因定位模型的生成方法或者故障根因定位方法;
一个或多个I/O接口503,连接在处理器与存储器之间,配置为实现处理器与存储器的信息交互。
其中,处理器501为具有数据处理能力的器件,其包括但不限于中央处理器(CPU)等;存储器502为具有数据存储能力的器件,其包括但不限于随机存取存储器(RAM,更具体如SDRAM、DDR等)、只读存储器(ROM)、带电可擦可编程只读存储器(EEPROM)、闪存(FLASH);I/O接口(读写接口)503连接在处理器501与存储器502间,能实现处理器501与存储器502的信息交互,其包括但不限于数据总线(Bus)等。
在一些实施例中,处理器501、存储器502和I/O接口503通过总线相互连接,进而与计算设备的其它组件连接。
本发明实施例还提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述实施例中任意一项的故障根因定位模型的生成方法或者故障根因定位方法,为避免重复描述,在此不再赘述具体步骤。
本领域普通技术人员可以理解,上文中所发明方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其它数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储器、或者可以用于存储期望的信息并且可以被计算机访问的任何其它的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其它传输机制之类的调制数据信号中的其它数据,并且可包括任何信息递送介质。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明实施例的范围之内并且形成不同的实施例。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
Claims (10)
1.一种故障根因定位模型的生成方法,其特征在于,包括:
获取历史告警数据作为样本数据,构建训练集,其中,所述历史告警数据与告警对象对应,所述告警对象包括业务平台中的任意一个或多个网络设备;
根据所述训练集,生成告警关联规则,其中,所述告警关联规则用于表示多个告警对象生成的告警之间的关联关系;
根据所述告警关联规则,训练得到目标故障根因定位模型,其中,所述目标故障根因定位模型用于基于告警对象之间的故障传播关系,以定位告警对象发生故障的故障根因。
2.根据权利要求1所述的方法,其特征在于,所述根据所述训练集,生成告警关联规则,包括:
对所述训练集中的样本数据进行标准化处理和预处理,得到目标样本数据,其中,所述标准化处理用于基于所述样本数据对应的标准化规则对所述样本数据进行资源定位以及对所述样本数据中的告警级别进行归一化处理;
对所述目标样本数据进行特征提取处理,得到与所述目标样本数据对应的告警特征值;
对所述告警特征值进行打标签处理,其中,所述打标签处理用于对所述告警特征值进行告警归类;
根据所述打标签处理后的告警特征值,生成告警项集;
根据所述告警项集,生成所述告警关联规则。
3.根据权利要求2所述的方法,其特征在于,所述根据所述告警项集,生成所述告警关联规则,包括:
根据预设支持度和/或预设置信度,对所述告警项集进行告警关联度挖掘处理,生成告警频繁项集;
根据所述告警频繁项集,生成所述告警关联规则。
4.根据权利要求2所述的方法,其特征在于,所述对所述目标样本数据进行特征提取处理,得到与所述目标样本数据对应的告警特征值,包括:
获取所述目标样本数据所归属的业务系统的系统信息;
根据所述系统信息、所述目标样本数据对应的告警资源以及告警标题,生成所述告警特征值。
5.根据权利要求2所述的方法,其特征在于,所述对所述告警特征值进行打标签处理,包括:
获取每一告警特征值对应的历史告警数据的告警标题,以及获取所述历史告警数据所对应的资源信息;
根据所述告警标题和所述资源信息,确定所述告警特征值所属的告警类别,并将所述告警类别作为所述告警特征值的标签。
6.根据权利要求1所述的方法,其特征在于,所述根据所述告警关联规则,训练得到目标故障根因定位模型,包括:
对所述告警关联规则中的各告警特征值进行特征计算处理,得到第一特征值;以及,
对所述告警关联规则对应的文本进行语义特征提取处理,得到第二特征值;
对所述第一特征值和所述第二特征值进行特征串联处理,得到目标特征值;
使用所述目标特征值训练得到目标故障根因定位模型。
7.一种故障根因定位方法,其特征在于,包括:
获取待处理的告警数据;
将所述告警数据输入目标故障根因定位模型中,获得故障定位根因,其中,所述目标故障根因定位模型是根据权利要求1-6任意一项所述的方法生成的。
8.一种故障根因定位模型的生成装置,其特征在于,包括:
构建模块,用于获取历史告警数据作为样本数据,构建训练集,其中,所述历史告警数据与告警对象对应,所述告警对象包括业务平台中的任意一个或多个网络设备;
生成模块,用于根据所述训练集,生成告警关联规则,其中,所述告警关联规则用于表示多个告警对象生成的告警之间的关联关系;
训练模块,用于根据所述告警关联规则,训练得到目标故障根因定位模型,其中,所述目标故障根因定位模型用于基于告警对象之间的故障传播关系,以定位告警对象发生故障的故障根因。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现权利要求1-7中任意一项所述的方法;
一个或多个I/O接口,连接在所述处理器与存储器之间,配置为实现所述处理器与存储器的信息交互。
10.一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现权利要求1-7中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211682658.6A CN116032725B (zh) | 2022-12-27 | 2022-12-27 | 故障根因定位模型的生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211682658.6A CN116032725B (zh) | 2022-12-27 | 2022-12-27 | 故障根因定位模型的生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116032725A true CN116032725A (zh) | 2023-04-28 |
CN116032725B CN116032725B (zh) | 2024-06-11 |
Family
ID=86069970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211682658.6A Active CN116032725B (zh) | 2022-12-27 | 2022-12-27 | 故障根因定位模型的生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116032725B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116627695A (zh) * | 2023-05-24 | 2023-08-22 | 北京优特捷信息技术有限公司 | 一种告警事件根因推荐方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111726248A (zh) * | 2020-05-29 | 2020-09-29 | 北京宝兰德软件股份有限公司 | 一种告警根因定位方法及装置 |
CN112100369A (zh) * | 2020-07-29 | 2020-12-18 | 浙江大学 | 结合语义的网络故障关联规则生成方法和网络故障检测方法 |
CN112507720A (zh) * | 2020-11-12 | 2021-03-16 | 西安交通大学 | 基于因果语义关系传递的图卷积网络根因识别方法 |
CN113360350A (zh) * | 2020-03-03 | 2021-09-07 | 中国移动通信集团贵州有限公司 | 定位网络设备根因告警的方法、装置、设备和存储介质 |
WO2022100108A1 (zh) * | 2020-11-16 | 2022-05-19 | 华为技术有限公司 | 处理故障的方法、装置及系统 |
CN115114343A (zh) * | 2021-03-18 | 2022-09-27 | 北京神州泰岳软件股份有限公司 | 根因规则建立方法、根因分析方法和装置 |
CN115174355A (zh) * | 2022-07-26 | 2022-10-11 | 杭州东方通信软件技术有限公司 | 故障根因定位模型的生成方法,故障根因定位方法和装置 |
-
2022
- 2022-12-27 CN CN202211682658.6A patent/CN116032725B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360350A (zh) * | 2020-03-03 | 2021-09-07 | 中国移动通信集团贵州有限公司 | 定位网络设备根因告警的方法、装置、设备和存储介质 |
CN111726248A (zh) * | 2020-05-29 | 2020-09-29 | 北京宝兰德软件股份有限公司 | 一种告警根因定位方法及装置 |
CN112100369A (zh) * | 2020-07-29 | 2020-12-18 | 浙江大学 | 结合语义的网络故障关联规则生成方法和网络故障检测方法 |
CN112507720A (zh) * | 2020-11-12 | 2021-03-16 | 西安交通大学 | 基于因果语义关系传递的图卷积网络根因识别方法 |
WO2022100108A1 (zh) * | 2020-11-16 | 2022-05-19 | 华为技术有限公司 | 处理故障的方法、装置及系统 |
CN115114343A (zh) * | 2021-03-18 | 2022-09-27 | 北京神州泰岳软件股份有限公司 | 根因规则建立方法、根因分析方法和装置 |
CN115174355A (zh) * | 2022-07-26 | 2022-10-11 | 杭州东方通信软件技术有限公司 | 故障根因定位模型的生成方法,故障根因定位方法和装置 |
Non-Patent Citations (2)
Title |
---|
WENHONG BAO; QIAN FANG; PIN WANG; WENQI YAN; PENG PAN: "A Fault Location Method for Active Distribution Network with DGs", IEEE, 12 July 2021 (2021-07-12) * |
国悦婷;刘磊;张星;: "基于Apriori算法的时序关联关系数据挖掘装置的实现", 计算机与数字工程, no. 02, 20 February 2018 (2018-02-20) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116627695A (zh) * | 2023-05-24 | 2023-08-22 | 北京优特捷信息技术有限公司 | 一种告警事件根因推荐方法、装置、设备及存储介质 |
CN116627695B (zh) * | 2023-05-24 | 2024-05-14 | 北京优特捷信息技术有限公司 | 一种告警事件根因推荐方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116032725B (zh) | 2024-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110661659B (zh) | 一种告警方法、装置、系统及电子设备 | |
EP3798846B1 (en) | Operation and maintenance system and method | |
CN111522704A (zh) | 告警信息处理方法、装置、计算机装置及存储介质 | |
CN113282461B (zh) | 传输网的告警识别方法和装置 | |
CN109471783B (zh) | 预测任务运行参数的方法和装置 | |
US10628250B2 (en) | Search for information related to an incident | |
CN109992484B (zh) | 一种网络告警相关性分析方法、装置和介质 | |
CN111427748A (zh) | 任务告警方法、系统、设备及存储介质 | |
CN104158682A (zh) | 一种基于贡献度的同步数字体系sdh故障定位方法 | |
CN110909363A (zh) | 基于大数据的软件第三方组件漏洞应急响应系统及方法 | |
CN112183782A (zh) | 故障工单处理方法及设备 | |
CN116032725B (zh) | 故障根因定位模型的生成方法及装置 | |
CN114911800A (zh) | 电力系统的故障预测方法、装置以及电子设备 | |
CN110716804A (zh) | 无用资源的自动删除方法、装置、存储介质及电子设备 | |
CN112306820A (zh) | 一种日志运维根因分析方法、装置、电子设备及存储介质 | |
CN116841779A (zh) | 异常日志检测方法、装置、电子设备和可读存储介质 | |
CN114090372A (zh) | 一种故障处理的方法和装置 | |
CN115408236A (zh) | 一种日志数据审计系统、方法、设备及介质 | |
CN114443738A (zh) | 异常数据挖掘方法、装置、设备及介质 | |
CN113254269A (zh) | 一种存储系统异常事件修复的方法、系统、设备和介质 | |
CN112860527A (zh) | 应用服务器的故障监测方法及装置 | |
CN113537519A (zh) | 一种识别异常设备的方法和装置 | |
CN111523826A (zh) | 一种数据采集方法、装置及设备 | |
CN112995243A (zh) | 一种基于大数据的政策信息推送方法和系统 | |
CN114756401B (zh) | 基于日志的异常节点检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |