CN117221078A - 关联规则确定方法、装置及存储介质 - Google Patents

关联规则确定方法、装置及存储介质 Download PDF

Info

Publication number
CN117221078A
CN117221078A CN202311148785.2A CN202311148785A CN117221078A CN 117221078 A CN117221078 A CN 117221078A CN 202311148785 A CN202311148785 A CN 202311148785A CN 117221078 A CN117221078 A CN 117221078A
Authority
CN
China
Prior art keywords
alarm
information
association rule
determining
items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311148785.2A
Other languages
English (en)
Inventor
张冬月
韩赛
王泽林
李奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202311148785.2A priority Critical patent/CN117221078A/zh
Publication of CN117221078A publication Critical patent/CN117221078A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供一种关联规则确定方法、装置及存储介质,涉及通信领域,能够高效准确的确定告警之间的关联规则。该方法包括获取多条告警信息和网络拓扑信息;其中,多条告警信息中每个告警信息包括:告警名称、告警发生时间、告警等级和告警来源节点;按照各告警信息的告警发生时间对多条告警信息进行聚类,确定多个第一告警组;将第一告警组中告警来源节点在网络拓扑信息中存在连接关系的告警信息划分为第二告警组,得到多个第二告警组;根据预设算法、各告警信息的告警等级和多个第二告警组,确定关联规则;其中,关联规则用于确定通信网络中各层级的告警之间的关联关系。本申请用于确定关联规则。

Description

关联规则确定方法、装置及存储介质
技术领域
本申请涉及通信领域,尤其涉及一种关联规则确定方法、装置及存储介质。
背景技术
目前,第五代移动通信技术(5th generation mobile communicationtechnology,5G)核心网一般可以分为硬件层、虚拟层和业务网元层。对于这多层资源的告警信息管理和故障诊断,是5G核心网运营维护的重要环节。
然而,底层(即硬件层)告警一般隐藏在由底层告警所引发的多层衍生告警(即虚拟层告警和业务网元层告警等)中,往往难以有效地分析多层衍生告警的产生原因。因此,需要探索有效地方法进行告警信息管理,以实现跨层故障诊断。
发明内容
本申请提供一种关联规则确定方法、装置及存储介质,能够高效准确的确定告警之间的关联规则。
为达到上述目的,本申请采用如下技术方案:
第一方面,提供一种关联规则确定方法,该方法包括:获取多条告警信息和网络拓扑信息;其中,多条告警信息中每个告警信息包括:告警名称、告警发生时间、告警等级和告警来源节点;网络拓扑信息包括通信网络中多个网络节点之间的连接关系;多个网络节点包括物理层的网络节点、虚拟层的网络节点和网元层的网络节点;按照各告警信息的告警发生时间对多条告警信息进行聚类,确定多个第一告警组;其中,第一告警组中的告警信息的告警发生时间处于第一预设时长的同一时间段内;将第一告警组中告警来源节点在网络拓扑信息中存在连接关系的告警信息划分为第二告警组,得到多个第二告警组;根据预设算法多个第二告警组,确定关联规则;其中,关联规则用于确定通信网络中各层级的告警之间的关联关系。
一种可能的方式中,按照各告警信息的告警发生时间对多条告警信息进行聚类,确定多个第一告警组之前,方法还包括:对多条告警信息进行去重处理,得到处理后告警信息;处理后告警信息中各条告警信息的告警来源节点不相同,或者告警来源节点相同、且告警名称不同,或者告警来源节点相同、且告警名称相同、以及告警发生时间的间隔大于第二预设时长。
一种可能的方式中,告警信息还包括:告警来源层级;告警来源层级用于表征所述通信网络中告警发生的层级。
一种可能的方式中,预设算法为加权的频繁模式增长FP-growth算法,根据预设算法和多个第二告警组,确定关联规则,具体包括:根据告警信息的告警等级对第二告警组中的告警信息设置告警权重;基于加权的FP-growth算法和多个第二告警组构建事务表,并将事务表中事务的项确定为告警项;其中,告警项与第二告警组中的告警信息一一对应,告警项包含以下多项:告警权重、告警名称和告警来源层级;按照各告警项的告警权重由高到低的顺序依次将各告警项构建为节点、且将各告警项出现的频数构建为节点的值,得到频繁模式树;根据频繁模式树,确定关联规则。
一种可能的方式中,根据频繁模式树,确定关联规则,具体包括:将各告警项在频繁模式树中对应的节点与频繁模式树的根节点之间的节点,确定为各告警项的条件模式基,得到多个条件模式基;构建与多个条件模式基一一对应的多个条件频繁模式树;基于多个条件频繁模式树确定符合预设条件的频繁项集,得到关联规则;预设条件包括支持度大于或等于预设支持度阈值、且置信度大于或等于预设置信度阈值、且各告警信息按照告警等级由高至低的顺序排列;频繁项集包括存在关联关系的多个告警项。
第二方面,本申请提供一种关联规则确定装置,该装置包括:获取单元和处理单元;获取单元,用于获取多条告警信息和网络拓扑信息;其中,多条告警信息中每个告警信息包括:告警名称、告警发生时间、告警等级和告警来源节点;网络拓扑信息包括通信网络中多个网络节点之间的连接关系;多个网络节点包括物理层的网络节点、虚拟层的网络节点和网元层的网络节点;处理单元,用于按照各告警信息的告警发生时间对多条告警信息进行聚类,确定多个第一告警组;其中,第一告警组中的告警信息的告警发生时间处于第一预设时长的同一时间段内;处理单元,还用于将第一告警组中告警来源节点在网络拓扑信息中存在连接关系的告警信息划分为第二告警组,得到多个第二告警组;处理单元,还用于根据预设算法、各告警信息的告警等级和多个第二告警组,确定关联规则;其中,关联规则用于确定通信网络中各层级的告警之间的关联关系。
一种可能的方式中,处理单元,还用于对多条告警信息进行去重处理,得到处理后告警信息;处理后告警信息中各条告警信息的告警来源节点不相同,或者告警来源节点相同、且告警名称不同,或者告警来源节点相同、且告警名称相同、以及告警发生时间的间隔大于第二预设时长。
一种可能的方式中,所述告警信息还包括:告警来源层级;所述告警来源层级用于表征所述通信网络中告警发生的层级。一种可能的方式中,处理单元,具体用于:根据告警信息的告警等级对第二告警组中的告警信息设置告警权重;基于加权的FP-growth算法和多个第二告警组构建事务表,并将事务表中事务的项确定为告警项;其中,告警项与第二告警组中的告警信息一一对应,告警项包含以下多项:告警权重、告警名称和告警来源层级;按照各告警项的告警权重由高到低的顺序依次将各告警项构建为节点、且将各告警项出现的频数构建为节点的值,得到频繁模式树;根据频繁模式树,确定关联规则。
一种可能的方式中,处理单元,具体用于:将各告警项在频繁模式树中对应的节点与频繁模式树的根节点之间的节点,确定为各告警项的条件模式基,得到多个条件模式基;构建与多个条件模式基一一对应的多个条件频繁模式树;基于多个条件频繁模式树确定符合预设条件的频繁项集,得到关联规则;预设条件包括支持度大于或等于预设支持度阈值、且置信度大于或等于预设置信度阈值、且各告警信息按照告警等级由高至低的顺序排列;频繁项集包括存在关联关系的多个告警项。
第三方面,本申请提供了一种关联规则确定装置,该装置包括:处理器和通信接口;通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的关联规则确定方法。
第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在终端上运行时,使得终端执行如第一方面和第一方面的任一种可能的实现方式中描述的关联规则确定方法。
第五方面,本申请实施例提供一种包含指令的计算机程序产品,当计算机程序产品在关联规则确定装置上运行时,使得关联规则确定装置执行如第一方面和第一方面的任一种可能的实现方式中所描述的关联规则确定方法。
第六方面,本申请实施例提供一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的关联规则确定方法。
具体的,本申请实施例中提供的芯片还包括存储器,用于存储计算机程序或指令。
基于上述技术方案,本申请提供一种关联规则确定方法,在获取多条告警信息和网络拓扑信息后,可以根据聚类算法对多条告警信息进行聚类,确定出多个第一告警组,这样可以使时间相近的告警信息聚类在一起,从而可以更好的对告警信息进行处理。然后将各告警信息中告警来源节点在网络拓扑信息中存在连接关系的告警信息划分为第二告警组,从而得到多个第二告警组。这样可以使存在连接关系的告警信息在一个告警组,从而能够更有效率的确定告警信息的关联规则;最后,根据预设算法、各告警信息的告警等级和多个第二告警组,确定出告警之间的关联规则。由此,本申请可以对各层之间的告警进行关联,从而高效的对告警进行处理。
附图说明
图1为本申请实施例提供的一种关联规则确定应用场景的结构示意图;
图2为本申请实施例提供的一种关联规则确定设备的硬件结构示意图;
图3为本申请实施例提供的另一种关联规则确定设备的硬件结构示意图;
图4为本申请实施例提供的一种关联规则确定方法的流程示意图;
图5为本申请实施例提供的根据通信网络拓扑关系拆分第一告警组的示意图;
图6为本申请实施例提供的另一种关联规则确定方法的流程示意图;
图7为本申请实施例提供的另一种关联规则确定方法的流程示意图;
图8为本申请实施例提供的一种关联规则确定装置的结构示意图。
具体实施方式
下面结合附图对本申请实施例提供的关联规则确定方法及装置进行详细地描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
随着5G核心网的大规模商用部署,5G核心网告警管理和故障诊断是5G核心网运营维护的重要环节,且5G核心网采用网络功能虚拟化NFV架构后,告警的层次增加,告警的数量激增。由于底层告警隐藏在由底层告警本身引发的多层衍生告警中,很难分析告警的根本原因。在此背景下,需要对各层之间的告警信息进行关联,进一步实现跨层故障诊断。
现阶段采取的确定告警之间关联规则的方法,主要有两种:
第一种方法是在大数据场景下基于机器学习的5G云网告警关联分析,对FP-growth算法进行契合5G云网告警场景的改进和应用,利用现网告警数据展开告警关联分析工作,挖掘网元及云网告警之间的关联关系,并进行告警压缩和收敛,为5G云网故障分析和定位提供有效帮助。但是该方法所使用的是未进行改进FP-growth算法,且此方法提到Aprirori算法的效率和实用性较差,这也就导致该方法的效率较差。
第二种方法是通过对网元配置文件的分析,从中抽取出网元配置的切片标识,解析配置文件后,获取核心网网元和切片标识关联关系,并实时加载核心网网元和切片的关联关系;将关联到的告警网元名称和切片的网元名称相匹配,通过关联映射的方法,分析出这条告警涉及到的所有切片标识,并将告警涉及到的切片标识存入数据库中。但是该方法只针对网元和切片之间的告警关联分析,并没有具体到物理设备。
分析可知,现有技术中的方法覆盖层面不够完善,且采用的算法效率较低。总结来说,现阶段的关联规则确定方法,仍然不能有效的对各层之间的告警信息进行关联。
针对上述缺陷,申请提供一种关联规则确定方法,在获取多条告警信息和网络拓扑信息后,可以根据聚类算法对多条告警信息进行聚类,确定出多个第一告警组,这样可以使时间相近的告警信息聚类在一起,从而可以更好的对告警信息进行处理。然后将各告警信息中告警来源节点在网络拓扑信息中存在连接关系的告警信息划分为第二告警组,从而得到多个第二告警组。这样可以使存在连接关系的告警信息在一个告警组,从而能够更有效率的确定告警信息的关联规则;最后,根据预设算法、各告警信息的告警等级和多个第二告警组,确定出告警之间的关联规则。由此,本申请可以对各层之间的告警进行关联,从而高效的对告警进行处理。
在对本申请实施例的关联规则确定方法进行详细介绍之前,先对本申请实施例的实施环境和应用场景进行介绍。
示例性的,如图1所示,为本申请实施例提供的一种关联规则确定方法应用场景的架构示意图,包括关联规则确定装置101和信息采集装置102。关联规则确定装置101与信息采集装置102之间可以建立通信连接。
在实际应用中,关联规则确定装置101可以与一个或多个信息采集装置102之间通信连接。
为了便于理解,本申请以关联规则确定装置101与一个信息采集装置102为例进行说明。
可选的,图1中的关联规则确定装置101和信息采集装置102可以是集成于同一个设备内的功能模块,也可以是两个相互独立设置的设备。本公开实施例对此不作限制。
容易理解的是,当关联规则确定装置101和信息采集装置102是集成于同一个设备内的功能模块时,关联规则确定装置101和信息采集装置102之间的通信方式为设备内部模块之间的通信。这种情况下,二者之间的通信流程与“关联规则确定装置101和信息采集装置102相互独立设置的情况下,二者之间的通信流程”相同。
为了便于理解,本公开主要以关联规则确定装置101和信息采集装置102相互独立设置为例进行说明。
图1中的关联规则确定装置101可以配置有预设算法、第一预设时长和第二预设时长等资源文件。关联规则确定装置101可以接收到信息采集装置102发送的多个告警信息,并基于配置的资源文件确定与多个告警信息对应的关联规则。
图1中的信息采集装置102可以用于采集通信网络中在不同时刻产生的告警信息,并向关联规则确定装置101发送采集到的告警信息。
可选地,图1中的关联规则确定装置101和信息采集装置102可以是终端,也可以是服务器,还可以是其他类型的电子设备。图1中所示仅为关联规则确定装置101和信息采集装置102的设备形态的一种示例,并不对其构成限定。
该终端可以是为指向用户提供语音和/或数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。该终端可以经无线接入网(radio access network,RAN)与一个或多个核心网进行通信。该终端可以是移动终端,如具有移动终端的计算机,也可以是便携式、袖珍式、手持式、计算机内置的移动装置,它们与无线接入网交换语言和/或数据,例如,手机、平板电脑、笔记本电脑、上网本、个人数字助理(personal digital assistant,PDA)。本申请实施例对此不作任何限制。
该服务器可以是单独的一个服务器,或者,也可以是由多个服务器构成的服务器集群。部分实施方式中,服务器集群还可以是分布式集群。本申请实施例对此不作任何限制。
如图2所示,为本申请实施例提供的关联规则确定装置的一种硬件结构示意图。该关联规则确定装置包括处理器21,存储器22、通信接口23、总线24。处理器21,存储器22以及通信接口23之间可以通过总线24连接。
处理器21是关联规则确定装置的控制中心,可以是一个处理器,也可以是多个处理元件的统称。例如,处理器21可以是一个通用中央处理单元(central processing unit,CPU),也可以是其他通用处理器等。其中,通用处理器可以是微处理器或者是任何常规的处理器等。
作为一种实施例,处理器21可以包括一个或多个CPU,例如图2中所示的CPU 0和CPU 1。
存储器22可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
一种可能的实现方式中,存储器22可以独立于处理器21存在,存储器22可以通过总线24与处理器21相连接,用于存储指令或者程序代码。处理器21调用并执行存储器22中存储的指令或程序代码时,能够实现本申请下述实施例提供的资源调度方法。
另一种可能的实现方式中,存储器22也可以和处理器21集成在一起。
通信接口23,用于关联规则确定装置与其他设备通过通信网络连接,通信网络可以是以太网,无线接入网,无线局域网(wireless local area networks,WLAN)等。通信接口23可以包括用于接收数据的接收单元,以及用于发送数据的发送单元。
总线24,可以是工业标准体系结构(industry standard architecture,ISA)总线、外部设备互连(peripheral component interconnect,PCI)总线或扩展工业标准体系结构(extended industry standard architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图2中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
图3示出了本申请实施例中关联规则确定装置的另一种硬件结构。如图3所示,关联规则确定装置可以包括处理器31以及通信接口32。处理器31与通信接口32耦合。
处理器31的功能可以参考上述处理器21的描述。此外,处理器31还具备存储功能,可以起上述存储器22的功能。
通信接口32用于为处理器31提供数据。该通信接口32可以是关联规则确定装置的内部接口,也可以是关联规则确定装置对外的接口(相当于通信接口23)。
需要指出的是,图2(或图3)中示出的结构并不构成对关联规则确定装置的限定,除图2(或图3)所示部件之外,该关联规则确定装置可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合附图,对本申请提供的关联规则确定方法进行具体说明:
示例性的,如图4所示,为本申请实施例提供的一种关联规则确定方法,该方法包括以下步骤:
S401、关联规则确定装置获取多条告警信息和网络拓扑信息。
其中,多条告警信息中每个告警信息包括:告警名称、告警发生时间、告警等级和告警来源节点。网络拓扑信息包括通信网络中多个网络节点之间的连接关系。多个网络节点包括物理层的网络节点、虚拟层的网络节点和网元层的网络节点。
可以理解的是,告警来源节点是指在通信网络中,发生告警的设备及告警发生的层次。
需要说明的是,在获取多条告警信息和网络拓扑信息之后,且在按照各告警信息的告警发生时间对多条告警信息进行聚类,确定多个第一告警组之前,方法还可以包括:对多条告警信息进行去重处理,得到处理后告警信息。处理后告警信息中各条告警信息的告警来源节点不相同,或者告警来源节点相同、且告警名称不同,或者告警来源节点相同、且告警名称相同、以及告警发生时间的间隔大于第二预设时长。
示例性的,在实际运用中,第二预设时长可具体根据实际需求来设定,例如,第二预设时长可设置为1分钟,本申请对此不做具体限制。
S402、关联规则确定装置按照各告警信息的告警发生时间对多条告警信息进行聚类,确定多个第一告警组。
其中,第一告警组中的告警信息的告警发生时间处于第一预设时长的同一时间段内。
需要说明的是,在实际运用中,第一预设时长可根据实际需求来设定,本申请对此不做具体限制。
示例性的,关联规则确定装置可以根据密度聚类算法(density-based spatialclustering of applications with noise,DBSCAN)按照各告警信息的告警发生时间对多条告警信息进行聚类,从而确定多个第一告警组。算法中参数可设置为:距离函数(metric)代表告警发生时间的时间差(单位为ms),设置时间阈值为250ms,时间阈值也就是前文所提到的第一预设周期;在两个告警发生的时间差小于时间阈值的情况下,将这两个告警聚类到同一告警组。
需要说明的是,在实际运用中,也可根据其他算法来对多条告警信息进行聚类,可根据实际需求来设定,本申请对此不做具体限制。且在对多条告警信息进行聚类时,算法设置的参数也可根据实际需求来设定,本申请同样对此不做具体限制。
S403、关联规则确定装置将第一告警组中告警来源节点在网络拓扑信息中存在连接关系的告警信息划分为第二告警组,得到多个第二告警组。
一种可能的方式中,多个第二告警组中每个第二告警组中的告警信息之间存在连接关系。
示例性的,结合图5对关联规则确定装置将第一告警组中告警来源节点在网络拓扑信息中存在连接关系的告警信息划分为第二告警组,得到多个第二告警组进行具体说明。根据网络拓扑信息和一组第一告警组中告警来源节点,确定该第一告警组的连接关系无向图,再根据算法获取连接关系无向图的极大连通子图。其中,极大连通子图中的一个连通子图代表一个第二告警组。
需要说明的是,在实际运用中,可以根据kosaraju算法获取连接关系图的极大连通图,也可以根据tarjan算法获取连接关系图的极大连通图,由实际需求确定,本申请对此不做具体限制。
S404、关联规则确定装置根据预设算法和多个第二告警组,确定关联规则。
其中,关联规则用于确定通信网络中各层级的告警之间的关联关系。
需要说明的是,关联规则确定装置根据预设算法和多个第二告警组,确定关联规则的方式,可参见下文S601-S604,此处不再赘述。
基于上述技术方案,申请提供一种关联规则确定方法,在获取多条告警信息和网络拓扑信息后,可以根据聚类算法对多条告警信息进行聚类,确定出多个第一告警组,这样可以使时间相近的告警信息聚类在一起,从而可以更好的对告警信息进行处理。然后将各告警信息中告警来源节点在网络拓扑信息中存在连接关系的告警信息划分为第二告警组,从而得到多个第二告警组。这样可以使存在连接关系的告警信息在一个告警组,从而能够更有效率的确定告警之间的关联规则;最后,根据预设算法、各告警信息的告警等级和多个第二告警组,确定出告警信息之间的关联规则。由此,本申请可以对各层之间的告警信息进行关联,从而高效的对告警进行处理。
示例性地,结合图4,如图6所示,在本申请提供的关联规则确定方法中,上述S404具体可以通过以下S601-S604实现:
S601、关联规则确定装置根据告警信息的告警等级对第二告警组中的告警信息设置告警权重。
一种可能的方式中,告警的原始数据中标记了告警的级别。一级告警、二级告警、三级告警、四级告警。级别越高代表告警越重要。可以随机生成0到1之间的小数,然后从小到大排列,依次分配给一级告警、二级告警、三级告警、四级告警,作为告警的权重。
示例性的,设置一级告警的权重为0.8、二级告警权重为0.6、三级告警权重为0.4、四级告警权重为0.1。设A、C为一级告警、E、G为二级告警、B、D为三级告警、F为四级告警。则A、C的权重为0.8,E、G的权重为0.6,B、D的权重为0.4,F的权重为0.1。
S602、关联规则确定装置基于加权的FP-growth算法和多个第二告警组构建事务表,并将事务表中事务的项确定为告警项。
其中,告警项与第二告警组中的告警信息一一对应,告警项包含以下多项:告警权重、告警名称和告警来源层级。
可选地,事务表用于表征每个告警的告警权重和发生频次。
一种可能的方式中,基于加权的FP-growth算法和多个第二告警组构建事务表,并将事务表中事务的项确定为告警项。关联规则确定装置可以根据事务表确定多个第二告警组中各告警信息所对应的告警的权重和出现的频次。
一种可能的方式中,多个第二告警组对应一个事务表,一个第二告警组对应事务表中的一个事务,事务表中事务的项为告警项。
可选地,在关联规则确定装置基于加权的FP-growth算法和多个第二告警组构建事务表,并将事务表中事务的项确定为告警项之前,还需要设置权重参数,设置的权重参数可以包括:告警权重阈值为w=0.5、支持度阈值support=0.2、置信度阈值confidence=0.6。
需要说明的是,在实际运用中,权重阈值、支持度阈值和置信度阈值,都可根据实际需求确定,本申请对此不作具体限定。
可选地,支持度表示前项与后项在一个数据集中同时发生的概率。示例性的,设A、B为事务表中事务的项,A、B的支持度是指A、B同时发生的概率,即事务表中同时包含A、B的事务数与总事务数的比值。支持度可根据以下公式1表示:
support(A,B)=P(A∪B) 公式1
其中,support(A,B)表示A、B的支持度,P(A∪B)表示A、B同时发生的概率。
可选地,置信度表示前项发生后,后项发生的概率。示例性地,设C、D为事务表中事务的项,C、D的置信度是指C出现时,D出现的概率。置信度根据以下公式2表示:
cofidence(C,D)=P(C丨D) 公式2
其中,cofidence(C,D)表示C、D的置信度,P(C丨D)表示C出现时,D出现的概率。
S603、关联规则确定装置按照各告警项的告警权重由高到低的顺序依次将各告警项构建为节点、且将各告警项出现的频数构建为节点的值,得到频繁模式树。
需要说明的是,频繁模式树是一种用于数据挖掘的算法,主要用于发现数据集中频繁出现的模式。在构建树结构时利用了树的特性,将频繁模式的查找过程转化为树的遍历过程,从而提高了效率。频繁模式树由一个根节点和若干个子节点组成。每个节点代表一个项集或者一个单独的项,节点之间通过链接进行连接。通过频繁模式树,可以高效地发现频繁项集。在树上进行深度优先遍历,可以得到不同长度的频繁项集。同时,频繁模式树主要用于关联规则的挖掘。总之,频繁模式树是一种用于发现数据集中频繁出现的模式的算法,通过树结构提高了查找效率,可以对关联规则进行挖掘。
一种可能的方式中,关联规则确定装置按照各告警项的告警权重由高到低的顺序依次将各告警项构建为节点、且将各告警项出现的频数构建为节点的值,得到频繁模式树之前,还需要对事务表进行两次扫描。
可选地,第一次扫描事务表后,事务表中只保留支持度大于或等于支持度阈值的告警项,并对事务表中所有支持度大于或等于支持度阈值的告警项进行计数。
可选地,第二次扫描事务表,将事务表中各告警项按照告警权重由高至低的顺序进行排列,以便关联规则确定装置根据该事务表构建频繁模式树。
示例性的,设事务表为下表1,下表1为关联规则确定装置基于加权的FP-growth算法和多个第二告警组,确定的事务表。
表1
ID 事务
1 A B C E F O
2 A C G
3 E I
4 A C D E G
5 A C E G L
6 E J
7 A B C E F P
8 A C D
9 A C E G M
10 A C E G N
第一次扫描事务表,事务表中只保留支持度大于或等于支持度阈值的告警信息,并对事务表中所有支持度大于或等于支持度阈值的告警信息进行计数。
如下表2,表2为第一次扫描后的事务表。
表2
对比表1和表2可知,在第一次扫描事务表后,获取了事务表中所有告警项的计数,删除了表1中支持度小于支持度阈值的告警项I、J、K、M、N,只保留支持度大于或等于支持度阈值的告警信息。
以及,第二次扫描事务表,将事务表中各告警项按照支持度由高至低的顺序进行排列,以便关联规则确定装置根据该事务表构建频繁模式树。如下表3,表3为第二次扫描后的事务表。
表3
A 8
C 8
E 8
G 5
B 2
D 2
F 2
一种可能的方式中,根据上述进行两次扫描的事务表构建频繁模式树,需要从根节点开始进行如下步骤:(1)如果当前处理的告警项存在于频繁模式树的子节点中,则更新这个子节点的计数值。
(2)否则,创建新的子节点,更新头指针表。(3)并且在当前告警项的告警权重大于子节点的告警权重的情况下,不再生成子节点,并删除当前告警项以及后续告警项。对事务表的其余事务的项和当前事务的项的对应子节点从步骤(1)开始递归。直到所有事务表中所有事务的项都插入到频繁模式树后,频繁模式树的建立完成。
可以理解的是,构建频繁模式树不局限本申请所提供的方法。具体可参见本领域的现有技术,本申请在此不再赘述。
S604、关联规则确定装置根据频繁模式树,确定关联规则。
需要说明的是,关联规则确定装置根据频繁模式树,确定关联规则的方式,可参见下文S701-S703,此处不再赘述。
基于上述技术方案,本申请提供的方法能够基于加权的FP-growth算法按照各告警项的告警权重由高至低的顺序依次将各告警项构建为节点、且将各告警项出现的次数构建为节点的值,得到频繁模式树。从而可以在频繁模式树确定各告警之间的大概的关联情况,并以此来确定关联规则。由此,本申请能够根据告警之间的关联规则对各层之间的告警进行关联,从而高效的对告警进行处理。
示例性地,结合图6,如图7所示,在本申请提供的关联规则确定方法中,上述S604具体可以通过以下S701-S703实现:
S701、关联规则确定装置将各告警信息在频繁模式树中对应的节点与频繁模式树的根节点之间的节点,确定为各告警信息的条件模式基,得到多个条件模式基。
需要说明的是,条件模式基是以“所查找的元素项”为结尾的路径集合,每一个路径其实都是前缀路径。一条前缀路径是指介于所查找的元素项与树根节点之间的所有内容。在本申请中是指在频繁模式树中对应的节点与频繁模式树的根节点之间的节点集合。
S702、关联规则确定装置构建与多个条件模式基一一对应的多个条件频繁模式树。
可以理解的是,对于每一个条件模式基,都需要创建一颗条件频繁模式树。
示例性地,根据上述步骤中确定的条件模式基作为输入,累加每个条件模式基上的元素项频繁度,删除低于支持度阈值的元素项,即删除低于支持度阈值的的告警信息。然后通过递归发现频繁项、条件模式基和其他条件频繁模式树。需要说明的是,构建条件频繁模式树的方式与前述中构建频繁模式树的方式相同,此处不再赘述。
S703、关联规则确定装置基于多个条件频繁模式树确定符合预设条件的频繁项集,得到关联规则。
其中,预设条件包括支持度大于或等于预设支持度阈值、且置信度大于或等于预设置信度阈值、且各告警信息按照告警等级由高至低的顺序排列;频繁项集包括存在关联关系的多个告警信息。
可选地,预设支持度阈值可根据实际需求设定。例如,预设支持度阈值可以设置为0.6,也可以设置为0.7。本申请对此不做具体限制。
可选地,预设置信度阈值可根据实际需求设定。例如,预设置信度阈值可以设置为0.5,也可以设置为0.4。本申请对此不做具体限制。
可选地,关联规则用于确定通信网络各层级的告警信息之间的关联关系。
一种可能的方式中,关联规则确定装置基于多个条件频繁模式树确定符合预设条件的频繁项集时,只保留置信度小于置信度阈值,且根据告警权重降序排列的频繁项集。同时,不再生成频繁项集的超集。
需要说明的是,频繁项集是指支持度大于或等于支持度阈值的项集。
可以理解的是,在确定出频繁项集后,本申请能够基于频繁项集,来确定出关联规则。具体可参见本领域的现有技术,本申请在此不再赘述。
基于上述技术方案,本申请能够将各告警信息在频繁模式树中对应的节点与频繁模式树的根节点之间的节点,确定为各告警信息的条件模式基,得到多个条件模式基,以使得根据条件模式基构建条件频繁模式树;并根据多个条件频繁模式树,生成频繁项集。从而根据频繁项集,确定告警之间的关联规则。由此,本申请能够根据告警之间的关联规则对各层之间的告警进行关联,从而高效的对告警进行处理。
示例性的,如图8所示,为本申请实施例提供的一种关联规则确定装置的结构示意图。关联规则确定装置用于执行本申请提供的关联规则确定方法。例如,上述图4、图6和图7中的关联规则确定方法。关联规则确定装置可以包括获取单元801、处理单元802。
可选地,获取单元801,用于获取多条告警信息和网络拓扑信息。例如,结合图6,获取单元801,用于执行S401。
可选地,处理单元802,用于按照各告警信息的告警发生时间对多条告警信息进行聚类,确定多个第一告警组。例如,结合图4,处理单元802,用于执行S402。
可选地,处理单元802,还用于将第一告警组中告警来源节点在网络拓扑信息中存在连接关系的告警信息划分为第二告警组,得到多个第二告警组。例如,结合图4,处理单元802,用于执行S403。
可选地,处理单元802,还用于根据预设算法和多个第二告警组,确定关联规则。例如,结合图4,处理单元802,用于执行S404。
可选地,处理单元802,还用于对多条告警信息进行去重处理,得到处理后告警信息。
可选地,处理单元802,具体用于根据告警信息的告警等级对第二告警组中的告警信息设置告警权重。例如,结合图6,处理单元802,用于执行S601。
基于加权的FP-growth算法和多个第二告警组构建事务表,并将事务表中事务的项确定为告警项。例如,结合图6,处理单元802,用于执行S602。
按照各告警项的告警权重由高到低的顺序依次将各告警项构建为节点、且将各告警项出现的频数构建为节点的值,得到频繁模式树。例如,结合图6,处理单元802,用于执行S603。
根据频繁模式树,确定关联规则。例如,结合图6,处理单元802,用于执行S604。
可选地,处理单元802,具体用于将各告警项在频繁模式树中对应的节点与频繁模式树的根节点之间的节点,确定为各告警项的条件模式基,得到多个条件模式基。例如,结合图7,处理单元802,用于执行S701。
构建与多个条件模式基一一对应的多个条件频繁模式树。例如,结合图7,处理单元802,用于执行S702。
基于多个条件频繁模式树确定符合预设条件的频繁项集,得到关联规则。例如,结合图7,处理单元802,用于执行S703。
此外,图8的关联规则确定装置的技术效果可以参考上述实施例的关联规则确定方法的技术效果,此处不再赘述。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例提供一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得该计算机执行上述方法实施例中的关联规则确定方法。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当该指令在计算机上运行时,使得该计算机执行上述方法实施例所示的方法流程中的关联规则确定方法。
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合、或者本领域熟知的任何其它形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(Application Specific Integrated Circuit,ASIC)中。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
由于本申请的实施例中的关联规则确定装置、计算机可读存储介质、计算机程序产品可以应用于上述方法,因此,其所能获得的技术效果也可参考上述方法实施例,本申请实施例在此不再赘述。
以上,仅为本申请的具体实时方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (12)

1.一种关联规则确定方法,其特征在于,所述方法包括:
获取多条告警信息和网络拓扑信息;其中,所述多条告警信息中每个告警信息包括:告警名称、告警发生时间、告警等级和告警来源节点;所述网络拓扑信息包括通信网络中多个网络节点之间的连接关系;所述多个网络节点包括物理层的网络节点、虚拟层的网络节点和网元层的网络节点;
按照各所述告警信息的告警发生时间对所述多条告警信息进行聚类,确定多个第一告警组;其中,所述第一告警组中的告警信息的告警发生时间处于第一预设时长的同一时间段内;
将所述第一告警组中告警来源节点在所述网络拓扑信息中存在连接关系的告警信息划分为第二告警组,得到多个第二告警组;
根据预设算法和所述多个第二告警组,确定关联规则;其中,所述关联规则用于确定所述通信网络中各层级的所述告警之间的关联关系。
2.根据权利要求1所述的关联规则确定方法,其特征在于,所述按照各所述告警信息的告警发生时间对所述多条告警信息进行聚类,确定多个第一告警组之前,所述方法还包括:
对所述多条告警信息进行去重处理,得到处理后告警信息;所述处理后告警信息中各条告警信息的告警来源节点不相同,或者告警来源节点相同、且告警名称不同,或者告警来源节点相同、且告警名称相同、以及告警发生时间的间隔大于第二预设时长。
3.根据权利要求2所述的关联规则确定方法,其特征在于,所述告警信息还包括:告警来源层级;所述告警来源层级用于表征所述通信网络中告警发生的层级。
4.根据权利要求3所述的关联规则确定方法,其特征在于,所述预设算法为加权的频繁模式增长FP-growth算法,所述根据所述预设算法和所述多个第二告警组,确定所述关联规则,具体包括:
根据所述告警信息的告警等级对所述第二告警组中的所述告警信息设置告警权重;
基于所述加权的FP-growth算法和多个第二告警组构建事务表,并将所述事务表中事务的项确定为告警项;其中,所述告警项与第二告警组中的告警信息一一对应,所述告警项包含以下多项:所述告警权重、所述告警名称和所述告警来源层级;
按照各所述告警项的告警权重由高到低的顺序依次将各所述告警项构建为节点、且将各所述告警项出现的频数构建为节点的值,得到频繁模式树;
根据所述频繁模式树,确定所述关联规则。
5.根据权利要求4所述的关联规则确定方法,其特征在于,所述根据所述频繁模式树,确定所述关联规则,具体包括:
将各所述告警项在所述频繁模式树中对应的节点与所述频繁模式树的根节点之间的节点,确定为各所述告警项的条件模式基,得到多个条件模式基;
构建与所述多个条件模式基一一对应的多个条件频繁模式树;
基于所述多个条件频繁模式树确定符合预设条件的频繁项集,得到所述关联规则;所述预设条件包括支持度大于或等于预设支持度阈值、且置信度大于或等于预设置信度阈值、且各告警信息按照告警等级由高至低的顺序排列;所述频繁项集包括存在关联关系的多个告警项。
6.一种关联规则确定装置,其特征在于,包括:获取单元和处理单元;
所述获取单元,用于获取多条告警信息和网络拓扑信息;其中,所述多条告警信息中每个告警信息包括:告警名称、告警发生时间、告警等级和告警来源节点;所述网络拓扑信息包括通信网络中多个网络节点之间的连接关系;所述多个网络节点包括物理层的网络节点、虚拟层的网络节点和网元层的网络节点;
所述处理单元,用于按照各所述告警信息的告警发生时间对所述多条告警信息进行聚类,确定多个第一告警组;其中,所述第一告警组中的告警信息的告警发生时间处于第一预设时长的同一时间段内;
所述处理单元,还用于将所述第一告警组中告警来源节点在所述网络拓扑信息中存在连接关系的告警信息划分为第二告警组,得到多个第二告警组;
所述处理单元,还用于根据预设算法和所述多个第二告警组,确定关联规则;其中,所述关联规则用于确定所述通信网络中各层级的告警之间的关联关系。
7.根据权利要求6所述的装置,其特征在于,所述处理单元,还用于对所述多条告警信息进行去重处理,得到处理后告警信息;所述处理后告警信息中各条告警信息的告警来源节点不相同,或者告警来源节点相同、且告警名称不同,或者告警来源节点相同、且告警名称相同、以及告警发生时间的间隔大于第二预设时长。
8.根据权利要求7所述的装置,其特征在于,所述告警信息还包括:告警来源层级;所述告警来源层级用于表征所述通信网络中告警发生的层级。
9.根据权利要求8所述的装置,其特征在于,所述预设算法为加权的频繁模式增长FP-growth算法,所述处理单元,具体用于:
根据所述告警信息的告警等级对所述第二告警组中的所述告警信息设置告警权重;
基于所述加权的FP-growth算法和多个第二告警组构建事务表,并将所述事务表中事务的项确定为告警项;其中,所述告警项与第二告警组中的告警信息一一对应,所述告警项包含以下多项:所述告警权重、所述告警名称和所述告警来源层级;
按照各所述告警项的告警权重由高到低的顺序依次将各所述告警项构建为节点、且将各所述告警项出现的频数构建为节点的值,得到频繁模式树;
根据所述频繁模式树,确定所述关联规则。
10.根据权利要求9所述的装置,其特征在于,所述处理单元,具体用于:
将各所述告警项在所述频繁模式树中对应的节点与所述频繁模式树的根节点之间的节点,确定为各所述告警项的条件模式基,得到多个条件模式基;
构建与所述多个条件模式基一一对应的多个条件频繁模式树;
基于所述多个条件频繁模式树确定符合预设条件的频繁项集,得到所述关联规则;所述预设条件包括支持度大于或等于预设支持度阈值、且置信度大于或等于预设置信度阈值、且各告警信息按照告警等级由高至低的顺序排列;所述频繁项集包括存在关联关系的多个告警项。
11.一种关联规则确定装置,其特征在于,包括:处理器和通信接口;所述通信接口和所述处理器耦合,所述处理器用于运行计算机程序或指令,以实现如权利要求1-5任一项中所述的关联规则确定方法。
12.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当计算机执行该指令时,该计算机执行上述权利要求1-5任一项中所述的关联规则确定方法。
CN202311148785.2A 2023-09-06 2023-09-06 关联规则确定方法、装置及存储介质 Pending CN117221078A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311148785.2A CN117221078A (zh) 2023-09-06 2023-09-06 关联规则确定方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311148785.2A CN117221078A (zh) 2023-09-06 2023-09-06 关联规则确定方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN117221078A true CN117221078A (zh) 2023-12-12

Family

ID=89036364

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311148785.2A Pending CN117221078A (zh) 2023-09-06 2023-09-06 关联规则确定方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN117221078A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117632666A (zh) * 2024-01-25 2024-03-01 杭州阿里云飞天信息技术有限公司 一种告警方法、设备及存储介质
CN117806916A (zh) * 2024-02-29 2024-04-02 中国人民解放军国防科技大学 多单元服务器轻量化告警相关性挖掘和收敛方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117632666A (zh) * 2024-01-25 2024-03-01 杭州阿里云飞天信息技术有限公司 一种告警方法、设备及存储介质
CN117632666B (zh) * 2024-01-25 2024-05-07 杭州阿里云飞天信息技术有限公司 一种告警方法、设备及存储介质
CN117806916A (zh) * 2024-02-29 2024-04-02 中国人民解放军国防科技大学 多单元服务器轻量化告警相关性挖掘和收敛方法及系统

Similar Documents

Publication Publication Date Title
Chen et al. Maximum co-located community search in large scale social networks
CN107547633B (zh) 一种用户常驻点的处理方法、装置和存储介质
CN117221078A (zh) 关联规则确定方法、装置及存储介质
CN108304444B (zh) 信息查询方法及装置
Tang et al. Identifying evolving groups in dynamic multimode networks
US9680915B2 (en) Methods for clustering networks based on topology discovery and devices thereof
WO2016110121A1 (zh) 数据栅格化、用户行为分析的方法和装置
CN111125268A (zh) 网络告警分析模型创建方法、告警分析方法及装置
CN104077723B (zh) 一种社交网络推荐系统及方法
KR102654884B1 (ko) 대화형 정보 제공 서비스 방법 및 이를 위한 장치
CN110298687B (zh) 一种区域吸引力评估方法及设备
CN112953738B (zh) 根因告警的定位系统、方法、装置、计算机设备
Ebadian et al. Fast algorithm for k-truss discovery on public-private graphs
CN112181767A (zh) 软件系统异常的确定方法、装置和存储介质
CN113379176A (zh) 电信网络异常数据检测方法、装置、设备和可读存储介质
CN114265927A (zh) 数据查询方法及装置、存储介质及电子装置
CN114579409A (zh) 告警方法、装置、设备及存储介质
US10250550B2 (en) Social message monitoring method and apparatus
CN109885651A (zh) 一种问题推送方法和装置
CN104965846B (zh) MapReduce平台上的虚拟人建立方法
CN109190052A (zh) 一种分布式环境下基于社会感知的空间索引方法
CN113556368A (zh) 用户识别方法、装置、服务器及存储介质
CN111159577A (zh) 一种社群划分方法、装置、存储介质及电子装置
Du et al. An efficient indexing and query mechanism for ubiquitous IoT services
CN112887910B (zh) 异常覆盖区域的确定方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination