CN116366421A - 告警质量监控方法、装置、电子设备、及程序产品 - Google Patents
告警质量监控方法、装置、电子设备、及程序产品 Download PDFInfo
- Publication number
- CN116366421A CN116366421A CN202111612926.2A CN202111612926A CN116366421A CN 116366421 A CN116366421 A CN 116366421A CN 202111612926 A CN202111612926 A CN 202111612926A CN 116366421 A CN116366421 A CN 116366421A
- Authority
- CN
- China
- Prior art keywords
- alarm
- quality
- warning threshold
- early warning
- quality early
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 69
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000002159 abnormal effect Effects 0.000 claims abstract description 34
- 238000013450 outlier detection Methods 0.000 claims abstract description 30
- 238000004590 computer program Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 12
- 238000009826 distribution Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 6
- 238000012806 monitoring device Methods 0.000 abstract description 6
- 230000015556 catabolic process Effects 0.000 abstract description 5
- 238000006731 degradation reaction Methods 0.000 abstract description 5
- 238000003860 storage Methods 0.000 description 12
- 238000007726 management method Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- OOXMVRVXLWBJKF-DUXPYHPUSA-N n-[3-[(e)-2-(5-nitrofuran-2-yl)ethenyl]-1,2,4-oxadiazol-5-yl]acetamide Chemical compound O1C(NC(=O)C)=NC(\C=C\C=2OC(=CC=2)[N+]([O-])=O)=N1 OOXMVRVXLWBJKF-DUXPYHPUSA-N 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0604—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/16—Threshold monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请提供告警质量监控方法、装置、电子设备、及程序产品。所述方法包括:对告警特征进行离群点检测,剔除异常特征,得到第一告警特征集;基于第一告警特征集,拟合告警质量预警阈值;基于告警质量预警阈值进行告警质量监控,并根据告警质量预警事件修正告警质量预警阈值。本申请提供的告警质量监控方法,通过对告警特征进行离群点检测,剔除异常特征,确保第一告警特征集中特征的规整性,有效缩短异常定位时长,基于第一告警特征集,拟合出合理的告警质量预警阈值,再根据伪告警质量预警事件动态修正告警质量预警阈值,确保告警质量预警阈值的精度,提高告警的准确性,有效控制告警质量劣化管控空窗期,减少网络故障风险,及时解决问题。
Description
技术领域
本申请涉及网络管理技术领域,具体涉及一种告警质量监控方法、装置、电子设备、及计算机程序产品。
背景技术
网络故障告警,指当网络中所部署的硬件设备、软硬系统及传输链路等发生异常或故障时,设备会上报异常信息,该信息通过网络管理单元逐级上送至故障监控单元,以通过人工或自动的方式对故障信息进行发现、识别、判断和预处理。随着运营商网络规模的扩大、网络复杂度的增加,对告警的依靠程度日益加深,而告警的质量更为重要。目前对告警自身的质量监测主要是通过对网管路径的监测,例如在告警信息的上报路径中是否有链路丢包、是否有链路断开的监测;或者通过对在上报路径中不同层级之间所用到的告警上报接口进行监测,该种方式主要能发现当接口连接异常造成的告警信息无法上报的情况,但对于接口假死等其它情况无法监测,同时该方式指向不够明确,需要技术专家进行二次判断,以确认影响范围;还有通过人工定期导出报表进行周期性分析,该种方式随机性较大,不同经验的人员往往得出的结论不同,同时耗费的人工成本也比较高。对于复杂原因导致的告警质量劣化很难通过上述三种方案解决,而且上述三种方案的时效性和准确性均不足。
发明内容
本申请实施例提供一种告警质量监控方法,用以解决现有技术监测告警质量的时效性和准确性均不足的技术问题。
第一方面,本申请实施例提供一种告警质量监控方法,包括:
对告警特征进行离群点检测,剔除异常特征,得到第一告警特征集;
基于所述第一告警特征集,拟合告警质量预警阈值;
基于所述告警质量预警阈值生成告警质量预警事件,根据告警质量预警事件的反馈数据修正所述告警质量预警阈值。
在一个实施例中,所述对告警特征进行离群点检测,包括:
根据告警发生时间信息,得到所述告警特征;
通过离群点检测模型对所述告警特征进行离群点检测;
其中,所述离群点检测模型基于高斯分布算法训练得到。
在一个实施例中,所述基于所述第一告警特征集,拟合告警质量预警阈值,包括:
根据所述告警发生时间信息,得到告警发生时间间隔信息;
根据所述告警发生时间间隔信息,得到第二告警特征集;
根据所述第二告警特征集,拟合告警质量预警阈值。
在一个实施例中,所述第二告警特征集包括告警发生时间间隔特征和告警发生时间间隔出现次数特征。
在一个实施例中,所述根据所述第二告警特征集,拟合告警质量预警阈值,包括:
根据告警发生时间间隔出现次数特征,为告警发生时间间隔特征设置权重;
根据设置权重后的告警发生时间间隔特征,得到告警质量预警阈值。
在一个实施例中,所述基于所述告警质量预警阈值生成告警质量预警事件,根据告警质量预警事件的反馈数据修正所述告警质量预警阈值,包括:
判断告警质量监控中出现的告警质量预警事件的真伪性,得到伪告警质量预警事件;
根据伪告警质量预警事件的源域数据,修正所述告警质量预警阈值。
在一个实施例中,所述根据伪告警质量预警事件的源域数据,修正所述告警质量预警阈值,包括:
根据伪告警质量预警事件的源域数据,得到第三告警特征集;
根据所述第三告警特征集,通过迭代加权修正所述告警质量预警阈值。
第二方面,本申请实施例提供一种一种告警质量监控装置,包括:
离群点检测模块,用于:对告警特征进行离群点检测,剔除异常特征,得到第一告警特征集;
告警质量预警阈值拟合模块,用于:基于所述第一告警特征集,拟合告警质量预警阈值;
告警质量预警阈值修正模块,用于:基于所述告警质量预警阈值生成告警质量预警事件,根据告警质量预警事件的反馈数据修正所述告警质量预警阈值
第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述的告警质量监控方法的步骤。
第四方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面所述的告警质量监控方法的步骤。
本申请实施例提供的告警质量监控方法、装置、电子设备、及计算机程序产品,通过对告警特征进行离群点检测,剔除异常特征,确保第一告警特征集中特征的规整性,有效缩短异常定位时长,然后基于第一告警特征集,拟合出合理的告警质量预警阈值,再根据伪告警质量预警事件动态修正告警质量预警阈值,确保告警质量预警阈值的精度,提高告警的准确性,有效控制告警质量劣化管控空窗期,减少网络故障风险,及时解决问题。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的告警质量监控方法的流程示意图。
图2是本申请实施例提供的告警质量监控装置的结构示意图。
图3是本申请实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种告警质量监控方法的流程示意图。
参照图1,本申请实施例提供的一种告警质量监控方法,可以包括:
S110、对告警特征进行离群点检测,剔除异常特征,得到第一告警特征集;
S120、基于所述第一告警特征集,拟合告警质量预警阈值;
S130、基于告警质量预警阈值进行告警质量监控,并根据告警质量监控中出现的伪告警质量预警事件修正所述告警质量预警阈值。
需要说明的是,本申请提供的一种告警质量监控方法的执行主体可以是任何网络侧设备,例如网络管控系统等。
在步骤S110中,网络侧设备会对告警特征进行离群点检测,剔除异常特征,得到第一告警特征集。
需要说明的是,告警特征可以从告警特征数据库中获得,告警特征数据库中存储有过去发生活动告警时相关的数据。
在数据的产生和采集过程中,部分数据因受偶然因素影响与序列中其他数值偏差较远,即离群点。在各个领域聚焦特征信息,均存在离群点检测场景,如通过用户行为识别账号异常登录、通过引擎震动强度识别器件故障等。在告警质量监控方面,选取合适的告警特征能够有效及时地发现离群点,可以趋于精准地拟合告警质量预警阈值,进而对日常生产进行实时监控,可以快速发现异常事件,及时解决问题。
在步骤S120中,网络侧设备会基于所述第一告警特征集,拟合告警质量预警阈值。
网络侧设备可以根据第一告警特征集中的特征的特性来拟合告警质量预警阈值,使得告警质量预警阈值符合网络管理的规则,通过告警质量预警阈值可以及时发现网络异常或故障。网络侧设备可以通过特征量足够多的第一告警特征集来拟合出更精准的告警质量预警阈值。
在步骤S130中,网络侧设备会基于告警质量预警阈值进行告警质量监控,并根据告警质量监控中出现的伪告警质量预警事件修正所述告警质量预警阈值。
需要说明的是,网络侧设备可以基于告警质量预警阈值进行告警质量监控,此时网络中会生成告警质量预警事件,网络侧设备可以通过呈现模块程序出告警质量预警事件,利于管理人员通过人机交互反馈式处理模块来处理告警质量预警事件,例如判断出告警质量预警事件的真伪性,把告警质量预警事件中为伪告警质量预警事件的数据作为修正告警质量预警阈值的根据,如此来动态地修正告警质量预警阈值,能够保证告警质量预警阈值的时效性,利用多次迭代修正后告警质量预警阈值来进行网络管理告警,能够极大程度上降低告警误差率,确保告警准确性。
本申请实施例提供的告警质量监控方法,通过对告警特征进行离群点检测,剔除异常特征,确保第一告警特征集中特征的规整性,有效缩短异常定位时长,然后基于第一告警特征集,拟合出合理的告警质量预警阈值,再根据伪告警质量预警事件动态修正告警质量预警阈值,确保告警质量预警阈值的精度,提高告警的准确性,有效控制告警质量劣化管控空窗期,减少网络故障风险,及时解决问题。
在一种实施例中,所述对告警特征进行离群点检测,可以包括:
根据告警发生时间信息,得到所述告警特征;
通过离群点检测模型对所述告警特征进行离群点检测;
其中,所述离群点检测模型基于高斯分布算法训练得到。
需要说明的是,为了表征告警质量,需要在告警基本信息中选取恰当的告警特征形成无标签样本集。
告警基本信息可以抽象表示为“什么时间什么设备发生了什么异常事件”,包括时间、主体、动作三个属性:
(1)动作属性:告警质量不涉及告警详细内容,故告警特征不考虑动作属性。
(2)主体属性:以云化告警为例,其采集流程涉及不同主体,主要分为NFVO、PIM/VIM/OMC、设备类型、网元等级别,选取不同主体可以把采集异常故障精准定位到具体主体级别。本申请需要保证应用主体的全面性,故主体属性不具备特征性。本申请的主体均以设备类型为例,该要素可以替换成其他主体。
(3)因此,在时间属性的告警基本信息中选取告警特征:通过告警发生时间信息——告警发生时间(AlarmTime),构建告警特征AP=(dev,AlarmPeriod)。其中dev表示设备类型;AlarmPeriod表示(AlarmTime 2-AlarmTime 1),即该设备类型上次告警发生时间与本次告警发生时间的时间间隔。为了压缩数据采集算力,可以先构建告警集AT=(dev,AlarmTime),以AlarmTime为维度作序列,进而得到告警特征(AP)。其中,AlarmPeriod应满足正且非零的基本条件,即AlarmPeriod>0。
基于告警特征(AP)形成数据集,即无标签样本集。
需要说明的是,基于告警特征(AP),需要选择合适的离群点检测算法,对异常数据进行快速的筛选,网络侧设备可以通过离群点监测模型来实现对告警特征的离群点检测。
需要说明的是,关于AlarmPeriod的数据集应该集中分布在某个较小的区间,该区间为正常采集的告警空窗期。小于该区间的可能原因是设备发生故障,频繁上报告警;大于该区间的可能是告警采集流程异常。数据集符合高斯分布趋势,一元特征统计方式简单,空间复杂度低,故可以选择高斯分布算法进行模型构建,得到离群点检测模型。
具体的,模型构建过程包括如下过程。
(1)得到m个告警特征训练样本X={x(1),x(2),…,x(m)}满足高斯分布,记为X~N(μ,σ2),高斯分布算法定义X样本集的概率密度函数如下:
其中,μ表示X样本(告警特征集)集在各个维度上的数学期望,σ2表示X样本集在各个维度上的方差。
(2)根据m个训练样本X的概率密度函数ρ(x),以及利用少量Cross Validation(交叉验证)集确定的阈值ε(ε=99%),可得密度估计:
得n个保留样本集X={x(1),x(2),…,x(n)}。
通过离群点检测模型对告警特征进行离群点检测,能够快速且准确地剔除异常数据,确保第一告警特征集的数据准确性。
在一种实施例中,步骤S120可以包括:
根据所述第一告警特征集,得到告警发生时间间隔信息;
根据所述告警发生时间间隔信息,得到第二告警特征集;
根据所述第二告警特征集,拟合告警质量预警阈值。
需要说明的是,告警发生时间间隔信息包括告警发生时间信息、告警发生时长信息等等,通过告警发生时间信息可以例如计算得到上次告警发生时间与本次告警发生时间的时间间隔信息等等。
需要说明的是,所述第二告警特征集包括告警发生时间间隔特征和告警发生时间间隔出现次数特征。其中,告警发生时间间隔特征表征规整后的AlarmPeriod((AlarmTime2-AlarmTime 1),即该设备类型上次告警发生时间与本次告警发生时间的时间间隔,该时间间隔可以根据告警发生时间间隔信息得到),规整可以是对告警发生时间间隔数值进行四舍五入取整为10的倍数,例如AlarmPeriod为28分钟(mins),则规整为30分钟(mins),告警发生时间间隔出现次数特征表征告警发生时间间隔出现过的次数(该告警发生时间间隔出现过的次数可以根据告警发生时间间隔信息得到),所以第二告警特征集中的特征可以表示为AQ={(AP_N,num)},AP_N表示告警发生时间间隔特征,num表示告警发生时间间隔出现次数特征,得到第二告警特征集AQ_n:
AQ_n={(APN (1),num(1)),(APN (2),num(2)),…,(AP_N(N),num(N))。
进一步地,所述根据所述第二告警特征集,拟合告警质量预警阈值,可以包括:
根据所述告警发生时间间隔出现次数特征,为所述告警发生时间间隔特征设置权重;
根据设置权重后的告警发生时间间隔特征,拟合告警质量预警阈值。
可以通过式(5)计算得到告警质量预警阈值ts1:
一般而言,阈值应该涵盖所有正常值,粗略的算法可以直接取正常值的最大值。由于考虑到高斯算法中边界正常值和异常值判定模糊,则选择二次判定的方法:通过权重分配计算告警质量预警阈值(若存在高斯算法判定中涵盖部分边缘异常值,则告警质量预警阈值无比趋向于最终阈值;若高斯算法准确排除所有异常值,则告警质量预警阈值会比最终阈值偏小),进而通过监督学习进行定向加权修正。
进一步地,所述根据告警质量预警事件修正所述告警质量预警阈值,可以包括:
判断告警质量监控中出现的告警质量预警事件的真伪性,得到伪告警质量预警事件;
根据伪告警质量预警事件的源域数据,修正所述告警质量预警阈值。
需要说明的是,判断告警质量监控中出现的告警质量预警事件的真伪性,得到伪告警质量预警事件可以通过人工判断或现有的任何其他技术自动判断。
具体的,所述根据伪告警质量预警事件的源域数据,修正所述告警质量预警阈值,可以包括:
根据伪告警质量预警事件的源域数据,得到第三告警特征集;
根据所述第三告警特征集,通过迭代加权修正所述告警质量预警阈值。
需要说明的是,可以先构建含有真伪标记的源域数据集:以告警质量预警阈值ts1作为最终阈值运行,网络中会出现N次告警质量预警(其中m次为真,n次为伪,N=m+n),当判断得到告警质量预警为伪告警质量预警时,从源域数据库中提取对应的数据,标记真实标记AP_N_T。
整合得到第三告警特征集AQ_n2为:
AQ_n2
={(ts1,num(1)),(AP_N_T(1),num(2)),…,(AP_N_T(N),num(N))}
再利用第三告警特征集AQ_n2(即标记的源域数据)根据下式(5)对告警质量预警阈值进行迭代加权修正:
其中ts2表示修正后的告警质量预警阈值(第二阈值),ts1表示修正前的告警质量预警阈值(第一阈值),N表示告警质量预警事件出现的次数,num表示告警发生时间间隔出现次数特征,AP_N_T表示伪告警质量预警事件对应的源域数据的真实标记(第三告警特征集AQ_n2)。
通过本申请对告警质量预警阈值的多次迭代修正,能够保证告警质量预警阈值始终符合网络实际情况的管理,时效性高,使得网络侧设备能够及时地发出准确的告警,大大降低告警误差率。
另外,关于运营商实际生产流程对本申请的实现方式进一步说明如下:
1)告警质量监控本质上是对设备告警生成、监测系统采集、数据库储存等流程进行管控,对于活动告警,需要基于相应环节特定标识字段进行有效分类,进而完成告警特征离群点检测模型的建立,输出告警特征合理值集合。
2)在系统初运行阶段需要积累足够的数据量,以拟合尽可能合理的第一阈值。成熟运行后,新增类型可以自主借鉴分类中已稳定运行的阈值初步拟合其第一阈值,以缩短数据积累时间。
3)对告警质量监测每一环节,通过动态阈值生成算法定位告警异常临界点。
以下将描述应用本申请提出的告警质量监控方法的效果分析。
以2021年第二季度广东移动云化告警质量分析为例,运用本申请提出的告警质量监控方法,通过离群点检测模型筛选告警特征、迭代优化告警质量预警阈值,形成动态的告警质量预警阈值实现定位告警质量异常事件,得到结论如下:
(1)2021年第二季度共生成21单告警质量预警,覆盖3大类(标记字段为:omcid、sourceid、厂家&设备类型),分析存在误告1单,误告率为4.19%;共0单预警上报时延超管理办法要求阈值(60分钟),延时上报率为0%。
(2)同比2020年第二季度,未运用本申请提出的告警质量监控方法,云化告警质量分析共生成58单告警质量预警,分析存在误告39单,误告率为67.24%;共27单上报时延超要求阈值,延时上报率为46.55%。
本申请提出的告警质量监控方法可以在实际生产中随网络变动情况有效拟合适当的告警质量预警阈值,提升告警质量异常事件处理效率,有效保障网络安全运行。对比现有方案,本申请具有明显优势:
1)预警正确率明显提高,本申请预警有效率超95%。随着数据累积,告警质量预警阈值迭代的精准化会继续提高,维护人员无效处理比例压缩,减少维护人员工作负荷;
2)异常定位时长缩短,及时率达100%。有效控制告警质量劣化管控空窗期,减少故障风险。
可见,本申请提出的告警质量监控方法,具有通用性、标准化,通过迭代修正告警质量预警阈值实现网络异常事件智能定位,自适应程度高,适应性广,可在多行业应用;且本申请涉及的算法实现简单但效果明显,基于告警特征相异度人工智能深度学习对告警质量预警阈值进行自更新,不以人为经验为判断原则,更智能且精确地实现高效故障定位,提升异常解决效率。
另外,本文所指的动态告警质量预警阈值实质是指迭代修正告警质量预警阈值,告警质量预警阈值是可变的、是动态化的,使其可适应于多种情况的告警质量监控。
下面对本申请实施例提供的告警质量监控装置进行描述,下文描述的告警质量监控装置与上文描述的告警质量监控方法可相互对应参照。
图2为本申请实施例提供一种告警质量监控装置的结构示意图。
参照图2,本申请实施例提供一种告警质量监控装置,可以包括:
离群点检测模块210,用于:对告警特征进行离群点检测,剔除异常特征,得到第一告警特征集;
告警质量预警阈值拟合模块220,用于:基于所述第一告警特征集,拟合告警质量预警阈值;
告警质量预警阈值修正模块230,用于:基于所述告警质量预警阈值进行告警质量监控,并根据告警质量监控中出现的伪告警质量预警事件修正所述告警质量预警阈值。
在一种实施例中,所述离群点检测模块210包括:
告警特征得到子模块,用于:根据告警发生时间信息,得到所述告警特征;
离群点检测子模块,用于:通过离群点检测模型对所述告警特征进行离群点检测;
其中,所述离群点检测模型基于高斯分布算法训练得到。
在一种实施例中,所述告警质量预警阈值拟合模块220包括:
告警发生时间间隔信息得到子模块,用于:根据所述第一告警特征集,得到告警发生时间间隔信息;
第二告警特征集得到子模块,用于:根据所述告警发生时间间隔信息,得到第二告警特征集;
告警质量预警阈值拟合子模块,用于:根据所述第二告警特征集,拟合所述告警质量预警阈值。
在一种实施例中,所述第二告警特征集包括告警发生时间间隔特征和告警发生时间间隔出现次数特征。
在一种实施例中,所述告警质量预警阈值拟合子模块包括:
权重分配子模块,用于:根据所述告警发生时间间隔出现次数特征,为所述告警发生时间间隔特征设置权重;
阈值拟合子模块,用于:根据设置权重后的告警发生时间间隔特征,拟合所述告警质量预警阈值。
在一种实施例中,所述告警质量预警阈值修正模块230包括:
伪告警质量预警事件得到子模块,用于:判断告警质量监控中出现的告警质量预警事件的真伪性,得到伪告警质量预警事件;
告警质量预警阈值修正子模块,用于:根据所述伪告警质量预警事件的源域数据,修正所述告警质量预警阈值。
在一种实施例中,所述告警质量预警阈值修正子模块包括:
第三告警特征集得到子模块,用于:根据所述伪告警质量预警事件的源域数据,得到第三告警特征集;
阈值迭代修正子模块,用于:根据所述第三告警特征集,通过迭代加权修正所述告警质量预警阈值。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)810、通信接口(Communication Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的计算机程序,以执行告警质量监控方法的步骤,例如包括:
对告警特征进行离群点检测,剔除异常特征,得到第一告警特征集;
基于所述第一告警特征集,拟合告警质量预警阈值;
基于所述告警质量预警阈值进行告警质量监控,并根据告警质量监控中出现的伪告警质量预警事件修正所述告警质量预警阈值。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各实施例所提供的告警质量监控方法的步骤,例如包括:
对告警特征进行离群点检测,剔除异常特征,得到第一告警特征集;
基于所述第一告警特征集,拟合告警质量预警阈值;
基于所述告警质量预警阈值进行告警质量监控,并根据告警质量监控中出现的伪告警质量预警事件修正所述告警质量预警阈值。
另一方面,本申请实施例还提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使处理器执行上述各实施例所提供的告警质量监控方法的步骤,例如包括:
对告警特征进行离群点检测,剔除异常特征,得到第一告警特征集;
基于所述第一告警特征集,拟合告警质量预警阈值;
基于所述告警质量预警阈值进行告警质量监控,并根据告警质量监控中出现的伪告警质量预警事件修正所述告警质量预警阈值。
所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种告警质量监控方法,其特征在于,包括:
对告警特征进行离群点检测,剔除异常特征,得到第一告警特征集;
基于所述第一告警特征集,拟合告警质量预警阈值;
基于所述告警质量预警阈值进行告警质量监控,并根据告警质量监控中出现的伪告警质量预警事件修正所述告警质量预警阈值。
2.根据权利要求1所述的告警质量监控方法,其特征在于,所述对告警特征进行离群点检测,包括:
根据告警发生时间信息,得到所述告警特征;
通过离群点检测模型对所述告警特征进行离群点检测;
其中,所述离群点检测模型基于高斯分布算法训练得到。
3.根据权利要求2所述的告警质量监控方法,其特征在于,所述基于所述第一告警特征集,拟合告警质量预警阈值,包括:
根据所述第一告警特征集,得到告警发生时间间隔信息;
根据所述告警发生时间间隔信息,得到第二告警特征集;
根据所述第二告警特征集,拟合所述告警质量预警阈值。
4.根据权利要求3所述的告警质量监控方法,其特征在于,所述第二告警特征集包括告警发生时间间隔特征和告警发生时间间隔出现次数特征。
5.根据权利要求4所述的告警质量监控方法,其特征在于,所述根据所述第二告警特征集,拟合所述告警质量预警阈值,包括:
根据所述告警发生时间间隔出现次数特征,为所述告警发生时间间隔特征设置权重;
根据设置权重后的告警发生时间间隔特征,拟合所述告警质量预警阈值。
6.根据权利要求1-5任一项所述的告警质量监控方法,其特征在于,所述根据告警质量预警事件修正所述告警质量预警阈值,包括:
判断告警质量监控中出现的告警质量预警事件的真伪性,得到伪告警质量预警事件;
根据所述伪告警质量预警事件的源域数据,修正所述告警质量预警阈值。
7.根据权利要求6所述的告警质量监控方法,其特征在于,所述根据所述伪告警质量预警事件的源域数据,修正所述告警质量预警阈值,包括:
根据所述伪告警质量预警事件的源域数据,得到第三告警特征集;
根据所述第三告警特征集,通过迭代加权修正所述告警质量预警阈值。
8.一种告警质量监控装置,其特征在于,包括:
离群点检测模块,用于:对告警特征进行离群点检测,剔除异常特征,得到第一告警特征集;
告警质量预警阈值拟合模块,用于:基于所述第一告警特征集,拟合告警质量预警阈值;
告警质量预警阈值修正模块,用于:基于所述告警质量预警阈值进行告警质量监控,并根据告警质量监控中出现的伪告警质量预警事件修正所述告警质量预警阈值。
9.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的告警质量监控方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的告警质量监控方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111612926.2A CN116366421A (zh) | 2021-12-27 | 2021-12-27 | 告警质量监控方法、装置、电子设备、及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111612926.2A CN116366421A (zh) | 2021-12-27 | 2021-12-27 | 告警质量监控方法、装置、电子设备、及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116366421A true CN116366421A (zh) | 2023-06-30 |
Family
ID=86910314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111612926.2A Pending CN116366421A (zh) | 2021-12-27 | 2021-12-27 | 告警质量监控方法、装置、电子设备、及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116366421A (zh) |
-
2021
- 2021-12-27 CN CN202111612926.2A patent/CN116366421A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110880984B (zh) | 基于模型的流量异常监测方法、装置、设备及存储介质 | |
EP3539316B1 (en) | Prediction of performance indicators in cellular networks | |
US10903554B2 (en) | Machine learning models for detecting the causes of conditions of a satellite communication system | |
WO2017215647A1 (en) | Root cause analysis in a communication network via probabilistic network structure | |
CA3113626A1 (en) | Machine learning clustering models for determining the condition of a communication system | |
CN110968061B (zh) | 设备故障的预警方法、装置、存储介质和计算机设备 | |
US8660022B2 (en) | Adaptive remote decision making under quality of information requirements | |
CN111262750B (zh) | 一种用于评估基线模型的方法及系统 | |
CN114978956B (zh) | 智慧城市网络设备性能异常突变点检测方法及装置 | |
US20180295014A1 (en) | Managing Network Alarms | |
US20210359899A1 (en) | Managing Event Data in a Network | |
CN114630352A (zh) | 一种接入设备的故障监测方法和装置 | |
CN114095965A (zh) | 指标检测模型获取及故障定位方法、装置、设备及存储介质 | |
US20220382833A1 (en) | Methods and apparatus for automatic anomaly detection | |
US11146447B2 (en) | Method and apparatus of establishing computer network monitoring criteria | |
CN113918433A (zh) | 一种自适应的智慧网络设备性能指标异常检测装置及方法 | |
CN117093461A (zh) | 一种时延检测分析的方法、系统、设备和存储介质 | |
CN116366421A (zh) | 告警质量监控方法、装置、电子设备、及程序产品 | |
CN114666210B (zh) | 基于大数据日志分析的告警方法及装置 | |
Khatib et al. | LTE performance data reduction for knowledge acquisition | |
CN112820062B (zh) | 一种火灾发生概率预测方法及系统 | |
CN114020971A (zh) | 一种异常数据检测方法及装置 | |
Rozaki | Design and implementation for automated network troubleshooting using data mining | |
CN111078974A (zh) | 实时检测新闻量异常的方法、设备和存储介质 | |
CN111327442A (zh) | 基于控制图的投诉预警阈值获取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |