CN111200530A - 一种基于kpi指标进行根因分析的方法及装置 - Google Patents

一种基于kpi指标进行根因分析的方法及装置 Download PDF

Info

Publication number
CN111200530A
CN111200530A CN201911424019.8A CN201911424019A CN111200530A CN 111200530 A CN111200530 A CN 111200530A CN 201911424019 A CN201911424019 A CN 201911424019A CN 111200530 A CN111200530 A CN 111200530A
Authority
CN
China
Prior art keywords
alarm
kpi
alarms
log
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911424019.8A
Other languages
English (en)
Inventor
冯勇
熊昌伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHANJET INFORMATION TECHNOLOGY CO LTD
Original Assignee
CHANJET INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHANJET INFORMATION TECHNOLOGY CO LTD filed Critical CHANJET INFORMATION TECHNOLOGY CO LTD
Priority to CN201911424019.8A priority Critical patent/CN111200530A/zh
Publication of CN111200530A publication Critical patent/CN111200530A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种基于KPI指标进行根因分析的方法,包括:进行KPI指标的定义,主要分为日志和监控2大类,其中日志主要包括访问日志和程序日志,访问日志KPI指标包括访问量变化、响应时间变化和状态码变化,程序日志KPI指标定义包括严重等级标签和重要等级标签,监控类KPI指标定义包括CPU、内存、IO和网络,每种指标分为核心指标和重要指标,每种指标对应一个权重值,指标是报警的形式存在;在应用报警发生时,基于KPI指标模型统一分析处理报警,再由程序根据预定的规则和算法,进行分析和判断,给出一个初步的分析结果作为参考,综合分析故障报警原因。

Description

一种基于KPI指标进行根因分析的方法及装置
技术领域
本发明涉及计算机网络技术领域,更具体地,涉及一种基于KPI指标进行根因分析的方法及装置。
背景技术
随着中小企业数字化转型的深入,以及业务的快速变化,应用也愈加趋于互联网化,应用正快速由传统的架构逐步转向分布式的微服务架构,服务类型复杂多样,应用之间的调用关系也越来越复杂,传统的依靠手工,以及运维专家个人经验,“基于人为指定规则”的专家系统逐渐变得力不从心。尤其在进行故障原因分析、定位、排除的过程,其耗时也越来越长,这种情况严重影响用户的体验。
应用稳定运行,需要关注很多方面。当同一时间接收到多条应用灾难级报警时,报警处理的优先级就显得尤为重要,但是往往人为短时间无法准确的判断,小的故障如果没能及时得到处理,就容易导致更大的应用故障。
发明内容
在现有的监控手段下,定位和分析问题还是比较繁琐的,通过将各类信息集中起来,基于KPI指标模型统一分析处理,再由程序根据预定的规则和算法,进行分析和判断,给出一个初步的分析结果作为参考,这样就可以大大提高问题修复的效率,降低故障发生的概率。
本发明提供一种基于KPI指标进行根因分析的方法,包括:
步骤一、进行KPI指标的定义,主要分为日志和监控2大类,其中日志主要包括访问日志和程序日志,访问日志KPI指标包括访问量变化、响应时间变化和状态码变化,程序日志KPI指标定义包括严重等级标签和重要等级标签,监控类KPI指标定义包括CPU、内存、IO和网络,每种指标分为核心指标和重要指标,每种指标对应一个权重值,指标是报警的形式存在;
步骤二、在应用报警发生时,基于KPI指标模型统一分析处理报警,产生的报警维度包括日志类报警和监控类报警2大类,其中日志类报警主要包括访问日志报警和程序日志报警,访问日志报警维度包括访问量报警、响应时间报警和状态码报警,程序日志报警维度包括严重等级标签报警和重要等级标签报警,监控类报警维度包括CPU报警、内存报警、IO报警和网络报警,每种报警指标分为核心指标和重要指标;
步骤三、再由程序根据预定的规则和算法,进行分析和判断,给出一个初步的分析结果作为参考,综合分析故障报警原因。
在本公开的一实施例中,所述核心指标和重要指标定义包括由异常检测模型实时检测产生的异常检测的报警、超过阈值的报警和同环比超阈值的报警。
在本公开的一实施例中,所述异常检测模型采用孤立森林(Isolation Forest)异常检测算法。
在本公开的一实施例中,所述孤立森林(Isolation Forest)异常检测算法构建流程包括数据获取整合、数据质量检查、数据清洗、特征工程、样本采集、模型训练及参数优化、模型发布、模型使用、模型反馈及优化。
在本公开的一实施例中,所述数据清洗对访问日志按照如下固定格式:域名、访问地址(url)、访问时间、响应时间、流量、状态码进行切分,同时按照数据要求进行数据类型转换。
在本公开的一实施例中,所述模型使用调用访问日志异常检测模型服务,进行预测,输出时间点、域名、预测对应的分值,分值在0—1之间,分值越大,表示异常的可能性越高。
本发明另公开了一种基于KPI指标进行根因分析的装置,包括:
KPI指标定义模块,进行KPI指标的定义,主要分为日志和监控2大类,其中日志主要包括访问日志和程序日志,访问日志KPI指标包括访问量变化、响应时间变化和状态码变化,程序日志KPI指标定义包括严重等级标签和重要等级标签,监控类KPI指标定义包括CPU、内存、IO和网络,每种指标分为核心指标和重要指标,每种指标对应一个权重值,指标是报警的形式存在;
KPI指标报警模块,用于在应用报警发生时,基于KPI指标模型统一分析处理报警,产生的报警维度包括日志类报警和监控类报警2大类,其中日志类报警主要包括访问日志报警和程序日志报警,访问日志报警维度包括访问量报警、响应时间报警和状态码报警,程序日志报警维度包括严重等级标签报警和重要等级标签报警,监控类报警维度包括CPU报警、内存报警、IO报警和网络报警,每种报警指标分为核心指标和重要指标;
故障分析模块,用于再由程序根据预定的规则和算法,进行分析和判断,给出一个初步的分析结果作为参考,综合分析故障报警原因。
在本公开的一实施例中,所述核心指标和重要指标定义包括由异常检测模型实时检测产生的异常检测的报警、超过阈值的报警和同环比超阈值的报警。
在本公开的一实施例中,所述应用日志异常检测模型采用孤立森林(IsolationForest)异常检测算法。
在本公开的一实施例中,所述孤立森林(Isolation Forest)异常检测算法构建流程包括数据获取整合、数据质量检查、数据清洗、特征工程、样本采集、模型训练及参数优化、模型发布、模型使用、模型反馈及优化。
在本公开的一实施例中,所述数据清洗对访问日志按照如下固定格式:域名、访问地址(url)、访问时间、响应时间、流量、状态码进行切分,同时按照数据要求进行数据类型转换。
在本公开的一实施例中,所述模型使用调用访问日志异常检测模型服务,进行预测,输出时间点、域名、预测对应的分值,分值在0—1之间,分值越大,表示异常的可能性越高。
本发明提供的一种基于KPI指标进行根因分析的方法及装置,具有如下技术效果:
1、基于应用日志,可以方便快速的构建特征工程,以及获取多种维度的样本。
2、采用成熟的算法建立多维的异常检测模型,可以通过预测分值的大小输出可能的异常点。
3、以应用故障为触发事件,综合分析故障原因。
本发明实施例的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明实施例的技术方案做进一步的详细描述。
附图说明
图1是KPI指标分析模型示意图;
图2是异常检测算法Isolation Forest(孤立森林)构建流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明基于KPI指标进行根因分析的方法及装置,通过将各类信息集中起来,基于KPI指标模型统一分析处理,再由程序根据预定的规则和算法,进行分析和判断,给出一个初步的分析结果作为参考,这样就可以大大提高问题修复的效率,降低故障发生的概率。
本发明提供的一种基于KPI指标进行根因分析的方法,以应用故障为触发事件,基于KPI指标分析模型,进行根因分析,通过机器学习建立应用日志异常检测模型。通过应用日志异常检测模型对应用日志多维度的异常检测,定位异常点,综合分析报警原因。
KPI指标分析模型结构图如图1。首先进行KPI指标的定义,主要分为日志和监控2大类,指标分为核心指标和重要指标,每种指标对应一个权重值,指标是报警的形式存在。其中日志主要包括,应用的访问日志和程序日志。针对程序日志,会对程序产生的错误日志,实时进行清洗,关联应用的错误日志标签库,对应用错误日志进行打标签,通过标签的实时变化,分析应用是否存在异常情况。
访问日志KPI指标定义:
访问量变化
核心指标:异常检测的报警
重要指标:同环比超阈值的报警
响应时间变化
核心指标:95分位的报警
重要指标:异常检测的报警
状态码变化,包括正常状态码和错误状态码。
正常状态码的核心指标:异常检测的报警
正常状态码的重要指标:同环比超阈值的报警
错误状态码的核心指标:超过阈值的报警
错误状态码的重要指标:同环比超阈值的报警
程序日志KPI指标定义,会根据标签的等级进行定义:
1、严重等级标签
核心指标:超过阈值的报警
重要指标:同环比超阈值的报警
2、重要等级标签
核心指标:异常检测的报警
重要指标:同环比超阈值的报警
监控类KPI指标定义:
CPU
核心指标:异常检测的报警
重要指标:超过阈值的报警
内存
核心指标:异常检测的报警
重要指标:超过阈值的报警
IO
核心指标:异常检测的报警
重要指标:超过阈值的报警
网络
核心指标:异常检测的报警
重要指标:超过阈值的报警
本发明基于KPI指标进行根因分析的方法,以应用故障为触发事件,基于KPI指标分析模型,产生报警,进行根因分析。本实施例基于KPI指标产生的报警维度如下:
1、日志类报警
异常检测的报警,是由异常检测模型实时检测产生的。
同环比超阈值的报警,是以分钟聚类的结果,与前一天、上一周进行同比,检测超过阈值产生的。
超过阈值的报警,定时检测统计值超过阈值产生的。
如下表1所示,访问日志报警分为四个维度,分别为访问量、响应时间、正常状态码和错误状态码。本实施例访问量和正常状态码产生了核心指标报警,响应时间和错误状态码产生了重要指标报警。程序日志报警以标签等级为维度,分别为严重和重要。本实施例严重标签产生了核心指标报警,重要标签产生了重要指标报警。
Figure BDA0002350418780000061
表1
2、监控类报警
异常检测的报警,是由异常检测模型实时检测监控值产生的。
超过阈值的报警,是定时检测监控值超过阈值产生的。
如下表2所示,监控报警分为四个维度,分别为CPU、内存、IO和网络。本实施例CPU和IO维度产生了核心指标报警,内存和网络维度产生了重要指标报警。
Figure BDA0002350418780000071
表2
3、独立事件
独立事件,主要包括产品更新、系统操作、脚步执行等事件。
异常检测报警是基于KPI指标进行根因分析的重要环节,是获得KPI指标的关键手段之一。训练访问日志的异常检测模型,采用的是业界较为成熟的异常检测算法IsolationForest(孤立森林),构建流程图如图(2),包括如下过程:数据获取整合、数据质量检查、数据清洗、特征工程、样本采集、模型训练及参数优化、模型发布、模型使用、模型反馈及优化。下面是这些过程的详细介绍:
1、数据获取整合
将所有的访问日志,按照时间顺序,以相同的格式收集整合在一起。
2、数据质量检查
实时对收集到日志进行检查,过滤掉脏数据,脏数据主要包括缺失值、异常值和不一致的值。
3、数据清洗
访问日志按照如下固定格式:域名、访问地址(url)、访问时间、响应时间、流量、状态码等进行切分,同时按照数据要求进行数据类型转换。数据类型转换可选择格式有产品+访问次数、产品+平均响应时间、产品+平均流量、产品+状态码+访问次数等,按照分钟级进行聚类,构造出各特征项。
4、特征工程
结合日常人工巡检的经验,优先选择的是产品+访问次数、产品+平均响应时间、产品+平均流量3项特征作为异常检测的3个维度。
5、样本采集
对特征工程中构造的特征集,选取30天的特征数据作为样本。
6、模型训练及参数优化
使用“孤立森林”异常检测算法进行建模,对这些模型在交叉验证的基础上进行模型选择,在选择好的模型上对特定模型的参数进行最优值查找,选择在验证集上表现最优的参数,作为最优的模型参数。
7、模型发布
对构建好的模型发布成服务。
8、模型使用
在实时收集日志过程中,调用访问日志异常检测模型服务,进行预测,输出时间点、域名、预测对应的分值,分值在0—1之间,分值越大,表示异常的可能性越高。
9、模型反馈及优化
根据检测的效果,调整特征及样本。
本发明又一实施例提供一种基于KPI指标进行根因分析的装置,包括:KPI指标定义模块,进行KPI指标的定义,主要分为日志和监控2大类,其中日志主要包括访问日志和程序日志,访问日志KPI指标包括访问量变化、响应时间变化和状态码变化,程序日志KPI指标定义包括严重等级标签和重要等级标签,监控类KPI指标定义包括CPU、内存、IO和网络,每种指标分为核心指标和重要指标,每种指标对应一个权重值,指标是报警的形式存在;KPI指标报警模块,用于在应用报警发生时,基于KPI指标模型统一分析处理报警,产生的报警维度包括日志类报警和监控类报警2大类,其中日志类报警主要包括访问日志报警和程序日志报警,访问日志报警维度包括访问量报警、响应时间报警和状态码报警,程序日志报警维度包括严重等级标签报警和重要等级标签报警,监控类报警维度包括CPU报警、内存报警、IO报警和网络报警,每种报警指标分为核心指标和重要指标;故障分析模块,用于再由程序根据预定的规则和算法,进行分析和判断,给出一个初步的分析结果作为参考,综合分析故障报警原因。
其中,核心指标和重要指标定义包括由异常检测模型实时检测产生的异常检测的报警、超过阈值的报警和同环比超阈值的报警。异常检测模型采用孤立森林(IsolationForest)异常检测算法。孤立森林(Isolation Forest)异常检测算法构建流程包括数据获取整合、数据质量检查、数据清洗、特征工程、样本采集、模型训练及参数优化、模型发布、模型使用、模型反馈及优化。数据清洗对访问日志按照如下固定格式:域名、访问地址(url)、访问时间、响应时间、流量、状态码进行切分,同时按照数据要求进行数据类型转换。所述模型使用调用访问日志异常检测模型服务,进行预测,输出时间点、域名、预测对应的分值,分值在0—1之间,分值越大,表示异常的可能性越高。
本发明实施方法及装置通过将各类信息集中起来,基于KPI指标模型统一分析处理各种报警,给出报警的KPI指标类型,再由程序根据预定的规则和算法,进行分析和判断,给出一个初步的分析结果作为参考,这样就可以大大提高问题修复的效率,降低故障发生的概率。
以上所述仅为本发明的较佳实施例而已,为方便本领域的技术人员更容易理解而设计,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种基于KPI指标进行根因分析的方法,其特征在于,包括:
步骤一、进行KPI指标的定义,主要分为日志和监控2大类,其中日志主要包括访问日志和程序日志,访问日志KPI指标包括访问量变化、响应时间变化和状态码变化,程序日志KPI指标定义包括严重等级标签和重要等级标签,监控类KPI指标定义包括CPU、内存、IO和网络,每种指标分为核心指标和重要指标,每种指标对应一个权重值,指标是报警的形式存在;
步骤二、在应用报警发生时,基于KPI指标模型统一分析处理报警,产生的报警维度包括日志类报警和监控类报警2大类,其中日志类报警主要包括访问日志报警和程序日志报警,访问日志报警维度包括访问量报警、响应时间报警和状态码报警,程序日志报警维度包括严重等级标签报警和重要等级标签报警,监控类报警维度包括CPU报警、内存报警、IO报警和网络报警,每种报警指标分为核心指标和重要指标;
步骤三、再由程序根据预定的规则和算法,进行分析和判断,给出一个初步的分析结果作为参考,综合分析故障报警原因。
2.如权利要求1所述的方法,其特征在于,所述核心指标和重要指标定义包括由异常检测模型实时检测产生的异常检测的报警、超过阈值的报警和同环比超阈值的报警。
3.如权利要求2所述的方法,其特征在于,所述异常检测模型采用孤立森林(IsolationForest)异常检测算法。
4.如权利要求3所述的方法,其特征在于,所述孤立森林(Isolation Forest)异常检测算法构建流程包括数据获取整合、数据质量检查、数据清洗、特征工程、样本采集、模型训练及参数优化、模型发布、模型使用、模型反馈及优化。
5.如权利要求4所述的方法,其特征在于,所述数据清洗对访问日志按照如下固定格式:域名、访问地址(url)、访问时间、响应时间、流量、状态码进行切分,同时按照数据要求进行数据类型转换。
6.如权利要求4所述的方法,其特征在于,所述模型使用调用访问日志异常检测模型服务,进行预测,输出时间点、域名、预测对应的分值,分值在0—1之间,分值越大,表示异常的可能性越高。
7.一种基于KPI指标进行根因分析的装置,其特征在于,包括:KPI指标定义模块,进行KPI指标的定义,主要分为日志和监控2大类,其中日志主要包括访问日志和程序日志,访问日志KPI指标包括访问量变化、响应时间变化和状态码变化,程序日志KPI指标定义包括严重等级标签和重要等级标签,监控类KPI指标定义包括CPU、内存、IO和网络,每种指标分为核心指标和重要指标,每种指标对应一个权重值,指标是报警的形式存在;
KPI指标报警模块,用于在应用报警发生时,基于KPI指标模型统一分析处理报警,产生的报警维度包括日志类报警和监控类报警2大类,其中日志类报警主要包括访问日志报警和程序日志报警,访问日志报警维度包括访问量报警、响应时间报警和状态码报警,程序日志报警维度包括严重等级标签报警和重要等级标签报警,监控类报警维度包括CPU报警、内存报警、IO报警和网络报警,每种报警指标分为核心指标和重要指标;
故障分析模块,用于再由程序根据预定的规则和算法,进行分析和判断,给出一个初步的分析结果作为参考,综合分析故障报警原因。
8.如权利要求7所述的装置,其特征在于,所述核心指标和重要指标定义包括由异常检测模型实时检测产生的异常检测的报警、超过阈值的报警和同环比超阈值的报警。
9.如权利要求8所述的装置,其特征在于,所述异常检测模型采用孤立森林(IsolationForest)异常检测算法。
10.如权利要求9所述的装置,其特征在于,所述孤立森林(Isolation Forest)异常检测算法构建流程包括数据获取整合、数据质量检查、数据清洗、特征工程、样本采集、模型训练及参数优化、模型发布、模型使用、模型反馈及优化。
11.如权利要求10所述的装置,其特征在于,所述数据清洗对访问日志按照如下固定格式:域名、访问地址(url)、访问时间、响应时间、流量、状态码进行切分,同时按照数据要求进行数据类型转换。
12.如权利要求10所述的装置,其特征在于,所述模型使用调用访问日志异常检测模型服务,进行预测,输出时间点、域名、预测对应的分值,分值在0—1之间,分值越大,表示异常的可能性越高。
CN201911424019.8A 2019-12-31 2019-12-31 一种基于kpi指标进行根因分析的方法及装置 Pending CN111200530A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911424019.8A CN111200530A (zh) 2019-12-31 2019-12-31 一种基于kpi指标进行根因分析的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911424019.8A CN111200530A (zh) 2019-12-31 2019-12-31 一种基于kpi指标进行根因分析的方法及装置

Publications (1)

Publication Number Publication Date
CN111200530A true CN111200530A (zh) 2020-05-26

Family

ID=70746757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911424019.8A Pending CN111200530A (zh) 2019-12-31 2019-12-31 一种基于kpi指标进行根因分析的方法及装置

Country Status (1)

Country Link
CN (1) CN111200530A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450139A (zh) * 2021-06-04 2021-09-28 上海明略人工智能(集团)有限公司 基于交互策略的流量检测、系统、存储介质及电子设备
US11265205B2 (en) * 2020-07-31 2022-03-01 Verizon Patent And Licensing Inc. System and method for anomaly detection with root cause identification
CN114650240A (zh) * 2022-03-10 2022-06-21 网宿科技股份有限公司 一种业务数据的异常检测方法及装置
CN116302660A (zh) * 2023-05-16 2023-06-23 天津金城银行股份有限公司 一种重试获取异常信息的方法、系统、计算机和存储介质
CN117271350A (zh) * 2023-09-28 2023-12-22 江苏天好富兴数据技术有限公司 一种基于日志分析的软件质量评估系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105873105A (zh) * 2016-04-22 2016-08-17 中国科学技术大学 一种基于网络体验质量的移动通信网异常检测和定位方法
US20170208487A1 (en) * 2016-01-20 2017-07-20 Tektronix Texas, Llc Multi kpi correlation in wireless protocols
CN110400052A (zh) * 2019-06-28 2019-11-01 北京汉迪移动互联网科技股份有限公司 关键性能指标的监控方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170208487A1 (en) * 2016-01-20 2017-07-20 Tektronix Texas, Llc Multi kpi correlation in wireless protocols
CN105873105A (zh) * 2016-04-22 2016-08-17 中国科学技术大学 一种基于网络体验质量的移动通信网异常检测和定位方法
CN110400052A (zh) * 2019-06-28 2019-11-01 北京汉迪移动互联网科技股份有限公司 关键性能指标的监控方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱海麒等: "人工智能时代面向运维数据的异常检测技术研究与分析", 《信息网络安全》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11265205B2 (en) * 2020-07-31 2022-03-01 Verizon Patent And Licensing Inc. System and method for anomaly detection with root cause identification
US20220150103A1 (en) * 2020-07-31 2022-05-12 Verizon Patent And Licensing Inc. System and method for anomaly detection with root cause identification
US11627033B2 (en) 2020-07-31 2023-04-11 Verizon Patent And Licensing Inc. System and method for anomaly detection with root cause identification
CN113450139A (zh) * 2021-06-04 2021-09-28 上海明略人工智能(集团)有限公司 基于交互策略的流量检测、系统、存储介质及电子设备
CN114650240A (zh) * 2022-03-10 2022-06-21 网宿科技股份有限公司 一种业务数据的异常检测方法及装置
CN116302660A (zh) * 2023-05-16 2023-06-23 天津金城银行股份有限公司 一种重试获取异常信息的方法、系统、计算机和存储介质
CN116302660B (zh) * 2023-05-16 2023-08-08 天津金城银行股份有限公司 一种重试获取异常信息的方法、系统、计算机和存储介质
CN117271350A (zh) * 2023-09-28 2023-12-22 江苏天好富兴数据技术有限公司 一种基于日志分析的软件质量评估系统及方法
CN117271350B (zh) * 2023-09-28 2024-07-02 江苏天好富兴数据技术有限公司 一种基于日志分析的软件质量评估系统及方法

Similar Documents

Publication Publication Date Title
CN111200530A (zh) 一种基于kpi指标进行根因分析的方法及装置
CN111309565B (zh) 告警处理方法、装置、电子设备以及计算机可读存储介质
CN112395170A (zh) 智能故障分析方法、装置、设备及存储介质
CN110708204A (zh) 一种基于运维知识库的异常处理方法、系统、终端及介质
CN112181758B (zh) 一种基于网络拓扑及实时告警的故障根因定位方法
CN111539493B (zh) 一种告警预测方法、装置、电子设备及存储介质
CN110428018A (zh) 一种全链路监控系统中的异常预测方法及装置
CN115809183A (zh) 基于知识图谱的信创终端故障发现及处置的方法
CN110636066B (zh) 基于无监督生成推理的网络安全威胁态势评估方法
CN110460591B (zh) 基于改进分层时间记忆网络的cdn流量异常检测装置及方法
CN116955092B (zh) 基于数据分析的多媒体系统监控方法及系统
CN112462734B (zh) 一种工业生产设备故障预测分析方法及模型
CN114757468B (zh) 一种面向流程挖掘中流程执行异常的根源分析方法
CN111666978B (zh) 一种it系统运维大数据的智能故障预警系统
CN114647558A (zh) 一种日志异常检测的方法和装置
CN114357171A (zh) 一种应急事件处理方法、装置、存储介质及电子设备
CN111352820A (zh) 一种高性能应用运行状态预测和监控方法、设备和装置
CN113778792B (zh) 一种it设备的告警归类方法及系统
CN116225752A (zh) 基于故障模式库的微服务系统故障根因分析方法及系统
CN114881112A (zh) 一种系统异常检测方法、装置、设备及介质
CN111221704B (zh) 一种确定办公管理应用系统运行状态的方法及系统
CN114662981A (zh) 基于大数据应用的污染源企业监管方法
CN114385398A (zh) 一种请求响应状态确定方法、装置、设备和存储介质
CN113296994A (zh) 一种基于国产计算平台的故障诊断系统及方法
CN118094531B (zh) 一种安全运维实时预警一体化系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200526

RJ01 Rejection of invention patent application after publication