CN107357714A - 一种基于监控平台的故障分析方法和装置 - Google Patents

一种基于监控平台的故障分析方法和装置 Download PDF

Info

Publication number
CN107357714A
CN107357714A CN201610301420.2A CN201610301420A CN107357714A CN 107357714 A CN107357714 A CN 107357714A CN 201610301420 A CN201610301420 A CN 201610301420A CN 107357714 A CN107357714 A CN 107357714A
Authority
CN
China
Prior art keywords
monitoring data
extreme value
result
distribution
hangover
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610301420.2A
Other languages
English (en)
Other versions
CN107357714B (zh
Inventor
陈爱明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610301420.2A priority Critical patent/CN107357714B/zh
Publication of CN107357714A publication Critical patent/CN107357714A/zh
Application granted granted Critical
Publication of CN107357714B publication Critical patent/CN107357714B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开一种基于监控平台的故障分析方法和装置,可解决其均衡分布判断问题。本发明提供一种基于监控平台的故障分析方法,包括:获取监控平台采集到的n个监控数据;根据n个监控数据的总体置信区间确定n个监控数据是否满足极值置信条件,得到极值置信结果;根据n个监控数据中的极值分布情况确定n个监控数据是否满足极值拖尾条件,得到极值拖尾结果;根据预置的数据精确度确定n个监控数据是否满足同一分布条件,得到同一分布结果;根据极值置信结果、极值拖尾结果、同一分布结果确定n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据均衡分布结果从n个监控数据中确定出需要进行故障分析的监控指标。

Description

一种基于监控平台的故障分析方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于监控平台的故障分析方法和装置。
背景技术
针对均衡分布判断问题,传统做法都是根源于统计学,主要是基于统计学进行数理统计,比如常用的方法是计算变量的分布函数或密度函数,还有假设检验方法,比如应用最广泛的Kolmogorov-Smirnov检验,简称为K-S检验。对于K-S检验法,主要是将待统计分析数据跟一组标准的数据进行对比,在判断待统计分析数据是否符合均衡分布状态时,先要产生一组标准的均衡分布随机数据,再通过对比两组数据之间的偏差来判定未知数据的分布状态。这期间需要计算两组数据的累积分布函数,同时去查阅对应的统计分布表,若偏差值落在对应的置信区间内,则待统计分析的数据符合均衡分布状态,否则,不符合均衡分布状态。
随着学科的不断发展,统计学与计算机科学不断交叉融合,兴起了机器学习的热潮。机器学习的核心部分也是统计学思想。在机器学习领域,对于判断未知数据是否服从均衡分布问题,机器学习中的离群点判断、聚类等方法都可以为该问题提供思路与解决办法。在离群点判断方法中,首先需要知道指定点,针对该点判断其是否脱离总体。若该点脱离了总体轨迹,则确定其为离群点,进而可确定该组数据不服从均衡分布,反之同理。可是在业务监控采样数据中,所有数据点都是未知的,而且都有可能是离群点,假如循环所有数据点去判断,这种做法的计算过程效率很低,无法适用于对业务监控采样数据的分析,特别是随着业务迅猛增长,监控质量要求不断提高,往往要求做到秒级监控,故障要实时、准确发现,从而离群点判断方法越来越不能适应。
而对于机器学习的聚类方法,也即数据挖掘的聚类算法,比如分割聚类法K-means、密度聚类法DBSCAN、小波分析聚类法WaveCluster等,主要面向的是二维及以上的多维数据。聚类方法在处理多维数据时必然会占用较多的内存资源,而业务监控采样数据通常不涉及到多维数据,因此无论从成本考虑,还是从效率方面考虑,聚类方法用来判断业务监控采样数据的均衡分布判断问题,都不是最优的选择。
通过分析以上提到的传统的数理统计方法、以统计学为核心的机器学习方法,可以发现:这种基于统计学的方法解决业务监控采样数据的均衡分布判断问题时,存在很多的缺陷。比如K-S检验需要先产生一组先验数据作为对比的标准数据,同时K-S检验方法对数据的随机性要求很高。又如,机器学习的聚类方法,分析其算法核心可发现,各聚类方法都需要计算不同定义下的数据点之间的距离,在处理当前监控平台的业务监控采样数据时会造成信息冗余,而且数据点间距离计算过程,通常需要多阶的运算,这将会导致成本高、效率低等问题。因此,目前已有的均衡分布判断方法,都不再适用于监控平台的业务故障自适应分析过程,无法解决其均衡分布判断问题。
发明内容
本发明实施例提供了一种基于监控平台的故障分析方法和装置,用于实现对监控平台的业务故障自适应分析过程,解决其均衡分布判断问题。
为解决上述技术问题,本发明实施例提供以下技术方案:
第一方面,本发明实施例提供一种基于监控平台的故障分析方法,包括:
获取监控平台采集到的n个监控数据,所述监控数据包括:监控指标和所述监控指标对应的监控数值,所述n为非零自然数;
根据所述n个监控数据的总体置信区间确定所述n个监控数据是否满足极值置信条件,得到极值置信结果;
根据所述n个监控数据中的极值分布情况确定所述n个监控数据是否满足极值拖尾条件,得到极值拖尾结果;
根据预置的数据精确度确定所述n个监控数据是否满足同一分布条件,得到同一分布结果;
根据所述极值置信结果、所述极值拖尾结果、所述同一分布结果确定所述n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据所述均衡分布结果从所述n个监控数据中确定出需要进行故障分析的监控指标。
第二方面,本发明实施例还提供一种基于监控平台的故障分析装置,包括:
获取模块,用于获取监控平台采集到的n个监控数据,所述监控数据包括:监控指标和所述监控指标对应的监控数值,所述n为非零自然数;
极值置信确定模块,用于根据所述n个监控数据的总体置信区间确定所述n个监控数据是否满足极值置信条件,得到极值置信结果;
极值拖尾确定模块,用于根据所述n个监控数据中的极值分布情况确定所述n个监控数据是否满足极值拖尾条件,得到极值拖尾结果;
同一分布确定模块,用于根据预置的数据精确度确定所述n个监控数据是否满足同一分布条件,得到同一分布结果;
均衡分布确定模块,用于根据所述极值置信结果、所述极值拖尾结果、所述同一分布结果确定所述n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据所述均衡分布结果从所述n个监控数据中确定出需要进行故障分析的监控指标。
从以上技术方案可以看出,本发明实施例具有以下优点:
在本发明实施例中,获取监控平台采集到的n个监控数据,监控数据包括:监控指标和监控指标对应的监控数值,根据n个监控数据的总体置信区间确定n个监控数据是否满足极值置信条件,得到极值置信结果,根据n个监控数据中的极值分布情况确定n个监控数据是否满足极值拖尾条件,得到极值拖尾结果,根据预置的数据精确度确定n个监控数据是否满足同一分布条件,得到同一分布结果,根据极值置信结果、极值拖尾结果、同一分布结果确定n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据均衡分布结果从n个监控数据中确定出需要进行故障分析的监控指标。由于本发明实施例中通过对n个监控数据的极值置信条件、极值拖尾条件、同一分布条件的判断,最后生成了3种判断结果:极值置信结果、极值拖尾结果、同一分布结果,这三种判断结果可以确定出n个监控数据的分布状态是否为均衡分布,改变了现有技术中对均衡分布的判断方法,相比于现有技术,本发明更加简便易行,不需要预先产生标准的随机数据,也不需要计算多维数据,占用的内存资源少,更适用于业务增长迅速的业务平台,可以实现秒级监控和业务故障的自适应分析。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于监控平台的故障分析方法的流程方框示意图;
图2为本发明实施例提供的监控平台故障自适应分析的均衡分布判断算法流程图;
图3-a为本发明实施例提供的一种基于监控平台的故障分析装置的组成结构示意图;
图3-b为本发明实施例提供的另一种基于监控平台的故障分析装置的组成结构示意图;
图3-c为本发明实施例提供的一种极值置信确定模块的组成结构示意图;
图3-d为本发明实施例提供的一种极值拖尾确定模块的组成结构示意图;
图3-e为本发明实施例提供的一种同一分布确定子模块的组成结构示意图;
图4为本发明实施例提供的基于监控平台的故障分析方法应用于服务器的组成结构示意图。
具体实施方式
本发明实施例提供了一种基于监控平台的故障分析方法和装置,用于实现对监控平台的业务故障自适应分析过程,解决其均衡分布判断问题。
本发明首先对目前的数理统计方法、以统计学为核心的机器学习方法进行深入分析,总结归纳传统做法,具有如下主要缺点,导致其无法再适用于监控平台的业务故障自适应分析过程,无法解决其均衡分布判断问题。
第一,对数据的分布特性,具有较高的随机性要求;
第二,依赖先验知识,判断未知数据前,都要产生一组标准数据;
第三,处理效率低,离群点判断法处理,则要循环判断未知数据的所有点;
第四,内存开销大,成本高,聚类过程中,需要计算各数据点间的距离,效率低下,最终输出的距离值又用不上,造成信息冗余且成本高。最终需要的结果不是距离,而是判断结果“是否为均衡分布状态”,假如用聚类算法,则中间输出的“距离”是多余的。
在监控平台的业务监控采样数据中,绝大多数的情况都是真实场景的采样数据,不具有随机性,或者说随机性非常弱,因此本发明避开了传统统计学方法的假设检验;在现有的监控平台业务故障分析中,都在不断提高实时性要求,在此情况下,依赖先验知识必然无法满足需求,因此本发明直接对业务故障的采样数据进行处理,不依赖其他标准数据;在业务发生故障时,及时、快速定位问题,在所有监控指标中找出最需关注的指标,由于监控平台中每个指标都属于盲区(即每个指标都是未知,都有可能是所要判断的离群点),不能逐个去判断,不然效率非常低下,特别是在如今互联网迅猛发展的趋势下,业务量日益增长,效率问题备受关注;与此同时,业务量越大,故障业务的采样数据量也将会不断增长,从而服务器内存消耗的成本问题,这些都不得不提到重点事项上来。因此本发明的算法设计过程中,紧抓算法的时间与空间复杂度,提高算法效率,降低成本。
除此之外,本发明把成熟的统计学与机器学习相结合,以数据为驱动,去掉时间维度信息,降低空间成本,动态寻找最需要关注的监控指标,抓住故障关键指标,实时、高效计算采样数据的整体分布状态的各个参数,且每个参数都是基础的统计量,能快速计算,这些正是本发明的最大优点,解决了监控平台对业务故障自适应分析的均衡分布判断问题,为监控平台提供实时、高效的高质量服务。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域的技术人员所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
以下分别进行详细说明。
本发明基于监控平台的故障分析方法的一个实施例,具体可以应用于监控平台的业务故障自适应分析过程中。请参阅图1所示,本发明一个实施例提供的基于监控平台的故障分析方法,可以包括如下步骤:
101、获取监控平台采集到的n个监控数据,监控数据包括:监控指标和监控指标对应的监控数值,n为非零自然数。
在本发明实施例中,监控平台中设置有多个监控项,每个监控项监控一监控指标,将监控平台中按照监控项采集到的监控数值及其对应的监控指标定义为监控数据,秒级监控的监控平台会实时产生多个监控数据,因此本发明实施例中需要实现对多个监控数据的实时故障自适应分析,为便于描述,定义本发明实施例中监控平台采集到的监控数据共有n个,对于监控平台采集到的n个监控数据输出给本发明实施例提供的基于监控平台的故障分析装置,该装置首先获取到n个监控数据,其中,n可以为1,也可以为2,也可以为大于2的任意自然数,n的取值由监控平台的监控项来具体决定。
在本发明的一些实施例中,步骤101获取监控平台采集到的n个监控数据之后,本发明实施例提供的基于业务平台的故障分析方法除了执行后续步骤102、103、104之外,还可以执行如下步骤:
A1、当n个监控数据采用不相同的量纲时,对n个监控数据进行标准化处理。
其中,获取到n个监控数据时,对每个监控数据采用的量纲进行判断,若n个监控数据采用的量纲不统一时,可以对n个监控数据进行标准化处理,因此本发明实施例通过对采样到的n个监控数据做预处理,把采样到的n个监控数据进行标准化处理,去掉量纲维度,拓宽了本发明的适用范围。可以理解的是,在本发明实施例中,当n个监控数据采用相同的量纲时,无需对n个监控数据进行标准化处理,可以在步骤101之后直接执行步骤102或103或104。本发明实施例中去掉“量纲”的影响,就是不受“数据单位”的限制,适合所有“单位”的数据,比如无单位的百分比、有单位的整数(例如流量为兆、千兆等)。在监控数据采用不同的量纲时,若不进行标准化处理,就需要用不同方法处理数据,从而会增加数据处理的复杂度,所以去量纲的影响可以便于对n个监控数据的分布状态进行判断。
需要说明的是,在本发明实施例中,步骤101获取到n个监控数据之后,可以先执行步骤102,再执行步骤103,然后再执行步骤104,如图1中所示。也可以先执行步骤103,再执行步骤104,然后再执行步骤102。其中步骤102、103、104之间没有先后逻辑顺序,这三个步骤可以先执行其中任何一个步骤、任何两个步骤,也可以通过执行这三个步骤,此处不做限定,图1所示的顺序只是可实现的一种方式而已,不作为对本发明的限定。
102、根据n个监控数据的总体置信区间确定n个监控数据是否满足极值置信条件,得到极值置信结果。
在本发明实施例中,获取到n个监控数据之后,可以先确定n个监控数据的总体置信区间,其中,一组数据的总体置信区间,囊括了数据本身的稳定性与波动性,因此总体置信区间是判断数据分布状态是否均衡的直接指标,根据n个监控数据的总体置信区间可以判断出这n个监控数据是否满足极值置信条件,极值置信条件是指根据n个监控数据中极值与总体置信区间的关系而确定的条件,通过对n个监控数据是否满足极值置信条件的判断,可以衡量出n个监控数据的稳定性和波动性,便于最终确定n个监控数据的分布状态。在确定出n个监控数据是否满足极值置信条件时可以生成极值置信结果,该极值置信结果是输出用于判断n个监控数据的分布状态的依据,极值置信结果包括n个监控数据满足极值置信条件,或者极值置信结果包括n个监控数据不满足极值置信条件。举例说明如下,可以通过对极值置信结果的取值来指示n个监控数据是否满足极值置信条件,例如,极值置信结果为0时表示n个监控数据满足极值置信条件,极值置信结果为1时表示n个监控数据不满足极值置信条件。又如,极值置信结果为1时表示n个监控数据满足极值置信条件,极值置信结果为-1时表示n个监控数据不满足极值置信条件。
在本发明的一些实施例中,步骤102根据n个监控数据的总体置信区间确定n个监控数据是否满足极值置信条件,得到极值置信结果,具体可以包括如下步骤:
B1、计算n个监控数据的数学期望值和n个监控数据的标准差;
B2、根据数学期望值、标准差确定n个监控数据的总体置信区间,总体置信区间包括:区间上限和区间下限;
B3、计算n个监控数据中的极大值和极小值;
B4、通过判断极大值和极小值是否处于总体置信区间内确定n个监控数据是否满足极值置信条件,得到极值置信结果。
其中,对于步骤B1和步骤B2,为了判断n个监控数据的整体分布状态,数学期望是衡量n个监控数据的稳定性重要指标,计算出的n个监控数据的数学期望值可以通过n个监控数据的数据均值来实现。另外,判断n个监控数据的整体分布状态,标准差是衡量n个监控数据波动性的主要指标,计算出的n个监控数据的标准差可以是无偏估计标准差。在计算出数学期望值和标准差之后,可以分别计算出区间上限和区间下限,通过区间下限和区间上限构成n个监控数据的总体置信区间。对于步骤B3,n个监控数据作为一组数据,从n个监控数据中筛选出极大、极小值,通过极大值和极小值可以反映出数据内部的极端差距,为判断数据的分布状态提供重要信息。结合步骤B2和步骤B3,在步骤B4中,通过判断极大值和极小值是否处于总体置信区间内确定n个监控数据是否满足极值置信条件,得到极值置信结果。例如,在本发明的一些实施例中,步骤B4通过判断极大值和极小值是否处于总体置信区间内确定n个监控数据是否满足极值置信条件,得到极值置信结果,可以包括如下步骤:
B41、当极大值大于区间上限,或者极小值小于区间下限时,确定n个监控数据不满足极值置信条件,极值置信结果为n个监控数据不满足极值置信条件;
B42、当极大值小于或等于区间上限、且极小值大于或等于区间下限时,确定n个监控数据满足极值置信条件,极值置信结果为n个监控数据满足极值置信条件。
其中,若n个监控数据的极大值、极小值脱离了总体置信区间,则n个监控数据很可能是非均衡分布,若n个监控数据的极大值、极小值都在总体置信区间内,n个监控数据很有可能是非均衡分布,当然最终的分布状态还依赖其他结果参数。
需要说明的是,本发明的上述步骤B41和步骤B42的实现方式只是步骤B4的一种可实现方式,不限定的是,在本发明的另一些实施例中还可以采用其它方式来确定n个监控数据是否满足极值置信条件。例如,当极大值大于区间上限和调整因子相乘的结果,或者极小值小于区间下限和调整因子相乘的结果时,确定n个监控数据不满足极值置信条件,极值置信结果为n个监控数据不满足极值置信条件;当极大值小于或等于区间上限和调整因子相乘的结果、且极小值大于或等于区间下限和调整因子相乘的结果时,确定n个监控数据满足极值置信条件,极值置信结果为n个监控数据满足极值置信条件。具体的,调整因子可以根据具体的应用场景来灵活选择,例如可以根据监控平台采样到的监控数据的数量多少来确定,若监控数据的数量很多时可以将调整因子设置为大于1的数值,若监控数据的数量较少时可以将调整因子设置为小于1的数值。另外还可以预配置出调整因子,结合上述举例说明来确定n个监控数据是否满足极值置信条件。
在本发明的另一些实施例中,步骤B4通过判断极大值和极小值是否处于总体置信区间内确定n个监控数据是否满足极值置信条件,得到极值置信结果,具体可以包括如下步骤:
B43、当n个监控数据采用相同的量纲时,根据极大值和极小值计算n个监控数据的极差,极差为极大值减去极小值;
B44、当极差大于或等于标准差的特定整数倍且极大值大于区间上限时,或者当极差大于或等于标准差的特定整数倍且极小值小于区间下限时,确定n个监控数据不满足极值置信条件,极值置信结果为n个监控数据不满足极值置信条件;
B45、当极大值小于或等于区间上限、且极小值大于或等于区间下限时,或者当极差小于标准差的特定整数倍时,确定n个监控数据满足极值置信条件,极值置信结果为n个监控数据满足极值置信条件。
其中,步骤B43至步骤B45是在n个监控数据采用相同的量纲时确定n个监控数据是否满足极值置信条件的解决方案。具体的,除了判断极大值与区间上限的数值关系、极小值与区间下限的数值关系之外,还需要判断极差与标准差的特定整数倍之间的关系,其中该特定整数倍可以是3,也可以是2,具体结合应用场景来确定。
103、根据n个监控数据中的极值分布情况确定n个监控数据是否满足极值拖尾条件,得到极值拖尾结果。
在本发明实施例中,获取到n个监控数据之后,可以先确定n个监控数据的极值分布情况,其中,n个监控数据的极值分布情况可以是n个监控数据中极值在所有监控数据中的分布权重,通过n个监控数据的极值分布情况可以从侧面反映出数据分布的稳定性,因此极值分布情况也是判断数据分布状态是否均衡的直接指标,根据n个监控数据的极值分布情况可以判断出这n个监控数据是否满足极值拖尾条件,极值拖尾条件是指根据n个监控数据中的极值(例如极大值或极小值)在n个监控数据中的分布关系而确定的条件,通过对n个监控数据是否满足极值拖尾条件的判断,可以衡量出n个监控数据的稳定性和波动性,便于最终确定n个监控数据的分布状态。在确定出n个监控数据是否满足极值拖尾条件时可以生成极值拖尾结果,该极值拖尾结果是输出用于判断n个监控数据的分布状态的依据,极值拖尾结果包括n个监控数据满足极值拖尾条件,或者极值拖尾结果包括n个监控数据不满足极值拖尾条件。举例说明如下,可以通过对极值拖尾结果的取值来指示n个监控数据是否满足极值拖尾条件,例如,极值拖尾结果为0时表示n个监控数据满足极值拖尾条件,极值拖尾结果为1时表示n个监控数据不满足极值拖尾条件。又如,极值拖尾结果为1时表示n个监控数据满足极值拖尾条件,极值拖尾结果为-1时表示n个监控数据不满足极值拖尾条件。
在本发明的一些实施例中,步骤103根据n个监控数据中的极值分布情况确定n个监控数据是否满足极值拖尾条件,得到极值拖尾结果,具体可以包括如下步骤:
C1、计算n个监控数据中的极大值和极小值,并计算n个监控数据中非极值数据的非极值权重,非极值数据为n个监控数据中除极大值以外的所有监控数据;
C2、计算n个监控数据的标准差,并根据标准差计算n个监控数据的拖尾系数;
C3、通过计算极大值和非极值权重之间的数值关系、计算极小值和拖尾系数之间的数值关系确定n个监控数据是否满足极值拖尾条件,得到极值拖尾结果。
其中,对于步骤C1,n个监控数据作为一组数据,从n个监控数据中筛选出极大、极小值,通过极大值和极小值可以反映出数据内部的极端差距,为判断数据的分布状态提供重要信息。n个监控数据中的非极值数据指的是除极大值以外的所有监控数据,非极值权重是指非极值数据在n个监控数据中所占的权重,非极值权重反映了n个监控数据所形成的波形曲线的非峰值情况,这部分数据所占总体的权重,从侧面反映出数据分布的稳定性。在步骤C2中,判断n个监控数据的整体分布状态,标准差是衡量n个监控数据波动性的主要指标,计算出的n个监控数据的标准差可以是无偏估计标准差。另外,判断数据的分布是否均衡,则数据的拖尾情况是一个重要参数,拖尾性展示了最小值跟均匀分布频率值之间的差距,在此命名为拖尾系数。在步骤C3中,通过计算极大值和非极值权重之间的数值关系、计算极小值和拖尾系数之间的数值关系确定n个监控数据是否满足极值拖尾条件,得到极值拖尾结果。例如,在本发明的一些实施例中,步骤C3通过计算极大值和非极值权重之间的数值关系、计算极小值和拖尾系数之间的数值关系确定n个监控数据是否满足极值拖尾条件,得到极值拖尾结果,可以包括如下步骤:
C31、当极大值大于非极值权重,或者极小值小于拖尾系数时,确定n个监控数据不满足极值拖尾条件,极值拖尾结果为n个监控数据不满足极值拖尾条件;
C32、当极大值小于或等于非极值权重,或者极小值大于或等于拖尾系数时,确定n个监控数据满足极值拖尾条件,极值拖尾结果为n个监控数据满足极值拖尾条件。
其中,若n个监控数据的极大值大于非极值权重,或极小值小于拖尾系数,则其很可能是非均衡分布,若n个监控数据中的极大值小于或等于非极值权重,或者极小值大于或等于拖尾系数,则n个监控数据很可能是均衡分布,但是最终的分布状态还依赖其他结果参数。
需要说明的是,本发明的上述步骤C31和步骤C32的实现方式只是步骤C3的一种可实现方式,不限定的是,在本发明的另一些实施例中还可以采用其它方式来确定n个监控数据是否满足极值拖尾条件。例如,当极大值大于非极值权重和调整因子相乘的结果,或者极小值小于拖尾系数时,确定n个监控数据不满足极值拖尾条件,极值拖尾结果为n个监控数据不满足极值拖尾条件;当极大值小于或等于非极值权重和调整因子相乘的结果,或者极小值大于或等于拖尾系数时,确定n个监控数据满足极值拖尾条件,极值拖尾结果为n个监控数据满足极值拖尾条件。具体的,调整因子可以根据具体的应用场景来灵活选择,例如可以根据监控平台采样到的监控数据的数量多少来确定,若监控数据的数量很多时可以将调整因子设置为大于1的数值,若监控数据的数量较少时可以将调整因子设置为小于1的数值。另外还可以预配置出调整因子,结合上述举例说明来确定n个监控数据是否满足极值置信条件。
104、根据预置的数据精确度确定n个监控数据是否满足同一分布条件,得到同一分布结果。
在本发明实施例中,获取到n个监控数据之后,可以先确定n个监控数据中每个监控数值的取值情况,其中,n个监控数据的监控数值取值情况直接决定了n个监控数据的分布状态,分析n个监控数据所有监控数值可以判断监控数据相互之间取值大小的差异。在数据精确度预先配置好的情况下,可以通过该数据精确度确定n个监控数据是否满足同一分布条件,若在n个监控数据中两个监控数值的差值小于该数据精确度,则可以认为这两个监控数值是相等的。其中,数据精确度是指数值计算中需要保留的小数点个数,例如保留几位小数点就是数据精确度达到多少,比如要保留4位,则数据精确度=0.0001。通过n个监控的极值分布情况可以从侧面反映出数据分布的稳定性,因此极值分布情况也是判断数据分布状态是否均衡的直接指标,根据n个监控数据的监控数值取值情况可以判断出这n个监控数据是否满足同一分布条件,同一分布条件是根据n个监控数据中监控数值的相互差异而确定的条件,通过对n个监控数据是否满足同一分布条件的判断,可以衡量出n个监控数据的稳定性和波动性,便于最终确定n个监控数据的分布状态。在确定出n个监控数据是否满足同一分布条件时可以生成同一分布结果,该同一分布结果是输出用于判断n个监控数据的分布状态的依据,同一分布结果包括n个监控数据满足同一分布条件,或者同一分布结果包括n个监控数据不满足同一分布条件。举例说明如下,可以通过对同一分布结果的取值来指示n个监控数据是否满足同一分布条件,例如,同一分布结果为0时表示n个监控数据满足同一分布条件,同一分布结果为1时表示n个监控数据不满足同一分布条件。又如,同一分布结果为1时表示n个监控数据满足同一分布条件,同一分布结果为-1时表示n个监控数据不满足同一分布条件。
在本发明的一些实施例中,步骤104根据预置的数据精确度确定n个监控数据是否满足同一分布条件,得到同一分布结果,具体可以包括如下步骤:
D1、从n个监控数据中选择出一个监控数据作为参照数据;
D2、分别计算n个监控数据与参照数据之间的差值,得到n个差值结果;
D3、通过计算n个差值结果与数据精确度之间的数值关系确定n个监控数据是否满足同一分布条件,得到同一分布结果。
其中,参照数据可以是n个监控数据中的任意一个监控数据,通常的是,该参照数据是指n个监控数据中的第1个监控数据。若n个监控数据服从等概率现象,或者是每个值都在数据精确度范围内相等,则可以确定n个监控数据满足同一分布条件,其分布状态肯定为均衡分布,通过计算n个差值结果与数据精确度之间的数值关系可以确定n个监控数据是否满足同一分布条件,在n个监控数据不满足同一分布条件时,n个监控数据是否为均衡分布,还依赖其他条件参数一起判断。其中,若n个差值结果中某个差值结果小于数据精确度,则可以确定该差值结果对应的两个监控数据是相等。
在本发明的一些实施例中,步骤D3通过计算n个差值结果与数据精确度之间的数值关系确定n个监控数据是否满足同一分布条件,得到同一分布结果,具体可以包括如下步骤:
D31、获取n个差值结果中小于数据精确度的差值结果个数;
D32、当差值结果个数大于或等于n时,确定n个监控数据满足同一分布条件,同一分布结果为n个监控数据满足同一分布条件;
D33、当差值结果个数小于n时,确定n个监控数据不满足同一分布条件,同一分布结果为n个监控数据不满足同一分布条件。
其中,对于计算出的n个差值结果,可以对n个差值结果中小于数据精确度的差值结果进行计数,通过小于数据精确度的差值结果个数与监控数据的总个数n的关系可以确定出n个监控数据是否满足同一分布条件。不限定的是,上述实施例只是对n个监控数据是否满足同一分布条件的一种判断方式,在本发明的另一些实施例中还可以采用其它的判断方式,举例说明如下,当差值结果个数大于或等于n和调整因子相乘的结果时,确定n个监控数据满足同一分布条件,同一分布结果为n个监控数据满足同一分布条件;当差值结果个数小于n和调整因子相乘的结果时,确定n个监控数据不满足同一分布条件,同一分布结果为n个监控数据不满足同一分布条件。具体的,调整因子可以根据具体的应用场景来灵活选择,例如可以根据监控平台采样到的监控数据的数量多少来确定,若监控数据的数量很多时可以将调整因子设置为大于1的数值,若监控数据的数量较少时可以将调整因子设置为小于1的数值。另外还可以预配置出调整因子,结合上述举例说明来确定n个监控数据是否满足极值置信条件。
105、根据极值置信结果、极值拖尾结果、同一分布结果确定n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据均衡分布结果从n个监控数据中确定出需要进行故障分析的监控指标。
在本发明实施例中,通过前述步骤102、103、104的执行,可以分别获取到极值置信结果、极值拖尾结果、同一分布结果,这三个结果可以用于最终确定n个监控数据的分布状态,其中,通过前述步骤对n个监控数据的分析,从n个监控数据的极值置信结果、极值拖尾结果和同一分布结果中已经携带了这n个监控数据在稳定性和波动性等方面的数据特性,通过对极值置信结果、极值拖尾结果和同一分布结果的最后综合,可以确定出n个监控数据的最终分布状态是否符合均衡分布,生成均衡分布结果。举例说明如下,可以通过对均衡分布结果的取值来指示n个监控数据是否符合均衡分布状态,例如,均衡分布结果为0时表示n个监控数据符合均衡分布状态,均衡分布结果为1时表示n个监控数据不符合均衡分布状态。又如,均衡分布结果为1时表示n个监控数据符合均衡分布状态,均衡分布结果为-1时表示n个监控数据不符合均衡分布状态。本发明实施例中只需要生成值置信结果、极值拖尾结果、同一分布结果,通过这三种结果就可以确定出n个监控数据的分布状态是否为均衡分布,改变了现有技术中对均衡分布的判断方法,相比于现有技术,本发明更加简便易行,不需要预先产生标准的随机数据,也不需要计算多维数据,占用的内存资源少,更适用于业务增长迅速的业务平台,可以实现秒级监控和业务故障的自适应分析。
在本发明的一些实施例中,步骤105根据极值置信结果、极值拖尾结果、同一分布结果确定n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据均衡分布结果从n个监控数据中确定出需要进行故障分析的监控指标,具体可以包括如下步骤:
E1、当极值置信结果为n个监控数据不满足极值置信条件、且同一分布结果为n个监控数据不满足同一分布条件时,或者当极值拖尾结果为n个监控数据不满足极值拖尾条件、且同一分布结果为n个监控数据不满足同一分布条件时,确定n个监控数据的分布状态不满足均衡分布,从n个监控数据中去除掉监控数值最小的监控指标,得到(n-1)个监控数据,并重新确定(n-1)个监控数据的分布状态是否满足均衡分布,经过(n-n1)次对监控数据的均衡分布判断,直至确定n1个监控数据的分布状态满足均衡分布时,确定需要进行故障分析的监控指标为n1个监控数据,n1为小于n的自然数;
E2、当同一分布结果为n个监控数据满足同一分布条件时,或者当极值置信结果为n个监控数据满足极值置信条件、且极值拖尾结果为n个监控数据满足极值拖尾条件时,确定n个监控数据的分布状态满足均衡分布,确定所有监控指标都不需要进行故障分析。
在上述步骤E1中指出了n个监控数据不满足均衡分布的条件,这些条件通过极值置信结果、极值拖尾结果、同一分布结果来确定,需要说明的是,当n个监控数据不满足均衡分布时,需要从n个监控数据中剔除掉监控数值最小的监控指标,得到(n-1)个监控数据,并重新确定(n-1)个监控数据的分布状态是否满足均衡分布,其中确定(n-1)个监控数据的分布状态是否满足均衡分布的方式与确定n个监控数据的分布状态是否满足均衡分布的方式相类似,即通过前述实施例中步骤101至步骤105的重新执行来判断(n-1)个监控数据的分布状态是否满足均衡分布,若(n-1)个监控数据的分布状态还不满足均衡分布,则需要从(n-1)个监控数据中剔除掉监控数值最小的监控指标,得到(n-2)个监控数据,并重新确定(n-2)个监控数据的分布状态是否满足均衡分布,按照上述执行顺序进行多次执行,经过(n-n1)次对监控数据的均衡分布判断,直至确定n1个监控数据的分布状态满足均衡分布时,确定需要进行故障分析的监控指标为n1个监控数据。通过每一次的均衡分布状态判断,在不满足均衡分布时都会剔除掉一个监控数据,直至最后剩余n1个监控数据时满足了均衡分布,此时可以输出n1个监控数据用于故障分析。
在步骤E2中指出了n个监控数据满足均衡分布的条件,这些条件通过极值置信结果、极值拖尾结果、同一分布结果来确定,若确定n个监控数据的分布状态为均衡分布状态,说明各项监控指标处于良好状态,无需干预,或者在某些特定情形下,可以认为所有指标都需要均衡关注,无需进行指标筛选。
需要说明的是,本发明的上述步骤E1和步骤E2的实现方式只是步骤105的一种可实现方式,不限定的是,在本发明的另一些实施例中还可以采用其它方式来确定n个监控数据的分布状态是否为均衡分布。例如,通过前述步骤102至104获取到极值置信结果、极值拖尾结果、同一分布结果之后,当同一分布结果为n个监控数据满足同一分布条件、且极值置信结果为n个监控数据满足极值置信条件、且极值拖尾结果为n个监控数据满足极值拖尾条件时,确定n个监控数据的分布状态满足均衡分布,在不满足上述条件的情况下可以确定n个监控数据的分布状态不满足均衡分布。
通过前述实施例对本发明的描述可知,在本发明实施例中,获取监控平台采集到的n个监控数据,监控数据包括:监控指标和监控指标对应的监控数值,根据n个监控数据的总体置信区间确定n个监控数据是否满足极值置信条件,得到极值置信结果,根据n个监控数据中的极值分布情况确定n个监控数据是否满足极值拖尾条件,得到极值拖尾结果,根据预置的数据精确度确定n个监控数据是否满足同一分布条件,得到同一分布结果,根据极值置信结果、极值拖尾结果、同一分布结果确定n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据均衡分布结果从n个监控数据中确定出需要进行故障分析的监控指标。由于本发明实施例中通过对n个监控数据的极值置信条件、极值拖尾条件、同一分布条件的判断,最后生成了3种判断结果:极值置信结果、极值拖尾结果、同一分布结果,这三种判断结果可以确定出n个监控数据的分布状态是否为均衡分布,改变了现有技术中对均衡分布的判断方法,相比于现有技术,本发明更加简便易行,不需要预先产生标准的随机数据,也不需要计算多维数据,占用的内存资源少,更适用于业务增长迅速的业务平台,可以实现秒级监控和业务故障的自适应分析。
为便于更好的理解和实施本发明实施例的上述方案,下面举例相应的应用场景来进行具体说明。
本发明实施例主要是支持监控平台业务故障的自适应分析过程,对监控指标分布状态做出判断,若各指标为均衡分布状态,说明监控处于良好状态,无需干预,或者在某些特定情形下,可以认为所有指标都需要均衡关注,无需进行指标筛选,若通过采样数据得到其分布并非处于均衡状态,则需要寻找出最需关注的top(m)指标,进行故障定位干预。
接下来本发明以直播业务慢速频道分析为背景,对直播频道做实时监控,在线采集监控数据,在秒级监控场景下,每秒计算一次,一旦发现有故障发生,再从众多直播频道中找出最受关注的频道(比如发生故障的频道、对总体影响最大的频道)进行故障分析。本发明实施例中首先约定以下数学运算符号:sum,求和;max,求最大值;min,求最小值;abs,求绝对值;count,求个数。如图2所示,为本发明实施例提供的监控平台故障自适应分析的均衡分布判断算法流程图,本发明实施例中基于监控平台的故障分析方法详细过程如下:
[0]输入:监控项的n个监控指标实时监控采样到的监控数据x(i),其中i=1,2,……,n;x(i)为第i个指标的采样值,其中包括监控指标名、指标监控数值、时间维度等信息。因为数据上报时,都会带着时间戳信息,每个采样点是哪个时间的值,这就是时间维度。
[1]初始化值:数据精确度efcl0;两个指标判断原则的阈值上限RateU0,下限RateD0,一般重点业务设置上限0.6,下限0.4,也可理解是经验值,不过这上、下限值也是统计学的默认常用值,形成极端置信区间[RateD0,RateU0],由于在只有两个指标情况下,就相当于只有两个数据点进行分布判断,没有统计学的分析意义。当然在现有的业务监控平台中,这是一种极端情况,可以直接人为规定初值,也可以根据业务的重要级别来初始化。
[2]数据解析与极端处理:
[2-1]数据解析:去掉采样值的时间维度等信息,仅保留其中的监控指标名及其对应的实时监控数值,构成key-value对形式,为节省内存空间,分别把key值、value值一一对应有序保存到向量结构AllKey、AllValue中。在数据解析过程中一旦发现数据上报错误,比如流量,上报负数、其他字母符号等或者指标为空,则算法结束。
[2-2]极端处理:最后分布状态的判定,用符号UFlag表示均衡分布,若UFlag=1,则为均衡分布,若UFlag=0,则非均衡分布。若指标集AllKey中只有一个key,每个key就代表一个直播频道。则分布状态判为均衡分布,更新状态值UFlag=1,算法进入步骤[7]输出结果;若key有两个,则进行全0判断,假如两个key的值都为0,key的值是value,也就是该指标对应的采样值,则分布状态为均衡分布,更新状态值UFlag=1,算法进入步骤[7]输出结果;否则计算任一key的占比Rate,定义为
其中i=1或2;value(i)∈AllValue;
接着再判断Rate与极端置信区间[RateD0,RateU0]的关系,若Rate∈[RateD0,RateU0],则分布状态为均衡分布,更新状态值UFlag=1,此时降序排列AllValue,并同步调整AllKey的排序,算法进入步骤[7]输出结果;否则为非均衡分布,更新状态值UFlag=0,再去掉AllValue的最小值及AllKey的对应key,算法进入步骤[7]输出结果;若key多于两个,则进行下面步骤;
[3]分布参数计算:
[3-1]数据标准化:为避免数据量纲影响,提高算法的通用性,本算法首先进行数据标准化处理,得到标准化数据序列{data(i)},定义为
由如上定义式可知,这样的标准化过程保持了数据的结构特性,因此以下各步骤做分布状态判断的参数计算都用标准化后的数据。
需要说明的是,本发明实施例可以适用于监控平台业务采样监控值属于同性质,比如指标都是慢速数的非比率数据,或者都是慢速比的比率数据,而不是两者混合的监控值。当然对不同性质的比率、非比率相混合数据,可通过加入等价变换过程即可处理。因此,对于考虑比率、非比率不同性质数据相混合的情况,同样是本发明所包含的方案。此外,如上方案中考虑了量纲的影响问题,加入了数据标准化过程,去掉量纲影响。当然若上报数据确保是同量纲指标,则可以去掉步骤[3-1]的标准化过程。
[3-2]计算数学期望值:要判断数据的整体分布状态,数学期望是衡量稳定性的重点指标,在监控平台下,数学期望是通过用数据均值meandata来代替,定义为
[3-3]计算标准差:要判断数据的整体分布状态,标准差是衡量波动性的主要指标,在此标准差用无偏估计标准差stddata,定义为
其中n>1;
[3-4]计算极值:一组数据中的极大、极小值,反映出数据内部的极端差距,为判断数据的分布状态提供重要信息,在此极大值用maxdata表示,极小值用mindata,定义为
需要说明的是,当然若上报数据确保是同量纲指标,则上述步骤[3-4]中还可以增加极差计算过程,极差值jicha,定义为:jicha=maxdata-mindata。
[3-5]计算总体置信区间:一组数据的置信区间,囊括了数据本身的稳定性与波动性,是判断数据分布状态是否均衡的直接指标,结合步骤[3-2]、[3-3]及监控平台采样数据的非负特性,在此定义置信区间,上限miudataU=meandata+3stddata,下限miudataD=max{meandata-3stddata,0};
[3-6]计算非极值权重与拖尾系数:一组数据中去掉极大值后剩下的非极值数据,反映了数据所形成的波形曲线的非峰值情况,这部分数据所占总体的权重,从侧面反映出数据分布的稳定性,结合步骤[3-1]可得非极值权重Nmaxp,定义为
其中,上述公式Nmaxp中采用集合的表示形式,条件为:abs(data(i)-maxdata)>efcl0。
此外,判断数据的分布是否均衡,则数据的拖尾情况是一个重要参数,拖尾性展示了最小值跟均匀分布频率值之间的差距,在此命名拖尾系数,用Nminp表示,定义为
[4]计算判断条件参数:
[4-1]极值置信条件:若一组数据的极大值、极小值脱离了置信区间,则其很可能是非均衡分布,结合步骤[3-4]、[3-5],在此用极值置信条件参数Flag1衡量,若Flag1=0,则最有可能是均衡分布;若Flag1=1,则很有可能是非均衡分布,当然最后结论还依赖其他条件参数,Flag1定义为
需要说明的是,当然若上报数据确保是同量纲指标,则上述步骤[3-4]中还可以增加极差计算过程,在这种情况下,Flag1可以定义为
[4-2]极值拖尾条件:若一组数据的极大值大于非极值权重,或极小值小于拖尾系数,则其很可能是非均衡分布,结合步骤[3-4]、[3-6],在此用极值拖尾条件参数Flag2衡量,若Flag2=0,则最有可能是均衡分布;若Flag2=1,则很可能是非均衡,最后结论还依赖其他条件参数,Flag2定义为
[4-3]同一分布条件:若一组数据服从等概率现象,或者是每个值都在精度范围内相等,则视为满足同一分布条件,其分布状态肯定为均衡分布,在此用Flag3表示同一分布条件参数,若Flag3=0,则该组数据服从同一分布条件,自然肯定为均衡分布;若Flag3=1,则不满足同一分布条件,其是否为均衡分布,还依赖其他条件参数一起判断,Flag3定义为
其中,上述实施例中,以参照数据为data(1)为例。
[5]状态判定:算法的结论判断部分
借助步骤[3]的分布参数,依据步骤[4]的条件参数,对数据状态是否为均衡分布定义判定式为
其中,UFlag=1的条件为:不满足(flag1=1或flag2=1)且flag3=1的其他条件,即数据并非同一分布,同时,其极大或极小值脱离置信区间,或者极大值大于非极值权重或极小值小于拖尾系数,则分布状态为非均衡分布,否则为均衡分布。由于最后要给出top(m)指标,则降序排列该组数据AllValue,且对应调整指标名AllKey的排列;若此步骤的结果UFlag=1,则该组数据是均衡分布,说明监控处于良好状态,无需干预,或者在某些特定情形(比如非重点业务,所有指标都出现故障了运维才来看)下,也可以代表指标无需再进行筛选,所有指标都要关注,此时算法进入步骤[7]输出结果;若UFlag=0,则该组数据非均衡,记下状态值,作为最终结论的判断值,此时要定位出最需关注的top(m)指标,则算法进入步骤[6]。
[6]寻找最需关注的top(m)指标:去掉AllValue的最小值,同时相应去掉AllKey的对应key值,然后回到步骤[2-2],且跳过步骤[3-1],算法逐步进行,最后保留下来的AllKey-AllValue,则为最需要关注的top(m)指标及其对应的监控值。
如图2所示,Uflagtmp就是算法中的UFlag,以采用C++语言编写的算法为例,通常用Uflagtmp来代表UFlag在算法运行过程中的值,在计算出Uflagtmp=1时,继续判断是否是第一次运行本算法,若是第一次运行,则输出UFlag=1,若不是第一次运行本算法,则输出UFlag=0,即监控数据的状态为非均衡。
[7]输出:状态值UFlag及最后保留下来的最需要关注的top(m)指标AllKey。
在本发明的前述实施例中,通过分布参数、非极值权重与拖尾系数的定义与使用,不仅抓住了数据分布的整体情况,还兼顾了极端情况,同时结合传统的统计量指标,充分展示数据的分布状态。此外,本发明的算法计算简单,最高的复杂度是求标准差过程,其复杂度也只有一阶O(n)的线性时间复杂度,算法的复杂度是n的一阶函数,此过程可以通过内置函数快速运算,因此,本发明实施例不仅可以达到实时在线计算需求,而且能快速定位出最需要关注的top(m)指标,自动计算m值,为用户提供非常大的便捷,提高运维团队的工作效率。再者,判断条件参数,把极值、拖尾性、同一分布特性相结合,最后通过推理化简出状态判定式,计算更加简单,只有基础的比较大小运算,速度极高,因此本发明的算法复杂度非常低。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
为便于更好的实施本发明实施例的上述方案,下面还提供用于实施上述方案的相关装置。
请参阅图3-a所示,本发明实施例提供的一种基于监控平台的故障分析装置300,可以包括:获取模块301、极值置信确定模块302、极值拖尾确定模块303、同一分布确定模块304和均衡分布确定模块305,其中,
获取模块301,用于获取监控平台采集到的n个监控数据,所述监控数据包括:监控指标和所述监控指标对应的监控数值,所述n为非零自然数;
极值置信确定模块302,用于根据所述n个监控数据的总体置信区间确定所述n个监控数据是否满足极值置信条件,得到极值置信结果;
极值拖尾确定模块303,用于根据所述n个监控数据中的极值分布情况确定所述n个监控数据是否满足极值拖尾条件,得到极值拖尾结果;
同一分布确定模块304,用于根据预置的数据精确度确定所述n个监控数据是否满足同一分布条件,得到同一分布结果;
均衡分布确定模块305,用于根据所述极值置信结果、所述极值拖尾结果、所述同一分布结果确定所述n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据所述均衡分布结果从所述n个监控数据中确定出需要进行故障分析的监控指标。
在本发明的一些实施例中,如图3-b所示,所述基于监控平台的故障分析装置300,还包括:标准化处理模块306,用于所述获取模块301获取监控平台采集到的n个监控数据之后,当所述n个监控数据采用不相同的量纲时,对所述n个监控数据进行标准化处理。
在本发明的一些实施例中,如图3-c所示,所述极值置信确定模块302,包括:
第一计算子模块3021,用于计算所述n个监控数据的数学期望值和所述n个监控数据的标准差;
第二计算子模块3022,用于根据所述数学期望值、所述标准差确定所述n个监控数据的总体置信区间,所述总体置信区间包括:区间上限和区间下限;
第三计算子模块3023,用于计算所述n个监控数据中的极大值和极小值;
极值置信确定子模块3024,用于通过判断所述极大值和所述极小值是否处于所述总体置信区间内确定所述n个监控数据是否满足极值置信条件,得到极值置信结果。
在本发明的一些实施例中,所述极值置信子模块3024,具体用于当所述极大值大于所述区间上限,或者所述极小值小于所述区间下限时,确定所述n个监控数据不满足所述极值置信条件,所述极值置信结果为所述n个监控数据不满足所述极值置信条件;当所述极大值小于或等于所述区间上限、且所述极小值大于或等于所述区间下限时,确定所述n个监控数据满足所述极值置信条件,所述极值置信结果为所述n个监控数据满足所述极值置信条件。
在本发明的一些实施例中,所述极值置信子模块3024,具体用于当所述n个监控数据采用相同的量纲时,根据所述极大值和所述极小值计算所述n个监控数据的极差,所述极差为所述极大值减去所述极小值;当所述极差大于或等于所述标准差的特定整数倍且所述极大值大于所述区间上限时,或者当所述极差大于或等于所述标准差的特定整数倍且所述极小值小于所述区间下限时,确定所述n个监控数据不满足所述极值置信条件,所述极值置信结果为所述n个监控数据不满足所述极值置信条件;当所述极大值小于或等于所述区间上限、且所述极小值大于或等于所述区间下限时,或者当所述极差小于所述标准差的特定整数倍时,确定所述n个监控数据满足所述极值置信条件,所述极值置信结果为所述n个监控数据满足所述极值置信条件。
在本发明的一些实施例中,如图3-d所示,所述极值拖尾确定模块303,包括:
第四计算子模块3031,用于计算所述n个监控数据中的极大值和极小值,并计算所述n个监控数据中非极值数据的非极值权重,所述非极值数据为所述n个监控数据中除所述极大值以外的所有监控数据;
第五计算子模块3032,用于计算所述n个监控数据的标准差,并根据所述标准差计算所述n个监控数据的拖尾系数;
极值拖尾确定子模块3033,用于通过计算所述极大值和所述非极值权重之间的数值关系、计算所述极小值和所述拖尾系数之间的数值关系确定所述n个监控数据是否满足极值拖尾条件,得到极值拖尾结果。
在本发明的一些实施例中,所述极值拖尾确定子模块3033,具体用于当所述极大值大于所述非极值权重,或者所述极小值小于所述拖尾系数时,确定所述n个监控数据不满足所述极值拖尾条件,所述极值拖尾结果为所述n个监控数据不满足所述极值拖尾条件;当所述极大值小于或等于所述非极值权重,或者所述极小值大于或等于所述拖尾系数时,确定所述n个监控数据满足所述极值拖尾条件,所述极值拖尾结果为所述n个监控数据满足所述极值拖尾条件。
在本发明的一些实施例中,如图3-e所示,所述同一分布确定子模块304,包括:
参照数据选择子模块3041,用于从所述n个监控数据中选择出一个监控数据作为参照数据;
差值计算子模块3042,用于分别计算所述n个监控数据与所述参照数据之间的差值,得到n个差值结果;
同一分布确定子模块3043,用于通过计算所述n个差值结果与所述数据精确度之间的数值关系确定所述n个监控数据是否满足同一分布条件,得到同一分布结果。
在本发明的一些实施例中,所述同一分布确定子模块3043,具体用于获取所述n个差值结果中小于所述数据精确度的差值结果个数;当所述差值结果个数大于或等于所述n时,确定所述n个监控数据满足所述同一分布条件,所述同一分布结果为所述n个监控数据满足所述同一分布条件;当所述差值结果个数小于所述n时,确定所述n个监控数据不满足所述同一分布条件,所述同一分布结果为所述n个监控数据不满足所述同一分布条件。
在本发明的一些实施例中,所述均衡分布确定模块305,具体用于当所述极值置信结果为所述n个监控数据不满足所述极值置信条件、且所述同一分布结果为所述n个监控数据不满足所述同一分布条件时,或者当所述极值拖尾结果为所述n个监控数据不满足所述极值拖尾条件、且所述同一分布结果为所述n个监控数据不满足所述同一分布条件时,确定所述n个监控数据的分布状态不满足所述均衡分布,从所述n个监控数据中去除掉监控数值最小的监控指标,得到(n-1)个监控数据,并重新确定所述(n-1)个监控数据的分布状态是否满足均衡分布,经过(n-n1)次对监控数据的均衡分布判断,直至确定n1个监控数据的分布状态满足均衡分布时,确定需要进行故障分析的监控指标为所述n1个监控数据,所述n1为小于所述n的自然数;当所述同一分布结果为所述n个监控数据满足所述同一分布条件时,或者当所述极值置信结果为所述n个监控数据满足所述极值置信条件、且所述极值拖尾结果为所述n个监控数据满足所述极值拖尾条件时,确定所述n个监控数据的分布状态满足所述均衡分布,确定所有监控指标都不需要进行故障分析。
通过以上对本发明实施例的描述可知,获取监控平台采集到的n个监控数据,监控数据包括:监控指标和监控指标对应的监控数值,根据n个监控数据的总体置信区间确定n个监控数据是否满足极值置信条件,得到极值置信结果,根据n个监控数据中的极值分布情况确定n个监控数据是否满足极值拖尾条件,得到极值拖尾结果,根据预置的数据精确度确定n个监控数据是否满足同一分布条件,得到同一分布结果,根据极值置信结果、极值拖尾结果、同一分布结果确定n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据均衡分布结果从n个监控数据中确定出需要进行故障分析的监控指标。由于本发明实施例中通过对n个监控数据的极值置信条件、极值拖尾条件、同一分布条件的判断,最后生成了3种判断结果:极值置信结果、极值拖尾结果、同一分布结果,这三种判断结果可以确定出n个监控数据的分布状态是否为均衡分布,改变了现有技术中对均衡分布的判断方法,相比于现有技术,本发明更加简便易行,不需要预先产生标准的随机数据,也不需要计算多维数据,占用的内存资源少,更适用于业务增长迅速的业务平台,可以实现秒级监控和业务故障的自适应分析。
图4是本发明实施例提供的一种服务器结构示意图,该服务器400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)422(例如,一个或一个以上处理器)和存储器432,一个或一个以上存储应用程序442或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中,存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器422可以设置为与存储介质430通信,在服务器400上执行存储介质430中的一系列指令操作。
服务器400还可以包括一个或一个以上电源426,一个或一个以上有线或无线网络接口450,一个或一个以上输入输出接口458,和/或,一个或一个以上操作系统441,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行前述基于监控平台的故障分析方法包括的各个步骤,该服务器可以是基于该图4所示的服务器结构。
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
综上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照上述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对上述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (20)

1.一种基于监控平台的故障分析方法,其特征在于,包括:
获取监控平台采集到的n个监控数据,所述监控数据包括:监控指标和所述监控指标对应的监控数值,所述n为非零自然数;
根据所述n个监控数据的总体置信区间确定所述n个监控数据是否满足极值置信条件,得到极值置信结果;
根据所述n个监控数据中的极值分布情况确定所述n个监控数据是否满足极值拖尾条件,得到极值拖尾结果;
根据预置的数据精确度确定所述n个监控数据是否满足同一分布条件,得到同一分布结果;
根据所述极值置信结果、所述极值拖尾结果、所述同一分布结果确定所述n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据所述均衡分布结果从所述n个监控数据中确定出需要进行故障分析的监控指标。
2.根据权利要求1所述的方法,其特征在于,所述获取监控平台采集到的n个监控数据之后,所述方法还包括:
当所述n个监控数据采用不相同的量纲时,对所述n个监控数据进行标准化处理。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述n个监控数据的总体置信区间确定所述n个监控数据是否满足极值置信条件,得到极值置信结果,包括:
计算所述n个监控数据的数学期望值和所述n个监控数据的标准差;
根据所述数学期望值、所述标准差确定所述n个监控数据的总体置信区间,所述总体置信区间包括:区间上限和区间下限;
计算所述n个监控数据中的极大值和极小值;
通过判断所述极大值和所述极小值是否处于所述总体置信区间内确定所述n个监控数据是否满足极值置信条件,得到极值置信结果。
4.根据权利要求3所述的方法,其特征在于,所述通过判断所述极大值和所述极小值是否处于所述总体置信区间内确定所述n个监控数据是否满足极值置信条件,得到极值置信结果,包括:
当所述极大值大于所述区间上限,或者所述极小值小于所述区间下限时,确定所述n个监控数据不满足所述极值置信条件,所述极值置信结果为所述n个监控数据不满足所述极值置信条件;
当所述极大值小于或等于所述区间上限、且所述极小值大于或等于所述区间下限时,确定所述n个监控数据满足所述极值置信条件,所述极值置信结果为所述n个监控数据满足所述极值置信条件。
5.根据权利要求3所述的方法,其特征在于,所述通过判断所述极大值和所述极小值是否处于所述总体置信区间内确定所述n个监控数据是否满足极值置信条件,得到极值置信结果,包括:
当所述n个监控数据采用相同的量纲时,根据所述极大值和所述极小值计算所述n个监控数据的极差,所述极差为所述极大值减去所述极小值;
当所述极差大于或等于所述标准差的特定整数倍且所述极大值大于所述区间上限时,或者当所述极差大于或等于所述标准差的特定整数倍且所述极小值小于所述区间下限时,确定所述n个监控数据不满足所述极值置信条件,所述极值置信结果为所述n个监控数据不满足所述极值置信条件;
当所述极大值小于或等于所述区间上限、且所述极小值大于或等于所述区间下限时,或者当所述极差小于所述标准差的特定整数倍时,确定所述n个监控数据满足所述极值置信条件,所述极值置信结果为所述n个监控数据满足所述极值置信条件。
6.根据权利要求1或2所述的方法,其特征在于,所述根据所述n个监控数据中的极值分布情况确定所述n个监控数据是否满足极值拖尾条件,得到极值拖尾结果,包括:
计算所述n个监控数据中的极大值和极小值,并计算所述n个监控数据中非极值数据的非极值权重,所述非极值数据为所述n个监控数据中除所述极大值以外的所有监控数据;
计算所述n个监控数据的标准差,并根据所述标准差计算所述n个监控数据的拖尾系数;
通过计算所述极大值和所述非极值权重之间的数值关系、计算所述极小值和所述拖尾系数之间的数值关系确定所述n个监控数据是否满足极值拖尾条件,得到极值拖尾结果。
7.根据权利要求6所述的方法,其特征在于,所述通过计算所述极大值和所述非极值权重之间的数值关系、计算所述极小值和所述拖尾系数之间的数值关系确定所述n个监控数据是否满足极值拖尾条件,得到极值拖尾结果,包括:
当所述极大值大于所述非极值权重,或者所述极小值小于所述拖尾系数时,确定所述n个监控数据不满足所述极值拖尾条件,所述极值拖尾结果为所述n个监控数据不满足所述极值拖尾条件;
当所述极大值小于或等于所述非极值权重,或者所述极小值大于或等于所述拖尾系数时,确定所述n个监控数据满足所述极值拖尾条件,所述极值拖尾结果为所述n个监控数据满足所述极值拖尾条件。
8.根据权利要求1或2所述的方法,其特征在于,所述根据预置的数据精确度确定所述n个监控数据是否满足同一分布条件,得到同一分布结果,包括:
从所述n个监控数据中选择出一个监控数据作为参照数据;
分别计算所述n个监控数据与所述参照数据之间的差值,得到n个差值结果;
通过计算所述n个差值结果与所述数据精确度之间的数值关系确定所述n个监控数据是否满足同一分布条件,得到同一分布结果。
9.根据权利要求8所述的方法,其特征在于,所述通过计算所述n个差值结果与所述数据精确度之间的数值关系确定所述n个监控数据是否满足同一分布条件,得到同一分布结果,包括:
获取所述n个差值结果中小于所述数据精确度的差值结果个数;
当所述差值结果个数大于或等于所述n时,确定所述n个监控数据满足所述同一分布条件,所述同一分布结果为所述n个监控数据满足所述同一分布条件;
当所述差值结果个数小于所述n时,确定所述n个监控数据不满足所述同一分布条件,所述同一分布结果为所述n个监控数据不满足所述同一分布条件。
10.根据权利要求1所述的方法,其特征在于,所述根据所述极值置信结果、所述极值拖尾结果、所述同一分布结果确定所述n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据所述均衡分布结果从所述n个监控数据中确定出需要进行故障分析的监控指标,包括:
当所述极值置信结果为所述n个监控数据不满足所述极值置信条件、且所述同一分布结果为所述n个监控数据不满足所述同一分布条件时,或者当所述极值拖尾结果为所述n个监控数据不满足所述极值拖尾条件、且所述同一分布结果为所述n个监控数据不满足所述同一分布条件时,确定所述n个监控数据的分布状态不满足所述均衡分布,从所述n个监控数据中去除掉监控数值最小的监控指标,得到(n-1)个监控数据,并重新确定所述(n-1)个监控数据的分布状态是否满足均衡分布,经过(n-n1)次对监控数据的均衡分布判断,直至确定n1个监控数据的分布状态满足均衡分布时,确定需要进行故障分析的监控指标为所述n1个监控数据,所述n1为小于所述n的自然数;
当所述同一分布结果为所述n个监控数据满足所述同一分布条件时,或者当所述极值置信结果为所述n个监控数据满足所述极值置信条件、且所述极值拖尾结果为所述n个监控数据满足所述极值拖尾条件时,确定所述n个监控数据的分布状态满足所述均衡分布,确定所有监控指标都不需要进行故障分析。
11.一种基于监控平台的故障分析装置,其特征在于,包括:
获取模块,用于获取监控平台采集到的n个监控数据,所述监控数据包括:监控指标和所述监控指标对应的监控数值,所述n为非零自然数;
极值置信确定模块,用于根据所述n个监控数据的总体置信区间确定所述n个监控数据是否满足极值置信条件,得到极值置信结果;
极值拖尾确定模块,用于根据所述n个监控数据中的极值分布情况确定所述n个监控数据是否满足极值拖尾条件,得到极值拖尾结果;
同一分布确定模块,用于根据预置的数据精确度确定所述n个监控数据是否满足同一分布条件,得到同一分布结果;
均衡分布确定模块,用于根据所述极值置信结果、所述极值拖尾结果、所述同一分布结果确定所述n个监控数据的分布状态是否满足均衡分布,得到均衡分布结果,并根据所述均衡分布结果从所述n个监控数据中确定出需要进行故障分析的监控指标。
12.根据权利要求11所述的装置,其特征在于,所述基于监控平台的故障分析装置,还包括:标准化处理模块,用于所述获取模块获取监控平台采集到的n个监控数据之后,当所述n个监控数据采用不相同的量纲时,对所述n监控数据进行标准化处理。
13.根据权利要求11或12所述的装置,其特征在于,所述极值置信确定模块,包括:
第一计算子模块,用于计算所述n个监控数据的数学期望值和所述n个监控数据的标准差;
第二计算子模块,用于根据所述数学期望值、所述标准差确定所述n个监控数据的总体置信区间,所述总体置信区间包括:区间上限和区间下限;
第三计算子模块,用于计算所述n个监控数据中的极大值和极小值;
极值置信确定子模块,用于通过判断所述极大值和所述极小值是否处于所述总体置信区间内确定所述n个监控数据是否满足极值置信条件,得到极值置信结果。
14.根据权利要求13所述的装置,其特征在于,所述极值置信子模块,具体用于当所述极大值大于所述区间上限,或者所述极小值小于所述区间下限时,确定所述n个监控数据不满足所述极值置信条件,所述极值置信结果为所述n个监控数据不满足所述极值置信条件;当所述极大值小于或等于所述区间上限、且所述极小值大于或等于所述区间下限时,确定所述n个监控数据满足所述极值置信条件,所述极值置信结果为所述n个监控数据满足所述极值置信条件。
15.根据权利要求13所述的装置,其特征在于,所述极值置信子模块,具体用于当所述n个监控数据采用相同的量纲时,根据所述极大值和所述极小值计算所述n个监控数据的极差,所述极差为所述极大值减去所述极小值;当所述极差大于或等于所述标准差的特定整数倍且所述极大值大于所述区间上限时,或者当所述极差大于或等于所述标准差的特定整数倍且所述极小值小于所述区间下限时,确定所述n个监控数据不满足所述极值置信条件,所述极值置信结果为所述n个监控数据不满足所述极值置信条件;当所述极大值小于或等于所述区间上限、且所述极小值大于或等于所述区间下限时,或者当所述极差小于所述标准差的特定整数倍时,确定所述n个监控数据满足所述极值置信条件,所述极值置信结果为所述n个监控数据满足所述极值置信条件。
16.根据权利要求11或12所述的装置,其特征在于,所述极值拖尾确定模块,包括:
第四计算子模块,用于计算所述n个监控数据中的极大值和极小值,并计算所述n个监控数据中非极值数据的非极值权重,所述非极值数据为所述n个监控数据中除所述极大值以外的所有监控数据;
第五计算子模块,用于计算所述n个监控数据的标准差,并根据所述标准差计算所述n个监控数据的拖尾系数;
极值拖尾确定子模块,用于通过计算所述极大值和所述非极值权重之间的数值关系、计算所述极小值和所述拖尾系数之间的数值关系确定所述n个监控数据是否满足极值拖尾条件,得到极值拖尾结果。
17.根据权利要求16所述的装置,其特征在于,所述极值拖尾确定子模块,具体用于当所述极大值大于所述非极值权重,或者所述极小值小于所述拖尾系数时,确定所述n个监控数据不满足所述极值拖尾条件,所述极值拖尾结果为所述n个监控数据不满足所述极值拖尾条件;当所述极大值小于或等于所述非极值权重,或者所述极小值大于或等于所述拖尾系数时,确定所述n个监控数据满足所述极值拖尾条件,所述极值拖尾结果为所述n个监控数据满足所述极值拖尾条件。
18.根据权利要求11或12所述的装置,其特征在于,所述同一分布确定子模块,包括:
参照数据选择子模块,用于从所述n个监控数据中选择出一个监控数据作为参照数据;
差值计算子模块,用于分别计算所述n个监控数据与所述参照数据之间的差值,得到n个差值结果;
同一分布确定子模块,用于通过计算所述n个差值结果与所述数据精确度之间的数值关系确定所述n个监控数据是否满足同一分布条件,得到同一分布结果。
19.根据权利要求18所述的装置,其特征在于,所述同一分布确定子模块,具体用于获取所述n个差值结果中小于所述数据精确度的差值结果个数;当所述差值结果个数大于或等于所述n时,确定所述n个监控数据满足所述同一分布条件,所述同一分布结果为所述n个监控数据满足所述同一分布条件;当所述差值结果个数小于所述n时,确定所述n个监控数据不满足所述同一分布条件,所述同一分布结果为所述n个监控数据不满足所述同一分布条件。
20.根据权利要求11所述的装置,其特征在于,所述均衡分布确定模块,具体用于当所述极值置信结果为所述n个监控数据不满足所述极值置信条件、且所述同一分布结果为所述n个监控数据不满足所述同一分布条件时,或者当所述极值拖尾结果为所述n个监控数据不满足所述极值拖尾条件、且所述同一分布结果为所述n个监控数据不满足所述同一分布条件时,确定所述n个监控数据的分布状态不满足所述均衡分布,从所述n个监控数据中去除掉监控数值最小的监控指标,得到(n-1)个监控数据,并重新确定所述(n-1)个监控数据的分布状态是否满足均衡分布,经过(n-n1)次对监控数据的均衡分布判断,直至确定n1个监控数据的分布状态满足均衡分布时,确定需要进行故障分析的监控指标为所述n1个监控数据,所述n1为小于所述n的自然数;当所述同一分布结果为所述n个监控数据满足所述同一分布条件时,或者当所述极值置信结果为所述n个监控数据满足所述极值置信条件、且所述极值拖尾结果为所述n个监控数据满足所述极值拖尾条件时,确定所述n个监控数据的分布状态满足所述均衡分布,确定所有监控指标都不需要进行故障分析。
CN201610301420.2A 2016-05-09 2016-05-09 一种基于监控平台的故障分析方法和装置 Active CN107357714B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610301420.2A CN107357714B (zh) 2016-05-09 2016-05-09 一种基于监控平台的故障分析方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610301420.2A CN107357714B (zh) 2016-05-09 2016-05-09 一种基于监控平台的故障分析方法和装置

Publications (2)

Publication Number Publication Date
CN107357714A true CN107357714A (zh) 2017-11-17
CN107357714B CN107357714B (zh) 2020-09-08

Family

ID=60270950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610301420.2A Active CN107357714B (zh) 2016-05-09 2016-05-09 一种基于监控平台的故障分析方法和装置

Country Status (1)

Country Link
CN (1) CN107357714B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108878995A (zh) * 2018-04-24 2018-11-23 北京长城华冠汽车科技股份有限公司 确定新能源车辆的电池组温差的方法、装置和控制方法
CN109614284A (zh) * 2018-10-25 2019-04-12 北京奇艺世纪科技有限公司 一种数据处理方法及装置
CN115358280A (zh) * 2022-10-19 2022-11-18 深圳市信润富联数字科技有限公司 轴承信号故障诊断方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101267362A (zh) * 2008-05-16 2008-09-17 亿阳信通股份有限公司 一种性能指标值正常波动范围的动态确定方法及其装置
CN102129651A (zh) * 2011-02-09 2011-07-20 浪潮集团山东通用软件有限公司 一种智能确定离群点和优化显示方式的财务预测方法
US20120310939A1 (en) * 2011-06-06 2012-12-06 Taiyeong Lee Systems And Methods For Clustering Time Series Data Based On Forecast Distributions
CN104850933A (zh) * 2015-04-10 2015-08-19 国电南瑞科技股份有限公司 基于可信特征值的调度自动化数据稽查系统及其稽查方法
CN104901823A (zh) * 2014-03-04 2015-09-09 中国移动通信集团北京有限公司 一种告警阈值生成方法、业务性能指标监控方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101267362A (zh) * 2008-05-16 2008-09-17 亿阳信通股份有限公司 一种性能指标值正常波动范围的动态确定方法及其装置
CN102129651A (zh) * 2011-02-09 2011-07-20 浪潮集团山东通用软件有限公司 一种智能确定离群点和优化显示方式的财务预测方法
US20120310939A1 (en) * 2011-06-06 2012-12-06 Taiyeong Lee Systems And Methods For Clustering Time Series Data Based On Forecast Distributions
CN104901823A (zh) * 2014-03-04 2015-09-09 中国移动通信集团北京有限公司 一种告警阈值生成方法、业务性能指标监控方法及装置
CN104850933A (zh) * 2015-04-10 2015-08-19 国电南瑞科技股份有限公司 基于可信特征值的调度自动化数据稽查系统及其稽查方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108878995A (zh) * 2018-04-24 2018-11-23 北京长城华冠汽车科技股份有限公司 确定新能源车辆的电池组温差的方法、装置和控制方法
CN109614284A (zh) * 2018-10-25 2019-04-12 北京奇艺世纪科技有限公司 一种数据处理方法及装置
CN109614284B (zh) * 2018-10-25 2022-06-14 北京奇艺世纪科技有限公司 一种数据处理方法及装置
CN115358280A (zh) * 2022-10-19 2022-11-18 深圳市信润富联数字科技有限公司 轴承信号故障诊断方法、装置、设备及存储介质
CN115358280B (zh) * 2022-10-19 2023-03-24 深圳市信润富联数字科技有限公司 轴承信号故障诊断方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN107357714B (zh) 2020-09-08

Similar Documents

Publication Publication Date Title
CN105577440B (zh) 一种网络故障时间定位方法和分析设备
CN109818961B (zh) 一种网络入侵检测方法、装置和设备
CN114298863A (zh) 一种智能抄表终端的数据采集方法及系统
CN110083507B (zh) 关键性能指标分类方法及装置
CN112491854B (zh) 一种基于fcnn的多方位安全入侵检测方法及系统
CN114513470B (zh) 网络流量控制方法、装置、设备及计算机可读存储介质
CN108805174A (zh) 聚类方法及装置
CN107357714A (zh) 一种基于监控平台的故障分析方法和装置
CN117156442B (zh) 基于5g网络的云数据安全保护方法及系统
CN112800115B (zh) 数据处理方法及数据处理装置
CN110493221A (zh) 一种基于聚簇轮廓的网络异常检测方法
CN114781650B (zh) 一种数据处理方法、装置、设备以及存储介质
CN114637263A (zh) 一种异常工况实时监测方法、装置、设备及存储介质
CN117170980A (zh) 一种服务器硬件异常预警方法、装置、设备及存储介质
CN111953531A (zh) 网络故障分析方法及装置
CN114566964B (zh) 一种配电网馈线自动化控制方法、装置、设备及存储介质
WO2021190068A1 (zh) 一种建模方法及装置
CN115314400A (zh) 网络系统异常检测方法、装置、电子设备及存储介质
CN115392582A (zh) 基于增量模糊粗糙集属性约简的作物产量预测方法
CN111984637A (zh) 数据建模中的缺失值处理方法和装置、设备及存储介质
CN115809404B (zh) 一种检测阈值计算方法、装置、存储介质及电子设备
CN115629715B (zh) 一种提高闪存中块类型判断准确率的方法及系统
CN111080150A (zh) 生产数据分析方法、装置、设备及介质
CN116541252B (zh) 一种机房故障日志数据处理方法及装置
CN113435655B (zh) 扇区动态管理决策方法、服务器及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant