CN107451029A - 一种信息处理方法及装置、设备 - Google Patents

一种信息处理方法及装置、设备 Download PDF

Info

Publication number
CN107451029A
CN107451029A CN201610383572.1A CN201610383572A CN107451029A CN 107451029 A CN107451029 A CN 107451029A CN 201610383572 A CN201610383572 A CN 201610383572A CN 107451029 A CN107451029 A CN 107451029A
Authority
CN
China
Prior art keywords
item
sample sequence
fractionation
value
close
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610383572.1A
Other languages
English (en)
Other versions
CN107451029B (zh
Inventor
陈爱明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610383572.1A priority Critical patent/CN107451029B/zh
Publication of CN107451029A publication Critical patent/CN107451029A/zh
Application granted granted Critical
Publication of CN107451029B publication Critical patent/CN107451029B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3017Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3068Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data format conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Abstract

本发明公开了一种信息处理方法及装置、设备,所述方法包括:获取各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列,其中,所述第一采样序列和所述第三采样序列为第一指标的采样序列,所述第三采样序列和所述第四采样序列为第二指标的采样序列;根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的波动值和关联系数;根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值;根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对所述汇总项的影响度。

Description

一种信息处理方法及装置、设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种信息处理方法及装置、设备。
背景技术
在机房业务监控中,有业务接入监控平台时,监控平台会为该业务配置一个业务配置项,并将该业务配置项作为一个独立单元进行监控,每个业务配置项在监控平台中有唯一对应的ID。在对该业务配置项进行监控时,监控平台会根据业务特性,为该业务配置项设定监控指标如流量、慢速比、失败率等指标,监控平台可以监控获得这些监控指标的汇总项和拆分项。这里,一个汇总项对应唯一的业务配置项的一项监控指标,汇总项由多个拆分项汇聚而成,假设汇总项对应一批机房的一项监控指标的数据,则拆分项对应所述一批机房中一个机房的该项监控指标的数据。
当监控平台监控到相应业务配置项中的一个监控指标的汇总项出现异常时,监控平台认为有故障发生,开始定位是由于哪些机房的故障导致了汇总项出现异常。监控平台在进行故障定位时,通过计算各个拆分项对汇总项的影响度,得到对汇总项影响度最高的N个拆分项,确定这N个拆分项对应的N个机房,定位这N个机房为导致汇总项出现异常的关联机房;这样就可以派遣运维人员对这N个机房进行故障查找和修复。
现有技术中,计算各个拆分项对汇总项的影响度的方法有很多种,一种是基于相关系数的方法,其主要流程包括:确定汇总项、拆分项的采样序列;根据预设的相关性系数算法,计算每个拆分项与汇总项的相关系数,这里,预设的相关性系数算法可以是皮尔逊相关系数法、距离法(比如欧氏距离、哈曼顿距离、闵科夫距离、切比雪夫距离、马氏距离等等)、余弦(cosine)相似度法、 频谱分析法等等;这里,用每个拆分项与汇总项的相关系数来表示每个拆分项对汇总项的影响度,相关系数越大,代表相应拆分项对汇总项的影响度越高。另一种是基于机器学习的聚类算法,其主要流程包括:确定汇总项、拆分项的采样序列;这里,把汇总项作为类中心点,拆分项看成是需要聚类的其他数据点,其中汇总项、拆分项的采样序列中各个采样点的值,看成是类中心、其他数据点的不同维度的值;然后,计算其他数据点(拆分项)每个维度的平均值,得到一个平均值数据点,采用预设的距离算法计算这个平均值数据点与该类中心的距离(欧氏距离或绝对值距离等等),并将其作为每个数据点(拆分项)到类中心(汇总项)的距离,这里,用每个数据点(拆分项)到类中心(汇总项)的距离来表示每个拆分项对汇总项的影响度,距离越小,代表相应拆分项对汇总项的影响度越高。
采用上述两种方法都可以获得各个拆分项对汇总项的影响度,但是,上述的两种方法中采用不同的相关性系数算法或距离算法会得到不同的结果,这就表明上述两种方法进行故障定位的准确性不高;而且,上述两种方法都是只考虑了拆分项与汇总项之间的关系,而忽略了拆分项自身的波动情况,这也会导致最终的故障定位不准确。另外,上述的相关性系数算法或距离算法的计算复杂度都很高,特别是基于机器学习聚类算法的方法中,把汇总项、每个拆分项的采样序列看成一个多维数据点,在采样点增加的情况下,必定会带来维度灾难问题,导致距离算法效率低下,甚至无法进行,比如现在很多重点业务都要求秒级监控,则一天的数据有86400个采样点,这种情况下,距离算法要处理86400维的数据,这对距离的计算有极大挑战,非常容易带来维度灾难问题。
发明内容
有鉴于此,本发明实施例为解决现有技术中存在的至少一个问题而提供了一种信息处理方法及装置、设备,能够准确定位出对汇总项的影响度较高拆分项。
本发明的技术方案是这样实现的:
第一方面,本发明实施例提供一种信息处理方法,其特征在于,所述方法包括:
获取各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列,其中,所述第一采样序列和所述第三采样序列为第一指标的采样序列,所述第三采样序列和所述第四采样序列为第二指标的采样序列;
根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的波动值和关联系数;
根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值;
根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对所述汇总项的影响度。
第二方面,本发明实施例提供一种信息处理装置,所述装置包括:获取单元、第一计算单元、第二计算单元和第三计算单元,其中:
获取单元,用于获取各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列,其中,所述第一采样序列和所述第三采样序列为第一指标的采样序列,所述第三采样序列和所述第四采样序列为第二指标的采样序列;
第一计算单元,用于根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的波动值和关联系数;
第二计算单元,用于根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值;
第三计算单元,用于根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对所述汇总项的影响度。
第三方面,本发明实施例提供了一种信息处理设备,所述设备包括:处理器和输出装置,其中:
所述处理器,用于获取各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列,其中,所述第一采样序列和所述第三采样 序列为第一指标的采样序列,所述第三采样序列和所述第四采样序列为第二指标的采样序列;根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的波动值和关联系数;根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值;根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对所述汇总项的影响度;
所述输出装置,用于输出所述拆分项对所述汇总项的影响度。
本发明实施例提供了一种信息处理方法及装置、设备,在计算影响度的过程中,没有把汇总项、拆分项看成多维的数据点,而是把拆分项和汇总项的采样数据处理成一维数据进行计算,在秒级监控的趋势不断上升的情况下,避开了数据多维度计算造成的问题;且在计算所述拆分项对所述汇总项的影响度时,考虑到了拆分项自身的波动异常情况、拆分项与汇总项的关联程度、拆分项自身与其他拆分项的权重比值,与现有技术中仅考虑拆分项与汇总项的关联程度相比,本发明实施例从三个不同方向来分析拆分项对所述汇总项的影响度,计算出的拆分项对所述汇总项的影响度不仅体现了拆分项自身的局部性,还体现了拆分项与汇总项、其他所有拆分项的全局性,使得计算出的拆分项对汇总项的影响度更加准确,进而可以更加准确定位出对汇总项的影响度较高拆分项;另外,计算设备在计算影响度时考虑了每个拆分项自身会带有的在所有拆分项中的权重问题,让计算出的影响度更紧贴业务实际情况。
附图说明
图1为本发明实施例提供的一种机房业务监控系统的组成结构图;
图2为本发明实施例一提供的一种信息处理方法的实现流程示意图;
图3为本发明实施例二提供的一种信息处理方法的实现流程示意图;
图4为本发明实施例三提供的一种信息处理装置的组成结构示意图;
图5为本发明实施例四提供的一种信息处理设备的硬件组成结构示意图。
具体实施方式
为了更好地介绍和理解本发明的各实施例,下面介绍一下本发明的各实施例中可能涉及的一些专业词汇,具体包括:
业务配置项:业务接入监控平台时,监控平台为该业务配置一个业务配置项,将该业务配置项作为一个独立单元进行监控,相应地,每个业务配置项在监控平台中有唯一对应的ID。
监控指标:监控平台根据业务特性,为每个业务配置项设定监控指标,比如有流量、慢速比、失败率等指标。
汇总项:在机房业务监控中,汇总项代表一批机房的监控汇总情况,在监控平台中,也就对应着唯一的业务配置项。
拆分项:在机房业务监控中,一个汇总项,由多个拆分项汇聚而成,比如每个机房对应的就是一个拆分项。
约定以下数学运算符号:sum:求和;max:求最大值;count:求元素个数;mean:求平均值;std:求标准差;cov:求协方差;abs:求绝对值。
下面介绍一下本发明实施例所涉及的机房业务监控系统,如图1所示,该系统包括:监控平台11、机房21、机房22和机房23,其中,监控平台11为接入的业务配置有对应的业务配置项,监控平台11内配置有业务配置项101、…、业务配置项10n;监控平台11为业务配置项101设定有监控指标1011如流量、慢速比或失败率等,当然,对于一个业务配置项也可以设置多个监控指标,如监控平台11为业务配置项10n设定有监控指标10n1和监控指标10n2共两个监控指标。
这里,以监控指标为流量为例进行说明,监控平台11对机房21流量的监控数据为一个拆分项,监控平台11对机房22流量的监控数据为一个拆分项,监控平台11对机房23流量的监控数据为一个拆分项;将三个机房(机房21、机房22和机房23)视为一个设备,监控平台11对这一个设备的流量的监控数据为一个汇总项。
这里,所述汇总项可以是根据各个拆分项中的数据计算获得,也可以是监控平台直接监控获得。上述图1的例子只是本发明实施例涉及的一个系统架构实例,本发明实施例并不限于上述图1所述的系统结构,基于该系统架构,提出本发明各个实施例。
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
实施例一
为了解决背景技术中存在的问题,本发明实施例提供一种信息处理方法,应用于计算设备,该信息处理方法所实现的功能可以通过计算设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该计算设备至少包括处理器和存储介质。这里,所述计算设备可以是任何具有信息处理能够的计算设备,例如可以是终端、服务器等。
图2为本发明实施例一信息处理方法的实现流程示意图,如图2所示,该信息处理方法包括:
步骤S201、获取各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列。
这里,所述汇总项对应一组设备,所述拆分项对应所述一组设备中的一个设备,所述第一采样序列和所述第三采样序列为第一指标的采样序列,所述第三采样序列和所述第四采样序列为第二指标的采样序列。
步骤S202、根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的波动值和关联系数。
这里,计算设备根据所述拆分项的第一采样序列,计算所述拆分项的波动值;所述波动值用于表示所述拆分项的异常程度;若某拆分项异常越严重,则对汇总项的影响自然会大,即异常拆分项对影响度的贡献相对非异常拆分项要大些,因此本发明实施例计算影响度时考虑拆分项的异常程度。
这里,计算设备根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的关联系数;所述关联系数用于表示所述拆分项与所述 汇总项的关联程度,在汇总项出现异常时,是由于第一指标突变猛涨,则自然要重点关注第一指标有上涨趋势的拆分项,而不是第一指标下跌的拆分项,即拆分项的第一采样序列的趋势图与汇总项的第三采样序列的趋势图越一致,表明该拆分项对所述汇总项的影响度越大,因此本发明实施例计算影响度时考虑拆分项与所述汇总项的关联程度。
步骤S203、根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值。
这里,所述权重值用于表示所述拆分项的重要程度,该权重值反应了拆分项自身与其他拆分项的权重比值,重要的拆分项自然相对于不重要拆分项要多些关注,即越重要的拆分项对汇总项的影响度也越高,这样计算出的影响度更紧贴业务实际情况,因此本发明实施例计算影响度时考虑拆分项自身与其他拆分项的权重比值。
这里,所述第二指标可以为在线用户数,在线用户数越多的拆分项自然越重要,权重值越大。
步骤S204、根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对所述汇总项的影响度。
这里,针对一个拆分项,在本发明的一个实施例中,计算设备可以计算该拆分项的波动值、关联系数和权重值之和,用该和表示所述拆分项对所述汇总项的影响度。
这里,针对一个拆分项,在本发明的另一个实施例中,所述计算设备中预存有所述第二拆分项的波动值的系数k1、关联系数的系数k2和权重值的系数k3,所述k1、k2、k3可以是用户输入的经验值;计算设备可以根据所述k1、k2、k3和该拆分项的波动值、关联系数、权重值,计算该拆分项对所述汇总项的影响度;示例地,将拆分项j的波动值记为Fj、关联系数记为Rj、权重值记为Wj,则拆分项j对所述汇总项的影响度Efdj可以采用公式Efdj=k1*Fj+k2*Rj+k3*Wj计算获得。
本发明实施例中,计算设备没有把汇总项、拆分项看成多维的数据点,而是把拆分项和汇总项的采样数据处理成一维数据进行计算,在秒级监控的趋势不断上升的情况下,避开了数据多维度计算造成的问题;计算设备在计算所述拆分项对所述汇总项的影响度时,考虑到了拆分项自身的波动异常情况、拆分项与汇总项的关联程度、拆分项自身与其他拆分项的权重比值,与现有技术中仅考虑拆分项与汇总项的关联程度相比,本发明实施例从三个不同方向来分析拆分项对所述汇总项的影响度,计算出的拆分项对所述汇总项的影响度不仅体现了拆分项自身的局部性,还体现了拆分项与汇总项、其他所有拆分项的全局性,使得计算出的拆分项对汇总项的影响度更加准确,进而可以更加准确定位出对汇总项的影响度较高拆分项;且计算设备在计算影响度时考虑了每个拆分项自身会带有的在所有拆分项中的权重问题,让计算出的影响度更紧贴业务实际情况。
实施例二
基于前述的实施例,本发明实施例提供一种信息处理方法,应用于计算设备,该信息处理方法所实现的功能可以通过计算设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该计算设备至少包括处理器和存储介质。这里,所述计算设备可以是任何具有信息处理功能的计算设备,例如可以是终端、服务器。
图3为本发明实施例二信息处理方法的实现流程示意图,如图3所示,该信息处理方法包括:
步骤S301、计算设备获取各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列。
这里,基于图1所示的机房业务监控系统,所述汇总项对应一组机房(机房21、机房22和机房23),所述拆分项对应一组机房中的一个机房(机房21、机房22、机房23);第一指标为监控指标,所述监控指标是监控平台为业务对应的业务配置项设定的,用于监控设备的业务是否正常的一项指标,所述第二 指标为辅助指标,所述辅助指标是用于表示一组设备中各设备重要性的一项指标。
这里,针对一个业务配置项中一个监控指标对应的汇总项,所述监控平台中预存有该监控指标对应的汇总项的故障告警规则,所述监控平台根据所述故障告警规则监控汇总项在各个采样时间点的采样值,可以监控到在采样时间点StarTime到采样时间点EndTime之间的采样时段为故障时段,监控平台记录该故障时段[StarTime,EndTime],本实施例中,“[”表示区间包含左端点,“]”表示区间包含右端点,如[StarTime,EndTime]表示StarTime到EndTime的区间中包含采样时间点StarTime和EndTime。
这里,当监控平台判定相应的业务配置项出现故障时,监控平台就需要定位导致业务出现故障的机房为哪些,此时,监控平台需要先获取在包含故障告警时段(如2016年5月20日10点01分至12点59分)的预设时段(如一天2016年5月20日一天)内,该业务配置项中该监控指标的初始采样数据Data(i),其中,i=1,2,……,n,即n个采样时间点,可采样获得n个采样值;所述初始采样数据Data(i)包括汇总项的初始采样数据y′(i)和拆分项的初始采样数据xj′(i),其中j=1,2,……,M,j为拆分项标签,j用于标识拆分项对应的机房名,或者j用于标识拆分项对应的机房IP,M个拆分项就对应M个机房。
这里,汇总项的初始采样数据y′(i)包括第三初始采样序列y1′(i)和第四初始采样序列y2′(i),各个拆分项的初始采样数据xj′(i)包括第一初始采样序列xj1′(i)和第二初始采样序列xj2′(i),序列y1′(i)和xj1′(i)是监控指标的采样序列,序列y2′(i)和xj2′(i)是辅助指标的采样序列。
示例地,所述监控指标为慢速比,所述辅助指标为在线用户数,则y1′(i)为对一组机房的慢速比的采样序列,xj1′(i)为对机房j的慢速比的采样序列,y2′(i)为对一组机房的在线用户数的采样序列,xj2′(i)为对机房j的在线用户数的采样序列。
这里,所述计算设备可以是监控平台,也可以是其他具有信息处理功能的 设备,如果所述计算设备不是监控平台,则监控平台在获取所述监控指标的初始采样数据Data(i)和告警时段[StarTime,EndTime]后,会将Data(i)和告警时段[StarTime,EndTime]发送给计算设备,由计算设备进行处理。
这里,计算设备获取各个拆分项的初始采样数据xj′(i)和汇总项的初始采样数据y′(i),对所述各个拆分项的初始采样数据和汇总项的初始采样数据进行数据预处理,得到各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列。如,对xj1′(i)进行数据预处理可以得到第一采样序列xj1(i),对xj2′(i)进行数据预处理可以得到第二采样序列xj2(i),对y1′(i)进行数据预处理可以得到第三采样序列y1(i),对y2′(i)进行数据预处理可以得到第四采样序列y2(i)。
这里,所述数据预处理包括数据缺失补齐、毛刺点定位与光滑化,以对xj1′(i)进行数据预处理得到第一采样序列xj1(i)为例,数据缺失补齐过程为:序列xj1′(i)中由于机房断网等原因存在某些采样点没有采样值,此时就需要对序列xj1′(i)没有采样值的采样点补上采样值,补上的采样值可以等于前一个采样点的采样值,也可以等于后一个采样点的采样值,也可以是其前后采样点的采样值的均值等。毛刺点定位与光滑化过程为:所述序列xj1′(i)的连续m个采样点的采样值都不在预设的机房监控指标的正常值范围时,若m小于n0,则认为这m个采样点为毛刺点,此时需要将这m个采样点的采样值光滑化,使这m个采样点的采样值达到该正常值范围。
这里,在定位毛刺点时,可以根据采样序列的数据类型进行正常值范围的设定,如流量是整数型,慢速比是比率型,对整数型采样序列和比率型采样序列可以按照不同的算法计算正常值范围。
步骤S302、计算设备根据每个拆分项的第一采样序列,计算每个拆分项的波动值。
这里,针对一个拆分项,计算该拆分项的波动值可以包括:计算设备根据所述拆分项的第一采样序列,得到所述拆分项的异常子序列,其中,所述异常子序列为所述第一采样序列中采样值均不在预设范围内的连续子序列,所述异 常子序列中采样值的个数超过第三预设阈值;然后,根据所述拆分项的异常子序列,计算所述拆分项的波动值。当然,计算设备还可以用其他方法来计算获得表明该拆分项波动情况的波动值,如计算设备可以计算该拆分项的第一采样序列中,采样值不在预设范围内的连续子序列的个数做为该拆分项的波动值;等等。
在本发明的一个实施例中,计算设备根据所述拆分项的第一采样序列,得到所述拆分项的异常子序列,包括:扫描所述拆分项的第一采样序列;在扫描到第一子序列时,记录所述第一子序列为所述拆分项的异常子序列,所述第一子序列为所述第一采样序列中采样值不在第一预设范围内的子序列;此时,上述的预设范围为第一预设范围。
在本发明的另一个实施例中,计算设备根据所述拆分项的第一采样序列,得到所述拆分项的异常子序列,包括:计算设备可以根据所述第一采样序列在第一时段内的采样值,计算置信区间;若所述第一采样序列在第二时段内有连续超过预设第四阈值数目的采样值不在所述置信区间中,则记录所述连续超过预设第四阈值数目的采样值组成的序列为所述拆分项的异常子序列,其中,所述第一采样序列对应的采样时段由所述第一时段和所述第二时段组成,所述第二时段为第三采样序列不在预设正常范围内的时间段;此时,所述的预设范围为所述置信区间,所述第四预设阈值可以等于上述的第三预设阈值。
在本发明的其他实施例中,计算设备根据所述拆分项的第一采样序列,得到所述拆分项的异常子序列,包括:扫描所述拆分项的第一采样序列;在扫描到第一子序列时,记录所述第一子序列为所述拆分项的异常子序列,所述第一子序列为所述第一采样序列中采样值不在第一预设范围内的子序列;在未扫描到第一子序列时,根据所述第一采样序列在第一时段内的采样值,计算置信区间;若所述第一采样序列在第二时段内有连续超过预设第四阈值数目的采样值不在所述置信区间中,则记录所述连续超过预设第四阈值数目的采样值组成的序列为所述拆分项的异常子序列,其中,所述第一采样序列对应的采样时段由所述第一时段和所述第二时段组成,所述第二时段为第三采样序列不在预设正 常范围内的时间段。
这里,若计算设备没有获取到满足条件的异常子序列,则记录所述拆分项的异常子序列为空;即若所述第一采样序列在第二时段内的采样值中没有连续超过第三预设阈值数目的采样值不在所述置信区间中,则记录所述拆分项的异常子序列为空。
这里,计算所述异常子序列中各采样值与标准值之差的累计值,其中,所述标准值为第一预设值或所述拆分项的第一采样序列在第一时段内的采样值的均值;在所述第一采样序列的采样值类型为第一类型(如流量)时,确定所述累计值的绝对值为所述拆分项的初始波动值;在所述第一指标序列的采样值类型为第二类型(如慢速比)时,若所述累计值为负值或0,则确定所述拆分项的波动值为0;若所述累计值为正值,则确定所述拆分项的初始波动值为所述累计值;对所述拆分项的初始波动值做无量纲化处理,得到所述拆分项的波动值。
这里,承接上述示例,计算设备可以利用动态滑动窗口局部搜索算法,分别对拆分项j的第一采样序列即监控指标采样序列{xj1(i)|i=1,2,……,n}进行扫描,来获得拆分项j中有波动异常子序列即第一序列。需要说明的是,计算设备可以直接利用动态滑动窗口局部搜索算法对拆分项j的初始采样数据xj1′(i)进行数据预处理(包括数据缺失补齐、毛刺点定位于光滑化等),获得第一采样序列{xj1(i)|i=1,2,……,n}的同时,获得序列{xj1(i)|i=1,2,……,n}内部的波动情况;即步骤S301中第一采样序列的获取和步骤302中第一序列的获取可同时进行。
这里,如果动态滑动窗口搜索过程中发现有波动异常子序列即采样值均不在预设范围内的第一序列,该第一序列中的采样值个数应该超过第三预设阈值且第一序列中的采样值应该是连续的,假设监控指标为流量,第三预设阈值为5,预设范围为[0,100M],则如果计算设备扫描到拆分项j的第一采样序列中存在一段序列{xj1(75)=105M,xj1(76)=108M,xj1(77)=110M,xj1(78)=113M,xj1(79)=119M,xj1(80)=121M},则这段序列就是一个波动异常子 序列。此时,记录下该波动异常子序列为一个波动异常区间YCIndex即异常子序列。
这里,若计算设备在动态滑动窗口搜索过程中没有发现波动异常子序列,则计算设备获取第一采样序列中告警时段[StarTime,EndTime]即第二时段内的采样值与非告警时段即[1,StarTime)与(EndTime,n]内的采样值,本实施例中,“(”表示区间不包含左端点,“)”表示包含区间不包含右端点,如[1,StarTime)表示1到StarTime的区间中包含采样时间点1,不包含采样时间点StarTime;(EndTime,n]表示EndTime到n的区间中不包含采样时间点EndTime,包含采样时间点n。
这里,所述计算设备根据非告警时段的采样值计算置信区间[μ-3δ,μ+3δ],其中,μ为非告警时段的采样值的均值,δ为非告警时段的采样值的标准差。假如告警时段内的采样值脱离置信区间[μ-3δ,μ+3δ],且连续脱离置信区间的采样点个数大于第四预设阈值即n0的情况下,则将连续脱离置信区间的采样值组成的序列判为波动异常脱离置信区间的子序列,对应记录为该序列为波动异常区间YCIndex;若告警时段内的采样值都在非告警时段数据的置信区间内,或者告警时段内连续脱离置信区间的采样值个数小于n0,则该拆分项的第一采样序列波动正常,此时记波动异常区间YCIndex置为空。
这里,以所述第一指标序列的采样值类型为第二类型如慢速比为例,若得到的波动异常区间YCIndex不为空,则计算出YCIndex内采样值与非告警时段内的采样值的均值之差的累积值,为拆分项j的初始波动值Fj';若得到的YCIndex为空,则此时拆分项j的初始波动值Fj'为0;根据监控业务采样慢速比的非负特性,对于上述的初始波动值Fj',在某些极端情况下,可能会出现负值,当然这种情况是极少出现;为保证本实施例方法的稳健性,对负值情况看成波动正常,即负值处理成0。这里,可以按照以下等式(1)来计算拆分项j的初始波动值Fj':
这里,对于拆分项j的初始波动值Fj'的计算,在业务有特殊规定情形下,如业务要求有固定的数据波动正常阈值thresh0,即采样值超过或小于thresh0时,判为异常,此时可以采用如下等式(2)代替等式(1)来计算拆分项j的初始波动值Fj':
这里,等式(1)和(2)中j=1,2,……,M;对于初始波动值不为0的拆分项,由于最后要线性组合三个指标(波动值、关联系数和权重)来计算影响度,且三个指标的量纲不同,所以在此需要对Fj'≠0的波动值进行无量纲化处理,如采用中心化方法,根据以下等式(3)来进行无量纲化处理,计算得到拆分项j的波动值Fj
由此,计算设备可以得到每个拆分项的波动值Fj
步骤S303、计算设备确定所述波动值超过第一预设阈值的拆分项为第一拆分项。
这里,由于汇总项的故障发生肯定是某些拆分项发生异常导致,因此计算设备可以去掉Fj=0的拆分项,即异常子序列为空的波动正常的拆分项,留下波动异常的拆分项,即计算设备确定所述波动值超过0的拆分项为第一拆分项;当然,第一预设阈值可以根据实际情况来设定,不一定就是0。假设第一拆分项有m个,则m≤M,对m个第一拆分项重新排序记为{xj1(i)|i=1,2,……,n};j=1,2,……,m。
步骤S304、计算设备根据每个第一拆分项的第一采样序列与所述汇总项的第三采样序列,计算每个第一拆分项的关联系数。
这里,计算设备计算所述拆分项的第一采样序列的标准差,所述汇总项的第三采样序列的标准差;计算所述拆分项的第一采样序列与所述汇总项的第三 采样序列的协方差;根据所述第一采样序列的标准差、所述第三采样序列的标准差和所述协方差,计算所述拆分项的关联系数。
承接上述示例,对于m个异常拆分项即第一拆分项的监控指标序列即第一采样序列xj1(i),分别与汇总项的监控指标序列即第三采样序列y1(i),按照以下等式(4)进行关联系数的计算:
由此可得每个异常拆分项即第一拆分项的关联系数Rj
这里,关联系数的计算避开了距离计算,不但排除了距离的不同定义可能会带来的不同结果,而且最大程度地提高本实施例方法的效率。
步骤S305、计算设备确定所述波动值超过第一预设阈值且所述关联系数超过第二预设阈值的拆分项为第二拆分项。
这里,第一拆分项的波动值均超过第一预设阈值,假设第二预设阈值为R0;若Rj小于等于R0,则表明该拆分项的趋势与汇总项趋向比较不一致甚至相反,计算设备筛除这些拆分项;经过此步骤后,剩下的拆分项是本身波动异常即波动值大且趋势与汇总项趋势相对较为相似即关联系数较大的第二拆分项,假设第二拆分项有k个,则k≤m,对k个第一拆分项重新排序记为{xj1(i)|i=1,2,……,n};j=1,2,……,k。
步骤S306、计算设备根据每个第二拆分项的第二采样序列和所述汇总项的第四采样序列,计算每个第二拆分项的权重值。
这里,计算第一时段内,所述拆分项的第二采样序列中的各采样值与所述汇总项的第四采样序列中的各采样值的各比值;计算所述各比值的均值为所述拆分项的权重值。
这里,承接上述示例,仅计算第二拆分项的权重值,根据第二拆分项的辅助指标序列即第二采样序列xj2(i),j=1,2,……,k;计算在告警时段[StarTime,EndTime]内,第二拆分项的xj2(i)除以对应的汇总项采样值y2(i),最后再 取平均,即可得第二拆分项xj2(i)的权重值。示例地,第二拆分项xj2(i)的权重值可以采用如下等式(5)计算:
这里,假设辅助指标为在线用户数,则第二拆分项的权重值,即为在告警时段内,对应机房的在线用户数的平均占比值。
步骤S307、计算设备根据每个第二拆分项的波动值、关联系数和权重值,计算每个第二拆分项对所述汇总项的影响度。
这里,计算获取所述拆分项的波动值的系数k1、关联系数的系数k2和权重值的系数k3;根据所述k1、k2、k3和所述拆分项的波动值、关联系数、权重值,计算拆分项对所述汇总项的影响度。
这里,承接上述示例,通过上述步骤计算得到了导致汇总项发生故障的相关联拆分项即第二拆分项的波动值Fj、关联系数Rj、和权重值Wj三个指标的值,对三个指标进行线性组合,记组合系数分别为k1、k2、k3,采用公式Efdj=k1*Fj+k2*Rj+k3*Wj,j=1,2,……,k;计算拆分项j的影响度Efdj
这里,在本发明的一个实施例中,计算设备获取的所述拆分项的波动值的系数k1、关联系数的系数k2和权重值的系数k3可以是运维人员根据经验设置的,通常保持k1+k2+k3=1,运维人员根据经验认为哪个指标比较重要就将该指标的系数设置的大点;这种情况要求运维团队的人员需要有丰富的经验、对业务非常了解情况下会得到很好的效果。
这里,在本发明的另一个实施例中,在运维团队条件不够成熟情况下,很难得到理想效果,则算法通过自学习方式解决,即计算设备获取计算获取所述拆分项的波动值的系数k1、关联系数的系数k2和权重值的系数k3包括:将历史记录的多组汇总项的采样数据和各个拆分项的采样数据以及每组汇总项对应的使所述汇总项的采样数据出现异常的拆分项,输入学习模型,不断调整k1、k2和k3的值,直至获取满足预设条件的k1、k2和k3,输出所述满足预设条件的k1、 k2和k3;将所述学习模型输出的满足预设条件的k1、k2和k3作为所述拆分项的波动值的系数k1、关联系数的系数k2和权重值的系数k3
这里,示例地,计算设备首先获取一批历史数据(如获取30天历史数据,每天1440个采样点,100个机房,20个汇总项的采样数据做实验);然后按2/8原则(验证集/测试集)把数据集随机划分,每个测试集上的实验都先随机产生k1、k2、k3,且保持k1+k2+k3=1,在各个测试集上按照上述方法定位对汇总项影响度较高的拆分项,不断调整k1、k2、k3直至每个测试集中定位的影响度较高的拆分项的正确率大于等于97%(重点业务可能会更高,一般的业务97%都已经足够了),停止调整k1、k2、k3,再由多次实验的平均值确定k1、k2、k3;最后在验证集上检验k1、k2、k3,同时可能会对k1、k2、k3的值做小幅度调整,但始终满足两个要求:(1)k1+k2+k3=1;(2)测试集、验证集的定位正确率都不能小于97%。
步骤S308、计算设备根据拆分项对所述汇总项的影响度,按照影响度降序对拆分项进行排序。
这里,计算设备可以只对第二拆分项进行排序,在排序时可以按照影响度降序排序,即影响度越高排序越前。
步骤S309、计算设备从排序后的拆分项中得到排序在前K个的拆分项,所述K为第二预设值。
这里,计算设备可以从排序后的第二拆分项中得到排序在前K个的第二拆分项,即得到对汇总项发生故障的影响度最大的topK个拆分项,输出排序后的K个第二拆分项及其对应的影响度,这K个拆分项对应的机房即为对故障影响度最大的机房,此时就可以派遣运维人员重点对这几个机房进行故障查询和维修。
这里,在本发明的其他实施例中,计算设备也可以直接获取排序后的第二拆分项,输出排序后的k个第二拆分项及其对应的影响度,这k个拆分项对应的机房即为对故障影响度最大的机房,此时就可以派遣运维人员重点对这几个机房进行故障查询和维修。
本实施例方法是以机房故障定位背景为例进行说明,监控对象是机房,对于其他的业务监控,只要是能转化为与机房监控采样类似结构的业务,比如有汇总项、拆分项,且采样数据有监控指标序列、辅助指标序列,最后需要计算拆分项对汇总项的影响度、影响系数的情况,本实施例方法都可适用。
本发明实施例中,计算设备没有把汇总项、拆分项看成多维的数据点,而是把拆分项和汇总项的采样数据处理成一维数据进行计算,在秒级监控的趋势不断上升的情况下,避开了数据多维度计算造成的问题;在计算每个拆分项的波动值后,过滤掉波动正常的拆分项,这样,后续只需要计算波动值超过第一预设阈值的第一拆分项的关联系数,减少了计算量;然后过滤掉与汇总项弱相关、不相关的拆分项,只计算波动值超过第一预设阈值且关联系数超过第二预设阈值的第二拆分项的权重值,再次减少了计算量;本发明实施例中考虑了每个拆分项自身会带有的在所有拆分项中的权重问题,让最终计算的影响度更紧贴业务实际情况。最后,把拆分项的自身波动性、与汇总项的相关性、在所有拆分项中的权重三个指标进行线性组合,且组合系数可以自主学习得到,计算出最后的影响度,不但考虑了拆分项自身的局部性,而且考虑了拆分项与汇总项、与其他所有拆分项的全局性,提高了影响度计算的准确度。
实施例三
基于前述的实施例,本发明实施例提供一种信息处理装置,该信息处理装置所包括的各单元,以及各单元所包括的各模块,都可以通过该装置中的处理器来实现,当然也可通过具体的逻辑电路实现;在具体实施例的过程中,处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图4为本发明实施例三信息处理装置的组成结构示意图,如图4所示,该装置包括获取单元401、第一计算单元402、第二计算单元403和第三计算单元404,其中:
获取单元401,用于获取各个拆分项的第一采样序列和第二采样序列,汇 总项的第三采样序列和第四采样序列,其中,所述第一采样序列和所述第三采样序列为第一指标的采样序列,所述第三采样序列和所述第四采样序列为第二指标的采样序列。
第一计算单元402,用于根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的波动值和关联系数。
第二计算单元403,用于根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值。
第三计算单元404,用于根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对所述汇总项的影响度。
在本发明的其他实施例中,所述装置还包括第一确定单元,其中:
所述第一计算单元402,用于根据每个拆分项的第一采样序列,计算每个拆分项的波动值;所述第一确定单元,用于确定所述波动值超过第一预设阈值的拆分项为第一拆分项;所述第一计算单元402,用于根据每个第一拆分项的第一采样序列与所述汇总项的第三采样序列,计算每个第一拆分项的关联系数。
在本发明的其他实施例中,所述装置还包括:第二确定单元,其中:所述第二确定单元,用于确定所述波动值超过第一预设阈值且所述关联系数超过第二预设阈值的拆分项为第二拆分项;所述第二计算单元403,用于根据每个第二拆分项的第二采样序列和所述汇总项的第四采样序列,计算每个第二拆分项的权重值。
在本发明的其他实施例中,所述第一计算单元402,用于根据所述拆分项的第一采样序列,得到所述拆分项的异常子序列,根据所述拆分项的异常子序列,计算所述拆分项的波动值,其中,所述异常子序列为所述第一采样序列中采样值均不在预设范围内的连续子序列,所述异常子序列中采样值的个数超过第三预设阈值。
在本发明的其他实施例中,所述第一计算单元402,用于计算所述拆分项的第一采样序列的标准差,所述汇总项的第三采样序列的标准差;计算所述拆分项的第一采样序列与所述汇总项的第三采样序列的协方差;根据所述第一采 样序列的标准差、所述第三采样序列的标准差和所述协方差,计算所述拆分项的关联系数。
在本发明的其他实施例中,所述第二计算单元403,用于计算第一时段内,所述拆分项的第二采样序列中的各采样值与所述汇总项的第四采样序列中的各采样值的各比值;计算所述各比值的均值为所述拆分项的权重值。
在本发明的其他实施例中,所述第三计算单元404,用于获取所述拆分项的波动值的系数k1、关联系数的系数k2和权重值的系数k3;根据所述k1、k2、k3和所述拆分项的波动值、关联系数、权重值,计算拆分项对所述汇总项的影响度。
这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约篇幅,因此不再赘述。
实施例四
基于前述的实施例,本发明实施例提供一种信息处理设备,该设备包括处理器和输出装置,图5为本发明实施例四设备的一个可选的组成结构示意图,如图5所示,该信息处理设备包括处理器501和输出装置即外部通信接口502,其中:
所述处理器501,用于获取各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列,其中,所述第一采样序列和所述第三采样序列为第一指标的采样序列,所述第三采样序列和所述第四采样序列为第二指标的采样序列;根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的波动值和关联系数;根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值;根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对所述汇总项的影响度;
外部通信接口502,用于输出所述拆分项对所述汇总项的影响度。
这里,所述外部通信接口502可以将所述拆分项对所述汇总项的影响度输出给带有显示功能的终端,这样,终端将所述拆分项对所述汇总项的影响度显示给运维人员,运维人员就可以重点对影响度较高的拆分项对应的几个机房进行故障查询和维修。
在本发明的其他实施例中,所述输出装置还可以是信息处理设备的显示器,所述显示器,用于显示所述拆分项对所述汇总项的影响度,运维人员就可以根据显示的拆分项对应的影响度,重点对影响度较高的拆分项对应的几个机房进行故障查询和维修。
如图5所示,该设备中还包括存储介质503,所述处理器501、存储介质503以及外部通信接口502均通过总线504连接,其中外部通信接口用于该设备与外部的电子设备之间的通信。需要说明的是,图5所示的设备是采用总线(Bus)结构的,对于本领域的技术人员来说,该设备还可以采用其他的结构,只要处理器能够控制外部通信接口与外部的电子设备进行通信,而存储介质用于存储处理器可执行的程序代码等对象即可,可见,本发明实施例并不对设备做出更多限定。
这里需要指出的是:以上设备实施例项的描述,与上述方法描述是类似的,具有同方法实施例相同的有益效果,因此不做赘述。对于本发明设备实施例中未披露的技术细节,本领域的技术人员请参照本发明方法实施例的描述而理解,为节约篇幅,这里不再赘述。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例 序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计 算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (24)

1.一种信息处理方法,其特征在于,所述方法包括:
获取各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列,其中,所述第一采样序列和所述第三采样序列为第一指标的采样序列,所述第三采样序列和所述第四采样序列为第二指标的采样序列;
根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的波动值和关联系数;
根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值;
根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对所述汇总项的影响度。
2.根据权利要求1所述的方法,其特征在于,所述根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的波动值和关联系数,包括:
根据每个拆分项的第一采样序列,计算每个拆分项的波动值;
确定所述波动值超过第一预设阈值的拆分项为第一拆分项;
根据每个第一拆分项的第一采样序列与所述汇总项的第三采样序列,计算每个第一拆分项的关联系数。
3.根据权利要求1所述的方法,其特征在于,根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值,包括:
确定所述波动值超过第一预设阈值且所述关联系数超过第二预设阈值的拆分项为第二拆分项;
根据每个第二拆分项的第二采样序列和所述汇总项的第四采样序列,计算每个第二拆分项的权重值。
4.根据权利要求3所述方法,其特征在于,所述根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对所述汇总项的影响度,包括:
根据每个第二拆分项的波动值、关联系数和权重值,计算每个第二拆分项对所述汇总项的影响度。
5.根据权利要求1所述的方法,其特征在于,所述计算拆分项的波动值,包括:
根据所述拆分项的第一采样序列,得到所述拆分项的异常子序列,其中,所述异常子序列为所述第一采样序列中采样值均不在预设范围内的连续子序列,所述异常子序列中采样值的个数超过第三预设阈值;
根据所述拆分项的异常子序列,计算所述拆分项的波动值。
6.根据权利要求5所述的方法,其特征在于,所述根据所述拆分项的第一采样序列,得到所述拆分项的异常子序列,包括:
扫描所述拆分项的第一采样序列;
在扫描到第一子序列时,记录所述第一子序列为所述拆分项的异常子序列,所述第一子序列为所述第一采样序列中采样值不在第一预设范围内的子序列。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
在未扫描到第一子序列时,根据所述第一采样序列在第一时段内的采样值,计算置信区间;
若所述第一采样序列在第二时段内有连续超过预设第四阈值数目的采样值不在所述置信区间中,则记录所述连续超过预设第四阈值数目的采样值组成的序列为所述拆分项的异常子序列,其中,所述第一采样序列对应的采样时段由所述第一时段和所述第二时段组成,所述第二时段为第三采样序列不在预设正常范围内的时间段。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
若所述第一采样序列在第二时段内的采样值中没有连续超过第三预设阈值数目的采样值不在所述置信区间中,则记录所述拆分项的异常子序列为空。
9.根据权利要求5至8任一项所述的方法,其特征在于,所述根据所述拆分项的异常子序列,计算所述拆分项的波动值,包括:
计算所述异常子序列中各采样值与标准值之差的累计值,其中,所述标准值为第一预设值或所述拆分项的第一采样序列在第一时段内的采样值的均值;
在所述第一采样序列的采样值类型为第一类型时,确定所述累计值的绝对值为所述拆分项的初始波动值;
对所述拆分项的初始波动值做无量纲化处理,得到所述拆分项的波动值。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
在所述第一指标序列的采样值类型为第二类型时,若所述累计值为负值或0,则确定所述拆分项的波动值为0;
若所述累计值为正值,则确定所述拆分项的初始波动值为所述累计值。
11.根据权利要求1所述的方法,其特征在于,所述计算拆分项的关联系数,包括:
计算所述拆分项的第一采样序列的标准差,所述汇总项的第三采样序列的标准差;
计算所述拆分项的第一采样序列与所述汇总项的第三采样序列的协方差;
根据所述第一采样序列的标准差、所述第三采样序列的标准差和所述协方差,计算所述拆分项的关联系数。
12.根据权利要求1所述的方法,其特征在于,所述根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值,包括:
计算第一时段内,所述拆分项的第二采样序列中的各采样值与所述汇总项的第四采样序列中的各采样值的各比值;
计算所述各比值的均值为所述拆分项的权重值。
13.根据权利要求1所述的方法,其特征在于,所述根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对汇总项的影响度,包括:
获取所述拆分项的波动值的系数k1、关联系数的系数k2和权重值的系数k3
根据所述k1、k2、k3和所述拆分项的波动值、关联系数、权重值,计算拆分项对所述汇总项的影响度。
14.根据权利要求13所述的方法,其特征在于,所述获取所述拆分项的波动值的系数k1、关联系数的系数k2和权重值的系数k3,包括:
将历史记录的多组汇总项的采样数据和各个拆分项的采样数据以及每组汇总项对应的使所述汇总项的采样数据出现异常的拆分项,输入学习模型,不断调整k1、k2和k3的值,直至获取满足预设条件的k1、k2和k3,输出所述满足预设条件的k1、k2和k3
将所述学习模型输出的满足预设条件的k1、k2和k3作为所述拆分项的波动值的系数k1、关联系数的系数k2和权重值的系数k3
15.根据权利要求1所述的方法,其特征在于,所述计算所述拆分项对所述汇总项的影响度之后,所述方法还包括:
根据拆分项对所述汇总项的影响度,按照影响度降序对拆分项进行排序;
从排序后的拆分项中得到排序在前K个的拆分项,所述K为第二预设值。
16.根据权利要求1所述的方法,其特征在于,所述获取各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列,包括:
获取各个拆分项的初始采样数据和汇总项的初始采样数据;
对所述各个拆分项的初始采样数据和汇总项的初始采样数据进行数据预处理,得到各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列。
17.一种信息处理装置,其特征在于,所述装置包括:获取单元、第一计算单元、第二计算单元和第三计算单元,其中:
获取单元,用于获取各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列,其中,所述第一采样序列和所述第三采样序列为第一指标的采样序列,所述第三采样序列和所述第四采样序列为第二指标的采样序列;
第一计算单元,用于根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的波动值和关联系数;
第二计算单元,用于根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值;
第三计算单元,用于根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对所述汇总项的影响度。
18.根据权利要求17所述的装置,其特征在于,所述装置还包括第一确定单元,其中:
所述第一计算单元,用于根据每个拆分项的第一采样序列,计算每个拆分项的波动值;
所述第一确定单元,用于确定所述波动值超过第一预设阈值的拆分项为第一拆分项;
所述第一计算单元,用于根据每个第一拆分项的第一采样序列与所述汇总项的第三采样序列,计算每个第一拆分项的关联系数。
19.根据权利要求17所述的装置,其特征在于,所述装置还包括:第二确定单元,其中:
所述第二确定单元,用于确定所述波动值超过第一预设阈值且所述关联系数超过第二预设阈值的拆分项为第二拆分项;
所述第二计算单元,用于根据每个第二拆分项的第二采样序列和所述汇总项的第四采样序列,计算每个第二拆分项的权重值。
20.根据权利要求17所述的装置,其特征在于,
所述第一计算单元,用于根据所述拆分项的第一采样序列,得到所述拆分项的异常子序列,根据所述拆分项的异常子序列,计算所述拆分项的波动值,其中,所述异常子序列为所述第一采样序列中采样值均不在预设范围内的连续子序列,所述异常子序列中采样值的个数超过第三预设阈值。
21.根据权利要求17所述的装置,其特征在于,
所述第一计算单元,用于计算所述拆分项的第一采样序列的标准差,所述汇总项的第三采样序列的标准差;计算所述拆分项的第一采样序列与所述汇总项的第三采样序列的协方差;根据所述第一采样序列的标准差、所述第三采样序列的标准差和所述协方差,计算所述拆分项的关联系数。
22.根据权利要求17所述的装置,其特征在于,
所述第二计算单元,用于计算第一时段内,所述拆分项的第二采样序列中的各采样值与所述汇总项的第四采样序列中的各采样值的各比值;计算所述各比值的均值为所述拆分项的权重值。
23.根据权利要求17所述的装置,其特征在于,
所述第三计算单元,用于获取所述拆分项的波动值的系数k1、关联系数的系数k2和权重值的系数k3;根据所述k1、k2、k3和所述拆分项的波动值、关联系数、权重值,计算拆分项对所述汇总项的影响度。
24.一种信息处理设备,其特征在于,所述设备包括:处理器和输出装置,其中:
所述处理器,用于获取各个拆分项的第一采样序列和第二采样序列,汇总项的第三采样序列和第四采样序列,其中,所述第一采样序列和所述第三采样序列为第一指标的采样序列,所述第三采样序列和所述第四采样序列为第二指标的采样序列;根据所述拆分项的第一采样序列和所述汇总项的第三采样序列,计算所述拆分项的波动值和关联系数;根据所述拆分项的第二采样序列和所述汇总项的第四采样序列,计算所述拆分项的权重值;根据所述拆分项的波动值、关联系数和权重值,计算所述拆分项对所述汇总项的影响度;
所述输出装置,用于输出所述拆分项对所述汇总项的影响度。
CN201610383572.1A 2016-06-01 2016-06-01 一种信息处理方法及装置、设备 Active CN107451029B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610383572.1A CN107451029B (zh) 2016-06-01 2016-06-01 一种信息处理方法及装置、设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610383572.1A CN107451029B (zh) 2016-06-01 2016-06-01 一种信息处理方法及装置、设备

Publications (2)

Publication Number Publication Date
CN107451029A true CN107451029A (zh) 2017-12-08
CN107451029B CN107451029B (zh) 2021-01-05

Family

ID=60485531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610383572.1A Active CN107451029B (zh) 2016-06-01 2016-06-01 一种信息处理方法及装置、设备

Country Status (1)

Country Link
CN (1) CN107451029B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109302484A (zh) * 2018-10-18 2019-02-01 北京奇艺世纪科技有限公司 一种用户请求处理方法及装置
CN110764975A (zh) * 2018-07-27 2020-02-07 华为技术有限公司 设备性能的预警方法、装置及监控设备
CN112799923A (zh) * 2020-12-24 2021-05-14 深圳前海微众银行股份有限公司 系统异常原因确定方法、装置、设备及存储介质
CN116592951A (zh) * 2023-07-17 2023-08-15 陕西西特电缆有限公司 一种电缆数据智能采集方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611101A (zh) * 2012-03-08 2012-07-25 湖北省电力公司 一种互联电网运营的安全性评估方法
CN102801739A (zh) * 2012-08-25 2012-11-28 乐山师范学院 基于云计算环境的网络风险测定取证方法
CN105262647A (zh) * 2015-11-27 2016-01-20 广州神马移动信息科技有限公司 一种异常指标检测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611101A (zh) * 2012-03-08 2012-07-25 湖北省电力公司 一种互联电网运营的安全性评估方法
CN102801739A (zh) * 2012-08-25 2012-11-28 乐山师范学院 基于云计算环境的网络风险测定取证方法
CN105262647A (zh) * 2015-11-27 2016-01-20 广州神马移动信息科技有限公司 一种异常指标检测方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110764975A (zh) * 2018-07-27 2020-02-07 华为技术有限公司 设备性能的预警方法、装置及监控设备
CN110764975B (zh) * 2018-07-27 2021-10-22 华为技术有限公司 设备性能的预警方法、装置及监控设备
CN109302484A (zh) * 2018-10-18 2019-02-01 北京奇艺世纪科技有限公司 一种用户请求处理方法及装置
CN109302484B (zh) * 2018-10-18 2021-04-16 北京奇艺世纪科技有限公司 一种用户请求处理方法及装置
CN112799923A (zh) * 2020-12-24 2021-05-14 深圳前海微众银行股份有限公司 系统异常原因确定方法、装置、设备及存储介质
CN116592951A (zh) * 2023-07-17 2023-08-15 陕西西特电缆有限公司 一种电缆数据智能采集方法及系统
CN116592951B (zh) * 2023-07-17 2023-09-08 陕西西特电缆有限公司 一种电缆数据智能采集方法及系统

Also Published As

Publication number Publication date
CN107451029B (zh) 2021-01-05

Similar Documents

Publication Publication Date Title
CN108415789B (zh) 面向大规模混合异构存储系统的节点故障预测系统及方法
CN111459700B (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
US8078913B2 (en) Automated identification of performance crisis
EP2854053A1 (en) Defect prediction method and device
CN105488539B (zh) 分类模型的生成方法及装置、系统容量的预估方法及装置
EP3663919B1 (en) System and method of automated fault correction in a network environment
CN111475680A (zh) 检测异常高密子图的方法、装置、设备及存储介质
CN107451029A (zh) 一种信息处理方法及装置、设备
CN105071983A (zh) 一种面向云计算在线业务的异常负载检测方法
JP6085550B2 (ja) ログ分析装置及び方法
US10928815B2 (en) Computer system and method to process alarm signals
WO2017034512A1 (en) Interactive analytics on time series
WO2015072085A1 (ja) ログ分析システム、ログ分析方法、および、記憶媒体
CN113762377B (zh) 网络流量识别方法、装置、设备及存储介质
EP2963552B1 (en) System analysis device and system analysis method
CN110162445A (zh) 基于主机日志及性能指标的主机健康评价方法及装置
JP2015028700A (ja) 障害検知装置、障害検知方法、障害検知プログラム及び記録媒体
CN111984442A (zh) 计算机集群系统的异常检测方法及装置、存储介质
CN117131110B (zh) 一种基于关联分析的容性设备介质损耗监测方法及系统
CN113125903A (zh) 线损异常检测方法、装置、设备及计算机可读存储介质
CN115130847A (zh) 一种设备画像建模方法及系统
JP2006276924A (ja) 設備機器診断装置及び設備機器診断プログラム
US20160259791A1 (en) Parameter suggestion based on user activity
CN110457595A (zh) 突发事件报警方法、装置、系统、电子设备及存储介质
CN114297034A (zh) 云平台监控方法及云平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant