CN104317681A - 针对计算机系统的行为异常自动检测方法及检测系统 - Google Patents

针对计算机系统的行为异常自动检测方法及检测系统 Download PDF

Info

Publication number
CN104317681A
CN104317681A CN201410443322.3A CN201410443322A CN104317681A CN 104317681 A CN104317681 A CN 104317681A CN 201410443322 A CN201410443322 A CN 201410443322A CN 104317681 A CN104317681 A CN 104317681A
Authority
CN
China
Prior art keywords
monitoring period
similarity
tract
section
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410443322.3A
Other languages
English (en)
Other versions
CN104317681B (zh
Inventor
曹健
沈琪骏
顾骅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangyin Daily Information Technology Co., Ltd.
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201410443322.3A priority Critical patent/CN104317681B/zh
Publication of CN104317681A publication Critical patent/CN104317681A/zh
Application granted granted Critical
Publication of CN104317681B publication Critical patent/CN104317681B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及一种针对计算机系统的行为异常自动检测方法及检测系统,通过监控系统以时间序列的形式采集被检查机器的历史性能指标数据和实时性能指标数据,由时间序列预处理算法进行数据分段,去噪,尖峰点提取以及时间序列重建步骤,通过时间序列动态对齐算法进行各段时间序列之间的行为相似性进行计算从而构建时间序列相似性矩阵,最后由马尔科夫随机游走排序算法从相似性矩阵当中计算出各个时间段的行为异常指数。本发明针对计算机系统中的行为异常检测问题,全面考虑一段时间内的机器行为特征,通过各时段行为相互之间的相似性,采用马尔科夫随机游走排序进行全面的排序和异常评分,获得高自动化高检出率,无需训练的智能化行为异常检测。

Description

针对计算机系统的行为异常自动检测方法及检测系统
技术领域
本发明涉及一种行为异常自动检测方法及检测系统,尤其涉及一种针对计算机系统的行为异常自动检测方法及检测系统。 
背景技术
随着计算机硬件软件的技术不断提高,网络技术不断进步,计算机成为目前人们生产生活当中必不可少的部分。特别是在近几年来高速互联网络普及和计算机处理性能飞跃性提升,以及虚拟化技术的不断完善的推动下,计算机作为一种计算资源在当前社会的使用中往往承担着非常重要的任务诸如重要信息的存取,关键工作的计算等等。许多的企业系统和政府部门服务现在都有大型的计算机系统来进行支撑。因此计算机系统的稳定性和可靠性是目前的使用环境下必须要保证的重要方面。随着目前计算机科学技术的不断发展,软件硬件复杂性持续提高,同时计算机系统特别是云计算平台这类大型系统的使用方式也日益复杂。有研究表明由于系统本身结构的复杂化和使用模式的复杂化,我们所面对的系统异常无论是在数量上还是种类上也是随之而不断增加的。计算机系统当中的异常会直接影响到运行在其上的程序的性能甚至结果,可能对于承载在计算机上的各种任务造成不可估量的负面影响,直接损害到企业和部门的正常工作程序甚至于造成经济损失。如果能够自动化发现计算机系统当中存在的异常,那么就可以缩短异常发现和异常应对时间,减少异常持续时间从而减小异常造成的损害,同时给异常自动化应对打下基础。 
系统行为异常是指在系统运行期间,在一定时间段内出现的系统行为模式,包括系统计算负载,系统网络流量,系统存储利用率,系统承担的具体任务等方面,与历史正常情况出现明显的差别。当前的异常自动检测系统主要采用以下几种模式,第一是阈值报警,第二是基于统计函数,第三是基于机器学习,但是这些方法主要针对于时间点或者小时间段进行精测。系统行为异常定义在较长的一段时间段上,难以通过普通的阈值报警方法进行检测,而且可能对于整个系统的功能,效率以及安全性造成直接或者间接的影响。而其他针对时间点或者小时间段的智能检测技术,包括基于机器学习和统计学的方法,存在着需要人工对历史数据分配标识,自动化程度不高,无法全面识别较长时间段数 据特征等缺陷,造成检出率低而误报率高的不足之处。 
发明内容
本发明的目的在于提供一种针对计算机系统的行为异常预测方法,解决了针对计算机系统行为异常检测自动化程度不高,无法有效利用监控数据中的行为信息造成检出率低下而误报率过高的问题。 
为了解决上述问题,本发明涉及了一种针对计算机系统的行为异常自动检测方法,包括以下步骤: 
S1:将从所述计算机系统的监控系统或后台数据库中获得的历史监控数据和实时监控数据流构成监控时间序列; 
S2:将监控时间序列按照所述计算机系统的使用率的变化周期分段为若干数据段,按照所有数据段当中的最长采样点数对所有数据段进行重采样;对所述若干采样后的数据段分段去噪得到平滑时间序列段,计算采样前数据段的标准差和平均值,遍历每个采样点,采样点和所述平均值的欧几里得距离小于预定倍数标准差则偏差值设为0,否则偏差值设为绝对偏差距离,由每段时间序列段采用点的偏差值构成若干尖峰时间序列段;将尖峰时间序列段和去噪后的平滑时间序列段相加构成新的监控时间序列段; 
S3:将新的监控时间序列段动态对齐,并计算每段时间段中的所述计算机系统的机器行为相似性指数; 
S4:将S3中得到的相似性指数构成一个相似性矩阵,通过相似性矩阵转化为一个图的邻接矩阵,使得图中,相似性指数作为边权,时间段本身作为节点; 
S5:利用马尔科夫随机游走算法在S3中得到的图上进行游走得到各新的监控时间序列段的连接度,作为每个被检测时间段的异常指数。 
较佳地,原始时间序列中包括常规序列段和非常规特性段,所述常规序列段的时间戳之间的间隔时间一致,所述非常规序列段的时间戳之间的间隔时间不一致,按照所有分段当中最长采样个数对所有数据段进行线性重采样,使得监控时间序列获得相同的采样间隔和采样次数。 
较佳地,S3中进一步包括,根据实际负载情况进行预定范围以内的新的时 间序列段对齐,同时用欧几里得距离函数计算对齐后的新的时间序列段的相似度。 
较佳地,对于任意的两个监控时间序列Fi和Fj组成的监控时间序列对,用以下的方程来获得Fi和Fj的相似性指数: 
dist_up=f[ii-1][jj-k]+Euclidean(Fi[ii],Fj[jj-k+1])+…+Euclidean(Fi[ii],Fj[jj-k]), 
dist_down=f[ii-k][jj-1]+Euclidean(Fj[ii],Fi[jj-k+1])+…+Euclidean(Fj[ii],Fi[jj-k]), 
f[ii,jj]=min(dist_up,dist_down,f[ii][jj]), 
similarity=f[L,L], 
其中,L为监控时间序列段长度;Euclidean为欧几里得距离函数;Fi为第i段监控时间序列,i=1,2…m;Fj为第j段监控时间序列,i=1,2…m;Similarity为第i段监控时间序列与第j段监控时间序列的相似性指数;ii,jj,k为循环变量,其中ii为监控时间序列Fi中的任一采样点,jj为监控时间序列Fj中的一任意采样点,k为移动步数,ii=0,1…L;jj=0,1…L;k=0,1…n,f[ii][jj]为计算需要的中间结果。 
较佳地,还包括S6:设定判断阈值Threshold,连接度小于阈值Threshold的时间段标记为行为异常,连接度大于阈值Threshold的时间段标记为行为正常。 
为了解决上述问题,本发明还涉及了一种针对计算机系统的行为异常自动检测系统,包括: 
数据采集装置,将从所述计算机系统的监控系统或后台数据库中获得的历史监控数据和实时监控数据流构成监控时间序列; 
监控时间序列重建装置,将监控时间序列按照所述计算机系统的使用率的变化周期分段为若干数据段,按照所有数据段当中的最长采样点数对所有数据段进行重采样;对所述若干采样后的数据段分段去噪得到平滑时间序列段,计算采样前数据段的标准差和平均值,遍历每个采样点,采样点和所述平均值的欧几 里得距离小于预定倍数标准差则偏差值设为0,否则偏差值设为绝对偏差距离,由每段时间序列段采用点的偏差值构成若干尖峰时间序列段;将尖峰时间序列段和去噪后的平滑时间序列段相加构成新的监控时间序列段; 
相似性指数计算装置,将新的监控时间序列段动态对齐,并计算每段时间段中的所述计算机系统的机器行为相似性指数; 
邻接矩阵建立装置,将相似性指数计算装置中得到的相似性指数构成一个相似性矩阵,通过相似性矩阵转化为一个图的邻接矩阵,使得图中,相似性指数作为边权,时间段本身作为节点; 
异常指数评定装置,利用马尔科夫随机游走算法在邻接矩阵建立装置中得到的图上进行游走得到各新的监控时间序列段的连接度,作为每个被检测时间段的异常指数。 
较佳地,原始时间序列中包括常规序列段和非常规特性段,所述常规序列段的时间戳之间的间隔时间一致,所述非常规序列段的时间戳之间的间隔时间不一致,按照所有分段当中最长采样个数对所有数据段进行线性重采样,使得监控时间序列获得相同的采样间隔和采样次数。 
较佳地,监控时间序列重建装置中进一步包括,根据实际负载情况进行预定范围以内的新的时间序列段对齐,同时用欧几里得距离函数计算对齐后的新的时间序列段的相似度。 
较佳地,对于任意的两个监控时间序列Fi和Fj组成的监控时间序列对,用以下的方程来获得Fi和Fj的相似性指数: 
dist_up=f[ii-1][jj-k]+Euclidean(Fi[ii],Fj[jj-k+1])+…+Euclidean(Fi[ii],Fj[jj-k]), 
dist_down=f[ii-k][jj-1]+Euclidean(Fj[ii],Fi[jj-k+1])+…+Euclidean(Fj[ii],Fi[jj-k]), 
f[ii,jj]=min(dist_up,dist_down,f[ii][jj]), 
similarity=f[L,L], 
其中,L为监控时间序列段长度;Euclidean为欧几里得距离函数;Fi为第 i段监控时间序列,i=1,2…m;Fj为第j段监控时间序列,i=1,2…m;Similarity为第i段监控时间序列与第j段监控时间序列的相似性指数;ii,jj,k为循环变量,其中ii为监控时间序列Fi中的任一采样点,jj为监控时间序列Fj中的一任意采样点,k为移动步数,ii=0,1…L;jj=0,1…L;k=0,1…n,f[ii][jj]为计算需要的中间结果。 
较佳地,还包括行为异常标记装置,设定判断阈值Threshold,连接度小于阈值Threshold的时间段标记为行为异常,连接度大于阈值Threshold的时间段标记为行为正常。 
本发明由于采用以上技术方案,与现有技术相比,具有以下的优点和积极效果: 
1)本发明利用易于收集的底层性能数据来识别系统行为,而无需高层的操作系统或者软件运行记录,可以直接架设在现有的监控系统上,降低了部署难度; 
2)本发明采用时间序列动态对齐算法,将不同时间段内的时间序列监控数据按照行为模式对齐,从而减少可容忍行为变化带来的误差,从而降低误报率; 
3)本发明利用行为模式之间的关系而不是对行为模式本身进行建模,因此不需要人工对历史数据分配标识,大大提高自动化程度,同时极大的提高在多变环境下的检测能力; 
4)本发明通过马尔科夫随机游走算法对时间段行为进行异常指数计算,全面利用行为模式之间的相互关系信息,提高了识别率,并允许管理员选择阈值来做最终的异常和正常分类,提供灵活性。 
附图说明
图1为本发明一种针对计算机系统的行为异常自动检测方法的流程图; 
图2为本发明一种针对计算机系统的行为异常自动检测系统的结构框图。 
具体实施方式
以下将结合本发明的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,这里所描述的仅仅是本发明的一部分实例,并不是全部的实例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。 
为了便于对本发明实施例的理解,下面将结合附图以具体实施例为例作进一步的解释说明,且各个实施例不构成对本发明实施例的限定。 
实施例一 
请参考图1,本发明提供了针对计算机系统的行为异常自动检测方法,主要包括以下步骤: 
S1:将从所述计算机系统的监控系统或后台数据库中获得的历史监控数据和实时监控数据流构成监控时间序列; 
本实施例中,选择从前端监控系统中直接获得一台受监控机器的中央处理器使用率值(CPU Usage Rate,y)和相应的时间戳(Timestamp,t)。并将其构成监控时间序列Y=[(y1,t1),(y2,t2),...,(yn,tn),...]。 
其中,Y——最终的完整时间序列; 
yi——时间序列当中第i个元素的CPU占用率,i=0,1…n,n为时间序列的元素个数; 
ti——时间序列当中第i个的时间戳,i=0,1…n,n为时间序列的元素个数;S2:将监控时间序列按照所述计算机系统的使用率的变化周期分段为若干数据段,按照所有数据段当中的最长采样点数对所有数据段进行重采样;对所述若干采样后的数据段分段去噪得到平滑时间序列段,计算采样前数据段的标准差和平均值,遍历每个采样点,采样点和所述平均值的欧几里得距离小于预定倍数标准差则偏差值设为0,否则偏差值设为绝对偏差距离,由每段时间序列段采用点的偏差值构成若干尖峰时间序列段;将尖峰时间序列段和去噪后的平滑时间序列段相加构成新的监控时间序列段。其中,原始时间序列中包括常规序列段和非常规特性段,所述常规序列段的时间戳之间的间隔时间一致,所述非常规序列段的时间戳之间的间隔时间不一致,按照所有分段当中最长采样个数对 所有数据段进行线性重采样,使得监控时间序列获得相同的采样间隔和采样次数。 
本实施例中,根据经验得到CPU使用率的变化周期为T,经过自回归分析检验周期的有效性后,将S1中得到的时间序列Y根据变化周期T分为若干数据段Y1,Y2…Ym。其中检验周期有效性一般为:CPU历史记录序列在选择周期为T的条件下,计算序列的自相关系数,其绝对值高于0.5即为周期有效。其中m=tn/T,m为数据段的总数。原始时间序列中存在非常规特性,即时间戳之间的间隔时间不统一的情况,则按照所有分段当中最长采样个数对所有数据段进行线性重采样,使得时间序列获得相同的采样间隔和采样次数。 
用sym6为基底的小波变换和sqtwolog阈值控制进行分段去噪,得到去噪后的结果为R1,R2…Rm。其中m=tn/T。 
从分段后的数据段中提取尖峰数据点。方法为首先计算采样前数据段的标准差和平均值。之后遍历每个采样点,若数据点和平均值的欧氏距离超过三倍标准差,则判断此数据点为尖峰数据点。将尖峰数据点对应的偏差距离(若与平均值的欧氏距离小于三倍标准差,则为0,否则即为绝对偏差值)构成的时间序列记为P1,P2…Pm。其中m=tn/T。 
将尖峰时间序列和去噪后的平滑时间序列相加重构成新的时间序列段F1,F2…Fm。其中Fi=Pi+Ri,m=tn/T。 
S3:根据实际负载情况进行预定范围以内的新的时间序列段对齐,同时用欧几里得距离函数计算对齐后的新的时间序列段的相似度。 
本实施例中,对于任意的两个经过以上处理后的监控时间序列段,组成监控时间序列段对,记为Fi,Fj,记它们的长度均为L,用以下的方程来获得这对监控时间序列的行为相似性。 
dist_up=f[ii-1][jj-k]+Euclidean(Fi[ii],Fj[jj-k+1])+…+Euclidean(Fi[ii],Fj[jj-k]) 
dist_down=f[ii-k][jj-1]+Euclidean(Fj[ii],Fi[jj-k+1])+…+Euclidean(Fj[ii],Fi[jj-k]) 
f[ii][jj]=min(dist_up,dist_down,f[ii][jj]) 
similarity=f[L,L](L为序列Fi,Fj的长度) 
其中,L——监控时间序列段长度; 
Euclidean——欧几里得距离函数; 
Fi——第i段监控时间序列,i=1,2…m; 
Fj——第j段监控时间序列,j=1,2…m; 
Similarity——为第i段监控时间序列段与第j段监控时间序列段的相似性指数; 
ii,jj,k——循环变量,ii为其中一个监控时间序列Fi中的任一采样点,jj为另一个监控时间序列Fj中的任意采样点,k为移动步数,ii=0,1…L;jj=0,1…L;k=0,1…n;(L为监控时间序列段长度,n为最大允许的偏移步数) 
f[ii][jj]——计算需要的中间结果; 
S4:将S3中得到的相似性指数构成一个相似性矩阵,通过相似性矩阵转化为一个图的邻接矩阵,使得图中,相似性指数作为边权,时间段本身作为节点。 
本实施例中, 
使用以下方程将S3中得到的相似性指数矩阵转化为一个图的邻接矩阵。 
T ( i , j ) = M ( i , j ) Σ i = 1 n M ( i , j ) ifi ≠ j 0 ifi = j
其中,T(i,j)——邻接矩阵中第i行,第j列的元素,其中i=1,2…m,j=1,2…m; 
M(i,j)——相似性矩阵中第i行,第j列的元素,等于S3中Fi,Fj得到的similarity; 
更具体的说,G=<V,E>是邻接矩阵代表的图,V表示一个图中的点集合,这里一个时间序列段映射到一个点,所以V就代表所有的时间序列段,也就是F1..Fm;V×V代表这些点组成的一个图,E是图上点之间的边的集合,每一条边有一个权值C,是边上两个点之间的距离,在这里距离就是相似性指数,E∈V×V是图中的边集合,代表监控时间序列段之间的关系,边权值Gi,j代表Vi和Vj之间的相似性指数,Vi和Vj分别为序列Fi和Fj,在图中映射的点,即S3中计算得到的similarity。 
S5:利用马尔科夫随机游走算法在S3中得到的图上进行游走得到各新的监控时间序列段的连接度,作为每个被检测时间段的异常指数。 
本实施例中,根据S4中得到的邻接矩阵T,带入以下方程中进行迭代计算,本实施例中以I(常见值1000)次迭代作为参数,即连续进行I次以下方程的迭代来获得最后的结果,而阻尼系数damp设为d(常见值0.01到0.2)。 
conn = damp m + ( 1 - damp ) &times; T &times; conn
其中,conn——每个监控时间序列段的连接度; 
damp——阻尼系数,控制方程的收敛速度; 
T——S3中得到的邻接矩阵; 
m——监控时间序列段数。 
经过足够多次数的迭代计算之后,conn将会趋向于一个恒定的向量值,而其中每一个值代表对应的监控时间段所的行为异常可能性,连接度越大表示该监控时间序列段表现出的行为特征越常见,发生行为异常的可能性越小,而连接度越小表示该监控时间序列段表现出的行为特征越罕见,发生行为异常的可能性越大。 
S6:设定判断阈值Threshold,连接度小于阈值Threshold的时间段标记为 行为异常,连接度大于阈值Threshold的时间段标记为行为正常。 
本实施例中,设定判断阈值Threshold,将S5中得到的连接度向量conn按从小到大的方式进行排序,连接度小于阈值Threshold的时间段标记为行为异常,连接度大于阈值Threshold的时间段标记为行为正常。 
除了直接的标号之外,也可以根据实际的连接度大小值来判断行为异常的程度,判断依据如S5中提到:连接度越大表示该监控时间序列段发生行为异常的可能性越小,而连接度越小表示该监控时间序列段发生行为异常的可能性越大。 
实施例二 
请参考图2,本发明提供了针对计算机系统的行为异常自动检测系统,包括数据采集装置、监控时间序列重建装置、相似性指数计算装置、邻接矩阵建立装置、异常指数评定装置以及行为异常标记装置,其中各装置具体如下。 
数据采集装置,与计算机系统相连接或设置于计算机系统内部,将从所述计算机系统的监控系统或后台数据库中获得的历史监控数据和实时监控数据流构成监控时间序列。 
本实施例中,选择从前端监控系统中直接获得一台受监控机器的中央处理器使用率值(CPU Usage Rate,y)和相应的时间戳(Timestamp,t)。并将其构成监控时间序列Y=[(y1,t1),(y2,t2),...,(yn,tn),...]。 
其中,Y——最终的完整时间序列; 
yi——时间序列当中第i个元素的CPU占用率,i=0,1…n,n为时间序列的元素个数; 
ti——时间序列当中第i个的时间戳,i=0,1…n,n为时间序列的元素个数。 
监控时间序列重建装置,与数据采集装置相连接将监控时间序列按照计算机系统的使用率的变化周期分段为若干数据段,按照所有数据段当中的最长采样点数对所有数据段进行重采样;对所述若干采样后的数据段分段去噪得到平滑时间序列段,计算采样前数据段的标准差和平均值,遍历每个采样点,采样点和所述平均值的欧几里得距离小于预定倍数标准差则偏差值设为0,否则偏差值设为绝对偏差距离,由每段时间序列段采用点的偏差值构成若干尖峰时间序 列段;将尖峰时间序列段和去噪后的平滑时间序列段相加构成新的监控时间序列段。其中,原始时间序列中包括常规序列段和非常规特性段,常规序列段的时间戳之间的间隔时间一致,非常规序列段的时间戳之间的间隔时间不一致,按照所有分段当中最长采样个数对所有数据段进行线性重采样,使得监控时间序列获得相同的采样间隔和采样次数。 
本实施例中,根据经验得到CPU使用率的变化周期为T,经过自回归分析检验周期的有效性后,将S1中得到的时间序列Y根据变化周期T分为若干数据段Y1,Y2…Ym。其中m=tn/T,m为数据段的总数。原始时间序列中存在非常规特性,即时间戳之间的间隔时间不统一的情况,则按照所有分段当中最长采样个数对所有数据段进行线性重采样,使得时间序列获得相同的采样间隔和采样次数。 
用sym6为基底的小波变换和sqtwolog阈值控制进行分段去噪,得到去噪后的结果为R1,R2…Rm,其中m=tn/T。 
从分段后的数据段中提取尖峰数据点。方法为首先计算采样前数据段的标准差和平均值。之后遍历每个采样点,若数据点和平均值的欧氏距离超过三倍标准差,则判断此数据点为尖峰数据点。将尖峰数据点对应的偏差距离(若与平均值的欧氏距离小于三倍标准差,则为0,否则即为绝对偏差值)构成的时间序列记为P1,P2…Pm。其中m=tn/T。 
将尖峰时间序列和去噪后的平滑时间序列相加重构成新的时间序列段F1,F2…Fm。其中Fi=Pi+Ri,m=tn/T。 
相似性指数计算装置,根据实际负载情况(相同的使用模式下的两个监控时间序列由于计算机的随机性会出现一定的时间偏移)进行预定范围以内的新的时间序列段对齐,即在一定的允许的调整范围内,将两个时间序列以距离最小为目标进行时间戳对齐。用欧几里得距离函数计算对齐后的新的时间序列段的相似度。 
本实施例中,对于任意的两个经过以上处理后的监控时间序列段,组成监控时间序列段对,记为Fi,Fj,记它们的长度均为L,用以下的方程来获得这对监控时间序列的行为相似性。 
dist_up=f[ii-1][jj-k]+Euclidean(Fi[ii],Fj[jj-k+1])+…+Euclidean(Fi[ii],Fj[jj-k]) 
dist_down=f[ii-k][jj-1]+Euclidean(Fj[ii],Fi[jj-k+1])+…+Euclidean(Fj[ii],Fi[jj-k]) 
f[ii,jj]=min(dist_up,dist_down,f[ii][jj]) 
similarity=f[L,L](L为序列Fi,Fj的长度) 
其中,L——监控时间序列段长度; 
Euclidean——欧几里得距离函数; 
Fi——第i段监控时间序列,i=1,2…m; 
Fj——第j段监控时间序列,j=1,2…m; 
Similarity——为第i段监控时间序列段与第j段监控时间序列段的相似性指数; 
ii,jj,k——循环变量,ii为其中一个监控时间序列Fi中的任一采样点,jj为另一个监控时间序列Fj中的任意采样点,k为移动步数,ii=0,1…L;jj=0,1…L;k=0,1…n;(L为监控时间序列段长度,n为最大允许的偏移步数) 
f[ii][jj]——计算需要的中间结果; 
邻接矩阵建立,连接相似性指数计算装置,将相似性指数计算装置中得到的相似性指数构成一个相似性矩阵,通过相似性矩阵转化为一个图的邻接矩阵,使得图中,相似性指数作为边权,时间段本身作为节点。 
本实施例中, 
使用以下方程将相似性指数计算装置中得到的相似性指数矩阵转化为一个图的邻接矩阵。 
T ( i , j ) = M ( i , j ) &Sigma; i = 1 n M ( i , j ) ifi &NotEqual; j 0 ifi = j
其中,T(i,j)——邻接矩阵的第i行,第j列,其中i=1,2…m,j=1,2…m; 
M(i,j)——相似性矩阵的第i行,第j列,等于相似性指数计算装置中Fi,Fj得到的similarity; 
V表示一个图中的点集合,这里一个时间序列段映射到一个点,所以V就代表所有的时间序列段,也就是F1..Fm;V×V代表这些点组成的一个图,E是图上点之间的边的集合,每一条边有一个权值C,是边上两个点之间的距离,在这里距离就是相似性指数,E∈V×V是图中的边集合,代表监控时间序列段之间的关系,边权值Ci,j代表Vi和Vj之间的相似性指数,Vi和Vj分别为序列Fi和Fj,在图中映射的点,即S3中计算得到的similarity。 
异常指数评定装置,连接邻接矩阵建立装置,利用马尔科夫随机游走算法在邻接矩阵建立装置中得到的图上进行游走得到各新的监控时间序列段的连接度,作为每个被检测时间段的异常指数。 
本实施例中,根据邻接矩阵建立装置中得到的邻接矩阵T,带入以下方程中进行迭代计算,本实施例中以I(常见值1000)次迭代作为参数,即连续进行I次以下方程的迭代来获得最后的结果,而阻尼系数damp设为d(常见值0.01到0.2)。 
conn = damp m + ( 1 - damp ) &times; T &times; conn
其中,conn——每个监控时间序列段的连接度; 
damp——阻尼系数,控制方程的收敛速度; 
T——S3中得到的邻接矩阵; 
m——监控时间序列段数。 
经过足够多次数的迭代计算之后,conn将会趋向于一个恒定的向量值,而其中每一个值代表对应的监控时间段所的行为异常可能性,连接度越大表示该监控时间序列段表现出的行为特征越常见,发生行为异常的可能性越小,而连接度越小表示该监控时间序列段表现出的行为特征越罕见,发生行为异常的可能性越大。 
行为异常标记装置,连接异常指数评定装置,设定判断阈值Threshold,连接度小于阈值Threshold的时间段标记为行为异常,连接度大于阈值Threshold的时间段标记为行为正常。 
本实施例中,设定判断阈值Threshold,将邻接矩阵建立装置中得到的连接度向量conn按从小到大的方式进行排序,连接度小于阈值Threshold的时间段标记为行为异常,连接度大于阈值Threshold的时间段标记为行为正常。 
除了直接的标号之外,也可以根据实际的连接度大小值来判断行为异常的程度,判断依据如上提到:连接度越大表示该监控时间序列段发生行为异常的可能性越小,而连接度越小表示该监控时间序列段发生行为异常的可能性越大。 
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。 

Claims (10)

1.一种针对计算机系统的行为异常自动检测方法,其特征在于,包括以下步骤:
S1:将从所述计算机系统的监控系统或后台数据库中获得的历史监控数据和实时监控数据流构成监控时间序列;
S2:将监控时间序列按照所述计算机系统的使用率的变化周期分段为若干数据段,按照所有数据段当中的最长采样点数对所有数据段进行重采样;对所述若干采样后的数据段分段去噪得到平滑时间序列段,计算采样前数据段的标准差和平均值,遍历每个采样点,采样点和所述平均值的欧几里得距离小于预定倍数标准差则偏差值设为0,否则偏差值设为绝对偏差距离,由每段时间序列段采用点的偏差值构成若干尖峰时间序列段;将尖峰时间序列段和去噪后的平滑时间序列段相加构成新的监控时间序列段;
S3:将新的监控时间序列段动态对齐,并计算每段时间段中的所述计算机系统的机器行为相似性指数;
S4:将S3中得到的相似性指数构成一个相似性矩阵,通过相似性矩阵转化为一个图的邻接矩阵,使得图中,相似性指数作为边权,时间段本身作为节点;
S5:利用马尔科夫随机游走算法在S3中得到的图上进行游走得到各新的监控时间序列段的连接度,作为每个被检测时间段的异常指数。
2.如权利要求1所述的一种针对计算机系统的行为异常自动检测方法,其特征在于,原始时间序列中包括常规序列段和非常规特性段,所述常规序列段的时间戳之间的间隔时间一致,所述非常规序列段的时间戳之间的间隔时间不一致,按照所有分段当中最长采样个数对所有数据段进行线性重采样,使得监控时间序列获得相同的采样间隔和采样次数。
3.如权利要求1所述的一种针对计算机系统的行为异常自动检测方法,其特征在于,S3中进一步包括,根据实际负载情况进行预定范围以内的新的时间序列段对齐,同时用欧几里得距离函数计算对齐后的新的时间序列段的相似度。
4.如权利要求1或3所述的一种针对计算机系统的行为异常自动识别算法,其特征在于,对于任意的两个监控时间序列Fi和Fj组成的监控时间序列对,用以下的方程来获得Fi和Fj的相似性指数:
dist_up=f[ii-1][jj-k]+Euclidean(Fi[ii],Fj[jj-k+1])+…+Euclidean(Fi[ii],Fj[jj-k]),
dist_down=f[ii-k][jj-1]+Euclidean(Fj[ii],Fi[jj-k+1])+…+Euclidean(Fj[ii],Fi[jj-k]),
f[ii,jj]=min(dist_up,dist_down,f[ii][jj]),
similarity=f[L,L],
其中,L为监控时间序列段长度;Euclidean为欧几里得距离函数;Fi为第i段监控时间序列,i=1,2…m;Fj为第j段监控时间序列,i=1,2…m;Similarity为第i段监控时间序列与第j段监控时间序列的相似性指数;ii,jj,k为循环变量,其中ii为监控时间序列Fi中的任一采样点,jj为监控时间序列Fj中的一任意采样点,k为移动步数,ii=0,1…L;jj=0,1…L;k=0,1…n,f[ii][jj]为计算需要的中间结果。
5.如权利要求1所述的一种针对计算机系统的行为异常自动检测方法,其特征在于,还包括S6:设定判断阈值Threshold,连接度小于阈值Threshold的时间段标记为行为异常,连接度大于阈值Threshold的时间段标记为行为正常。
6.一种针对计算机系统的行为异常自动检测系统,其特征在于,包括
数据采集装置,将从所述计算机系统的监控系统或后台数据库中获得的历史监控数据和实时监控数据流构成监控时间序列;
监控时间序列重建装置,将监控时间序列按照所述计算机系统的使用率的变化周期分段为若干数据段,按照所有数据段当中的最长采样点数对所有数据段进行重采样;对所述若干采样后的数据段分段去噪得到平滑时间序列段,计算采样前数据段的标准差和平均值,遍历每个采样点,采样点和所述平均值的欧几里得距离小于预定倍数标准差则偏差值设为0,否则偏差值设为绝对偏差距离,由每段时间序列段采用点的偏差值构成若干尖峰时间序列段;将尖峰时间序列段和去噪后的平滑时间序列段相加构成新的监控时间序列段;
相似性指数计算装置,将新的监控时间序列段动态对齐,并计算每段时间段中的所述计算机系统的机器行为相似性指数;
邻接矩阵建立装置,将相似性指数计算装置中得到的相似性指数构成一个相似性矩阵,通过相似性矩阵转化为一个图的邻接矩阵,使得图中,相似性指数作为边权,时间段本身作为节点;
异常指数评定装置,利用马尔科夫随机游走算法在邻接矩阵建立装置中得到的图上进行游走得到各新的监控时间序列段的连接度,作为每个被检测时间段的异常指数。
7.如权利要求6所述的一种针对计算机系统的行为异常自动检测系统,其特征在于,原始时间序列中包括常规序列段和非常规特性段,所述常规序列段的时间戳之间的间隔时间一致,所述非常规序列段的时间戳之间的间隔时间不一致,按照所有分段当中最长采样个数对所有数据段进行线性重采样,使得监控时间序列获得相同的采样间隔和采样次数。
8.如权利要求6所述的一种针对计算机系统的行为异常自动检测系统,其特征在于,监控时间序列重建装置中进一步包括,根据实际负载情况进行预定范围以内的新的时间序列段对齐,同时用欧几里得距离函数计算对齐后的新的时间序列段的相似度。
9.如权利要求6或8所述的一种针对计算机系统的行为异常自动检测系统,其特征在于,对于任意的两个监控时间序列Fi和Fj组成的监控时间序列对,用以下的方程来获得Fi和Fj的相似性指数:
dist_up=f[ii-1][jj-k]+Euclidean(Fi[ii],Fj[jj-k+1])+…+Euclidean(Fi[ii],Fj[jj-k]),
dist_down=f[ii-k][jj-1]+Euclidean(Fj[ii],Fi[jj-k+1])+…+Euclidean(Fj[ii],Fi[jj-k]),
f[ii,jj]=min(dist_up,dist_down,f[ii][jj]),
similarity=f[L,L],
其中,L为监控时间序列段长度;Euclidean为欧几里得距离函数;Fi为第i段监控时间序列,i=1,2…m;Fj为第j段监控时间序列,i=1,2…m;Similarity为第i段监控时间序列与第j段监控时间序列的相似性指数;ii,jj,k为循环变量,其中ii为监控时间序列Fi中的任一采样点,jj为监控时间序列Fj中的一任意采样点,k为移动步数,ii=0,1…L;jj=0,1…L;k=0,1…n,f[ii][jj]为计算需要的中间结果。
10.如权利要求6所述的一种针对计算机系统的行为异常自动识别系统,其特征在于,还包括行为异常标记装置,设定判断阈值Threshold,连接度小于阈值Threshold的时间段标记为行为异常,连接度大于阈值Threshold的时间段标记为行为正常。
CN201410443322.3A 2014-09-02 2014-09-02 针对计算机系统的行为异常自动检测方法及检测系统 Active CN104317681B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410443322.3A CN104317681B (zh) 2014-09-02 2014-09-02 针对计算机系统的行为异常自动检测方法及检测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410443322.3A CN104317681B (zh) 2014-09-02 2014-09-02 针对计算机系统的行为异常自动检测方法及检测系统

Publications (2)

Publication Number Publication Date
CN104317681A true CN104317681A (zh) 2015-01-28
CN104317681B CN104317681B (zh) 2017-09-08

Family

ID=52372916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410443322.3A Active CN104317681B (zh) 2014-09-02 2014-09-02 针对计算机系统的行为异常自动检测方法及检测系统

Country Status (1)

Country Link
CN (1) CN104317681B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636874A (zh) * 2015-02-12 2015-05-20 北京嘀嘀无限科技发展有限公司 检测业务异常的方法及设备
CN104794235A (zh) * 2015-05-06 2015-07-22 曹东 金融时间序列分段分布特征计算方法及系统
CN104899327A (zh) * 2015-06-24 2015-09-09 哈尔滨工业大学 一种无类别标签的时间序列异常检测方法
CN105262647A (zh) * 2015-11-27 2016-01-20 广州神马移动信息科技有限公司 一种异常指标检测方法及装置
CN105510971A (zh) * 2016-02-18 2016-04-20 福建师范大学 一种基于随机漫步的地震数据异常检测方法
CN105653427A (zh) * 2016-03-04 2016-06-08 上海交通大学 基于行为异常检测的日志监控方法
CN106155867A (zh) * 2016-08-23 2016-11-23 珠海金智维信息科技有限公司 监控性能数据相似性度量的告警方法和系统
CN106228002A (zh) * 2016-07-19 2016-12-14 北京工业大学 一种基于二次筛选的高效率异常时序数据提取方法
CN106502815A (zh) * 2016-10-20 2017-03-15 北京蓝海讯通科技股份有限公司 一种异常原因定位方法、装置和计算设备
CN106528565A (zh) * 2015-09-11 2017-03-22 北京邮电大学 监测系统的数据处理方法和装置
CN107194184A (zh) * 2017-05-31 2017-09-22 成都数联易康科技有限公司 基于时间序列相似性分析的在院人次异常检测方法及系统
CN107451157A (zh) * 2016-06-01 2017-12-08 阿里巴巴集团控股有限公司 异常数据识别方法、装置及系统、搜索方法及装置
CN107748892A (zh) * 2017-09-25 2018-03-02 西安理工大学 一种基于马氏距离的人体行为数据分割方法
CN108133373A (zh) * 2018-01-04 2018-06-08 交通银行股份有限公司 探寻涉机器行为的风险账户的方法及装置
CN108932524A (zh) * 2017-05-22 2018-12-04 西门子股份公司 用于确定系统的异常状态的方法和装置
CN109508733A (zh) * 2018-10-23 2019-03-22 北京邮电大学 一种基于分布概率相似度度量的异常检测方法
CN109861857A (zh) * 2019-01-28 2019-06-07 网联清算有限公司 故障检测方法及装置
CN110226140A (zh) * 2017-01-25 2019-09-10 Ntn株式会社 状态监视方法及状态监视装置
CN111143102A (zh) * 2019-12-13 2020-05-12 东软集团股份有限公司 异常数据检测方法、装置、存储介质及电子设备
CN111367747A (zh) * 2018-12-25 2020-07-03 中国移动通信集团浙江有限公司 基于时间标注的指标异动检测预警的装置
CN115840897A (zh) * 2023-02-09 2023-03-24 广东吉器电子有限公司 一种温度传感器数据异常处理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030139905A1 (en) * 2001-12-19 2003-07-24 David Helsper Method and system for analyzing and predicting the behavior of systems
CN103400040A (zh) * 2013-07-31 2013-11-20 中国人民解放军国防科学技术大学 采用多步时域差值学习的故障诊断与预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030139905A1 (en) * 2001-12-19 2003-07-24 David Helsper Method and system for analyzing and predicting the behavior of systems
CN103400040A (zh) * 2013-07-31 2013-11-20 中国人民解放军国防科学技术大学 采用多步时域差值学习的故障诊断与预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘永庆等: "基于马尔科夫链的主机异常检测方法研究", 《计算机与数字工程》 *

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636874B (zh) * 2015-02-12 2019-04-16 北京嘀嘀无限科技发展有限公司 检测业务异常的方法及设备
CN104636874A (zh) * 2015-02-12 2015-05-20 北京嘀嘀无限科技发展有限公司 检测业务异常的方法及设备
CN104794235A (zh) * 2015-05-06 2015-07-22 曹东 金融时间序列分段分布特征计算方法及系统
CN104794235B (zh) * 2015-05-06 2018-01-05 曹东 金融时间序列分段分布特征计算方法及系统
CN104899327A (zh) * 2015-06-24 2015-09-09 哈尔滨工业大学 一种无类别标签的时间序列异常检测方法
CN104899327B (zh) * 2015-06-24 2018-03-30 哈尔滨工业大学 一种无类别标签的时间序列异常检测方法
CN106528565A (zh) * 2015-09-11 2017-03-22 北京邮电大学 监测系统的数据处理方法和装置
CN106528565B (zh) * 2015-09-11 2019-08-06 北京邮电大学 监测系统的数据处理方法和装置
CN105262647A (zh) * 2015-11-27 2016-01-20 广州神马移动信息科技有限公司 一种异常指标检测方法及装置
CN105510971A (zh) * 2016-02-18 2016-04-20 福建师范大学 一种基于随机漫步的地震数据异常检测方法
CN105653427B (zh) * 2016-03-04 2019-02-22 上海交通大学 基于行为异常检测的日志监控方法
CN105653427A (zh) * 2016-03-04 2016-06-08 上海交通大学 基于行为异常检测的日志监控方法
CN107451157A (zh) * 2016-06-01 2017-12-08 阿里巴巴集团控股有限公司 异常数据识别方法、装置及系统、搜索方法及装置
CN107451157B (zh) * 2016-06-01 2020-12-18 阿里巴巴集团控股有限公司 异常数据识别方法、装置及系统、搜索方法及装置
CN106228002B (zh) * 2016-07-19 2021-11-26 北京工业大学 一种基于二次筛选的高效率异常时序数据提取方法
CN106228002A (zh) * 2016-07-19 2016-12-14 北京工业大学 一种基于二次筛选的高效率异常时序数据提取方法
CN106155867A (zh) * 2016-08-23 2016-11-23 珠海金智维信息科技有限公司 监控性能数据相似性度量的告警方法和系统
CN106502815B (zh) * 2016-10-20 2019-08-02 北京蓝海讯通科技股份有限公司 一种异常原因定位方法、装置和计算设备
CN106502815A (zh) * 2016-10-20 2017-03-15 北京蓝海讯通科技股份有限公司 一种异常原因定位方法、装置和计算设备
CN110226140A (zh) * 2017-01-25 2019-09-10 Ntn株式会社 状态监视方法及状态监视装置
CN108932524A (zh) * 2017-05-22 2018-12-04 西门子股份公司 用于确定系统的异常状态的方法和装置
CN108932524B (zh) * 2017-05-22 2022-06-24 西门子股份公司 用于确定系统的异常状态的方法和装置
CN107194184B (zh) * 2017-05-31 2020-11-17 成都数联易康科技有限公司 基于时间序列相似性分析的在院人次异常检测方法及系统
CN107194184A (zh) * 2017-05-31 2017-09-22 成都数联易康科技有限公司 基于时间序列相似性分析的在院人次异常检测方法及系统
CN107748892A (zh) * 2017-09-25 2018-03-02 西安理工大学 一种基于马氏距离的人体行为数据分割方法
CN108133373A (zh) * 2018-01-04 2018-06-08 交通银行股份有限公司 探寻涉机器行为的风险账户的方法及装置
CN109508733A (zh) * 2018-10-23 2019-03-22 北京邮电大学 一种基于分布概率相似度度量的异常检测方法
CN111367747B (zh) * 2018-12-25 2023-07-04 中国移动通信集团浙江有限公司 基于时间标注的指标异动检测预警的装置
CN111367747A (zh) * 2018-12-25 2020-07-03 中国移动通信集团浙江有限公司 基于时间标注的指标异动检测预警的装置
CN109861857A (zh) * 2019-01-28 2019-06-07 网联清算有限公司 故障检测方法及装置
CN111143102A (zh) * 2019-12-13 2020-05-12 东软集团股份有限公司 异常数据检测方法、装置、存储介质及电子设备
CN111143102B (zh) * 2019-12-13 2024-01-19 东软集团股份有限公司 异常数据检测方法、装置、存储介质及电子设备
CN115840897B (zh) * 2023-02-09 2023-04-18 广东吉器电子有限公司 一种温度传感器数据异常处理方法
CN115840897A (zh) * 2023-02-09 2023-03-24 广东吉器电子有限公司 一种温度传感器数据异常处理方法

Also Published As

Publication number Publication date
CN104317681B (zh) 2017-09-08

Similar Documents

Publication Publication Date Title
CN104317681A (zh) 针对计算机系统的行为异常自动检测方法及检测系统
CN109308522B (zh) 一种基于循环神经网络的gis故障预测方法
CN104699606B (zh) 一种基于隐马尔科夫模型的软件系统状态预测方法
CN109766583A (zh) 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法
CN103473540B (zh) 智能交通系统车辆轨迹增量式建模与在线异常检测方法
CN104598813A (zh) 一种基于集成学习和半监督svm的计算机入侵检测方法
CN109470946B (zh) 一种发电设备故障检测方法及系统
CN112508105A (zh) 一种采油机故障检测与检索方法
CN104407688A (zh) 基于树回归的虚拟化云平台能耗测量方法及系统
Oo et al. Time series prediction based on Facebook Prophet: a case study, temperature forecasting in Myintkyina
CN111368863A (zh) 一种智能化的岸桥关键机构健康状态评估方法
CN112363896A (zh) 日志异常检测系统
CN110505114A (zh) 一种云计算环境下节点异常判断方法
CN114266289A (zh) 一种复杂装备健康状态评估方法
CN113988210A (zh) 结构监测传感网失真数据修复方法、装置及存储介质
CN111768022A (zh) 煤机生产设备的设备检测方法及装置
CN116400168A (zh) 一种基于深度特征聚类的电网故障诊断方法及系统
CN110956278A (zh) 重新训练机器学习模型的方法和系统
CN112070180A (zh) 基于信息物理双侧数据的电网设备状态判断方法及装置
CN118249504A (zh) 微网设备状态智能诊断与告警通知系统
Massaferro et al. Improving electricity non technical losses detection including neighborhood information
CN105183659A (zh) 基于多级模式预测的软件系统行为异常检测方法
CN109977131A (zh) 一种房型匹配系统
Zhu et al. A Performance Fault Diagnosis Method for SaaS Software Based on GBDT Algorithm.
CN107480647A (zh) 基于归纳式一致性异常检测的异常行为实时检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200116

Address after: Room 1709, Building No. 8, Binjiang West Road, Jiangyin City, Wuxi City, Jiangsu Province

Patentee after: Jiangyin Daily Information Technology Co., Ltd.

Address before: 200240 Dongchuan Road, Shanghai, No. 800, No.

Patentee before: Shanghai Jiaotong University