CN112380098B - 一种时序异常检测方法、装置、计算机设备及存储介质 - Google Patents
一种时序异常检测方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112380098B CN112380098B CN202011306700.5A CN202011306700A CN112380098B CN 112380098 B CN112380098 B CN 112380098B CN 202011306700 A CN202011306700 A CN 202011306700A CN 112380098 B CN112380098 B CN 112380098B
- Authority
- CN
- China
- Prior art keywords
- time sequence
- time
- convolution
- data
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 67
- 230000005856 abnormality Effects 0.000 title claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 51
- 238000013528 artificial neural network Methods 0.000 claims abstract description 35
- 230000002159 abnormal effect Effects 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 22
- 230000007246 mechanism Effects 0.000 claims abstract description 19
- 238000010276 construction Methods 0.000 claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims description 49
- 230000006870 function Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012423 maintenance Methods 0.000 claims description 11
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 230000002596 correlated effect Effects 0.000 claims description 9
- 230000003213 activating effect Effects 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3447—Performance evaluation by modeling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Hardware Design (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明公开了一种时序异常检测方法、装置、计算机设备及存储介质,方法包括:利用第一卷积神经网络对时序数据样本进行卷积处理,得到局部邻近时间步关联的时序特征;利用注意力机制对时序特征的全局时间步进行关联,得到全局时间步关联的时序特征;利用变分自编码算法对全局时间步关联的时序特征进行编码和解码,得到重构的时序特征;利用第二卷积神经网络对重构的时序特征进行卷积处理,得到时序还原数据;利用时序数据样本与所述时序还原数据的差异检测所述时序数据样本的异常值,完成时序异常检测模型的构建;利用所述时序异常检测模型对待测时序数据进行检测,得到所述待测时序数据的异常值。本发明提高了模型适用性和准确率。
Description
技术领域
本发明涉及人工智能技术领域,特别涉及一种时序异常检测方法、装置、计算机设备及存储介质。
背景技术
运维系统的异常检测程序,主要负责监控运维系统中关于应用、硬件等多个对象的指标(例如某一主机对象的CPU使用率指标),当指标发生异常时则实时告警,从而提示工作人员进行排查。异常检测算法种类较多,包括统计算法、机器学习算法、深度学习算法。其中,深度学习算法精度更高,是当前主要的研究和应用方向。
但现有技术中,异常检测过程中,普遍无法提供大量标注数据,造成监督学习算法的适用性降低、准确率不高。
发明内容
本发明的目的是提供一种时序异常检测方法、装置、计算机设备及存储介质,旨在解决现有技术中时序异常检测方法适用性降低、准确率不高的问题。
第一方面,本发明实施例提供一种时序异常检测方法,其中,包括:
利用第一卷积神经网络对运维系统的时序数据样本进行卷积处理,得到局部邻近时间步关联的时序特征;
利用注意力机制对所述时序特征的全局时间步进行关联,得到全局时间步关联的时序特征;
利用变分自编码算法对所述全局时间步关联的时序特征进行编码和解码,得到重构的时序特征;
利用第二卷积神经网络对所述重构的时序特征进行卷积处理,得到时序还原数据;
利用所述时序数据样本与所述时序还原数据的差异检测所述时序数据样本的异常值,完成时序异常检测模型的构建;
利用所述时序异常检测模型对待测时序数据进行检测,得到所述待测时序数据的异常值。
第二方面,本发明实施例提供一种时序异常检测装置,其中,包括:
第一卷积单元,用于利用第一卷积神经网络对运维系统的时序数据样本进行卷积处理,得到局部邻近时间步关联的时序特征;
注意力机制单元,用于利用注意力机制对所述时序特征的全局时间步进行关联,得到全局时间步关联的时序特征;
自编码单元,用于利用变分自编码算法对所述全局时间步关联的时序特征进行编码和解码,得到重构的时序特征;
第二卷积单元,用于利用第二卷积神经网络对所述重构的时序特征进行卷积处理,得到时序还原数据;
模型构建单元,用于利用所述时序数据样本与所述时序还原数据的差异检测所述时序数据样本的异常值,完成时序异常检测模型的构建;
模型检测单元,用于利用所述时序异常检测模型对待测时序数据进行检测,得到所述待测时序数据的异常值。
第三方面,本发明实施例提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如第一方面所述的时序异常检测方法。
第四方面,本发明实施例提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如第一方面所述的时序异常检测方法。
本发明实施例提供了一种时序异常检测方法、装置、计算机设备及存储介质,方法包括:利用第一卷积神经网络对时序数据样本进行卷积处理,得到局部邻近时间步关联的时序特征;利用注意力机制对所述时序特征的全局时间步进行关联,得到全局时间步关联的时序特征;利用变分自编码算法对所述全局时间步关联的时序特征进行编码和解码,得到重构的时序特征;利用第二卷积神经网络对所述重构的时序特征进行卷积处理,得到时序还原数据;利用所述时序数据样本与所述时序还原数据的差异检测所述时序数据样本的异常值,完成时序异常检测模型的构建;利用所述时序异常检测模型对待测时序数据进行检测,得到所述待测时序数据的异常值。本发明实施例通过卷积神经网络结合注意力机制,实现时序特征的提取,进而完成时序异常检测,并且通过变分自编码算法,基于无监督学习方式建立时序异常检测模型,提高了模型适用性和准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的时序异常检测方法的流程示意图;
图2为本发明实施例提供的时序异常检测方法的子流程示意图;
图3为本发明实施例提供的时序异常检测方法的又一子流程示意图;
图4为本发明实施例提供的时序异常检测方法的又一子流程示意图;
图5为本发明实施例提供的时序异常检测方法的又一子流程示意图;
图6为本发明实施例提供的时序异常检测装置的示意性框图;
图7为本发明实施例提供的时序异常检测装置的子单元示意性框图;
图8为本发明实施例提供的时序异常检测装置的又一子单元示意性框图;
图9为本发明实施例提供的时序异常检测装置的又一子单元示意性框图;
图10为本发明实施例提供的时序异常检测装置的又一子单元示意性框图;
图11为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1为本发明实施例提供的一种时序异常检测方法的流程示意图,如图所示,其包括步骤S101~S106:
S101、利用第一卷积神经网络对运维系统的时序数据样本进行卷积处理,得到局部邻近时间步关联的时序特征;
本发明实施例中,第一卷积神经网络的作用是对时序数据样本进行卷积处理,进而提取局部邻近时间步(step)关联的时序特征,本发明实施例中采用了2层卷积层:第一卷积层和第二卷积层,当然本发明实施例也可按照需求进行叠加卷积层。
在一实施例中,如图2所示,所述步骤S101包括步骤S201~S202:
S201、利用所述第一卷积神经网络中的第一卷积层对所述时序数据样本进行卷积处理,得到第一中间特征;
此步骤中,按如下公式进行卷积处理:x1=Conv1D1(x0)
其中,x0为输入的时序数据样本,Conv1D1表示第一卷积层的卷积运算,本发明实施例中,所述第一卷积层为1维卷积层,那么Conv1D1表示1维卷积运算。x1代表卷积处理后得到的第一中间特征。
S202、利用所述第一卷积神经网络中的第二卷积层对所述第一中间特征进行卷积处理,得到局部邻近时间步关联的时序特征。
此步骤中,按如下公式进行卷积处理:x2=Conv1D2(x1)
其中,右边的x1为处理前的第一时间特征,即输入的第一时间特征,Conv1D2表示第二卷积层的卷积运算,本发明实施例中,所述第二卷积层为1维卷积层,那么Conv1D2表示1维卷积运算。左边的x2代表卷积处理后得到的第一中间特征,即局部邻近时间步关联的时序特征。
S102、利用注意力机制对所述时序特征的全局时间步进行关联,得到全局时间步关联的时序特征;
上述第一卷积神经网络能够提取局部邻近时间步关联的时序特征,但无法对全局时间步(step)进行综合关联。故本发明实施例加入了注意力机制,对经过所述第一卷积神经网络处理的输出数据进行关联计算,以实现全局时序关联。
在一实施例中,如图3所示,所述步骤S102包括步骤S301~S303:
S301、将所述局部邻近时间步关联的时序特征作为输入数据,根据所述输入数据分别构建查询矩阵、键矩阵和值矩阵;
在所述步骤S301中,首先将局部邻近时间步关联的时序特征作为输入数据,并分别构建查询矩阵、键矩阵和值矩阵,所述查询矩阵矩阵即query,所述键矩阵即key矩阵,所述值矩阵即value矩阵。
具体分别按如下公式计算得到query矩阵、key矩阵和value矩阵:
query=Denseq(x2)
key=Densek(x2)
value=Densev(x2)
其中,x2为局部邻近时间步关联的时序特征,Dense表示全连接层Dense Layer,query表示query矩阵、key表示key矩阵、value表示value矩阵,其中的q、k、v分别表示矩阵转换。
其中,query、key、value三者计算方法相同,通过全连接层即可输出矩阵作为结果。全连接层内含参数w与b,计算方法为:
y=w×x+b
对于query矩阵、key矩阵和value矩阵,三者的参数w与b有所不同,所以对于同样的x=x2,得到不同的y,即query、key和value。
S302、将所述查询矩阵乘以所述键矩阵,并利用激活函数对乘积结果进行激活,得到注意力权重;
此步骤按如下公式计算注意力权重:attention=softmax(query*key)
其中,attention表示注意力权重,query表示query矩阵,key表示key矩阵,softmax表示softmax激活函数,即先对query矩阵与所述key矩阵进行乘积运算,然后对其激活,得到注意力权重attention。
softmax激活函数的计算方法如下:
所述softmax激活函数可以将输出数据映射到(0,1)区间内,从而将输出数据作为概率理解。例如对于一个数组V,Vi表示V中的第i个元素,那么这个元素的softmax值就是除上述softmax激活函数之外,本发明实施例还可以采用其他激活函数将输出数据转换至(0,1)区间内。
S303、将所述注意力权重与所述值矩阵相乘,并与输入数据进行连接,输出得到全局时间步关联的时序特征。
此步骤按如下公式计算全局时间步关联的时序特征:x3=attention*value+x2
其中,attention为注意力权重,value表示value矩阵,x2为局部邻近时间步关联的时序特征。
也就是先将注意力权重attention与value矩阵进行乘积运算,然后将乘积结果加上局部邻近时间步关联的时序特征,从而得到全局时间步关联的时序特征。由于计算过程中的注意力权重attention能够表征整个时间序列中每一时间步间的相互时序关联,所以本发明实施例实现了全局时序关联。
S103、利用变分自编码算法对所述全局时间步关联的时序特征进行编码和解码,得到重构的时序特征;
经过步骤S102的全局时序关联计算后,便可进行步骤S103的变分自编码运算。变分自编码算法VAE作为自编码算法的一种,包括编码器与解码器,编码器接收输入,解码器通过采样,对输入进行重构。
在一实施例中,如图4所示,所述步骤S103包括步骤S401~S402:
S401、将所述全局时间步关联的时序特征输入至编码器中进行编码,并通过全连接层生成均值与标准差;
此步骤中,通过所述编码器进行编码,所述编码器是通过卷积池化进行降维,并通过全连接层生成均值与标准差,以便后续输入至解码器。
S402、将所述均值与标准差输入至解码器进行标准正态分布采样,得到重构的时序特征。
此步骤中,解码器通过反卷积反池化进行升维,并对输入的均值与标准差进行标准正态分布采样,从而完成对时序特征的重构。
本实施例整体上可以以如下公式进行表示:x4=VAE(x3)
其中,x3表示全局时间步关联的时序特征,x4表示重构的时序特征,VAE即代表变分自编码算法。
S104、利用第二卷积神经网络对所述重构的时序特征进行卷积处理,得到时序还原数据;
在上述步骤103中,重构这一步骤,对输入信息而言是有损的,因此这一步骤无法很好还原模型训练过程中不会涉及的异常样本。所以,本发明实施例在经过VAE重构后再进行卷积处理。
在一实施例中,如图5所示,所述步骤S104包括步骤S501~S502:
S501、利用所述第二卷积神经网络中的第三卷积层对所述重构的时序特征进行卷积处理,得到第二中间特征;
此步骤中,按如下公式进行卷积处理:x5=Conv1D1(x4)
其中,x4为输入的重构的时序特征,Conv1D1表示第三卷积层的卷积运算,本发明实施例中,所述第三卷积层为1维卷积层,那么Conv1D1表示1维卷积运算。x5代表卷积处理后得到的第二中间特征。
S502、利用所述第二卷积神经网络中的第四卷积层对所述第二中间特征进行卷积处理,得到时序还原数据。
此步骤中,按如下公式进行卷积处理:x6=Conv1D2(x5)
其中,右边的x5为处理前的第二时间特征,即输入的第二时间特征,Conv1D2表示第四卷积层的卷积运算,本发明实施例中,所述第四卷积层为1维卷积层,那么Conv1D2表示1维卷积运算。左边的x6代表卷积处理后得到的第二中间特征,即时序还原数据。
S105、利用所述时序数据样本与所述时序还原数据的差异检测所述时序数据样本的异常值,完成时序异常检测模型的构建;
本步骤中,基于所述时序数据样本与所述时序还原数据的差异,可以进行模型训练和异常检测,从而完成时序异常检测模型的构建。
在一实施例中,所述步骤S105之后,包括:
基于所述时序数据样本与所述时序还原数据的差异计算损失函数;
利用所述损失函数对所述时序异常检测模型进行迭代优化,直至达到预设的迭代次数或者损失值小于预设损失阈值。
在本实施例中,基于所述时序数据样本与所述时序还原数据的差异,计算损失函数ELBO(证据下界),并基于损失函数ELBO,采用Adam(自适应矩估计)优化算法对所述时序异常检测模型进行迭代训练,完成模型的训练。训练的终止可以是迭代次数达到预设的迭代次数,也可以是损失值小于预设损失阈值。
S106、利用所述时序异常检测模型对待测时序数据进行检测,得到所述待测时序数据的异常值。
本发明实施例中,基于所述时序异常检测模型可以对待测时序数据进行检测,从而确定待测时序数据的异常值。对于正常样本,模型重构后能够实现较高相似度地还原。而对于异常样本,模型重构后便会与原始数据产生一定误差。这一误差可通过MSE(均方误差)度量,当MSE值达到预设度量阈值,即表示重构误差超过上限,从而将对应的样本识别为异常样本。
请参阅图6,图6为本发明实施例提供的一种时序异常检测装置的示意性框图,其包括:
第一卷积单元601,用于利用第一卷积神经网络对运维系统的时序数据样本进行卷积处理,得到局部邻近时间步关联的时序特征;
注意力机制单元602,用于利用注意力机制对所述时序特征的全局时间步进行关联,得到全局时间步关联的时序特征;
自编码单元603,用于利用变分自编码算法对所述全局时间步关联的时序特征进行编码和解码,得到重构的时序特征;
第二卷积单元604,用于利用第二卷积神经网络对所述重构的时序特征进行卷积处理,得到时序还原数据;
模型构建单元605,用于利用所述时序数据样本与所述时序还原数据的差异检测所述时序数据样本的异常值,完成时序异常检测模型的构建;
模型检测单元606,用于利用所述时序异常检测模型对待测时序数据进行检测,得到所述待测时序数据的异常值。
在一实施例中,如图7所示,所述第一卷积单元601包括:
第一卷积层处理单元701,用于利用所述第一卷积神经网络中的第一卷积层对所述时序数据样本进行卷积处理,得到第一中间特征;
第二卷积层处理单元702,用于利用所述第一卷积神经网络中的第二卷积层对所述第一中间特征进行卷积处理,得到局部邻近时间步关联的时序特征。
在一实施例中,如图8所示,所述注意力机制单元602包括:
矩阵构建单元801,用于将局部邻近时间步关联的时序特征作为输入数据,根据所述输入数据分别构建查询矩阵、键矩阵和值矩阵;
激活单元802,用于将所述查询矩阵乘以所述键矩阵,并利用激活函数对乘积结果进行激活,得到注意力权重;
全局关联单元803,用于将所述注意力权重与所述值矩阵相乘,并与输入数据进行连接,输出得到全局时间步关联的时序特征。
在一实施例中,如图9所示,所述自编码单元603包括:
编码单元901,用于将所述全局时间步关联的时序特征输入至编码器中进行编码,并通过全连接层生成均值与标准差;
解码单元902,用于将所述均值与标准差输入至解码器进行标准正态分布采样,得到重构的时序特征。
在一实施例中,如图10所示,所述第二卷积单元604包括:
第三卷积层处理单元1001,利用所述第二卷积神经网络中的第三卷积层对所述重构的时序特征进行卷积处理,得到第二中间特征;
第四卷积层处理单元1001,利用所述第二卷积神经网络中的第四卷积层对所述第二中间特征进行卷积处理,得到时序还原数据。
在一实施例中,所述时序异常检测装置600还包括:
损失计算单元,用于基于所述时序数据样本与所述时序还原数据的差异计算损失函数;
优化单元,用于利用所述损失函数对所述时序异常检测模型进行迭代优化,直至达到预设的迭代次数或者损失值小于预设损失阈值。
在一实施例中,所述第一卷积神经网络和第二卷积神经网络的卷积层均为1维卷积层。
本发明实施例提供的装置,通过卷积神经网络结合注意力机制,实现时序特征的提取,进而完成时序异常检测,并且通过变分自编码算法,基于无监督学习方式建立时序异常检测模型,提高了模型适用性和准确率。
上述时序异常检测装置600可以实现为计算机程序的形式,该计算机程序可以在如图11所示的计算机设备上运行。
请参阅图11,图11是本发明实施例提供的计算机设备的示意性框图。该计算机设备1100是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图11,该计算机设备1100包括通过系统总线1101连接的处理器1102、存储器和网络接口1105,其中,存储器可以包括非易失性存储介质1103和内存储器1104。
该非易失性存储介质1103可存储操作系统11031和计算机程序11032。该计算机程序11032被执行时,可使得处理器1102执行时序异常检测方法。
该处理器1102用于提供计算和控制能力,支撑整个计算机设备1100的运行。
该内存储器1104为非易失性存储介质1103中的计算机程序11032的运行提供环境,该计算机程序11032被处理器1102执行时,可使得处理器1102执行时序异常检测方法。
该网络接口1105用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备1100的限定,具体的计算机设备1100可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器1102用于运行存储在存储器中的计算机程序11032,以实现如下功能:利用第一卷积神经网络对运维系统的时序数据样本进行卷积处理,得到局部邻近时间步关联的时序特征;利用注意力机制对所述时序特征的全局时间步进行关联,得到全局时间步关联的时序特征;利用变分自编码算法对所述全局时间步关联的时序特征进行编码和解码,得到重构的时序特征;利用第二卷积神经网络对所述重构的时序特征进行卷积处理,得到时序还原数据;利用所述时序数据样本与所述时序还原数据的差异检测所述时序数据样本的异常值,完成时序异常检测模型的构建;利用所述时序异常检测模型对待测时序数据进行检测,得到所述待测时序数据的异常值。
本领域技术人员可以理解,图11中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图11所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器1102可以是中央处理单元(CentralProcessing Unit,CPU),该处理器1102还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:利用第一卷积神经网络对运维系统的时序数据样本进行卷积处理,得到局部邻近时间步关联的时序特征;利用注意力机制对所述时序特征的全局时间步进行关联,得到全局时间步关联的时序特征;利用变分自编码算法对所述全局时间步关联的时序特征进行编码和解码,得到重构的时序特征;利用第二卷积神经网络对所述重构的时序特征进行卷积处理,得到时序还原数据;利用所述时序数据样本与所述时序还原数据的差异检测所述时序数据样本的异常值,完成时序异常检测模型的构建;利用所述时序异常检测模型对待测时序数据进行检测,得到所述待测时序数据的异常值。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (8)
1.一种时序异常检测方法,其特征在于,包括:
利用第一卷积神经网络对运维系统的时序数据样本进行卷积处理,得到局部邻近时间步关联的时序特征;
利用注意力机制对所述时序特征的全局时间步进行关联,得到全局时间步关联的时序特征;
利用变分自编码算法对所述全局时间步关联的时序特征进行编码和解码,得到重构的时序特征;
利用第二卷积神经网络对所述重构的时序特征进行卷积处理,得到时序还原数据;
利用所述时序数据样本与所述时序还原数据的差异检测所述时序数据样本的异常值,完成时序异常检测模型的构建;
利用所述时序异常检测模型对待测时序数据进行检测,得到所述待测时序数据的异常值;
所述利用第一卷积神经网络对运维系统的时序数据样本进行卷积处理,得到局部邻近时间步关联的时序特征,包括:
利用所述第一卷积神经网络中的第一卷积层对所述时序数据样本进行卷积处理,得到第一中间特征;
利用所述第一卷积神经网络中的第二卷积层对所述第一中间特征进行卷积处理,得到局部邻近时间步关联的时序特征;
所述利用注意力机制对所述时序特征的全局时间步进行关联,得到全局时间步关联的时序特征,包括:
将局部邻近时间步关联的时序特征作为输入数据,根据所述输入数据分别构建查询矩阵、键矩阵和值矩阵;
将所述查询矩阵乘以所述键矩阵,并利用激活函数对乘积结果进行激活,得到注意力权重;
将所述注意力权重与所述值矩阵相乘,并与输入数据进行连接,输出得到全局时间步关联的时序特征。
2.根据权利要求1所述的时序异常检测方法,其特征在于,所述利用变分自编码算法对所述全局时间步关联的时序特征进行编码和解码,得到重构的时序特征,包括:
将所述全局时间步关联的时序特征输入至编码器中进行编码,并通过全连接层生成均值与标准差;
将所述均值与标准差输入至解码器进行标准正态分布采样,得到重构的时序特征。
3.根据权利要求1所述的时序异常检测方法,其特征在于,所述利用第二卷积神经网络对所述重构的时序特征进行卷积处理,得到时序还原数据,包括:
利用所述第二卷积神经网络中的第三卷积层对所述重构的时序特征进行卷积处理,得到第二中间特征;
利用所述第二卷积神经网络中的第四卷积层对所述第二中间特征进行卷积处理,得到时序还原数据。
4.根据权利要求1所述的时序异常检测方法,其特征在于,利用所述时序数据样本与所述时序还原数据的差异检测所述时序数据样本的异常值,完成时序异常检测模型的构建之后,包括:
基于所述时序数据样本与所述时序还原数据的差异计算损失函数;
利用所述损失函数对所述时序异常检测模型进行迭代优化,直至达到预设的迭代次数或者损失值小于预设损失阈值。
5.根据权利要求1所述的时序异常检测方法,其特征在于,所述第一卷积神经网络和第二卷积神经网络的卷积层均为1维卷积层。
6.一种时序异常检测装置,其特征在于,包括:
第一卷积单元,用于利用第一卷积神经网络对运维系统的时序数据样本进行卷积处理,得到局部邻近时间步关联的时序特征;
注意力机制单元,用于利用注意力机制对所述时序特征的全局时间步进行关联,得到全局时间步关联的时序特征;
自编码单元,用于利用变分自编码算法对所述全局时间步关联的时序特征进行编码和解码,得到重构的时序特征;
第二卷积单元,用于利用第二卷积神经网络对所述重构的时序特征进行卷积处理,得到时序还原数据;
模型构建单元,用于利用所述时序数据样本与所述时序还原数据的差异检测所述时序数据样本的异常值,完成时序异常检测模型的构建;
模型检测单元,用于利用所述时序异常检测模型对待测时序数据进行检测,得到所述待测时序数据的异常值;
第一卷积单元,具体用于利用所述第一卷积神经网络中的第一卷积层对所述时序数据样本进行卷积处理,得到第一中间特征;
利用所述第一卷积神经网络中的第二卷积层对所述第一中间特征进行卷积处理,得到局部邻近时间步关联的时序特征;
注意力机制单元包括:
矩阵构建单元,用于将局部邻近时间步关联的时序特征作为输入数据,根据所述输入数据分别构建查询矩阵、键矩阵和值矩阵;
激活单元,用于将所述查询矩阵乘以所述键矩阵,并利用激活函数对乘积结果进行激活,得到注意力权重;
全局关联单元,用于将所述注意力权重与所述值矩阵相乘,并与输入数据进行连接,输出得到全局时间步关联的时序特征。
7.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的时序异常检测方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的时序异常检测方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011306700.5A CN112380098B (zh) | 2020-11-19 | 2020-11-19 | 一种时序异常检测方法、装置、计算机设备及存储介质 |
PCT/CN2021/083751 WO2021204010A1 (zh) | 2020-11-19 | 2021-03-30 | 一种时序异常检测方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011306700.5A CN112380098B (zh) | 2020-11-19 | 2020-11-19 | 一种时序异常检测方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112380098A CN112380098A (zh) | 2021-02-19 |
CN112380098B true CN112380098B (zh) | 2024-03-19 |
Family
ID=74584388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011306700.5A Active CN112380098B (zh) | 2020-11-19 | 2020-11-19 | 一种时序异常检测方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112380098B (zh) |
WO (1) | WO2021204010A1 (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380098B (zh) * | 2020-11-19 | 2024-03-19 | 平安科技(深圳)有限公司 | 一种时序异常检测方法、装置、计算机设备及存储介质 |
CN113239075B (zh) * | 2021-05-13 | 2023-05-12 | 中国公路工程咨询集团有限公司 | 一种施工数据自检方法及系统 |
CN113111098B (zh) * | 2021-06-11 | 2021-10-29 | 阿里云计算有限公司 | 检测时序数据的查询的方法、装置及时序数据库系统 |
CN113780387A (zh) * | 2021-08-30 | 2021-12-10 | 桂林电子科技大学 | 基于共享自编码器的时间序列异常检测方法 |
CN113988268B (zh) * | 2021-11-03 | 2024-04-05 | 西安交通大学 | 基于无监督全属性图的异构多源时序异常检测方法 |
CN114186583B (zh) * | 2021-12-02 | 2022-12-27 | 国家石油天然气管网集团有限公司 | 一种储油罐罐壁腐蚀检测异常信号恢复方法及系统 |
CN114297036B (zh) * | 2022-01-05 | 2023-06-09 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、电子设备及可读存储介质 |
CN114692767B (zh) * | 2022-03-31 | 2024-01-19 | 中国电信股份有限公司 | 异常检测方法和装置、计算机可读存储介质、电子设备 |
CN115292659B (zh) * | 2022-08-02 | 2023-03-21 | 成都毅创空间科技有限公司 | 智能家居的时序数据异常检测方法 |
CN115903705B (zh) * | 2022-11-30 | 2023-07-14 | 福建省杭氟电子材料有限公司 | 用于电子级六氟丁二烯制备的生产管理控制系统 |
CN115879777B (zh) * | 2023-03-03 | 2023-05-12 | 吉林大学 | 基于时空大数据的石油安全智能推演系统及其方法 |
CN116362503B (zh) * | 2023-03-30 | 2023-11-07 | 国网河南省电力公司安阳供电公司 | 基于人工智能的电力调节方法及系统 |
CN116086790B (zh) * | 2023-04-11 | 2023-06-23 | 杭州鄂达精密机电科技有限公司 | 氢燃料电池高压阀的性能检测方法及其系统 |
CN116499607B (zh) * | 2023-06-27 | 2023-09-08 | 之江实验室 | 一种光纤传感信号降噪方法、装置和存储介质 |
CN116776273B (zh) * | 2023-08-23 | 2023-11-03 | 烟台云朵软件有限公司 | 物联网设备的运行状态监测方法及系统 |
CN116772944B (zh) * | 2023-08-25 | 2023-12-01 | 克拉玛依市燃气有限责任公司 | 配气站的智能监控系统及其方法 |
CN117270467A (zh) * | 2023-09-11 | 2023-12-22 | 浙江欧诗漫晶体纤维有限公司 | 多晶莫来石纤维的生产控制系统及方法 |
CN117241443B (zh) * | 2023-09-15 | 2024-06-04 | 中山市松伟照明电器有限公司 | 基于物联网的智能照明灯具及其智能控制方法 |
CN117834256B (zh) * | 2023-12-29 | 2024-06-18 | 广东云达智能物联科技有限公司 | 基于大数据的物联网设备安全监控系统 |
CN117786464B (zh) * | 2024-02-22 | 2024-05-24 | 广州市原子高科同位素医药有限公司 | 一种电热恒温培养箱的异常预警方法及系统 |
CN117831743A (zh) * | 2024-03-02 | 2024-04-05 | 长春职业技术学院 | 基于物联网技术的居家养老健康监测管理系统及方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110134946A (zh) * | 2019-04-15 | 2019-08-16 | 深圳智能思创科技有限公司 | 一种针对复杂数据的机器阅读理解方法 |
CN110349676A (zh) * | 2019-06-14 | 2019-10-18 | 华南师范大学 | 时序生理数据分类方法、装置、存储介质和处理器 |
CN110490132A (zh) * | 2019-08-16 | 2019-11-22 | 京东城市(北京)数字科技有限公司 | 数据处理方法和装置 |
CN111338878A (zh) * | 2020-02-21 | 2020-06-26 | 平安科技(深圳)有限公司 | 异常检测方法、装置、终端设备及存储介质 |
CN111679949A (zh) * | 2020-04-23 | 2020-09-18 | 平安科技(深圳)有限公司 | 基于设备指标数据的异常检测方法及相关设备 |
CN111858928A (zh) * | 2020-06-17 | 2020-10-30 | 北京邮电大学 | 一种基于图结构对抗学习的社交媒体谣言检测方法及装置 |
CN111860785A (zh) * | 2020-07-24 | 2020-10-30 | 中山大学 | 基于注意力机制循环神经网络的时间序列预测方法及系统 |
CN111880998A (zh) * | 2020-07-30 | 2020-11-03 | 平安科技(深圳)有限公司 | 服务系统异常检测方法、装置、计算机设备和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10169656B2 (en) * | 2016-08-29 | 2019-01-01 | Nec Corporation | Video system using dual stage attention based recurrent neural network for future event prediction |
CN111815053B (zh) * | 2020-07-09 | 2021-03-16 | 北京中超伟业信息安全技术股份有限公司 | 一种针对工业时序数据的预测方法及系统 |
CN112380098B (zh) * | 2020-11-19 | 2024-03-19 | 平安科技(深圳)有限公司 | 一种时序异常检测方法、装置、计算机设备及存储介质 |
-
2020
- 2020-11-19 CN CN202011306700.5A patent/CN112380098B/zh active Active
-
2021
- 2021-03-30 WO PCT/CN2021/083751 patent/WO2021204010A1/zh active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110134946A (zh) * | 2019-04-15 | 2019-08-16 | 深圳智能思创科技有限公司 | 一种针对复杂数据的机器阅读理解方法 |
CN110349676A (zh) * | 2019-06-14 | 2019-10-18 | 华南师范大学 | 时序生理数据分类方法、装置、存储介质和处理器 |
CN110490132A (zh) * | 2019-08-16 | 2019-11-22 | 京东城市(北京)数字科技有限公司 | 数据处理方法和装置 |
CN111338878A (zh) * | 2020-02-21 | 2020-06-26 | 平安科技(深圳)有限公司 | 异常检测方法、装置、终端设备及存储介质 |
CN111679949A (zh) * | 2020-04-23 | 2020-09-18 | 平安科技(深圳)有限公司 | 基于设备指标数据的异常检测方法及相关设备 |
CN111858928A (zh) * | 2020-06-17 | 2020-10-30 | 北京邮电大学 | 一种基于图结构对抗学习的社交媒体谣言检测方法及装置 |
CN111860785A (zh) * | 2020-07-24 | 2020-10-30 | 中山大学 | 基于注意力机制循环神经网络的时间序列预测方法及系统 |
CN111880998A (zh) * | 2020-07-30 | 2020-11-03 | 平安科技(深圳)有限公司 | 服务系统异常检测方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021204010A1 (zh) | 2021-10-14 |
CN112380098A (zh) | 2021-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112380098B (zh) | 一种时序异常检测方法、装置、计算机设备及存储介质 | |
US11169514B2 (en) | Unsupervised anomaly detection, diagnosis, and correction in multivariate time series data | |
CN111880998B (zh) | 服务系统异常检测方法、装置、计算机设备和存储介质 | |
CN111027686B (zh) | 一种滑坡位移的预测方法、装置及设备 | |
Hastie et al. | Matrix completion and low-rank SVD via fast alternating least squares | |
CN112732983A (zh) | 基于人工智能的数据检测方法、装置、服务器及存储介质 | |
CN112990426A (zh) | 用于自动编码器产生的遗传算法和优化训练器的协作使用 | |
CN111914516B (zh) | 一种网络数据预测序列生成方法、装置、设备及存储介质 | |
CN110580488B (zh) | 基于字典学习的多工况工业监测方法、装置、设备及介质 | |
CN112101400A (zh) | 工业控制系统异常检测方法、设备和服务器、存储介质 | |
CN111461445B (zh) | 短期风速预测方法、装置、计算机设备及存储介质 | |
CN114297036A (zh) | 数据处理方法、装置、电子设备及可读存储介质 | |
CN113704075A (zh) | 一种基于故障日志的高性能计算系统故障预测方法 | |
CN113901679B (zh) | 电力系统的可靠性分析方法、装置和计算机设备 | |
CN117076171A (zh) | 一种面向多元时序数据的异常检测及定位方法及装置 | |
Jiang et al. | A timeseries supervised learning framework for fault prediction in chiller systems | |
CN117253368A (zh) | 交通流量异常检测方法、装置、计算机设备和存储介质 | |
CN112131274A (zh) | 时间序列异常点的检测方法、装置、设备及可读存储介质 | |
CN116306030A (zh) | 考虑预测误差和波动分布的新能源预测动态场景生成方法 | |
CN114707414A (zh) | 一种机器人健康状态评估方法、装置、设备及存储介质 | |
KR20220159056A (ko) | 양방향 lstm 신경망을 이용한 조위 예측 시스템 및 방법 | |
CN112798949A (zh) | 一种抽水蓄能机组发电机温度预警方法和系统 | |
CN117633441B (zh) | 海表面温度数据的填补与修正方法、装置和电子设备 | |
Li et al. | Remote fault detection system design with online channel reliability information | |
CN117556261B (zh) | 一种基于mcnn的隔膜泵单向阀寿命预测方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40040407 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |