CN112765896A - 一种基于lstm的水处理时序数据异常检测方法 - Google Patents

一种基于lstm的水处理时序数据异常检测方法 Download PDF

Info

Publication number
CN112765896A
CN112765896A CN202110121981.5A CN202110121981A CN112765896A CN 112765896 A CN112765896 A CN 112765896A CN 202110121981 A CN202110121981 A CN 202110121981A CN 112765896 A CN112765896 A CN 112765896A
Authority
CN
China
Prior art keywords
data
lstm
hypersphere
time sequence
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110121981.5A
Other languages
English (en)
Inventor
李智勇
丁伶利
李学斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Shaodong Intelligent Manufacturing Innovative Institute
Original Assignee
Hunan University
Shaodong Intelligent Manufacturing Innovative Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University, Shaodong Intelligent Manufacturing Innovative Institute filed Critical Hunan University
Priority to CN202110121981.5A priority Critical patent/CN112765896A/zh
Publication of CN112765896A publication Critical patent/CN112765896A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Abstract

本发明公开了一种基于LSTM的水处理时序数据异常检测方法,包括获取时序数据序列并处理得到训练数据集;构建基于LSTM的无监督模型并训练得到时序数据异常检测模型;采用时序数据异常检测模型对待分析的水处理时序数据序列进行检测并完成时序数据的异常检测。本发明方法构建了无监督的基于LSTM的LSTM‑SVDD模型,并采用预处理后的数据集对模型进行训练,通过联合训练优化目标对LSTM‑SVDD模型进行参数调整,得到一个训练完好的模型,最后将得到的模型用于数据的异常检测;因此本发明方法能够实时监控数据并进行异常检测,而且可靠性高、准确性好且检测效果较好。

Description

一种基于LSTM的水处理时序数据异常检测方法
技术领域
本发明属于工业数据处理领域,具体涉及一种基于LSTM的水处理时序数据异常检测方法。
背景技术
随着经济技术的发展和物联网时代的到来,庞大的物联网及工业系统每天都会产生大量的时序数据。时间序列中的异常检测,是指在时间序列数据中找到与其周围表现异常的一个点或一段序列。真实情况下,异常点或异常序列一般代表着异常情况:非法交易、不正常心跳、系统故障或网络恶意攻击等。准确的异常检测可以触发及时的故障排除,从而保证系统的高效服务和工作。异常检测作为工业界服务器后台智能运维的重要组成部分,在各大公司都有着广泛应用。水处理是现代生产和生活中的重要保证,如何进行水处理过程中的时序数据异常检测,已经成为了人们研究的重点之一。
通过统计后台机器的关键指标信息,对构成的时序数据进行异常检测,可以极大降低运维成本。例如,腾讯自研的监测系统,采用统计、无监督、监督的方式对内部应用指标进行异常检测,以保证系统正常运行和降低运维成本;推特、雅虎、领英等知名互联网公司都有自己对应的开源的异常检测工具。与许多其他领域一样,上述领域的数据在大小和维度上增长迅速,因此需要高效的方法来检测大量高维数据中的异常。
然而,由于这些系统的动态复杂性,传统的基于阈值的异常检测方法具有一定局限性。一方面,基于监督的机器学习方法,由于缺乏标记数据而无法利用大量的样本数据。另一方面,无监督方法也无法很好的利用系统中变量之间的依赖关系:如单分类SVM(OC-SVM)以及核密度估计(KDE)等技术方案,需要设定固定长度的时间窗口来检查时间序列数据,因此其性能很大程度上依赖于时间窗口的大小。基于深度学习的方法中,LSTMs(长短期记忆网络)避免了由于使用跨时间的共享参数而需要指定一个时间窗口来考虑异常检测任务中的数据值的技术过程。该优点激发了LSTM网络在异常检测任务中的使用。然而,基于深度学习的方法依赖于基于重构误差的启发方法,通过对概率模型预测的误差设置阈值来检测异常,从而导致了优化问题的出现:如基于LSTM的异常检测算法,首先对时间序列数据进行预测,然后对误差进行多元高斯分布拟合,并选择该分布的阈值用于异常值检测,这大大降低了它们在实际应用中的性能。
发明内容
本发明的目的在于提供一种可靠性高、准确性好且检测效果较好的基于LSTM的水处理时序数据异常检测方法。
本发明提供的这种基于LSTM的水处理时序数据异常检测方法,包括如下步骤:
S1.获取用于训练模型的时序数据序列;
S2.对步骤S1获取的时序数据序列进行数据预处理操作,从而得到训练数据集;
S3.构建基于LSTM的无监督模型;
S4.采用步骤S2得到的训练数据集,对步骤S3构建的基于LSTM的无监督模型进行训练,从而得到时序数据异常检测模型;
S5.采用步骤S4得到的时序数据异常检测模型,对待分析的水处理时序数据序列进行检测,从而实现时序数据的异常检测。
步骤S2所述的对步骤S1获取的时序数据序列进行数据预处理操作,从而得到训练数据集,具体为采用如下步骤得到训练数据集:
A.获取时序数据序列;
B.对步骤A获取的时序数据序列,删除缺失数据和不相关维度的数据,并进行min-max标准化处理,从而将数据值转换到[0,1]区间;
C.针对处理后的数据,将60%的数据作为训练集,40%的数据作为测试集,且保证训练集均为正常数据,测试集中包括10%的异常数据。
步骤S3所述的构建基于LSTM的无监督模型,具体为采用如下步骤构建模型:
a.采用没有窥孔连接的LSTM框架,并引入门控递归单元(GRU)架构;遗忘门、输入门和输出门均采用Sigmoid函数作为激活函数;在生成候选记忆时,采用双曲正切函数tanh作为激活函数;最后初始化神经元元个数以及神经元的初始状态,构建LSTM网络模块;
b.设定隐藏层的维度,从而保证LSTM网络模块的输出层的维度低于输入层的维度;
c.针对LSTM网络模块的输出结果,采用Mean-Pooling机制融合各个神经元节点的结果信息,并取LSTM网络模块中每个神经元的输出的平均值作为SVDD模块(支持向量数据描述模块)的输入;
d.将SVDD模块的输入数据从原始空间映射到特征空间,并在特征空间中找到一个体积最小的超球体;所述超球体的内部仅包含正常数据,并将异常数据保留在超球体外部。
步骤a所述的初始化神经元元个数以及神经元的初始状态,具体为LSTM网络模块的隐藏层神经元个数为256个,dropout比率为0.85,为了防止在后面的训练过程中SVDD的超球面出现坍塌情况,设置LSTM网络模块的权重参数向量为w(·)Tw(·)=I,网络单元的偏置项b(·)为0向量;其中w(·)为LSTM网络的权重向量;b(·)为LSTM网络的偏置向量。
步骤b所述的设定隐藏层的维度,具体为采用单个隐藏层。
步骤d所述的SVDD模块,具体为采用如下模型作为SVDD模块的优化问题:
Figure BDA0002922483080000041
Figure BDA0002922483080000042
式中R为体积最小的超球体所对应的半径;α为超球体的中心点;v为控制因子,用于控制惩罚因子和球体体积之间的平衡关系,且v∈(0,1];n为数据点的总个数;εi为松弛变量;φ(xi)为观测数据xi在特征空间的映射;|| ||为诱导范数表示符。
步骤S4所述的对步骤S3构建的基于LSTM的无监督模型进行训练,具体为采用如下步骤进行训练:
采用如下目标函数对LSTM网络模块和SVDD模块进行联合训练:
Figure BDA0002922483080000043
式中n为数据点的个数;h(xi;W)为LSTM网络的输出结果;c为球体的中心点;λ为松弛因子,且λ>0;W为LSTM网络权重向量;|| ||为诱导范数表示符;|| ||F为F-范数。
通过随机梯度下降优化算法对权重进行优化调整,并采用相同的学习率对LSTM网络模块和SVDD模块进行联合优化;
采用交替最小化的方法来优化LSTM网络模块的参数和超球体半径;
采用反向传播对LSTM网络模块和SVDD模块进行联合优化;
在执行初始的前向传播后,设置超球体中心的初始值为映射数据的平均值,并在迭代更新超球体半径时,设置迭代次数k;迭代每隔k次,统计一次所有观测点到球心的距离,并取设定的分位数更新为当前的超球体半径值。
步骤S5所述的对待分析的水处理时序数据序列进行检测,具体为对于待分析的水处理时序数据xi,采用如下算式计算该数据到超球面中心的距离,并作为异常分数S(xi):
S(xi)=sgn(||h(xi;W*)-c||2-R2)
式中sgn为符号函数,且若a>0则sgn(a)=-1,若a≤0则sgn(a)=1;h(xi;W*)为LSTM网络的输出结果;c为最终的超球体的中心;R为最终的超球体的半径;|| ||为诱导范数表示符。
本发明提供的这种基于LSTM的水处理时序数据异常检测方法,构建了无监督的基于LSTM的LSTM-SVDD模型,并采用预处理后的数据集对模型进行训练,通过联合训练优化目标对LSTM-SVDD模型进行参数调整,得到一个训练完好的模型,最后将得到的模型用于数据的异常检测;因此本发明方法能够实时监控数据并进行异常检测,而且可靠性高、准确性好且检测效果较好。
附图说明
图1为本发明方法的方法流程示意图。
图2为本发明方法的总体结构示意图。
图3为本发明方法的模型框架构成示意图。
图4为本发明方法与现有技术之间的实验对比示意图。
具体实施方式
如图1所示为本发明的方法流程示意图:本发明提供的这种基于LSTM的水处理时序数据异常检测方法(整体流程如图2所示),包括如下步骤:
S1.获取用于训练模型的时序数据序列;
S2.对步骤S1获取的时序数据序列进行数据预处理操作,从而得到训练数据集;具体为采用如下步骤得到训练数据集:
A.获取时序数据序列;
B.对步骤A获取的时序数据序列,删除缺失数据和不相关维度的数据,并进行min-max标准化处理,从而将数据值转换到[0,1]区间;
具体实施时,min-max标准化处理,为采用公式
Figure BDA0002922483080000061
进行处理,其中x*为处理后得到的数据,x为处理前的数据,min为数据所对应的最小值,max为数据所对应的最大值;
C.针对处理后的数据,将60%的数据作为训练集,40%的数据作为测试集,且保证训练集均为正常数据,测试集中包括10%的异常数据;
S3.构建基于LSTM的无监督模型;如图3所示;通过LSTM来分析和学习序列之间的依赖关系并提取序列数据的潜在空间分布,然后使用基于核的支持向量数据描述SVDD,将LSTM网络的输出结果作为SVDD模型的输入,通过SVDD部分的训练,使得超球体的体积尽可能地小,同时能够包含所有真实分布的数据,针对这两个模块,通过定义一个明确的目标函数来联合训练LSTM和SVDD架构并优化其参数,使得异常数据尽可能的远离超球体外,从而检测出异常数据;具体为采用如下步骤构建模型:
a.采用没有窥孔连接的LSTM框架,并引入门控递归单元(GRU)架构;遗忘门、输入门和输出门均采用Sigmoid函数作为激活函数;在生成候选记忆时,采用双曲正切函数tanh作为激活函数;最后初始化神经元元个数以及神经元的初始状态,构建LSTM网络模块;
具体实施时,LSTM网络模块的隐藏层神经元个数为256个,dropout比率为0.85,为了防止在后面的训练过程中SVDD的超球面出现坍塌情况,设置LSTM网络模块的权重参数向量为w(·)Tw(·)=I,网络单元的偏置项b(·)为0向量;其中w(·)为LSTM网络的权重向量;b(·)为LSTM网络的偏置向量;
b.设定隐藏层的维度,从而保证LSTM网络模块的输出层的维度低于输入层的维度;
具体实施时,为了使LSTM能够学习到有效的特征,通过限制隐藏层的维度,使其输出比输入层的维度要低,从而使得LSTM模块捕捉训练数据中的显著特征,以辅助下一步单分类任务更好的实现。隐藏层的神经元可以学习到输入层的特性,并实现想要的输出结果,增加隐藏层可以模拟更加复杂的场景,从而达到很好的训练效果,但是网络模型过于复杂也增加的其训练成本。本模型是以异常检测为目标的分类任务,使用一个隐藏层即可达到理想效果,因此考虑时间成本,模型优选方案为采用单个隐藏层;
c.针对LSTM网络模块的输出结果,采用Mean-Pooling机制融合各个神经元节点的结果信息,并取LSTM网络模块中每个神经元的输出的平均值作为SVDD模块(支持向量数据描述模块)的输入;
d.将SVDD模块的输入数据从原始空间映射到特征空间,并在特征空间中找到一个体积最小的超球体;所述超球体的内部仅包含正常数据,并将异常数据保留在超球体外部;
具体实施时,采用如下模型作为SVDD模块的优化问题:
Figure BDA0002922483080000081
Figure BDA0002922483080000082
式中R为体积最小的超球体所对应的半径;α为超球体的中心点;v为控制因子,用于控制惩罚因子和球体体积之间的平衡关系,且v∈(0,1];n为数据点的个数;εi为松弛变量;φ(xi)为观测数据xi在特征空间的映射;|| ||为诱导范数表示符;
将LSTM模块的输出数据h(xi;W)从原始空间映射到特征空间,然后在特征空间中寻找一个体积最小的超球体,目的是寻找一个能够只包含正常数据的超球体,而将异常留在超球体之外;其中超球体的中心为c,最小半径为R>0;初始化球体中心点和半径构建SVDD模型。在特征空间中,当观测点xi与中心点c距离大于半径R时,则观测点在超球体的外面,该数据被视为异常数据;当观测数据与球心的距离小于半径R时,则观测点被包含在超球体内,该数据被视为正常数据;
S4.采用步骤S2得到的训练数据集,对步骤S3构建的基于LSTM的无监督模型进行训练,从而得到时序数据异常检测模型;具体为采用如下步骤进行训练:
采用如下目标函数对LSTM网络模块和SVDD模块进行联合训练:
Figure BDA0002922483080000083
式中n为数据点的个数;h(xi;W)为LSTM网络的输出结果;c为球体的中心点;λ为松弛因子,且λ>0;W为LSTM网络权重向量;|| ||为诱导范数表示符;|| ||F为F-范数;其中,优化目标包括两项:第一项是用于惩罚LSTM网络表示h(xi;W)到中心c的距离的二次损失,第二项是LSTM的权重衰减正则化;其中第二项还添加一个松弛因子λ(λ>0),为了将数据(平均)尽可能映射到接近中心c,LSTM网络必须提取隐含特征,并且对所有数据点上的平均距离进行惩罚。设置优化目标的学习率为1e-5;
通过随机梯度下降优化算法对权重进行优化调整,并采用相同的学习率对LSTM网络模块和SVDD模块进行联合优化;
采用交替最小化的方法来优化LSTM网络模块的参数和超球体半径;
采用反向传播对LSTM网络模块和SVDD模块进行联合优化;
在执行初始的前向传播后,设置超球体中心的初始值为映射数据的平均值,并在迭代更新超球体半径时,设置迭代次数k;迭代每隔k次,统计一次所有观测点到球心的距离,并取设定的分位数更新为当前的超球体半径值;
S5.采用步骤S4得到的时序数据异常检测模型,对待分析的水处理时序数据序列进行检测,从而实现时序数据的异常检测;具体为对于待分析的水处理时序数据xi,采用如下算式计算该数据到超球面中心的距离,并作为异常分数S(xi):
S(xi)=sgn(||h(xi;W*)-c||2-R2)
式中sgn为符号函数,且若a>0则sgn(a)=-1,若a≤0则sgn(a)=1;h(xi;W*)为LSTM网络的输出结果;c为最终的超球体的中心;R为最终的超球体的半径;|| ||为诱导范数表示符。
本发明的基于LSTM的水处理时序数据异常检测方法,在模型训练完成后,只需要保留训练好的参数,预测时不需要存储任何数据。因此,LSTM-SVDD模型内存复杂度较低。并且该模型通过一种无监督的方式自主学习高维度时序数据集之间内在的依赖关系,提取数据的隐含特征,因此在模型的训练过程中,模型的输入只包含数据集的特征属性,不需考虑数据集的标签,不需要对数据集进行标注。
通过在大规模时序数据生产领域使用本发明,可以实现:对历史时序数据进行预处理,构建无监督的基于LSTM的LSTM-SVDD方法,对预处理后的数据集进行训练,通过联合训练优化目标对LSTM-SVDD方法进行参数调整,得到的已训练模型用于当前时间端产生的数据的异常检测,从而有效的监控系统时序数据序列。
以下通过实验,验证了本发明的时序数据异常检测方法的可行性:采用深度学习基准的度量标准AUCROC对实验结果进行度量。采用三组数据集,分别为:traffic dataset,SWaT,WADI。第一个数据集由京都大学honeypotsystems采集的2013年网络流量数据,本文只用到整个数据集的25%,SWaT和WADI数据集来自是一个大型城市水处理系统。图4为本发明提出的算法与其他几种算法对比,每组算法执行的迭代次数为100次,然后取结果的平均值。如图4所示,基于LSTM的算法由于其内存结构,保存了序列信息,可以获得更高的AUC分数,因此,本发明所提出的方法相对于其他方法检测精度更优,具有很好的异常检测效果。

Claims (8)

1.一种基于LSTM的水处理时序数据异常检测方法,包括如下步骤:
S1.获取用于训练模型的时序数据序列;
S2.对步骤S1获取的时序数据序列进行数据预处理操作,从而得到训练数据集;
S3.构建基于LSTM的无监督模型;
S4.采用步骤S2得到的训练数据集,对步骤S3构建的基于LSTM的无监督模型进行训练,从而得到时序数据异常检测模型;
S5.采用步骤S4得到的时序数据异常检测模型,对待分析的水处理时序数据序列进行检测,从而实现时序数据的异常检测。
2.根据权利要求1所述的一种基于LSTM的水处理时序数据异常检测方法,其特征在于步骤S2所述的对步骤S1获取的时序数据序列进行数据预处理操作,从而得到训练数据集,具体为采用如下步骤得到训练数据集:
A.获取时序数据序列;
B.对步骤A获取的时序数据序列,删除缺失数据和不相关维度的数据,并进行min-max标准化处理,从而将数据值转换到[0,1]区间;
C.针对处理后的数据,将60%的数据作为训练集,40%的数据作为测试集,且保证训练集均为正常数据,测试集中包括10%的异常数据。
3.根据权利要求1所述的一种基于LSTM的水处理时序数据异常检测方法,其特征在于步骤S3所述的构建基于LSTM的无监督模型,具体为采用如下步骤构建模型:
a.采用没有窥孔连接的LSTM框架,并引入门控递归单元架构;遗忘门、输入门和输出门均采用Sigmoid函数作为激活函数;在生成候选记忆时,采用双曲正切函数tanh作为激活函数;最后初始化神经元元个数以及神经元的初始状态,构建LSTM网络模块;
b.设定隐藏层的维度,从而保证LSTM网络模块的输出层的维度低于输入层的维度;
c.针对LSTM网络模块的输出结果,采用Mean-Pooling机制融合各个神经元节点的结果信息,并取LSTM网络模块中每个神经元的输出的平均值作为SVDD模块的输入;
d.将SVDD模块的输入数据从原始空间映射到特征空间,并在特征空间中找到一个体积最小的超球体;所述超球体的内部仅包含正常数据,并将异常数据保留在超球体外部。
4.根据权利要求3所述的一种基于LSTM的水处理时序数据异常检测方法,其特征在于步骤a所述的初始化神经元元个数以及神经元的初始状态,具体为LSTM网络模块的隐藏层神经元个数为256个,dropout比率为0.85,为了防止在后面的训练过程中SVDD的超球面出现坍塌情况,设置LSTM网络模块的权重参数向量为w(·)Tw(·)=I,网络单元的偏置项b(·)为0向量;其中w(·)为LSTM网络的权重向量;b(·)为LSTM网络的偏置向量。
5.根据权利要求4所述的一种基于LST、M的水处理时序数据异常检测方法,其特征在于步骤b所述的设定隐藏层的维度,具体为采用单个隐藏层。
6.根据权利要求5所述的一种基于LSTM的水处理时序数据异常检测方法,其特征在于步骤d所述的SVDD模块,具体为采用如下模型作为SVDD模块的优化问题:
Figure FDA0002922483070000021
Figure FDA0002922483070000031
式中R为体积最小的超球体所对应的半径;α为球体的中心点;v为控制因子,用于控制惩罚因子和球体体积之间的平衡关系,且v∈(0,1];n为数据点的个数;εi为松弛变量;φ(xi)为观测数据xi在特征空间的映射;||||为诱导范数表示符。
7.根据权利要求3~6之一所述的一种基于LSTM的水处理时序数据异常检测方法,其特征在于步骤S4所述的对步骤S3构建的基于LSTM的无监督模型进行训练,具体为采用如下步骤进行训练:
采用如下目标函数对LSTM网络模块和SVDD模块进行联合训练:
Figure FDA0002922483070000032
式中n为数据点的个数;h(xi;W)为LSTM网络的输出结果;c为球体的中心点;λ为松弛因子,且λ>0;W为LSTM网络权重向量;||||为诱导范数表示符;||||F为F-范数;
通过随机梯度下降优化算法对权重进行优化调整,并采用相同的学习率对LSTM网络模块和SVDD模块进行联合优化;
采用交替最小化的方法来优化LSTM网络模块的参数和超球体半径;
采用反向传播对LSTM网络模块和SVDD模块进行联合优化;
在执行初始的前向传播后,设置超球体中心的初始值为映射数据的平均值,并在迭代更新超球体半径时,设置迭代次数k;迭代每隔k次,统计一次所有观测点到球心的距离,并取设定的分位数更新为当前的超球体半径值。
8.根据权利要求7所述的一种基于LSTM的水处理时序数据异常检测方法,其特征在于步骤S5所述的对待分析的水处理时序数据序列进行检测,具体为对于待分析的水处理时序数据xi,采用如下算式计算该数据到超球面中心的距离,并作为异常分数S(xi):
S(xi)=sgn(||h(xi;W*)-c||2-R2)
式中sgn为符号函数,且若a>0则sgn(a)=-1,若a≤0则sgn(a)=1;h(xi;W*)为LSTM网络的输出结果;c为最终的超球体的中心;R为最终的超球体的半径;||||为诱导范数表示符。
CN202110121981.5A 2021-01-29 2021-01-29 一种基于lstm的水处理时序数据异常检测方法 Pending CN112765896A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110121981.5A CN112765896A (zh) 2021-01-29 2021-01-29 一种基于lstm的水处理时序数据异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110121981.5A CN112765896A (zh) 2021-01-29 2021-01-29 一种基于lstm的水处理时序数据异常检测方法

Publications (1)

Publication Number Publication Date
CN112765896A true CN112765896A (zh) 2021-05-07

Family

ID=75706558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110121981.5A Pending CN112765896A (zh) 2021-01-29 2021-01-29 一种基于lstm的水处理时序数据异常检测方法

Country Status (1)

Country Link
CN (1) CN112765896A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255750A (zh) * 2021-05-17 2021-08-13 安徽大学 一种基于深度学习的vcc车辆攻击检测方法
CN114090396A (zh) * 2022-01-24 2022-02-25 华南理工大学 一种云环境多指标无监督异常检测和根因分析方法
CN114912109A (zh) * 2022-07-19 2022-08-16 中孚安全技术有限公司 一种基于图嵌入的异常行为序列识别方法及系统
CN115102746A (zh) * 2022-06-16 2022-09-23 电子科技大学 一种基于行为体积的主机行为在线异常检测方法
CN115099321A (zh) * 2022-06-17 2022-09-23 杭州电子科技大学 双向自回归无监督预训练微调式排污异常监控方法及应用
CN115659249A (zh) * 2022-12-28 2023-01-31 成都大汇物联科技有限公司 一种智能测站控制系统异常检测方法
CN115903741A (zh) * 2022-11-18 2023-04-04 南京信息工程大学 一种工业控制系统数据异常检测方法
CN117332351A (zh) * 2023-10-09 2024-01-02 浙江大学 基于无监督深度学习模型dcvae-svdd的结构异常诊断方法和装置
CN117331339A (zh) * 2023-12-01 2024-01-02 南京华视智能科技股份有限公司 基于时序神经网络模型的涂布机模头电机控制方法及装置
CN117590753A (zh) * 2024-01-17 2024-02-23 长春工业大学 一种基于深度学习的无监督批量控制方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255750B (zh) * 2021-05-17 2022-11-08 安徽大学 一种基于深度学习的vcc车辆攻击检测方法
CN113255750A (zh) * 2021-05-17 2021-08-13 安徽大学 一种基于深度学习的vcc车辆攻击检测方法
CN114090396A (zh) * 2022-01-24 2022-02-25 华南理工大学 一种云环境多指标无监督异常检测和根因分析方法
CN114090396B (zh) * 2022-01-24 2022-06-14 华南理工大学 一种云环境多指标无监督异常检测和根因分析方法
CN115102746A (zh) * 2022-06-16 2022-09-23 电子科技大学 一种基于行为体积的主机行为在线异常检测方法
CN115099321A (zh) * 2022-06-17 2022-09-23 杭州电子科技大学 双向自回归无监督预训练微调式排污异常监控方法及应用
CN115099321B (zh) * 2022-06-17 2023-08-04 杭州电子科技大学 双向自回归无监督预训练微调式排污异常监控方法及应用
CN114912109A (zh) * 2022-07-19 2022-08-16 中孚安全技术有限公司 一种基于图嵌入的异常行为序列识别方法及系统
CN114912109B (zh) * 2022-07-19 2022-12-06 中孚安全技术有限公司 一种基于图嵌入的异常行为序列识别方法及系统
CN115903741B (zh) * 2022-11-18 2024-03-15 南京信息工程大学 一种工业控制系统数据异常检测方法
CN115903741A (zh) * 2022-11-18 2023-04-04 南京信息工程大学 一种工业控制系统数据异常检测方法
CN115659249A (zh) * 2022-12-28 2023-01-31 成都大汇物联科技有限公司 一种智能测站控制系统异常检测方法
CN115659249B (zh) * 2022-12-28 2023-09-19 成都大汇物联科技有限公司 一种智能测站控制系统异常检测方法
CN117332351A (zh) * 2023-10-09 2024-01-02 浙江大学 基于无监督深度学习模型dcvae-svdd的结构异常诊断方法和装置
CN117331339A (zh) * 2023-12-01 2024-01-02 南京华视智能科技股份有限公司 基于时序神经网络模型的涂布机模头电机控制方法及装置
CN117331339B (zh) * 2023-12-01 2024-02-06 南京华视智能科技股份有限公司 基于时序神经网络模型的涂布机模头电机控制方法及装置
CN117590753A (zh) * 2024-01-17 2024-02-23 长春工业大学 一种基于深度学习的无监督批量控制方法

Similar Documents

Publication Publication Date Title
CN112765896A (zh) 一种基于lstm的水处理时序数据异常检测方法
Ding et al. Real-time anomaly detection based on long short-Term memory and Gaussian Mixture Model
CN111967343B (zh) 基于简单神经网络和极端梯度提升模型融合的检测方法
Lin et al. Data-driven missing data imputation in cluster monitoring system based on deep neural network
CN112784965A (zh) 面向云环境下大规模多元时间序列数据异常检测方法
Mukherjee et al. Deep learning-based multilabel classification for locational detection of false data injection attack in smart grids
CN111832647A (zh) 异常流量检测系统及方法
Wu et al. A weighted deep domain adaptation method for industrial fault prognostics according to prior distribution of complex working conditions
Peng et al. Dynamic network embedding via incremental skip-gram with negative sampling
Li et al. Learning robust deep state space for unsupervised anomaly detection in contaminated time-series
Du et al. GAN-based anomaly detection for multivariate time series using polluted training set
CN114500325B (zh) 一种基于无监督迁移学习的sdn控制器故障自适应智能检测方法
Zhang et al. Quantifying the knowledge in a DNN to explain knowledge distillation for classification
Xingrong Research on time series data mining algorithm based on Bayesian node incremental decision tree
Hu et al. Ensemble echo network with deep architecture for time-series modeling
Gao et al. Adversarial mobility learning for human trajectory classification
Shi et al. Dynamic barycenter averaging kernel in RBF networks for time series classification
Kumar et al. An adaptive transformer model for anomaly detection in wireless sensor networks in real-time
CN114500004A (zh) 一种基于条件扩散概率生成模型的异常检测方法
Zhang et al. An intrusion detection method based on stacked sparse autoencoder and improved gaussian mixture model
Zhu et al. Hierarchical reinforcement learning based on KNN classification algorithms
Song et al. Real-time anomaly detection method for space imager streaming data based on HTM algorithm
de Campos Souza et al. Online active learning for an evolving fuzzy neural classifier based on data density and specificity
CN116628612A (zh) 一种无监督异常检测方法、装置、介质及设备
Zhang et al. A hierarchical tensor error correction GRU model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210507