CN116796275A - 一种工业设备多模态时序异常检测方法 - Google Patents
一种工业设备多模态时序异常检测方法 Download PDFInfo
- Publication number
- CN116796275A CN116796275A CN202310765290.8A CN202310765290A CN116796275A CN 116796275 A CN116796275 A CN 116796275A CN 202310765290 A CN202310765290 A CN 202310765290A CN 116796275 A CN116796275 A CN 116796275A
- Authority
- CN
- China
- Prior art keywords
- time
- node
- mode
- time sequence
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000002457 bidirectional effect Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 7
- 230000000644 propagated effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 101100481876 Danio rerio pbk gene Proteins 0.000 claims description 3
- 101100481878 Mus musculus Pbk gene Proteins 0.000 claims description 3
- 230000005856 abnormality Effects 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 230000002159 abnormal effect Effects 0.000 abstract description 9
- 238000007781 pre-processing Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种工业设备多模态时序异常检测方法,包括步骤:对数据进行标准化,并将其转换为时间序列窗口,得到预处理窗口序列数据,利用多模态时间序列数据构造结构有向图;设计多模态时空特征提取网络,通过图注意力网络和时间维卷积网络获取不同级别的模态关联规则,提取时间序列特征;构建时间序列预测模块,模拟后续时间步长的正常输出;联合预测输出和实际输出计算异常分数,识别异常的时间序列。本方法步骤简明,所构建的网络模型结构简单,检测工业设备异常数据的过程快速而又准确。
Description
技术领域
本发明涉及工业时间序列异常检测领域,尤其涉及一种工业设备多模态时序异常检测方法。
背景技术
工业生产过程中,各种传感器和监测设备采集大量数据,例如温度、速度、功率等,这些数据通常按照时间顺序生成。通过对这些多模态时序数据进行异常检测,可以及时发现复杂工况下设备的故障、偏离预期的运行模式或异常行为,避免可能的生产事故和损失,多模态时间序列数据中的高效异常检测和诊断对现代工业应用具有重要意义。然而,如何建立一个能够快速、准确地定位异常数据点的系统是一个具有挑战性的问题。
时间序列异常检测是一个长期研究的问题。在之前的文献中主要研究两种类型的时间序列数据:单变量和多模态。对于前者分析和检测具有单一数据源的时间序列数据的异常情况,而对于后者,多模态时间序列一起分析和检测异常情况。当代的先进技术多以深度学习为基础设计监测架构,有效地利用时间序列数据中的时序依赖关系建模。这些模型能够处理变长序列、捕捉序列中的长期依赖关系,并具备记忆和遗忘的能力,适用于各种复杂的单变量时间序列异常检测任务,但对于具有复杂的空间依赖性和时间依赖性的多模态时间序列,如何处理模态间复杂的非线性关系仍然是个挑战。
发明内容
本发明提供一种基于多注意力时空图卷积的工业设备多模态时序异常检测方法,解决的技术问题在于:如何精准识别多模态时间序列中的异常片段。
为解决以上技术问题,本发明提供一种基于多注意力时空图卷积的工业设备多模态时序异常检测方法,包括步骤:
S1:获取待检测设备的多模态时间序列数据,使用具有特定长度的滑动窗口划分多模态时间序列序列,得到带有位置编码的固定长度的时间序列,利用多模态时间序列数据构造结构有向图以捕获各模态时间序列的行为特征;
S2:设计多模态时空特征提取网络,所述多模态时空特征提取网络包括图注意力网络和时间卷积网络,利用所述结构有向图,通过图注意力网络和时间卷积网络获取不同级别的模态关联规则,提取时间序列特征生成特征向量;
S3:构建时间序列预测模块,所述时间序列预测模块用于生成后续时间步长的预测输出;
S4:通过预测输出和实际输出计算异常分数,识别异常的时间序列。
进一步地,所述多模态时间序列数据由带有T个时间步长的M个模态的时间序列组成,每个模态序列包括N个单变量时间序列,所述多模态时间序列结构有向图G包括N个节点,每个节点存储一个单变量时间序列的表示,节点之间的边表示不同时间序列之间的依赖关系,同时为每个节点定义一个向量v作为嵌入,表示该节点的内在性质,根据有向图G构建邻接矩阵A,A={Aij},表示为:
其中,Aij表示从节点i到节点j的有向边表示,表示候选集,/>表示指示函数,当/>后的式子为真,则指示函数值为1,否则为0,eij表示节点i和节点j的余弦相似度,TopK表示从候选集中选出的与节点i余弦相似度最大的节点的索引值,找到与自身余弦相似度最大的节点,标记有向边,出点为i。
进一步地,所述图注意力网络包括多头注意力模块、模态内注意力模块、模态间注意力模块,所述时间卷积网络包括三个标准卷积层;
所述步骤S2具体包括步骤:
S21:将步骤S1所得的带有位置编码的固定长度的时间序列,输入所述多头注意力模块,计算得到时间序列间独立于模态的空间关系特征;
S22:将步骤S1得到固定长度的时间序列,输入所述模态内注意力模块,计算得到集中于同一模态内不同时间序列的相关性的特征;
S23:将步骤S1得到固定长度的时间序列,输入所述模态间注意力模块,计算得到集中于不同模态间不同时间序列相关性的特征;
S24:连接S21、S22和S23生成的三种特征,输入所述时间卷积网络,在时间维度上应用标准卷积提取特征,得到多模态时空特征,生成特征向量。
进一步地,所述多头注意力模块用于对多模态时间序列之间与模态无关的空间关系进行建模,通过聚合其邻居的表示来更新每个节点的特征表示,计算公式如下:
其中,代表多头注意力模块中第l层第j个节点的特征表示,/>表示多头注意力模块第l+1层上第i个节点的特征表示,S表示注意头的数量,/>表示由第s个注意头计算出的第l层的第i个节点和第j个节点之间的缩放点积注意力分数,/>表示第s个注意头在第l层的权重矩阵。
进一步地,所述模态内注意力模块用于计算每个节点与同一模态内不同时间序列的注意力分数,提取同一模态内时间序列的相关特征,计算公式如下:
其中,表示模态内注意力模块第l+1层上第i个节点的特征表示,/>表示模态内注意力模块第l层的第i个节点和第j个节点之间的注意力分数,/>表示模态内注意力模块第l层权重矩阵。
进一步地,所述模态间注意力模块用于计算每个节点与不同模态的各时间序列注意力分数,提取不同模态间时间序列的相关特征,计算公式如下:
其中,表示模态间注意力模块第l+1层上第i个节点的特征表示,/>表示模态间注意力模块第l层的第i个节点和第j个节点之间的注意力分数,/>表示模态间注意力模块第l层权重矩阵。
进一步地,所述时间序列预测模块包括密集双向门控循环单元和回声状态网络,所述步骤S3具体包括:
S31:将步骤S2所得的特征向量和步骤S1所述的带有位置编码的固定长度的时间序列作为所述密集双向门控循环单元的输入,捕获时间序列特征中存在的依赖性,得到更新后的特征向量;
S32:将更新后的特征向量输入所述回声状态网络,得到预测的时间戳t处的结果。
进一步地,所述密集双向门控循环单元包括三个顺序连接的双向门控循环单元;所述双向门控循环单元包括输入层、三个顺序连接且正向传播的门控循环单元、三个顺序连接且反向传播的门控循环单元和输出层;所述门控循环单元是一种门机制单元,包括更新门和重置门,重置门控制t-1时刻传递过来的特征信息有多少可以被利用,连接t时刻的的输入和t-1时刻的输出并进行线性变换,得到对t时刻信息处理后的结果,将该结果经更新门选择,和t-1时刻的输出权重相加,得到t时刻的输出。
进一步地,所述回声状态网络包括多个输入单元、隐层和多个输出单元;
所述隐层包括多个由随机生成且稀疏连接固定不变的内部权重矩阵得到的神经元,训练前利用一部分训练数据降低隐层噪声,更新至隐层最佳状态,再将特征输入隐层,经过多重线性组合,得到结果。
进一步地,在所述步骤S4中,所述异常分数的计算公式为:
其中,表示时间戳t处第i个节点的真实的结果,/>表示时间戳t处第i个节点的预测的结果,/>表示该时间尺度下第i个节点的的中位数,/>表示该时间尺度下第i个节点的的四分位距,qi(t)表示时间戳t处第i个节点约束在[0,1]范围内的的异常分数,计算预测输出和实际输出之间的误差值并进行归一化处理,若时间戳处的异常分数大于所定义的异常阈值,则该时间戳将被标记为“异常”,否则标记为“正常”。
本发明的有益效果:
本发明通过对数据进行标准化,并将其转换为时间序列窗口,得到预处理窗口序列数据,利用多模态时间序列数据构造结构有向图可以捕获隔膜太时间序列的行为特征;另外,本发明设计了多模态时空特征提取网络,通过图注意力网络和时间卷积网络可以获取不同级别的模态关联规则,从而提取时间序列特征;接着,本发明又构建时间序列预测模块,用于模拟后续时间步长的正常输出,并通过联合预测输出和实际输出计算异常分数,识别异常的时间序列。本方法构造的基于图注意力的时空特征提取网络,通过捕捉不同模态之间的和同一模态间不同时间序列的依赖关系,可以预测复杂工况下的输出,通过对比重构数据点和实际数据点,找出异常点。本方法的步骤简明,所构建的网络模型结构简单,检测工业设备异常数据的过程快速而又准确。
附图说明
图1是本发明实施例提供的一种基于多注意力时空图卷积的工业设备多模态时序异常检测方法的原理图;
图2是本发明实施例提供的多注意力时空图卷积异常检测网络的架构图。
具体实施方式
下面结合附图具体阐明本发明的实施方式,实施例的给出仅仅是为了说明目的,并不能理解为对本发明的限定,包括附图仅供参考和说明使用,不构成对本发明专利保护范围的限制,因为在不脱离本发明精神和范围基础上,可以对本发明进行许多改变。
为解决以上技术问题,本发明提供基于多注意力时空图卷积的工业设备多模态时序异常检测方法,如图1所示,该方法包括步骤:
S1:获取待检测设备的多模态时间序列数据,使用具有特定长度的滑动窗口划分多模态时间序列序列,得到带有位置编码的固定长度的时间序列,利用多模态时间序列数据构造结构有向图(即时序结构有向图)以捕获各模态时间序列的行为特征;
S2:设计多模态时空特征提取网络,所述多模态时空特征提取网络包括图注意力网络和时间卷积网络(或称为“时间维卷积网络”),利用所述结构有向图,通过图注意力网络和时间卷积网络获取不同级别的模态关联规则,提取时间序列特征生成特征向量;
S3:构建时间序列预测模块,所述时间序列预测模块用于生成后续时间步长的预测输出;
S4:通过预测输出和实际输出计算异常分数,识别异常的时间序列。
在一些实施例中,所述S1中,所述多模态时间序列数据由带有T个时间步长的M个模态的时间序列组成,每个模态序列包括N个单变量时间序列,所述多模态时间序列结构有向图G包括N个节点,每个节点存储一个单变量时间序列的表示,节点之间的边表示不同时间序列之间的依赖关系,同时为每个节点定义一个向量v作为嵌入,表示该节点的内在性质,根据有向图G构建邻接矩阵A,A={Aij},表示为:
其中,Aij表示从节点i到节点j的有向边表示,表示候选集,/>表示指示函数,当/>后的式子为真,则指示函数值为1,否则为0,eij表示节点i和节点j的余弦相似度,TopK表示从候选集中选出的与节点i余弦相似度最大的节点的索引值,找到与自身余弦相似度最大的节点,标记有向边,出点为i。
在一些实施例中,所述图注意力网络包括多头注意力模块、模态内注意力模块、模态间注意力模块,所述时间卷积网络包括三个标准卷积层(如图2所示),步骤S2具体包括步骤:
S21:将所述带有位置编码的固定长度的时间序列,输入所述多头注意力模块,计算得到时间序列间独立于模态的空间关系特征;
S22:所述步骤S1得到固定长度的时间序列,输入所述模态内注意力模块,计算得到集中于同一模态内不同时间序列的相关性的特征;
S23:所述步骤S1得到固定长度的时间序列,输入所述模态间注意力模块,计算得到集中于不同模态间不同时间序列相关性的特征;
S24:连接S21、S22和S23得到的三种特征,输入所述时间卷积层网络中,在时间维度上应用标准卷积提取特征,得到多模态时空特征。
在一些实施例中,所述多头注意力模块可以用于对多模态时间序列之间与模态无关的空间关系进行建模,通过聚合其邻居的表示来更新每个节点的特征表示,计算公式如下:
其中,代表图注意力网络中的多头注意力模块的第l层第j个节点的特征表示,表示多头注意力模块的第l+1层上第i个节点的特征表示,S表示注意头的数量,/>表示由第s个注意头计算出的第l层的第i个节点和第j个节点之间的缩放点积注意力分数,表示第s个注意头在第l层的权重矩阵。
所述模态内注意力模块用于计算每个节点与同一模态内不同时间序列的注意力分数,提取同一模态内时间序列的相关特征,计算公式如下:
其中,表示模态内注意力模块第l+1层上第i个节点的特征表示,/>表示模态内注意力模块第l层的第i个节点和第j个节点之间的注意力分数,/>表示模态内注意力模块第l层权重矩阵。
所述模态间注意力模块用于计算每个节点与不同模态的各时间序列注意力分数,提取不同模态间时间序列的相关特征,计算公式如下:
其中,表示模态间注意力模块第l+1层上第i个节点的特征表示,/>表示模态间注意力模块第l层的第i个节点和第j个节点之间的注意力分数,/>表示模态间注意力模块第l层权重矩阵。
在一些实施例中,在步骤S3中,搭建预测网络对时间序列进行重构,预测输出。所述预测模块具体包括密集双向门控循环单元和回声状态网络。
所述步骤S3具体包括:
S31:取步骤S2所得的特征向量和步骤S1所述的带有位置编码的固定长度的时间序列作为所述密集双向门控循环单元的输入,在保留现有的特征的同时,加强特征学习能力,深入捕获时间序列特征中存在的依赖性以对特征向量进行更新,从而得到更新后的特征向量;
S32:将更新后的特征向量输入所述回声状态网络,得到预测的与所述特征向量对应的时间戳t处的结果。
在一些实施例中,所述密集双向门控循环单元包括三个顺序连接的双向门控循环单元;所述双向门控循环单元包括输入层、三个顺序连接且正向传播的门控循环单元、三个顺序连接且反向传播的门控循环单元和输出层;所述门控循环单元是一种门机制单元,包括更新门和重置门。重置门控制t-1时刻传递过来的特征信息有多少可以被利用,连接t时刻的的输入和t-1时刻的输出并进行线性变换,得到对t时刻信息处理后的结果。将该结果经更新门选择,并和t-1时刻的输出权重相加,从而得到t时刻的输出,从而生成更新后的特征向量。
在一些实施例中,所述回声状态网络包括多个输入单元、隐层和多个输出单元。所述隐层包括多个由随机生成且稀疏连接固定不变的内部权重矩阵得到的神经元。训练前利用一部分训练数据降低隐层噪声,更新至隐层最佳状态,再将特征输入隐层,经过多重线性组合,得到预测结果(即预测输出)。
在步骤S4中,利用异常分数,即重构输出(即预测输出)和实际输出之间的误差,判断当前时间戳对应的时间数据是否为异常数据。所述异常分数的计算公式为:
其中,表示时间戳t处第i个节点的真实的结果,/>表示时间戳t处第i个节点的预测的结果,/>表示该时间尺度下第i个节点的的中位数,/>表示该时间尺度下第i个节点的的四分位距,qi(t)表示时间戳t处第i个节点约束在[0,1]范围内的的异常分数,通过计算预测输出和实际输出之间的误差值并进行归一化处理,若时间戳处的异常分数大于所定义的异常阈值,则该时间戳将被标记为“异常”,否则标记为“正常”。
进一步地,将本发明方法与其他时间序列异常检测技术进行比较,如表1所示,评价指标为精确率、召回率、ROC曲线下的面积(AUC)和F1分数。通过表1可知,与其他基线模型相比,本发明方法考虑数据序列中的局部峰值,设置更准确的门槛值,同时使用对抗性训练明确映射时间信息,放大错误,改进其他基线模型中的不足,实现了较高的得分。
表1
综上,本发明实施例提供的基于多注意力时空图卷积的工业设备多模态时序异常检测方法,利用多模态时间序列数据构造结构有向图;设计多模态时空特征提取网络,通过图注意力网络和时间维卷积网络获取不同级别的模态关联规则,提取时间序列特征;构建时间序列预测模块,模拟后续时间步长的正常输出;联合预测输出和实际输出计算异常分数,识别异常的时间序列。本方法构造了一个基于图注意力的时空特征提取网络,通过捕捉不同模态之间的和同一模态间不同时间序列的依赖关系,预测复杂工况下的输出,通过对比重构数据点和实际数据点,找出异常点。本方法步骤简明,所构建的网络模型结构简单,检测工业设备异常数据的过程快速而又准确。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.一种工业设备多模态时序异常检测方法,其特征在于,包括步骤:
S1:获取待检测设备的多模态时间序列数据,使用具有特定长度的滑动窗口划分多模态时间序列序列,得到带有位置编码的固定长度的时间序列,利用多模态时间序列数据构造结构有向图以捕获各模态时间序列的行为特征;
S2:设计多模态时空特征提取网络,所述多模态时空特征提取网络包括图注意力网络和时间卷积网络,利用所述结构有向图,通过图注意力网络和时间卷积网络获取不同级别的模态关联规则,提取时间序列特征生成特征向量;
S3:构建时间序列预测模块,所述时间序列预测模块用于生成后续时间步长的预测输出;
S4:通过预测输出和实际输出计算异常分数,识别异常的时间序列。
2.根据权利要求1所述的一种工业设备多模态时序异常检测方法,其特征在于,所述多模态时间序列数据由带有T个时间步长的M个模态的时间序列组成,每个模态序列包括N个单变量时间序列,所述多模态时间序列结构有向图G包括N个节点,每个节点存储一个单变量时间序列的表示,节点之间的边表示不同时间序列之间的依赖关系,同时为每个节点定义一个向量v作为嵌入,表示该节点的内在性质,根据有向图G构建邻接矩阵A,A={Aij},表示为:
其中,Aij表示从节点i到节点j的有向边表示,表示候选集,/>表示指示函数,当/>后的式子为真,则指示函数值为1,否则为0,eij表示节点i和节点j的余弦相似度,TopK表示从候选集中选出的与节点i余弦相似度最大的节点的索引值,找到与自身余弦相似度最大的节点,标记有向边,出点为i。
3.根据权利要求1所述的一种工业设备多模态时序异常检测方法,其特征在于,所述图注意力网络包括多头注意力模块、模态内注意力模块、模态间注意力模块,所述时间卷积网络包括三个标准卷积层;
所述步骤S2具体包括步骤:
S21:将步骤S1所得的带有位置编码的固定长度的时间序列,输入所述多头注意力模块,计算得到时间序列间独立于模态的空间关系特征;
S22:将步骤S1得到固定长度的时间序列,输入所述模态内注意力模块,计算得到集中于同一模态内不同时间序列的相关性的特征;
S23:将步骤S1得到固定长度的时间序列,输入所述模态间注意力模块,计算得到集中于不同模态间不同时间序列相关性的特征;
S24:连接S21、S22和S23生成的三种特征,输入所述时间卷积网络,在时间维度上应用标准卷积提取特征,得到多模态时空特征,生成特征向量。
4.根据权利要求3所述的一种工业设备多模态时序异常检测方法,其特征在于,所述多头注意力模块用于对多模态时间序列之间与模态无关的空间关系进行建模,通过聚合其邻居的表示来更新每个节点的特征表示,计算公式如下:
其中,代表多头注意力模块中第l层第j个节点的特征表示,/>表示多头注意力模块第l+1层上第i个节点的特征表示,S表示注意头的数量,/>表示由第s个注意头计算出的第l层的第i个节点和第j个节点之间的缩放点积注意力分数,/>表示第s个注意头在第l层的权重矩阵。
5.根据权利要求3所述的一种工业设备多模态时序异常检测方法,其特征在于,所述模态内注意力模块用于计算每个节点与同一模态内不同时间序列的注意力分数,提取同一模态内时间序列的相关特征,计算公式如下:
其中,表示模态内注意力模块第l+1层上第i个节点的特征表示,/>表示模态内注意力模块第l层的第i个节点和第j个节点之间的注意力分数,/>表示模态内注意力模块第l层权重矩阵。
6.根据权利要求3所述的一种工业设备多模态时序异常检测方法,其特征在于,所述模态间注意力模块用于计算每个节点与不同模态的各时间序列注意力分数,提取不同模态间时间序列的相关特征,计算公式如下:
其中,表示模态间注意力模块第l+1层上第i个节点的特征表示,/>表示模态间注意力模块第l层的第i个节点和第j个节点之间的注意力分数,/>表示模态间注意力模块第l层权重矩阵。
7.根据权利要求1所述的一种工业设备多模态时序异常检测方法,其特征在于,所述时间序列预测模块包括密集双向门控循环单元和回声状态网络,所述步骤S3具体包括:
S31:将步骤S2所得的特征向量和步骤S1所述的带有位置编码的固定长度的时间序列作为所述密集双向门控循环单元的输入,捕获时间序列特征中存在的依赖性,得到更新后的特征向量;
S32:将更新后的特征向量输入所述回声状态网络,得到预测的时间戳t处的结果。
8.根据权利要求7所述的一种工业设备多模态时序异常检测方法,其特征在于,所述密集双向门控循环单元包括三个顺序连接的双向门控循环单元;所述双向门控循环单元包括输入层、三个顺序连接且正向传播的门控循环单元、三个顺序连接且反向传播的门控循环单元和输出层;所述门控循环单元是一种门机制单元,包括更新门和重置门,重置门控制t-1时刻传递过来的特征信息有多少可以被利用,连接t时刻的的输入和t-1时刻的输出并进行线性变换,得到对t时刻信息处理后的结果,将该结果经更新门选择,和t-1时刻的输出权重相加,得到t时刻的输出。
9.根据权利要求7所述的一种工业设备多模态时序异常检测方法,其特征在于,所述回声状态网络包括多个输入单元、隐层和多个输出单元;
所述隐层包括多个由随机生成且稀疏连接固定不变的内部权重矩阵得到的神经元,训练前利用一部分训练数据降低隐层噪声,更新至隐层最佳状态,再将特征输入隐层,经过多重线性组合,得到预测输出。
10.根据权利要求1所述的一种工业设备多模态时序异常检测方法,其特征在于,在所述步骤S4中,所述异常分数的计算公式为:
其中,表示时间戳t处第i个节点的真实的结果,/>表示时间戳t处第i个节点的预测的结果,/>表示该时间尺度下第i个节点的的中位数,/>表示该时间尺度下第i个节点的的四分位距,qi(t)表示时间戳t处第i个节点约束在[0,1]范围内的的异常分数,通过计算预测输出和实际输出之间的误差值并进行归一化处理,若时间戳处的异常分数大于所定义的异常阈值,则该时间戳将被标记为“异常”,否则标记为“正常”。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310765290.8A CN116796275A (zh) | 2023-06-27 | 2023-06-27 | 一种工业设备多模态时序异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310765290.8A CN116796275A (zh) | 2023-06-27 | 2023-06-27 | 一种工业设备多模态时序异常检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116796275A true CN116796275A (zh) | 2023-09-22 |
Family
ID=88047828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310765290.8A Pending CN116796275A (zh) | 2023-06-27 | 2023-06-27 | 一种工业设备多模态时序异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116796275A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117725543A (zh) * | 2024-02-18 | 2024-03-19 | 中国民航大学 | 一种多元时间序列异常预测方法、电子设备及存储介质 |
-
2023
- 2023-06-27 CN CN202310765290.8A patent/CN116796275A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117725543A (zh) * | 2024-02-18 | 2024-03-19 | 中国民航大学 | 一种多元时间序列异常预测方法、电子设备及存储介质 |
CN117725543B (zh) * | 2024-02-18 | 2024-05-03 | 中国民航大学 | 一种多元时间序列异常预测方法、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110610035B (zh) | 一种基于gru神经网络的滚动轴承剩余寿命预测方法 | |
Yu et al. | A neural network ensemble-based model for on-line monitoring and diagnosis of out-of-control signals in multivariate manufacturing processes | |
CN108960303B (zh) | 一种基于lstm的无人机飞行数据异常检测方法 | |
CN115018021B (zh) | 基于图结构与异常注意力机制的机房异常检测方法及装置 | |
CN114386521A (zh) | 时间序列数据的异常检测方法、系统、设备和存储介质 | |
KR20190072652A (ko) | 정보 처리 장치 및 정보 처리 방법 | |
CN116796275A (zh) | 一种工业设备多模态时序异常检测方法 | |
CN116522265A (zh) | 工业互联网时序数据异常检测方法及装置 | |
Ye et al. | A deep learning-based method for automatic abnormal data detection: Case study for bridge structural health monitoring | |
CN116557787A (zh) | 管网状态智能评估系统及其方法 | |
Xu et al. | Global attention mechanism based deep learning for remaining useful life prediction of aero-engine | |
CN114169091A (zh) | 工程机械部件剩余寿命的预测模型建立方法及预测方法 | |
CN116843080B (zh) | 一种基于机器学习的尿素生产碳元素足迹预测方法及系统 | |
Zhou et al. | An adaptive remaining useful life prediction model for aeroengine based on multi-angle similarity | |
Li et al. | Knowledge enhanced ensemble method for remaining useful life prediction under variable working conditions | |
Yu et al. | A hybrid learning-based model for on-line monitoring and diagnosis of out-of-control signals in multivariate manufacturing processes | |
Wenqiang et al. | Remaining useful life prediction for mechanical equipment based on temporal convolutional network | |
Du et al. | Online intelligent monitoring and diagnosis of aircraft horizontal stabilizer assemble processes | |
CN116304849A (zh) | 一种基于局部切空间排列及门控循环网络的二维活塞泵故障诊断方法 | |
JP2016520220A (ja) | 隠れ属性モデル推定装置、方法およびプログラム | |
Lu et al. | Relation-aware attentive neural processes model for remaining useful life prediction | |
Baghel et al. | Software effort estimation using parameter tuned models | |
Hodapp | Unsupervised learning for computational phenotyping | |
Ceylan et al. | Siamese inception time network for remaining useful life estimation | |
CN116561528B (zh) | 一种旋转机械的rul预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |