CN113255733A - 多模态数据缺失下的无监督异常检测方法 - Google Patents

多模态数据缺失下的无监督异常检测方法 Download PDF

Info

Publication number
CN113255733A
CN113255733A CN202110474161.4A CN202110474161A CN113255733A CN 113255733 A CN113255733 A CN 113255733A CN 202110474161 A CN202110474161 A CN 202110474161A CN 113255733 A CN113255733 A CN 113255733A
Authority
CN
China
Prior art keywords
sample
anomaly detection
formula
encoder
modal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110474161.4A
Other languages
English (en)
Other versions
CN113255733B (zh
Inventor
陈景龙
冯勇
訾艳阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202110474161.4A priority Critical patent/CN113255733B/zh
Publication of CN113255733A publication Critical patent/CN113255733A/zh
Application granted granted Critical
Publication of CN113255733B publication Critical patent/CN113255733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种多模态数据缺失下的无监督异常检测方法,利用多个工业传感器采集机械设备运行状态数据,建立多模态数据集,对该数据集进行预处理,并将预处理后的数据集划分为训练集与测试集;构建用于多模态数据缺失下异常检测的无监督深度网络模型;然后使用训练集对所构建的深度模型进行训练;对训练集进行推理并得到训练集样本异常值,使用核密度估计重建训练集样本异常值的概率分布,根据该分布和置信度确定异常检测阈值;对测试集进行推理并得到测试集样本的异常值,根据阈值给出测试集样本的异常检测结果。本发明基于无监督学习框架,充分挖掘和利用多模态数据信息,为在任意模态数据缺失下的异常检测提供了一种有效方案。

Description

多模态数据缺失下的无监督异常检测方法
技术领域
本发明涉及异常检测领域,特别涉及一种多模态数据缺失下的无监督异常检测方法。
背景技术
随着现代机械装备向大型化、精密化以及智能化等方向发展,对机械设备异常尤其是系统级异常的检测极具挑战性。为保证复杂装备(如航空航天发动机)异常检测的可靠性,普遍采用来自多个传感器的多模态数据进行分析决策。然而,在高温、高压、强振动等恶劣的设备工况下,某些传感器失灵甚至脱落导致所获得多模态数据某些通道数据缺失,从而造成数据模态不完整,为多模态数据分析带来困难,同时降低了异常检测结果的准确率。因此,研究多模态数据缺失下的异常检测技术具有重要工程应用价值。
基于机器学习如支持向量机、K邻近、孤立森林、主成分分析等方法的传统异常检测模型,在处理工业大数据时代下的海量数据时,其特征提取能力、不同应用场景下的模型泛化能力、检测结果的准确性等方面存在明显的局限性。近年来,得益于深度学习的迅速发展,大量智能异常检测方法受到不同领域研究人员的广泛关注并开展了相关工作。然而,大多深度异常检测方法只针对单一模态而无法直接应用于多模态异常检测;而现有针对多模态数据的研究工作则建立在数据结构完整的假设之上,无法有效处理模态缺失的情况。因此,需要研究一种可有效处理多模态数据及模态缺失情况的深度异常检测方法。
发明内容
本发明的目的在于提供一种多模态数据缺失下的无监督异常检测方法,以克服现有技术无法进行多模态数据缺失下异常检测的缺陷,本发明基于深度学习框架,构建两个特征融合模块以实现缺失模态重建、模态内融合以及模态间融合,利用两次重构损失和隐空间特征差异度来表征检测对象的异常程度,最终实现无监督的多模态异常检测。
为达到上述目的,本发明采用如下技术方案:
多模态数据缺失下的无监督异常检测方法,包括以下步骤:
步骤1:利用多个工业传感器采集机械设备运行状态数据,建立多模态数据集,对该数据集进行预处理,并将预处理后的数据集划分为训练集与测试集;
步骤2:构建用于多模态数据缺失下异常检测的无监督深度网络模型;
步骤3:使用步骤1中的训练集对步骤2中构建的无监督深度网络模型进行训练;
步骤4:使用步骤3得到的异常检测模型对步骤1中的训练集进行推理并得到训练集样本异常值,重建训练集样本异常值的概率分布,根据该分布和置信度确定异常检测阈值;
步骤5:使用步骤3得到的异常检测模型对步骤1中的测试集进行推理并得到测试集样本的异常值,根据步骤4得到的阈值给出测试集样本的异常检测结果。
进一步地,步骤1中的预处理过程包括样本化、标签化和归一化;
对多模态数据集进行样本化处理,具体为:使用固定长度的滑动时窗从该数据集包含的多传感器时间序列中逐一提取样本,公式为:
Figure BDA0003046446360000031
式中:
Figure BDA0003046446360000032
为第k个样本,xj为第j个传感器获得的时间序列,M为模态个数,Si代表第i个模态内的源数目即传感器个数,L为时窗长度,di为该样本第i模态缺失源的数目;
对样本化的数据集进行归一化处理,公式如下:
Figure BDA0003046446360000033
式中:
Figure BDA0003046446360000034
为未归一化样本的第i个分量,x(i)为归一化样本的第i个分量,min(·)为取最小值函数,max(·)为取最大值函数;
对归一化的数据集进行标签化处理,样本标签为二维元组(A,B),其中,A代表样本来源设备的运行状态,B表示样本模态是否完整,具体为:将设备正常运行状态下获得的样本即正常样本标记为A=0,将设备异常状态下获得的样本即异常样本标记为A=1;将模态缺失即di>0的样本标记为B=0,将模态完整即di=0的样本标记为B=1;
对标签化的数据集进行划分:从标签为(0,1)的样本中选取1/3作为训练集,将其余样本作为测试集。
进一步地,步骤2中所述用于多模态数据缺失下异常检测的无监督深度网络模型由两个模块组成:第一个模块为自编码器组,第二个模块为具有跳跃连接的多通道自编码器;其中,第一个模块中每个自编码器由编码器、全连层和解码器组成,第二个模块由编码器和解码器组成;两个模块中,每个编码器均由多个下卷积块组成,下卷积块由卷积层、批归一化层和LeakyReLU函数层构成;每个解码器由多个上卷积块组成,上卷积块由转置卷积层、批归一化层和ReLU函数层构成。
进一步地,第一个模块实现模态内融合和缺失模态重建;编码器将输入的多模态数据映射到隐空间,过程表示为:
Figure BDA0003046446360000041
式中:
Figure BDA0003046446360000042
为第i模态中第j源x(i,j)经过编码器
Figure BDA0003046446360000043
和全连层后得到的隐向量,W1、W2分别表示两个全连层的权重,b1、b2分别表示两个全连层的偏置,δ为激活函数;
通过模态内融合重建缺失模态,公式如下:
Figure BDA0003046446360000044
Figure BDA0003046446360000045
Figure BDA0003046446360000046
Figure BDA0003046446360000047
式中:a(i,j)为模态内融合权重;
Figure BDA0003046446360000048
表示向量
Figure BDA0003046446360000049
的第k个分量,Nz为该向量的长度;
Figure BDA00030464463600000410
为第i模态特征的平均表示,ε为一个极小的正数;
Figure BDA00030464463600000411
为所有模态特征的平均表示;
Figure BDA00030464463600000412
为重建的第i模态中第j源隐向量;
解码器将多模态隐向量映射到样本空间,过程表示为:
Figure BDA00030464463600000413
式中:
Figure BDA00030464463600000414
为由编码器
Figure BDA00030464463600000415
得到的第一次重构样本的第i模态第j源。
进一步地,第二个模块实现模态间融合,具有跳跃连接的多通道自编码器每一层的处理过程为:
Figure BDA0003046446360000051
Figure BDA0003046446360000052
式中:
Figure BDA0003046446360000053
为第二个模块中编码器第k层
Figure BDA0003046446360000054
的输入,
Figure BDA0003046446360000055
为该层输出;
Figure BDA0003046446360000056
为第二个模块中解码器第k层
Figure BDA0003046446360000057
的输出,
Figure BDA0003046446360000058
为第二个模块中解码器第k+1层
Figure BDA0003046446360000059
的输出,
Figure BDA00030464463600000510
为特征维度拼接操作,第二个模块前向传播过程表示为:
Figure BDA00030464463600000511
Figure BDA00030464463600000512
式中:z2为第一次重构样本
Figure BDA00030464463600000513
经过编码器E2得到的隐向量,
Figure BDA00030464463600000514
由第一个模块得到的重构数据
Figure BDA00030464463600000515
拼接而成;
Figure BDA00030464463600000516
为由编码器D2得到的第二次重构样本。
进一步地,步骤3中对模型进行训练的优化目标为:
minL(x)=λ1R1(x)+λ2R2(x)+λ3Dz(x)
式中:L(x)为样本x的损失计算函数,λ1>0、λ2>0、λ3<0分别为三个常数因子,R1(x)、R2(x)、Dz(x)分别表示为第一次重构损失、第二次重构损失、隐空间特征差异度,其计算公式分别为:
Figure BDA00030464463600000517
Figure BDA00030464463600000518
Dz(x)=||z1-z2||1
式中:
Figure BDA00030464463600000519
分别表示第一次重构样本的第i模态第j源、第二次重构样本的第i模态第j源;z1为第一个模块中的隐向量和,即
Figure BDA00030464463600000520
z2为第二个模块中的隐向量;‖·‖1为平滑的一次损失函数,表达式为:
Figure BDA00030464463600000521
式中:z1(k)、z2(k)分别表示两个向量的第k分量。
进一步地,步骤4中和步骤5中通过模型推理得到样本得异常值,其表达式如下:
sx=λ1R1(x)+λ2R2(x)+λzDz(x)
式中:sx为样本x的异常值,λz<0为常系数。
进一步地,步骤4中使用核密度估计法对训练集异常值的概率分布进行估计和重建,公式如下:
Figure BDA0003046446360000061
式中:f(x;h)表示带宽为h时点x处的概率密度,N表示训练集样本数量,si表示第i个样本的异常值,K表示核函数;
根据该分布可确定异常检测阈值如下:
Figure BDA0003046446360000062
式中:τ为阈值,μf与σf为概率分布的均值与方差,U为标准正态分布的上侧分位数,α为置信度。
进一步地,步骤5对测试集样本进行异常检测,表示如下:
Figure BDA0003046446360000063
式中:AD(x)表示样本x的异常检测结果。
与现有技术相比,本发明具有以下有益的技术效果:
1)本发明提供了一种有效处理多模态数据的无监督异常检测方法,通过无监督深度模型对多模态数据进行模态内融合以及模态间融合,充分挖掘模态之间的深度非线性关系,为检测对象异常值的确定提供了有效的深层抽象特征;
2)本发明可针对任意数量传感器通道数据缺失下的异常检测,克服传统技术无法利用结构不完整多模态数据进行异常检测的缺陷,通过模态内融合技术重建缺失模态,可实现对结构完整或模态数据缺失下的多模态数据分析;
3)本发明中检测对象异常值由一次重构损失、二次重构损失、隐空间特征差异度等三个指标构成,提高了检测模型对复杂工况下多模态样本的检测可靠性和检测精度。
附图说明
图1为本发明方法的流程图;
图2为本发明方法所构建模型的结构图;
图3为本发明方法(UU-Net)与对比方法在多模态数据缺失下的异常检测结果柱状图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明,以便本领域的技术人员更好地理解本发明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。为了便于描述,附图中仅示出了与有关发明相关的部分。还需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
一种多模态数据缺失下的无监督异常检测方法,参见图1,包括以下步骤:
步骤1:利用多个工业传感器采集机械设备运行状态数据,建立多模态数据集,对该数据集进行预处理,并将预处理后的数据集划分为训练集与测试集。
首先,对数据集进行预处理,具体包括样本化、标签化和归一化。
对多模态数据集进行样本化处理,具体为:使用固定长度的滑动时窗从该数据集包含的多传感器时间序列中逐一提取样本,公式为:
Figure BDA0003046446360000081
式中:
Figure BDA0003046446360000082
为第k个样本,xj为第j个传感器获得的时间序列,M为模态个数,Si代表第i个模态内的源数目即传感器个数,L为时窗长度,di为该样本第i模态缺失源的数目。
样本化操作目的有以下两个:一是将异检测模型输入规范化,如固定长度、固定维度等;二是提高异常检测灵敏度,不对传感器采集的长序列进行分析,而是针对某个时刻附近的信息。
对样本化的数据集进行归一化处理,具体表示如下:
Figure BDA0003046446360000083
式中:
Figure BDA0003046446360000084
为未归一化样本的第i个分量,x(i)为归一化样本的第i个分量,min(·)为取最小值函数,max(·)为取最大值函数。
对归一化的数据集进行标签化处理,样本标签形式为二维元组(A,B),其中,A代表样本来源设备的运行状态,B表示样本模态是否完整,具体为:将设备正常运行状态下获得的样本即正常样本标记为A=0,将设备异常状态下获得的样本即异常样本标记为A=1;将模态缺失即di>0的样本标记为B=0,将模态完整即di=0的样本标记为B=1。
预处理之后,对标签化的数据集进行划分:从标签为(0,1)的样本中选取1/3作为训练集,将其余样本作为测试集。亦即:从正常且完整的样本中选出部分作为训练集,而测试集包含——正常且完整样本、异常且完整样本、正常且不完整样本、异常且不完整样本。
步骤2:构建用于多模态数据缺失下异常检测的无监督深度网络模型。
如图2所示,所构建的多模态数据缺失下异常检测的无监督深度网络模型由两个模块组成:第一个模块为自编码器组,第二个模块为具有跳跃连接的多通道自编码器。其中,第一个模块中每个自编码器由编码器、全连层和解码器组成,第二个模块由编码器和解码器组成。两个模块中,每个编码器由多个下卷积块组成,下卷积块由卷积层、批归一化层和LeakyReLU函数层构成;每个解码器由多个上卷积块组成,上卷积块由转置卷积层、批归一化层和ReLU函数层构成。
其中,第一个模块实现模态内融合和缺失模态重建。编码器将输入的多模态数据从样本空间映射到隐空间,过程表示为:
Figure BDA0003046446360000091
式中:
Figure BDA0003046446360000092
为第i模态中第j源x(i,j)经过编码器
Figure BDA0003046446360000093
和全连层后得到的隐向量,W1、W2分别表示两个全连层的权重,b1、b2分别表示两个全连层的偏置,δ为激活函数;
通过模态内融合重建缺失模态,公式如下:
Figure BDA0003046446360000094
Figure BDA0003046446360000095
Figure BDA0003046446360000096
Figure BDA0003046446360000101
式中:a(i,j)为模态内融合权重;
Figure BDA0003046446360000102
表示向量
Figure BDA0003046446360000103
的第k个分量,Nz为该向量的长度;
Figure BDA0003046446360000104
为第i模态特征的平均表示,ε为一个极小的正数;
Figure BDA0003046446360000105
为所有模态特征的平均表示;
Figure BDA0003046446360000106
为重建的第i模态中第j源隐向量;
此时,缺失模态的特征隐向量已经借助于模态内其他源得到了重建,再通过解码器便可以得到重建的结构完整的多模态样本。
解码器将多模态隐向量映射到样本空间,过程表示为:
Figure BDA0003046446360000107
式中:
Figure BDA0003046446360000108
为由编码器
Figure BDA0003046446360000109
得到的第一次重构样本的第i模态第j源。
第二个模块实现模态间融合,具有跳跃连接的多通道自编码器每一层的处理过程为:
Figure BDA00030464463600001010
Figure BDA00030464463600001011
式中:
Figure BDA00030464463600001012
为第二个模块中编码器第k层
Figure BDA00030464463600001013
的输入,
Figure BDA00030464463600001014
为该层输出;
Figure BDA00030464463600001015
为第二个模块中解码器第k层
Figure BDA00030464463600001016
的输出,
Figure BDA00030464463600001017
为第二个模块中解码器第k+1层
Figure BDA00030464463600001018
的输出,
Figure BDA00030464463600001019
为特征维度拼接操作。第二个模块前向传播过程表示为:
Figure BDA00030464463600001020
Figure BDA00030464463600001021
式中:z2为第一次重构样本
Figure BDA00030464463600001022
经过编码器E2得到的隐向量,
Figure BDA00030464463600001023
由第一个模块得到的重构数据
Figure BDA00030464463600001024
拼接而成;
Figure BDA00030464463600001025
为由编码器D2得到的第二次重构样本。
步骤3:使用步骤1中的训练集对步骤2中构建的模型进行训练。
该步骤旨在对所构建模型进行充分的训练,优化目标为:
minL(x)=λ1R1(x)+λ2R2(x)+λ3Dz(x)
式中:L(x)为样本x的损失计算函数,λ1>0、λ2>0、λ3<0分别为三个常数因子,R1(x)、R2(x)、Dz(x)分别表示为第一次重构损失、第二次重构损失、隐空间特征差异度,其计算公式分别为:
Figure BDA0003046446360000111
Figure BDA0003046446360000112
Dz(x)=||z1-z2||1
式中:
Figure BDA0003046446360000113
分别表示第一次重构样本的第i模态第j源、第二次重构样本的第i模态第j源;z1为第一个模块中的隐向量和,即
Figure BDA0003046446360000114
z2为第二个模块中的隐向量;‖·‖1为平滑的一次损失函数,表达式为:
Figure BDA0003046446360000115
式中:z1(k)、z2(k)分别表示两个向量的第k分量。
步骤4:使用步骤3得到的异常检测模型对步骤1中的训练集进行推理并得到训练集样本异常值,重建训练集样本异常值的概率分布,根据该分布和置信度确定异常检测阈值。
通过模型推理得到样本得异常值,包括一次重构损失、二次重构损失、隐空间特征差异度等,其表达式如下:
sx=λ1R1(x)+λ2R2(x)+λzDz(x)
式中:sx为样本x的异常值,λz<0为常系数。
由于训练集样本数量有限,直接确定的阈值是有偏的,因此使用核密度估计法对训练集异常值的概率分布进行估计和重建,公式如下:
Figure BDA0003046446360000121
式中:f(x;h)表示带宽为h时点x处的概率密度,N表示训练集样本数量,si表示第i个样本的异常值,K表示核函数。
根据该分布可确定异常检测阈值如下:
Figure BDA0003046446360000122
式中:τ为阈值,μf与σf为概率分布的均值与方差,U为标准正态分布的上侧分位数,α为置信度。
步骤5:使用步骤3得到的异常检测模型对步骤1中的测试集进行推理并得到测试集样本的异常值,根据步骤4得到的阈值给出测试集样本的异常检测结果。
对测试集样本进行异常检测,表示如下:
Figure BDA0003046446360000123
式中:AD(x)表示样本x的异常检测结果。
下面结合具体实施例对本发明做进一步详细描述:
为了更好地说明本发明的技术效果,采用一个具体实施例对本发明进行试验验证。本实施例采用的数据来自某型发动机试车实验,共获得4次独立实验的数据,其中:2次来自正常运行的发动机,2次来自工作异常的发动机。4次实验数据均为采用多个工业传感器在发动机关键部位采集的多模态数据,包括来自于发动机正常运行状态下的3000条一维信号,来自于发动机异常运行状态下的2000条一维信号。按照本发明中的预处理方法对多模态数据集进行样本化、归一化、标签化,将1000个正常且完整的样本作为训练集,其余作为测试集,测试集中50%的样本存在模态数据缺失情况。
本实施例对比了本发明与其他5个最新方法的异常检测性能,全部模型的细节如下:
1)UU-Net:本发明所提出的多模态数据缺失下的无监督异常检测方法;
2)EncDec-AD:基于长短时记忆网络的多传感器时间序列异常检测方法;
3)VAE-LSTM:基于多模态长短时记忆网络和变分自编码器的异常检测方法;
4)MVAE:基于变分自编码器、适用于任意数量模态输入的多模态异常检测方法;
5)CAE:基于多通道卷积自编码器的异常检测方法;
6)Skip-GAN:基于跳跃连接的生成对抗网络的异常检测方法。
在相同的训练条件下,6个模型的异常检测结果如表1和表2所示,其中AUC代表ROC曲线下面积,表征检测方法对正常和异常样本的区分能力。可以看到,不论是模态完整还是任意一个传感器通道缺失,本发明所提供的方法均能在误报率、检测率、f1-分数、AUC等性能指标方面有充分优势。为了进一步验证本发明在多个传感器通道缺失下的性能,对测试样本丢失0-5个通道的情况进行了验证,结果如图3所示,展示了本发明以及各对比方法的AUC数值,从而进一步体现了本发明方法(UU-Net)在多模态数据缺失情况下的鲁棒性。
表1多模态数据完整时的异常检测结果
Figure BDA0003046446360000131
Figure BDA0003046446360000141
表2多模态数据缺失1个传感器通道时的异常检测结果
Figure BDA0003046446360000142
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (9)

1.多模态数据缺失下的无监督异常检测方法,其特征在于,包括以下步骤:
步骤1:利用多个工业传感器采集机械设备运行状态数据,建立多模态数据集,对该数据集进行预处理,并将预处理后的数据集划分为训练集与测试集;
步骤2:构建用于多模态数据缺失下异常检测的无监督深度网络模型;
步骤3:使用步骤1中的训练集对步骤2中构建的无监督深度网络模型进行训练;
步骤4:使用步骤3得到的异常检测模型对步骤1中的训练集进行推理并得到训练集样本异常值,重建训练集样本异常值的概率分布,根据该分布和置信度确定异常检测阈值;
步骤5:使用步骤3得到的异常检测模型对步骤1中的测试集进行推理并得到测试集样本的异常值,根据步骤4得到的阈值给出测试集样本的异常检测结果。
2.根据权利要求1所述的多模态数据缺失下的无监督异常检测方法,其特征在于,步骤1中的预处理过程包括样本化、标签化和归一化;
对多模态数据集进行样本化处理,具体为:使用固定长度的滑动时窗从该数据集包含的多传感器时间序列中逐一提取样本,公式为:
Figure FDA0003046446350000011
式中:
Figure FDA0003046446350000012
为第k个样本,xj为第j个传感器获得的时间序列,M为模态个数,Si代表第i个模态内的源数目即传感器个数,L为时窗长度,di为该样本第i模态缺失源的数目;
对样本化的数据集进行归一化处理,公式如下:
Figure FDA0003046446350000021
式中:
Figure FDA0003046446350000022
为未归一化样本的第i个分量,x(i)为归一化样本的第i个分量,min(·)为取最小值函数,max(·)为取最大值函数;
对归一化的数据集进行标签化处理,样本标签为二维元组(A,B),其中,A代表样本来源设备的运行状态,B表示样本模态是否完整,具体为:将设备正常运行状态下获得的样本即正常样本标记为A=0,将设备异常状态下获得的样本即异常样本标记为A=1;将模态缺失即di>0的样本标记为B=0,将模态完整即di=0的样本标记为B=1;
对标签化的数据集进行划分:从标签为(0,1)的样本中选取1/3作为训练集,将其余样本作为测试集。
3.根据权利要求1所述的多模态数据缺失下的无监督异常检测方法,其特征在于,步骤2中所述用于多模态数据缺失下异常检测的无监督深度网络模型由两个模块组成:第一个模块为自编码器组,第二个模块为具有跳跃连接的多通道自编码器;其中,第一个模块中每个自编码器由编码器、全连层和解码器组成,第二个模块由编码器和解码器组成;两个模块中,每个编码器均由多个下卷积块组成,下卷积块由卷积层、批归一化层和LeakyReLU函数层构成;每个解码器由多个上卷积块组成,上卷积块由转置卷积层、批归一化层和ReLU函数层构成。
4.根据权利要求3所述的多模态数据缺失下的无监督异常检测方法,其特征在于,第一个模块实现模态内融合和缺失模态重建;编码器将输入的多模态数据映射到隐空间,过程表示为:
Figure FDA0003046446350000031
式中:
Figure FDA0003046446350000032
为第i模态中第j源x(i,j)经过编码器
Figure FDA0003046446350000033
和全连层后得到的隐向量,W1、W2分别表示两个全连层的权重,b1、b2分别表示两个全连层的偏置,δ为激活函数;
通过模态内融合重建缺失模态,公式如下:
Figure FDA0003046446350000034
Figure FDA0003046446350000035
Figure FDA0003046446350000036
Figure FDA0003046446350000037
式中:a(i,j)为模态内融合权重;
Figure FDA0003046446350000038
表示向量
Figure FDA0003046446350000039
的第k个分量,Nz为该向量的长度;
Figure FDA00030464463500000310
为第i模态特征的平均表示,ε为一个极小的正数;
Figure FDA00030464463500000311
为所有模态特征的平均表示;
Figure FDA00030464463500000312
为重建的第i模态中第j源隐向量;
解码器将多模态隐向量映射到样本空间,过程表示为:
Figure FDA00030464463500000313
式中:
Figure FDA00030464463500000314
为由编码器
Figure FDA00030464463500000315
得到的第一次重构样本的第i模态第j源。
5.根据权利要求4所述的多模态数据缺失下的无监督异常检测方法,其特征在于,第二个模块实现模态间融合,具有跳跃连接的多通道自编码器每一层的处理过程为:
Figure FDA00030464463500000316
Figure FDA0003046446350000041
式中:
Figure FDA0003046446350000042
为第二个模块中编码器第k层
Figure FDA0003046446350000043
的输入,
Figure FDA0003046446350000044
为该层输出;
Figure FDA0003046446350000045
为第二个模块中解码器第k层
Figure FDA0003046446350000046
的输出,
Figure FDA0003046446350000047
为第二个模块中解码器第k+1层
Figure FDA0003046446350000048
的输出,
Figure FDA0003046446350000049
为特征维度拼接操作,第二个模块前向传播过程表示为:
Figure FDA00030464463500000410
Figure FDA00030464463500000411
式中:z2为第一次重构样本
Figure FDA00030464463500000412
经过编码器E2得到的隐向量,
Figure FDA00030464463500000413
由第一个模块得到的重构数据
Figure FDA00030464463500000414
拼接而成;
Figure FDA00030464463500000415
为由编码器D2得到的第二次重构样本。
6.根据权利要求5所述的多模态数据缺失下的无监督异常检测方法,其特征在于,步骤3中对模型进行训练的优化目标为:
minL(x)=λ1R1(x)+λ2R2(x)+λ3Dz(x)
式中:L(x)为样本x的损失计算函数,λ1>0、λ2>0、λ3<0分别为三个常数因子,R1(x)、R2(x)、Dz(x)分别表示为第一次重构损失、第二次重构损失、隐空间特征差异度,其计算公式分别为:
Figure FDA00030464463500000416
Figure FDA00030464463500000417
Dz(x)=||z1-z2||1
式中:
Figure FDA00030464463500000418
分别表示第一次重构样本的第i模态第j源、第二次重构样本的第i模态第j源;z1为第一个模块中的隐向量和,即
Figure FDA00030464463500000419
z2为第二个模块中的隐向量;‖·‖1为平滑的一次损失函数,表达式为:
Figure FDA00030464463500000420
式中:z1(k)、z2(k)分别表示两个向量的第k分量。
7.根据权利要求6所述的多模态数据缺失下的无监督异常检测方法,其特征在于,步骤4中和步骤5中通过模型推理得到样本得异常值,其表达式如下:
sx=λ1R1(x)+λ2R2(x)+λzDz(x)
式中:sx为样本x的异常值,λz<0为常系数。
8.根据权利要求1所述的多模态数据缺失下的无监督异常检测方法,其特征在于,步骤4中使用核密度估计法对训练集异常值的概率分布进行估计和重建,公式如下:
Figure FDA0003046446350000051
式中:f(x;h)表示带宽为h时点x处的概率密度,N表示训练集样本数量,si表示第i个样本的异常值,K表示核函数;
根据该分布可确定异常检测阈值如下:
Figure FDA0003046446350000052
式中:τ为阈值,μf与σf为概率分布的均值与方差,U为标准正态分布的上侧分位数,α为置信度。
9.根据权利要求8所述的多模态数据缺失下的无监督异常检测方法,其特征在于,步骤5对测试集样本进行异常检测,表示如下:
Figure FDA0003046446350000053
式中:AD(x)表示样本x的异常检测结果。
CN202110474161.4A 2021-04-29 2021-04-29 多模态数据缺失下的无监督异常检测方法 Active CN113255733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110474161.4A CN113255733B (zh) 2021-04-29 2021-04-29 多模态数据缺失下的无监督异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110474161.4A CN113255733B (zh) 2021-04-29 2021-04-29 多模态数据缺失下的无监督异常检测方法

Publications (2)

Publication Number Publication Date
CN113255733A true CN113255733A (zh) 2021-08-13
CN113255733B CN113255733B (zh) 2023-04-07

Family

ID=77223667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110474161.4A Active CN113255733B (zh) 2021-04-29 2021-04-29 多模态数据缺失下的无监督异常检测方法

Country Status (1)

Country Link
CN (1) CN113255733B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113671917A (zh) * 2021-08-19 2021-11-19 中国科学院自动化研究所 针对多模态工业过程异常状态的检测方法、系统、设备
CN113743482A (zh) * 2021-08-20 2021-12-03 郑州云智信安安全技术有限公司 一种基于车联网obd数据的车辆安全检测方法
CN113988268A (zh) * 2021-11-03 2022-01-28 西安交通大学 基于无监督全属性图的异构多源时序异常检测方法
CN114359779A (zh) * 2021-12-01 2022-04-15 国家能源集团宿迁发电有限公司 一种基于深度学习的皮带撕裂检测方法
CN115188092A (zh) * 2022-06-14 2022-10-14 珠海格力电器股份有限公司 设备监管方法、系统、计算机设备和存储介质
CN115631829A (zh) * 2022-09-30 2023-01-20 广东亿佛手健康科技有限公司 一种基于穴位按摩设备的网络连接多模态检测方法及系统
WO2023087525A1 (zh) * 2021-11-19 2023-05-25 中国华能集团清洁能源技术研究院有限公司 多模态深度学习的发电设备异常一体化识别方法及设备
CN116319427A (zh) * 2023-05-22 2023-06-23 北京国信蓝盾科技有限公司 基于装备网络的安全性评估方法、装置、电子设备和介质
CN116627953A (zh) * 2023-05-24 2023-08-22 首都师范大学 一种地下水位监测数据缺失的修复方法
WO2023197617A1 (zh) * 2022-04-11 2023-10-19 浙江工业大学 基于多维传感数据的工业系统生产异常检测与诊断方法
CN116996869A (zh) * 2023-09-26 2023-11-03 济南正大科技发展有限公司 一种网络异常数据处理方法及装置
CN117238058A (zh) * 2023-11-10 2023-12-15 无锡明诚汽车部件有限公司 基于数据分析的汽车用起动机监测方法
CN117476247A (zh) * 2023-12-27 2024-01-30 杭州深麻智能科技有限公司 一种疾病多模态数据智能分析方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109615019A (zh) * 2018-12-25 2019-04-12 吉林大学 基于时空自动编码器的异常行为检测方法
US20190293462A1 (en) * 2018-03-23 2019-09-26 Industry-Academic Cooperation Foundation, Dankook University Apparatus and method for processing multi-type sensor signal on the basis of multi-modal deep learning
CN111209942A (zh) * 2019-12-27 2020-05-29 广东省智能制造研究所 一种足式机器人多模态感知的异常监测方法
US20200364579A1 (en) * 2019-05-17 2020-11-19 Honda Motor Co., Ltd. Systems and methods for anomalous event detection
CN112101426A (zh) * 2020-08-26 2020-12-18 东南大学 基于自编码器的无监督学习图像异常检测方法
CN112200244A (zh) * 2020-10-09 2021-01-08 西安交通大学 一种基于递阶对抗训练的航天发动机异常智能检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190293462A1 (en) * 2018-03-23 2019-09-26 Industry-Academic Cooperation Foundation, Dankook University Apparatus and method for processing multi-type sensor signal on the basis of multi-modal deep learning
CN109615019A (zh) * 2018-12-25 2019-04-12 吉林大学 基于时空自动编码器的异常行为检测方法
US20200364579A1 (en) * 2019-05-17 2020-11-19 Honda Motor Co., Ltd. Systems and methods for anomalous event detection
CN111209942A (zh) * 2019-12-27 2020-05-29 广东省智能制造研究所 一种足式机器人多模态感知的异常监测方法
CN112101426A (zh) * 2020-08-26 2020-12-18 东南大学 基于自编码器的无监督学习图像异常检测方法
CN112200244A (zh) * 2020-10-09 2021-01-08 西安交通大学 一种基于递阶对抗训练的航天发动机异常智能检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CONG ZHANG等: "An_Unsupervised_Anomaly_Detection_Approach_Based_on_Industrial_Big_Data", 《2019 2ND WORLD CONFERENCE ON MECHANICAL ENGINEERING AND INTELLIGENT MANUFACTURING (WCMEIM)》 *
郑非凡: "基于ResNet深度神经网络的异常检测模型", 《网络新媒体技术》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113671917B (zh) * 2021-08-19 2022-08-02 中国科学院自动化研究所 针对多模态工业过程异常状态的检测方法、系统、设备
CN113671917A (zh) * 2021-08-19 2021-11-19 中国科学院自动化研究所 针对多模态工业过程异常状态的检测方法、系统、设备
CN113743482B (zh) * 2021-08-20 2023-09-12 郑州云智信安安全技术有限公司 一种基于车联网obd数据的车辆安全检测方法
CN113743482A (zh) * 2021-08-20 2021-12-03 郑州云智信安安全技术有限公司 一种基于车联网obd数据的车辆安全检测方法
CN113988268A (zh) * 2021-11-03 2022-01-28 西安交通大学 基于无监督全属性图的异构多源时序异常检测方法
CN113988268B (zh) * 2021-11-03 2024-04-05 西安交通大学 基于无监督全属性图的异构多源时序异常检测方法
WO2023087525A1 (zh) * 2021-11-19 2023-05-25 中国华能集团清洁能源技术研究院有限公司 多模态深度学习的发电设备异常一体化识别方法及设备
CN114359779A (zh) * 2021-12-01 2022-04-15 国家能源集团宿迁发电有限公司 一种基于深度学习的皮带撕裂检测方法
WO2023197617A1 (zh) * 2022-04-11 2023-10-19 浙江工业大学 基于多维传感数据的工业系统生产异常检测与诊断方法
CN115188092B (zh) * 2022-06-14 2023-11-10 珠海格力电器股份有限公司 设备监管方法、系统、计算机设备和存储介质
CN115188092A (zh) * 2022-06-14 2022-10-14 珠海格力电器股份有限公司 设备监管方法、系统、计算机设备和存储介质
CN115631829B (zh) * 2022-09-30 2023-05-30 广东亿佛手健康科技有限公司 一种基于穴位按摩设备的网络连接多模态检测方法及系统
CN115631829A (zh) * 2022-09-30 2023-01-20 广东亿佛手健康科技有限公司 一种基于穴位按摩设备的网络连接多模态检测方法及系统
CN116319427A (zh) * 2023-05-22 2023-06-23 北京国信蓝盾科技有限公司 基于装备网络的安全性评估方法、装置、电子设备和介质
CN116627953A (zh) * 2023-05-24 2023-08-22 首都师范大学 一种地下水位监测数据缺失的修复方法
CN116627953B (zh) * 2023-05-24 2023-10-27 首都师范大学 一种地下水位监测数据缺失的修复方法
CN116996869A (zh) * 2023-09-26 2023-11-03 济南正大科技发展有限公司 一种网络异常数据处理方法及装置
CN116996869B (zh) * 2023-09-26 2023-12-29 济南正大科技发展有限公司 一种网络异常数据处理方法及装置
CN117238058A (zh) * 2023-11-10 2023-12-15 无锡明诚汽车部件有限公司 基于数据分析的汽车用起动机监测方法
CN117238058B (zh) * 2023-11-10 2024-01-26 无锡明诚汽车部件有限公司 基于数据分析的汽车用起动机监测方法
CN117476247A (zh) * 2023-12-27 2024-01-30 杭州深麻智能科技有限公司 一种疾病多模态数据智能分析方法
CN117476247B (zh) * 2023-12-27 2024-04-19 杭州乐九医疗科技有限公司 一种疾病多模态数据智能分析方法

Also Published As

Publication number Publication date
CN113255733B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN113255733B (zh) 多模态数据缺失下的无监督异常检测方法
CN111562108A (zh) 一种基于cnn和fcmc的滚动轴承智能故障诊断方法
CN112200244B (zh) 一种基于递阶对抗训练的航天发动机异常智能检测方法
CN112461537B (zh) 基于长短时神经网络与自动编码机的风电齿轮箱状态监测方法
CN115409844B (zh) 循环肿瘤细胞检测设备及其方法
CN113673346B (zh) 一种基于多尺度SE-Resnet的电机振动数据处理与状态识别方法
CN115293280A (zh) 基于时空特征分割重构的动力装备系统异常检测方法
CN112395382A (zh) 基于变分自编码器的船舶异常航迹数据检测方法和装置
CN113822201B (zh) 基于流场速度分量时程的水下物体外形识别的深度学习方法
CN112603334B (zh) 基于时序特征和堆叠Bi-LSTM网络的棘波检测方法
CN114544155A (zh) 基于深度学习的auv推进器多信源融合故障诊断方法及系统
CN111858340A (zh) 一种基于稳定性变换的深度神经网络测试数据生成方法
CN112464721A (zh) 微地震事件自动识别方法及装置
CN110825642B (zh) 一种基于深度学习的软件代码行级缺陷检测方法
CN112529678A (zh) 一种基于自监督判别式网络的金融指数时序异常检测方法
CN115688040A (zh) 一种机械设备故障诊断方法、装置、设备及可读存储介质
CN116702076A (zh) 一种基于cnn特征融合的小样本迁移学习故障诊断方法、系统、计算机及存储介质
CN110717602A (zh) 一种基于噪音数据的机器学习模型鲁棒性评估方法
CN116561562B (zh) 一种基于波导奇异点的声源深度最优化获取方法
CN117516937A (zh) 基于多模态特征融合增强的滚动轴承未知故障检测方法
CN112052880A (zh) 一种基于更新权值支持向量机的水声目标识别方法
CN115824519B (zh) 基于多传感器信息融合的阀门泄露故障综合诊断方法
CN117197057A (zh) 一种基于深度学习的钢铁材料腐蚀程度自动化检测方法
CN116680639A (zh) 一种基于深度学习的深海潜水器传感器数据的异常检测方法
CN116167008A (zh) 基于数据增强的物联感知云数据中心异常定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant