CN117688305A

CN117688305A - 基于改进降噪自编码器的异常检测方法及系统

Info

Publication number: CN117688305A
Application number: CN202311717855.1A
Authority: CN
Inventors: 王智弘; 熊富强; 唐明珠; 俞昱; 唐星昱; 章健军; 曹景亮; 刘晓波; 于艺盛
Original assignee: Super High Voltage Substation Co Of State Grid Hunan Electric Power Co ltd; State Grid Corp of China SGCC; State Grid Hunan Electric Power Co Ltd
Current assignee: Super High Voltage Substation Co Of State Grid Hunan Electric Power Co ltd; State Grid Corp of China SGCC; State Grid Hunan Electric Power Co Ltd
Priority date: 2023-12-13
Filing date: 2023-12-13
Publication date: 2024-03-12

Abstract

本发明公开了一种基于改进降噪自编码器的异常检测方法及系统，方法包括：获取主变压器的声纹数据样本，同时添加噪声得到含噪声纹数据，对声纹数据样本与含噪声纹数据进行特征提取，获取第一原始声纹特征和含噪声纹特征的时序数据；使用含噪声纹特征数据和融合定向距离损失函数训练一维卷积和全连接层并联并行的双通道降噪自编码器；将第一原始声纹特征数据输入双通道降噪自编码器并计算重构误差；根据重构误差分布确定多特征阈值向量；获取主变压器的实时声纹数据，进行特征提取后获取第二原始声纹特征的时序数据并输入双通道降噪自编码器，计算重构误差并与阈值向量进行对比以确定是否存在异常。本发明提高了主变压器声纹异常检测的综合抗噪性能。

Description

基于改进降噪自编码器的异常检测方法及系统

技术领域

本发明涉及异常检测技术，尤其涉及一种基于改进降噪自编码器的异常检测方法及系统。

背景技术

主变压器是电力系统中的一个关键设备，其健康、稳定运行确保了电压的正常转换、电能的合理分配。主变压器故障不仅会导致大量的维修成本，而且会造成大量用户断电。由于设计、制造、原材料和自然环境等的影响，主变压器故障频繁发生。因此对主变压器运行工况进行异常检测具有重要意义。

近年来，深度学习方法在异常检测领域受到广泛关注。深度学习模型以其强大的表征学习能力，能够自动学习数据中的特征表示而备受推崇。在声纹数据方面，深度学习模型通过多层神经网络来学习声音信号的频谱特征，探索其与声纹的长时序关联，从而实现对个体特征和状态变化的精准捕捉，以实现异常的检测和识别。

常见的基于深度学习的异常检测算法包括：自编码器(Auto-Encoder)、生成对抗网络(Generative Adversarial Networks)、自对抗变分自编码器(Self-adversarialVariational Autoencoder)等。其中，自编码器由编码器和解码器构成，编码器将输入数据压缩为低维编码表示，解码器将编码数据重构回原始输入。自编码器的目标是最小化输入与重构之间的重构误差，异常样本通常具有较高的重构误差，因此可用重构误差作为异常的指标。

目前基于深度学习的异常检测算法在特征提取过程中可能会学习到降噪自编码器输入数据中的噪声纹特征，而非仅限于原始信号的特征。声学测量方法容易受到环境噪声的影响，因此需要进一步对数据和模型进行降噪处理。

发明内容

本发明要解决的技术问题就在于：针对现有技术存在的技术问题，本发明提供一种基于改进降噪自编码器的异常检测方法及系统，通过Fbank(Filter Banks，滤波器组)特征提取和滑动窗口获得时序样本，使用改进降噪自编码器重构数据，通过FDD(FusedDirectional Distance，融合定向距离)重构误差训练模型，计算多特征阈值，对测试数据进行异常检测，将声纹Fbank特征和改进降噪自编码模型结合，提高在不同强度背景噪声下的主变压器声纹异常检测综合性能。

为解决上述技术问题，本发明提出的技术方案为：

一种基于改进降噪自编码器的异常检测方法，包括以下步骤：

S101)获取主变压器的声纹数据样本，同时按照指定信噪比向声纹数据样本添加噪声得到含噪声纹数据，对所述声纹数据样本进行特征提取得到第一原始声纹特征，对所述含噪声纹数据进行特征提取得到含噪声纹特征，获取第一原始声纹特征和含噪声纹特征的时序数据；

S102)使用含噪声纹特征数据和融合定向距离损失函数训练改进降噪自编码器，所述改进降噪自编码器包括一维卷积和全连接层并联并行的双通道降噪自编码器；

S103)将第一原始声纹特征数据输入训练好的改进降噪自编码器，得到对应的重构声纹特征数据，计算每个第一原始声纹特征数据与对应重构声纹特征数据之间的重构误差；

S104)根据重构误差分布确定多特征的阈值向量；

S105)获取主变压器的实时声纹数据，对所述实时声纹数据进行特征提取得到第二原始声纹特征，获取第二原始声纹特征的时序数据并输入训练好的改进降噪自编码器，得到对应的重构声纹特征数据，计算每个第二原始声纹特征数据与对应重构声纹特征数据之间的重构误差，并将重构误差与阈值向量进行对比，根据比较结果确定是否存在异常。

进一步的，步骤S101和步骤S105中，进行特征提取时，均包括：将经过预处理的声纹数据进行快速傅里叶变换，然后获取功率谱并对其进行平方，接着使用梅尔滤波器对数据进行处理，最终取对数获得Fbank特征。

进一步的，步骤S101中获取第一原始声纹特征和含噪声纹特征的时序数据，以及步骤S105中获取第二原始声纹特征的时序数据时，均包括：按照指定的窗口大小和滑动步长，在时间序列上移动窗口，得到每个窗口观测到的声纹特征数据。

进一步的，步骤S102中，所述双通道降噪自编码器一路通道采用一维卷积对数据进行特征提取，然后通过批标准化层、ReLU激活层和最大池化层达到隐藏层，最后通过反池化层和过滤器个数与数据的变量数相同的一维卷积进行解码，得到第一特征矩阵；

所述双通道降噪自编码器另一路通道将数据通过批标准化层、ReLU激活层、批标准化层、ReLU激活层到达隐藏层，然后通过批标准化层、ReLU激活层和全连接层进行解码，得到第二特征矩阵；

最终将第一特征矩阵和第二特征矩阵取平均，得到重构矩阵。

进一步的，步骤S102中，使用含噪声纹特征数据和融合定向距离损失函数训练改进降噪自编码器时，包括：将含噪声纹特征数据作为改进降噪自编码器的输入，并将改进降噪自编码器训练到收敛状态，训练过程中通过最小化原始声纹特征数据与重构声纹特征数据的融合定向距离损失函数来更新改进降噪自编码器的神经网络权重。

进一步的，所述融合定向距离损失函数的表达式如下：

其中，表示原始数据与重构数据的均方误差，/>表示原始数据与重构数据的余弦相似度，x表示第一原始声纹特征数据，/>表示含噪声纹特征数据对应的重构声纹特征数据，λ是用于平衡数据之间的距离和角度差的权重的可调超参数。

进一步的，所述第一原始声纹特征和含噪声纹特征的时序数据均是多个特征组成的数据集，每个特征均包含多个子特征，步骤S104中，根据重构误差分布确定多特征的阈值向量时，包括：将每个子特征的最大重构误差作为阈值向量。

进一步的，步骤S105中，根据比较结果确定是否存在异常时，包括：

若重构误差大于或等于阈值向量，则对应的第二原始声纹特征数据异常；若重构误差小于阈值向量，则对应的第二原始声纹特征数据正常；

若异常的第二原始声纹特征数据数量大于正常的第二原始声纹特征数据数量，则主变压器的实时声纹数据异常，否则主变压器的实时声纹数据正常。

进一步的，步骤S101中，所述声纹数据样本包括正常声纹的样本。

本发明还提出一种基于改进降噪自编码器的异常检测系统，包括依次连接的声纹传感器、声纹放大器、恒流适配器、数据采集卡、交换机以及上位机，所述上位机被编程或配置以执行任一项所述的基于改进降噪自编码器的异常检测方法。

与现有技术相比，本发明的优点在于：

本发明提出改进降噪自编码器，应用于主变压器的声纹异常检测，将卷积自编码器和普通自编码器结合，能够减缓卷积降噪自编码器过度提取输入数据中噪声纹特征的现象，导致降噪自编码器在高背景噪声下性能降低。此外，利用卷积层的高效特征捕捉能力，提高模型在低背景噪声下的声纹特征捕捉能力。

附图说明

图1为滑动窗口示意图。

图2为降噪自动编码器结构图。

图3为本发明实施例的改进降噪自编码器结构图。

图4为本发明实施例的异常检测流程图。

图5为本发明实施例的方法流程图。

图6为本发明实施例的说话背景噪声下模型gMean性能对比图。

图7为本发明实施例的高斯白噪声下模型gMean性能对比图。

图8为本发明实施例的工业背景噪声下模型gMean性能对比图。

图9为本发明实施例的系统结构图。

具体实施方式

以下结合说明书附图和具体优选的实施例对本发明作进一步描述，但并不因此而限制本发明的保护范围。

在介绍具体实施例之前，先对于相关技术进行说明。

Fbank特征提取

Fbank特征提取在声音信号处理中具有重要地位。首先，它将经过预处理的声纹数据进行快速傅里叶变换，然后获取功率谱并对其进行平方，接着使用梅尔滤波器对数据进行处理，最终取对数即可获得Fbank特征。梅尔频率与实际频率之间的转换关系如下式：

其中，f_mel为梅尔频率，f为实际频率。

Fbank特征的应用在声音信号处理领域具有显著的优势。其能够捕捉声音信号的本质特性，具备与人耳接收特性相拟合的能力。此外，深层神经网络的特点在于对大规模数据的充分训练，且对高度相关信息不敏感。相对于MFCC等特征，Fbank特征因其种种优势已经成为一个普遍被采用的选择。

滑动窗口

滑动窗口作为一种数据处理技术，常用于将时间序列数据转化为固定大小的样本，便于机器学习模型的训练。其基本原理是在时间序列上指定一个固定长度的窗口，以预设的步长和方向进行滑动。图1是多变量时间序列数据的滑动窗口示意图，具体步骤包括以下3点。

(1)确定窗口大小：确定滑动窗口的大小，即每个窗口中包含的时间步数，这个大小通常是根据问题的需求和数据的特性来确定的。

(2)定义滑动步长：滑动步长指定窗口在时间序列上的移动间隔，它决定窗口之间的重叠程度。较小的步长会产生更多的窗口和更大的样本数，而较大的步长则会减少窗口数量和样本数。

(3)创建滑动窗口样本：使用确定的窗口大小和步长，在时间序列上滑动窗口，从而创建固定大小的样本。每个窗口都包含一段连续的时间步，涵盖多个变量的观测值。最终得到样本的形状为(N,T,V)，其中N表示样本数，T表示窗口大小(时间步数)，V表示变量数。

降噪自编码器

降噪自编码器是一种简单且对称的网络结构，旨在提高传统自编码器的鲁棒性。其网络结构如图2所示，主要由数据加噪模块、编码器模块和解码器模块构成。编码器模块和解码器模块构成神经网络模块，数据加噪模块起到辅助训练鲁棒神经网络的作用。编码器负责数据压缩，解码器负责数据重构。神经网络模块的设计是对称的，包含输入层、隐藏层和输出层。编码和解码过程通过神经网络模块的前向传播来完成，而神经网络模块的超参数则通过反向传播进行优化。

假设原始输入样本为x，数据加噪模块的过程表示为：

编码器模块的编码过程表示为：

h＝f(y)(4)

解码器模块的解码过程可表示为：

式2-5统称为前向传播公式。其中，W_e、b_e和f(·)分别是编码器的权值矩阵、偏置项和非线性激活函数，W_d、b_d和g(·)分别是解码器的权值矩阵、偏置项和非线性激活函数，是神经网络的实际输入样本，/>是神经网络的输出结果。由于降噪自编码器的最终优化方向是使输出结果逼近原始输入样本，因此训练过程的约束条件写成：

在模型的训练过程中，数据加噪模块的引入旨在增强学习网络的鲁棒性。通过在一定的约束下，模型学习数据的隐含特征，在此基础上重构出原始数据。根据隐藏层神经元的规模设置，能够自主定义输入数据的隐含特征的维度。降噪自编码器使用反向传播算法对学习网络的参数进行调优，目标是最小化因数据压缩所导致的信息损失。因此，必须选择合适的损失函数来度量输入数据与输出数据之间的差异，即信息损失。在训练过程中，模型不断地通过最小化损失函数来更新神经网络的权重，最终得到一个能够实现降维编码且最小化信息损失的高效神经网络模型。自编码器常采用均方误差(Mean square error，MSE)作为损失函数，即：

其中，D是输入样本维数，x_i是原始样本的第i个值，是重构样本的第i个值。

实施例一

考虑到环境噪声对自编码模型重构性能的影响，导致检测性能降低，因此需要对数据进行降噪处理，提高模型的泛化能力。本实施例因此提出改进降噪自编码器，应用于主变压器的声纹异常检测。

在数据加噪层中，为模拟真实场景中的噪声分布，人为地向原始数据添加噪声。这样做的目的是自编码器在重构过程中能够更好地适应实际噪声环境。通常情况下，引入的噪声分布与真实场景中的噪声分布越接近，训练后的自编码器的重构性能就会越好。常见的加噪方法包括高斯噪声和随机置零等。然而，为更好地模拟环境中的多类别噪声，采用一种更为综合的方法。具体来说，将ESC-50数据集的环境声音数据融合，将其作为噪声数据添加到原始数据中。其中，通过信噪比控制原始数据和噪声数据之间的比例关系，信噪比决定加噪后数据中原始信号与噪声的相对强度。通过调整信噪比的大小，控制模型对噪声的敏感程度，从而平衡重构的准确性和噪声抑制的效果。信噪比(Signal Noise Ratio,SNR)是指在某段信号中目标信号功率与噪声信号功率的比值，其计算公式为：

式中，P_s、P_n分别为目标信号功率和噪声信号功率，单位为dB。信噪比越大，噪声数据的信号占比越小。

针对输入数据的特征提取和压缩，本实施例的改进降噪自编码器的网络结构采用一维卷积和全连接层结合的方式来提取输入数据的特征，其结构如图3所示，是一维卷积和全连接层并联并行的双通道降噪自编码器。

其中，双通道降噪自编码器一路通道(卷积自编码器)首先采用一维卷积对数据进行特征提取，使卷积核沿着变量方向进行卷积，实现对不同特征之间关系的提取。然后通过批标准化层、ReLU激活层和最大池化层达到隐藏层，最后通过反池化层和过滤器个数为V的一维卷积对其进行解码，最终得到一个V×T的特征矩阵(后文称为第一特征矩阵以进行区分)。

双通道降噪自编码器另一路通道(降噪自编码器)将数据通过批标准化层、ReLU激活层、批标准化层、ReLU激活层到达隐藏层，然后通过批标准化层、ReLU激活层和全连接层进行解码，得到另一个V×T的特征矩阵(后文称为第二特征矩阵以进行区分)。

批标准化层通过对每个小批量的输入数据进行归一化，使得每个特征维度的均值接近于0，方差接近于1，加速网络的收敛速度，提高训练的稳定性。最大池化层对特征维度进行压缩，构建潜在空间表征，捕捉重要特征和模式。反池化层通过恢复特征的空间维度，提高自编码器的重构能力、特征表达能力和重建优化效果。

该改进降噪自编码器将卷积自编码器和普通的降噪自编码器结合，能够减缓卷积降噪自编码器过度提取输入数据中噪声特征的现象，导致降噪自编码器在高背景噪声下性能降低。此外，利用卷积层的高效特征捕捉能力，提高模型在低背景噪声下的声纹特征捕捉能力。该网络最终得到两个V×T的特征矩阵，最后将两个特征矩阵取平均，得到最后的重构矩阵。

为进一步提高模型鲁棒性，该改进降噪自编码器的模型训练过程中使用融合定向距离损失函数(FDD)作为损失函数，FDD在MSE的基础上引入余弦相似度，能够从距离和角度两个方面来度量数据间的分布相似性。余弦相似度的定义如下。

将余弦相似度与MSE结合，得到FDD损失函数如下。

其中，λ是一个可调的超参数，用于平衡数据之间的距离和角度差的权重。

由于主变压器声纹信号具有高度非线性相关性和短时相依特征，当前值会受先前值的影响。采用Fbank特征和滑动窗口技术处理原始声纹数据，使滑动窗口内包含机组当前时刻与先前时刻的声纹Fbank特征信息，得到参数短时相依性的状态数据矩阵。建立自编码模型的同时获取多元特征间的非线性相关性和短时相依性。因此，基于前述的改进降噪自编码器，本实施例提出一种基于改进降噪自编码器的异常检测方法，通过Fbank特征提取和滑动窗口获得时序样本，使用基于ESC-50数据集合成的环境噪声和改进降噪自编码器重构数据，通过FDD重构误差训练模型，计算多特征阈值，对测试数据进行异常检测。如图4和图5所示，包括以下步骤：

S101)数据处理：获取主变压器的声纹数据样本，同时按照指定信噪比向声纹数据样本添加噪声得到含噪声纹数据，对所述声纹数据样本进行特征提取得到原始声纹特征(后文称为第一原始声纹特征以进行区分)，对所述含噪声纹数据进行特征提取得到含噪声纹特征，采用滑动窗口获取第一原始声纹特征和含噪声纹特征的时序数据；

S102)模型训练：使用含噪声纹特征数据和融合定向距离损失函数训练改进降噪自编码器，训练好的改进降噪自编码器能够学习声纹数据的特征表示；

S103)重构误差计算：将第一原始声纹特征数据输入训练好的改进降噪自编码器，得到对应的重构声纹特征数据，计算每个第一原始声纹特征数据与对应重构声纹特征数据之间的重构误差，作为每个样本(即第一原始声纹特征数据)的异常度量，重构误差的计算方式与FDD损失函数基本相同，在此不再赘述重构误差计算的具体过程；

S104)多特征阈值计算：根据重构误差分布确定多特征的阈值向量，使用统计方法或百分位数法来确定阈值，本实施例中采用每个子特征的最大重构误差作为阈值向量，其中包含N个阈值；如图4所示，采用滑动窗口获取的声纹特征时序数据是特征1至特征N组成的数据集，每个特征均包含子特征F₁至F_N，因此，通过步骤S103得到特征1中子特征F₁至F_N的重构误差、……、特征N中子特征F₁至F_N的重构误差，对于子特征F₁至F_N，分别选取其N个重构误差中的最大值作为阈值，从而组成子特征F₁至F_N的阈值向量；

S105)异常检测：获取主变压器的实时声纹数据，对所述实时声纹数据进行特征提取得到原始声纹特征(后文称为第二原始声纹特征以进行区分)，采用滑动窗口获取第二原始声纹特征的时序数据并输入训练好的改进降噪自编码器，得到对应的重构声纹特征数据，计算每个第二原始声纹特征数据与对应重构声纹特征数据之间的重构误差，并将重构误差与阈值向量进行对比，根据比较结果确定是否存在异常；

S106)性能评估：通过步骤S101至步骤S105，异常检测的模型构建完成，本实施例中称为FS-IDAE(Fbank Sliding Window-Improved Denoising Autoencoder)异常检测模型，接下来，采用包含异常样本的测试数据对模型性能进行评估，计算评价指标，以衡量模型的性能。

下面对于每一步骤进行具体说明。

在步骤S101中，获取主变压器的声纹数据样本时，声纹数据样本包含正常声纹和异常声纹两类样本，正常样本按比例为6：2：2划分为训练集、验证集和测试集，异常样本仅作为测试集。

接下来，对训练集、验证集和测试集进行数据预处理，数据预处理包括数据清洗、数据标准化、特征提取以及滑动窗口等操作。首先，对原始数据的有效性进行筛选，去除异常值、重复数据，同时对时序数据进行标准化，以确保数据的一致性。随后采用Fbank方法从原始声纹数据中提取特征。在获得Fbank特征后，应用滑动窗口技术，通过在时间轴上移动窗口，从而将连续的特征帧组合成有时序关联的原始特征集。此外，对ESC-50环境声数据集进行融合，生成噪声声纹数据。通过控制信噪比，将这些噪声数据与原始声纹数据合并，通过Fbank和滑动窗口，最终生成含噪特征集。

因此，步骤S101和步骤S105中，进行特征提取时，均包括：将经过预处理的声纹数据进行快速傅里叶变换，然后获取功率谱并对其进行平方，接着使用梅尔滤波器对数据进行处理，最终取对数获得Fbank特征。

本实施例的步骤S102中，使用含噪声纹特征数据训练改进降噪自编码器时，包括：将训练集的含噪声纹特征数据作为改进降噪自编码器的输入，并将改进降噪自编码器训练到收敛状态，从而确定模型参数，训练过程中通过最小化原始声纹特征数据(即第一原始声纹特征数据)与重构声纹特征数据(即含噪声纹特征数据对应的重构声纹特征数据)的FDD损失函数来更新改进降噪自编码器的神经网络权重，然后将验证集的含噪声纹特征数据输入训练后的改进降噪自编码器以调整模型参数，重复上述过程，直到FDD损失函数满足收敛条件。

本实施例的步骤S105中，根据比较结果确定是否存在异常时，包括：

本实施的步骤S106中，为验证FS-IDAE异常检测模型用于主变压器声纹数据时的异常检测性能以及在不同信噪比的噪声环境下该模型的抗噪性，与其他模型进行对比试验。

为评价模型性能，选择综合指标gMean，定义如下：

其中，FP为假阳性，表示检测出异常，实际没有异常的样本数；TN为真阴性，表示未检测出异常，实际也无异常的样本数；FN为假阴性，表示未检测出异常，实际有异常的样本数；TP为真阳性，表示检测出异常，实际也异常的样本数。

在实际的主变压器现场采集到的声音信号往往收到周围环境噪声的干扰，提取出的特征参数是否具有良好的抗噪性将对声纹异常检测系统的结果产生很大的影响。因此，为进一步验证FS-IDAE模型的抗噪能力和性能，与其他异常检测算法进行对比实验。对比算法中，对改进降噪自编码进行消融实验，DAE为使用普通降噪自编码器网络结构的模型，AE为将DAE的去掉降噪模块后的模型，CAE为卷积自编码器，CDAE为卷积降噪自编码器，iForest为孤立森林。为验证Fbank特征提取对异常检测性能的影响，S-iForest和S-IDAE为使用原始声纹数据的iForest和IDAE模型。

在测试数据中人工添加三种背景噪声分别为说话声、高斯白噪声和工业噪声，分别设置这几种噪声的信噪比为-10dB、-5dB、0dB、5dB、10dB。然后在原始信号中添加不同信噪比的背景噪声，将其输入模型中进行异常检测，得出的结果如图6至8所示。

由实验可得以下结论：

(1)在较低信噪比的背景噪声环境下，与普通自编码器相比，卷积自编码器和卷积降噪自编码器具有较高的gMean性能。随着信噪比的减小，卷积特征提取网络可能会学习到噪声的特征分布，此时，基于全连接层的普通自编码网络具有更优性能。本实施例的改进降噪自编码器将卷积和全连接层结合，弥补两种自编码网络的缺点，在-10dB到10dB的背景噪声下具有平均最优性能。

(2)在不同信噪比的背景噪声环境下，相较于使用原始声纹数据，采用基于Fbank特征的异常检测模型性能较好。与iForest异常检测模型相比，将Fbank特征与深度学习模型结合，能够更好地利用Fbank声纹特征，从而提高模型抗噪性能。

实施例二

本实施例还提出一种基于改进降噪自编码器的异常检测系统，如图9所示，包括依次连接的声纹传感器、声纹放大器、恒流适配器、数据采集卡、交换机以及上位机，通过采样频率为44100Hz的声纹传感器采集声纹信号，经过声纹放大器的放大以及恒流适配器、数据采集卡、交换机的传输后输入至上位机，实现了对主变压器的声纹信息的采集。而本实施例中的上位机被编程或配置以执行实施例一所述的基于改进降噪自编码器的异常检测方法，根据所采集的声纹信息构建异常检测模型并进行异常检测。

综上所述，本发明将声纹Fbank特征和改进降噪自编码模型结合，提高在不同强度背景噪声下的主变压器声纹异常检测综合性能。本发明的优点包括：首先，将Fbank特征与主变压器的声纹异常检测结合，为声纹数据异常检测提供新思路。其次，构建适用于主变压器声纹信号的降噪自编码器加噪方法，融合两种自编码器网络结构，解决异常检测随环境噪声波动较大的问题。最后将声纹信号引入主变压器异常检测，对于主变压器的预防维护具有重要意义。

上述只是本发明的较佳实施例，并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明。因此，凡是未脱离本发明技术方案的内容，依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均应落在本发明技术方案保护的范围内。

Claims

1.一种基于改进降噪自编码器的异常检测方法，其特征在于，包括以下步骤：

S104)根据重构误差分布确定多特征的阈值向量；

2.根据权利要求1所述的基于改进降噪自编码器的异常检测方法，其特征在于，步骤S101和步骤S105中，进行特征提取时，均包括：将经过预处理的声纹数据进行快速傅里叶变换，然后获取功率谱并对其进行平方，接着使用梅尔滤波器对数据进行处理，最终取对数获得Fbank特征。

3.根据权利要求1所述的基于改进降噪自编码器的异常检测方法，其特征在于，步骤S101中获取第一原始声纹特征和含噪声纹特征的时序数据，以及步骤S105中获取第二原始声纹特征的时序数据时，均包括：按照指定的窗口大小和滑动步长，在时间序列上移动窗口，得到每个窗口观测到的声纹特征数据。

4.根据权利要求1所述的基于改进降噪自编码器的异常检测方法，其特征在于，步骤S102中，所述双通道降噪自编码器一路通道采用一维卷积对数据进行特征提取，然后通过批标准化层、ReLU激活层和最大池化层达到隐藏层，最后通过反池化层和过滤器个数与数据的变量数相同的一维卷积进行解码，得到第一特征矩阵；

5.根据权利要求1所述的基于改进降噪自编码器的异常检测方法，其特征在于，步骤S102中，使用含噪声纹特征数据和融合定向距离损失函数训练改进降噪自编码器时，包括：将含噪声纹特征数据作为改进降噪自编码器的输入，并将改进降噪自编码器训练到收敛状态，训练过程中通过最小化原始声纹特征数据与重构声纹特征数据的融合定向距离损失函数来更新改进降噪自编码器的神经网络权重。

6.根据权利要求5所述的基于改进降噪自编码器的异常检测方法，其特征在于，所述和融合定向距离损失函数的表达式如下：

7.根据权利要求1所述的基于改进降噪自编码器的异常检测方法，其特征在于，所述第一原始声纹特征和含噪声纹特征的时序数据均是多个特征组成的数据集，每个特征均包含多个子特征，步骤S104中，根据重构误差分布确定多特征的阈值向量时，包括：将每个子特征的最大重构误差作为阈值向量。

8.根据权利要求1所述的基于改进降噪自编码器的异常检测方法，其特征在于，步骤S105中，根据比较结果确定是否存在异常时，包括：

9.根据权利要求1所述的基于改进降噪自编码器的异常检测方法，其特征在于，步骤S101中，所述声纹数据样本包括正常声纹的样本。

10.一种基于改进降噪自编码器的异常检测系统，其特征在于，包括依次连接的声纹传感器、声纹放大器、恒流适配器、数据采集卡、交换机以及上位机，所述上位机被编程或配置以执行权利要求1～9任一项所述的基于改进降噪自编码器的异常检测方法。