CN114297921A

CN114297921A - 基于am-tcn的故障诊断方法

Info

Publication number: CN114297921A
Application number: CN202111589058.0A
Authority: CN
Inventors: 凡时财; 张季阳; 郑宏; 何建
Original assignee: Research Institute Of Yibin University Of Electronic Science And Technology
Current assignee: Research Institute Of Yibin University Of Electronic Science And Technology
Priority date: 2021-12-23
Filing date: 2021-12-23
Publication date: 2022-04-08

Abstract

本发明公开了一种基于AM‑TCN的故障诊断方法，首先在工业过程的正常和各个故障运行状态下，采用传感器设备采集状态监控数据，构建时间序列训练样本；然后构建基于AM‑TCN的故障诊断模型，包括注意力机制层、时间卷积网络、全连接层和SoftMax层，其中时间卷积网络由多个时间卷积块堆叠而成；采用训练样本对基于AM‑TCN的故障诊断模型进行训练；在工业过程的实际运行过程，采集状态监控数据并构建时间序列，将时间序列输入训练好的基于AM‑TCN的故障诊断模型中，得到故障诊断结果。本发明结合注意力机制和时间卷积网络构建基于AM‑TCN的故障诊断模型，提升对时序数据的特征提取效果，从而提高工业过程的故障诊断的准确性和鲁棒性。

Description

基于AM-TCN的故障诊断方法

技术领域

本发明属于工业设备故障诊断技术领域，更为具体地讲，涉及一种基于AM-TCN的故障诊断方法。

背景技术

工业设备的异常监测在现代工业安全中起着重要的作用。及时、准确的故障诊断是避免经济损失和人员伤亡的关键。由于广泛应用的传感器和计算机控制系统收集了大量的监测数据，数据驱动的故障诊断方法因其不需要精确的物理模型和先验知识，得到了广泛的应用。其中，随着计算机科学和数据库技术的发展，基于机器学习的数据驱动的故障诊断方法已经成为一种流行的故障诊断技术。

基于机器学习的故障诊断方法可以分为两类:传统机器学习方法和深度学习方法。许多传统的机器学习方法已经被应用到故障诊断中，如随机森林、支持向量机和k近邻，然而由于上述模型结构较浅，这些方法的故障诊断性能并不令人满意。深度学习是一种有效的非线性特征提取方法，它不仅能克服浅层学习的问题，而且能同时优化特征提取和分类，因此被引入到故障诊断中。其中卷积神经网络(Convolutional Neural Network，CNN)和递归神经网络(Recurrent Neural Network，RNN)在故障诊断得到了广泛地应用。

然而，工业设备的监控数据是典型的时间序列数据，而CNN方法和RNN方法难以获取足够的时间序列信息，上述两种方法的长时间序列建模能力差。此外，工业过程中的监控数据也是典型的多变量数据，存在一些与故障模式高度相关的监控变量。CNN方法和RNN方法赋予了每个输入特征相同的权重，这会对故障诊断性能产生负面影响，因为数据中的一些重要部分需要被关注。同时，由于数据中不可避免地会包含一定的噪声，对一些无用变量给予同等重视，甚至会在一定程度上降低故障诊断能力。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于AM-TCN的故障诊断方法，结合注意力机制(Attention Mechanism，AM)和时间卷积网络(Temporal ConvolutionalNetwork，TCN)构建基于AM-TCN的故障诊断模型，提升对时序数据的特征提取效果，从而提高工业过程的故障诊断的准确性和鲁棒性。

为了实现上述发明目的，本发明基于AM-TCN的故障诊断方法包括以下步骤：

S1：在工业过程的正常运行状态和预设K种故障运行状态下，采用M个传感器设备分别采集得到T_k个采样时刻的状态监控数据，记第k种运行状态下采样时刻为t时第m个传感器设备的测量数据为

其中，k＝0表示正常运行状态，k＝1,2,…,K表示故障状态序号，t＝1,2,…,T_k，T_k表示在第k种运行状态下的采样时刻数量，m＝1,2,…,M；则第k种运行状态下采样时刻为t时得到的数据向量

S2：将得到的T_k个测量数据向量

作为行向量，按照采样时刻进行升序排列构成数据矩阵Z^k：

对于正常运行状态下的数据矩阵Z⁰，计算数据向量均值mean(Z⁰)和标准差std(Z⁰)，计算公式如下：

根据均值mean(Z⁰)和标准差std(Z⁰)对各种运行状态下得到的各个测量数据向量

进行标准化处理得到标准化数据向量

计算公式如下：

S3：将每种运行状态下经过数据标准化处理的标准化数据向量

的转置作为列向量，按照采样时刻的顺序升序构成时间序列

其中，上标T表示转置；

S4：采用长度为N、步长为Δ的滑动窗口对时间序列

进行滑动窗口采样，提取得到时间序列子序列

其中，h＝1,2,…,H_k，H_k表示第k种运行状态下所提取到的时间序列子序列的数量；

将提取得到的子序列

作为输入序列，所对应的运行状态编号k作为期望输出，即构成一个训练样本；

S5：构建基于AM-TCN的故障诊断模型，包括注意力机制层、时间卷积网络、全连接层和SoftMax层，其中：

注意力机制层用于接收输入序列，为序列中不同时刻的状态监控数据赋予不同权重，得到加权后的时间序列并输出至时间卷积网络，具体方法如下：

记输入序列为S：

其中，

表示输入序列S中第m维测量数据的N个时刻的时序向量，s_n,m表示输入序列S中坐标为(m,n)的元素，n＝1,2,…,N；

然后计算行向量

的重要性权重α_m，计算公式为：

其中，

表示在故障诊断模型训练过程中需要学习的查询向量，score(·)是注意力机制的打分函数，其计算公式为：

采用如下公式对行向量

进行重要性加权得到加权行向量c_m：

记输入序列S通过注意力机制加权得到的时间序列为C：

其中，

表示时间序列C中第n个时刻的M维数据向量；

时间卷积网络用于对输入的加权后的时间序列提取特征并输出至全连接层；时间卷积网络由D层时间卷积块堆叠得到，每个时间卷积块包括扩张因果卷积层和残差连接层；时间序列C中第n个时刻的M维数据向量

在经过时间卷积网络处理后得到的特征F(n)采用如下公式表示：

其中，Activation(·)表示ReLU激活函数，d表示扩张因果卷积层的扩张因子，R表示扩张因果卷积层的卷积核尺寸，

表示在时间序列C中第(n-d)·r个时刻的数据向量，当(n-d)·r≤0，

为0向量，f(r)表示可学习的扩张因果卷积层中的卷积核参数，r＝0,1,…,R-1；

全连接层将接收到的特征进行处理得到分类向量并发送至SoftMax层；

SoftMax层对接收到分类向量进行分类得到输入序列对应的运行状态序号的预测值；

S6：将步骤S4得到的各个训练样本中的输入序列作为模型输入，所对应和运行状态编号k作为期望输出，对步骤S5构建的基于AME-TCN的故障诊断模型进行训练；

S7：在工业过程的实际运行过程中，采用步骤S1中的相同方法采集得到N个采样时刻的状态监控数据，并采用步骤S2中的相同方法根据正常运行状态下的均值mean(Z0)和标准差std(Z0)进行标准化处理，记第n个采样时刻时第m个传感器设备的标准化测量数据为X_n′_,m，构成时间序列S′：

将时间序列S′输入至步骤S6中训练好的基于AM-TCN的故障诊断模型，得到诊断结果。

本发明基于AM-TCN的故障诊断方法，首先在工业过程的正常和各个故障运行状态下，采用传感器设备采集状态监控数据，构建时间序列训练样本；然后构建基于AM-TCN的故障诊断模型，包括注意力机制层、时间卷积网络、全连接层和SoftMax层，其中时间卷积网络由多个时间卷积块堆叠而成；采用训练样本对基于AM-TCN的故障诊断模型进行训练；在工业过程的实际运行过程，采集状态监控数据并构建时间序列，将时间序列输入训练好的基于AM-TCN的故障诊断模型中，得到故障诊断结果。

本发明所构建的基于AM-TCN的故障诊断模型，通过注意力机制强调更重要的变量对故障诊断的贡献，避免了部分对故障诊断无关的变量对模型决策的误导作用，使得模型更加鲁棒；同时利用时间卷积网络优于CNN和RNN的长时间序列建模能力来获取时间相关性，提取判别特征，从而充分挖掘数据之间的时间相关性；通过结合注意力机制和时间卷积网络，最终使得故障诊断的准确性和鲁棒性得到显著提高。

附图说明

图1是本发明基于AM-TCN的故障诊断方法的具体实施方式流程图；

图2是本发明中基于AM-TCN的故障诊断模型的结构图。

具体实施方式

下面结合附图对本发明的具体实施方式进行描述，以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是，在以下的描述中，当已知功能和设计的详细描述也许会淡化本发明的主要内容时，这些描述在这里将被忽略。

实施例

图1是本发明基于AM-TCN的故障诊断方法的具体实施方式流程图。如图1所示，本发明基于AM-TCN的故障诊断方法的具体步骤包括：

S101：收集历史状态监控数据。

在工业过程的正常运行状态和预设K种故障运行状态下，采用M个传感器设备分别采集得到T_k个采样时刻的状态监控数据，记第k种运行状态下采样时刻为t时第m个传感器设备的测量数据为

其中，k＝0表示正常运行状态，k＝1,2,…,K表示故障状态序号，t＝1,2,…,T_k，T_k表示在第k种运行状态下的采样时刻数量，m＝1,2,…,M。则第k种运行状态下采样时刻为t时得到的数据向量

S102：数据标准化：

为了使得步骤S101所采集的数据能更好的展示工业设备不同运行状态下的数据特点，需要先对数据进行标准化处理，具体方法如下：

将得到的T_k个测量数据向量

作为行向量，按照采样时刻进行升序排列构成数据矩阵Z^k：

进行标准化处理得到标准化数据向量

计算公式如下：

S103：构建时间序列：

将每种运行状态下经过数据标准化处理的标准化数据向量

的转置作为列向量，按照采样时刻的顺序升序构成时间序列

其中，上标T表示转置。

S104：滑动窗口采样生成训练样本：

采用长度为N、步长为Δ的滑动窗口对时间序列

进行滑动窗口采样，提取得到时间序列子序列

其中，h＝1,2,…,H_k，H_k表示第k种运行状态下所提取到的时间序列子序列的数量。可知

表示向上取整。

将提取得到的子序列

作为输入序列，所对应的运行状态编号k作为期望输出，即构成一个训练样本。

S105：构建基于AM-TCN的故障诊断模型：

为了实现工业设备的故障诊断，本发明需要构建基于AM-TCN的故障诊断模型。图2是本发明中基于AM-TCN的故障诊断模型的结构图。如图2所示，本发明基于AM-TCN的故障诊断模型包括注意力机制层、时间卷积网络、全连接层和SoftMax层，下面分别对各个组成部分进行详细说明：

记输入序列为S：

其中，

表示输入序列S中第m维测量数据的N个时刻的时序向量，s_n,m表示输入序列S中坐标为(m,n)的元素，n＝1,2,…,N。

然后计算行向量

的重要性权重α_m，计算公式为：

其中，

采用如下公式对行向量

进行重要性加权得到加权行向量c_m：

记输入序列S通过注意力机制加权得到的时间序列为C：

其中，

表示时间序列C中第n个时刻的M维数据向量。

时间卷积网络用于对输入的加权后的时间序列提取特征并输出至全连接层。时间卷积网络由D层时间卷积块堆叠得到，每个时间卷积块包括扩张因果卷积层和残差连接层。时间序列C中第n个时刻的M维数据向量

为0向量，f(r)表示可学习的扩张因果卷积层中的卷积核参数，r＝0,1,…,R-1。

全连接层将接收到的特征进行处理得到分类向量并发送至SoftMax层。

SoftMax层对接收到分类向量进行分类得到输入序列对应的运行状态序号的预测值。

全连接层和softmax层是神经网络中的常用单元，其具体过程在此不再赘述。

S106：训练基于AM-TCN的故障诊断模型：

将步骤S104得到的各个训练样本中的输入序列作为模型输入，所对应和运行状态编号k作为期望输出，对步骤S105构建的基于AME-TCN的故障诊断模型进行训练。

本实施例在模型训练时使用Adam优化算法，该算法相对于普通的随机梯度下降算法(SGD)有更好的训练效果。此外，选择交叉熵损失函数作为模型训练的损失函数，交叉熵损失函数是分类模型的一种常用损失函数，其具体计算方法在此不再赘述。当模型训练的迭代次数大于预设阈值或者交叉熵的值小于预设值时，则模型训练结束，得到训练好的基于AM-TCN的故障诊断模型。

S107：故障诊断：

在工业过程的实际运行过程中，采用步骤S101中的相同方法采集得到N个采样时刻的状态监控数据，并采用步骤S2中的相同方法根据正常运行状态下的均值mean(Z⁰)和标准差std(Z⁰)进行标准化处理，记第n个采样时刻时第m个传感器设备的标准化测量数据为X_n′_,m，构成时间序列S′：

将时间序列S′输入至步骤S106中训练好的基于AM-TCN的故障诊断模型，得到诊断结果。

为了更好地说明本发明的技术效果，采用一个具体实例对本发明进行实验验证。本实施例中采集TE过程在正常运行状态和20种故障运行状态下，则52个传感器设备分别在4800个采样时刻测量得到的状态监控数据。TE过程是由田纳西-伊斯曼化学品公创建的基于一个真实化工过程的仿真，其目的是为评价过程控制和监控方法提供一个现实的工业过程。TE过程是一个很复杂的非线性过程，整个过程涉及变量多，总共包括12个控制变量和41个测量变量。

本实施例中采用基于长短时记忆网络(LSTM)和1维卷积神经网络(1D CNN)的故障诊断方法作为对比方法，其训练集和测试集与本发明相同。采用F1分数(F1 Score)作为评价指标衡量故障诊断模型的性能，F1 Score兼顾了模型的分类精确率和召回率，是一个更全面的模型性能评价指标。F1 Score越大表明故障诊断模型的性能越好。

经研究发现，在20种故障运行状态中，故障3,9,15是极难正确诊断的故障类型，许多方法不能很好对这三种故障进行准确的故障诊断。因此本次实验验证也着重对这三种故障的准确率进行了单独统计。表1是本实施例中本发明AM-TCN模型在故障3,9,15的F1Score和20类故障的平均F1 Score与LSTM和1D CNN的故障诊断结果对比表。

表1

从表1可以看出，本发明的故障F1 Score最高，由于故障F1 Score值越高，表示对故障的诊断效果越好，因此可以看出本发明方法在工业生产系统的故障诊断上具有优异的诊断效果。

尽管上面对本发明说明性的具体实施方式进行了描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。