CN114297921A - 基于am-tcn的故障诊断方法 - Google Patents
基于am-tcn的故障诊断方法 Download PDFInfo
- Publication number
- CN114297921A CN114297921A CN202111589058.0A CN202111589058A CN114297921A CN 114297921 A CN114297921 A CN 114297921A CN 202111589058 A CN202111589058 A CN 202111589058A CN 114297921 A CN114297921 A CN 114297921A
- Authority
- CN
- China
- Prior art keywords
- time
- fault diagnosis
- vector
- data
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Testing And Monitoring For Control Systems (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
Abstract
本发明公开了一种基于AM‑TCN的故障诊断方法,首先在工业过程的正常和各个故障运行状态下,采用传感器设备采集状态监控数据,构建时间序列训练样本;然后构建基于AM‑TCN的故障诊断模型,包括注意力机制层、时间卷积网络、全连接层和SoftMax层,其中时间卷积网络由多个时间卷积块堆叠而成;采用训练样本对基于AM‑TCN的故障诊断模型进行训练;在工业过程的实际运行过程,采集状态监控数据并构建时间序列,将时间序列输入训练好的基于AM‑TCN的故障诊断模型中,得到故障诊断结果。本发明结合注意力机制和时间卷积网络构建基于AM‑TCN的故障诊断模型,提升对时序数据的特征提取效果,从而提高工业过程的故障诊断的准确性和鲁棒性。
Description
技术领域
本发明属于工业设备故障诊断技术领域,更为具体地讲,涉及一种基于AM-TCN的故障诊断方法。
背景技术
工业设备的异常监测在现代工业安全中起着重要的作用。及时、准确的故障诊断是避免经济损失和人员伤亡的关键。由于广泛应用的传感器和计算机控制系统收集了大量的监测数据,数据驱动的故障诊断方法因其不需要精确的物理模型和先验知识,得到了广泛的应用。其中,随着计算机科学和数据库技术的发展,基于机器学习的数据驱动的故障诊断方法已经成为一种流行的故障诊断技术。
基于机器学习的故障诊断方法可以分为两类:传统机器学习方法和深度学习方法。许多传统的机器学习方法已经被应用到故障诊断中,如随机森林、支持向量机和k近邻,然而由于上述模型结构较浅,这些方法的故障诊断性能并不令人满意。深度学习是一种有效的非线性特征提取方法,它不仅能克服浅层学习的问题,而且能同时优化特征提取和分类,因此被引入到故障诊断中。其中卷积神经网络(Convolutional Neural Network,CNN)和递归神经网络(Recurrent Neural Network,RNN)在故障诊断得到了广泛地应用。
然而,工业设备的监控数据是典型的时间序列数据,而CNN方法和RNN方法难以获取足够的时间序列信息,上述两种方法的长时间序列建模能力差。此外,工业过程中的监控数据也是典型的多变量数据,存在一些与故障模式高度相关的监控变量。CNN方法和RNN方法赋予了每个输入特征相同的权重,这会对故障诊断性能产生负面影响,因为数据中的一些重要部分需要被关注。同时,由于数据中不可避免地会包含一定的噪声,对一些无用变量给予同等重视,甚至会在一定程度上降低故障诊断能力。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于AM-TCN的故障诊断方法,结合注意力机制(Attention Mechanism,AM)和时间卷积网络(Temporal ConvolutionalNetwork,TCN)构建基于AM-TCN的故障诊断模型,提升对时序数据的特征提取效果,从而提高工业过程的故障诊断的准确性和鲁棒性。
为了实现上述发明目的,本发明基于AM-TCN的故障诊断方法包括以下步骤:
S1:在工业过程的正常运行状态和预设K种故障运行状态下,采用M个传感器设备分别采集得到Tk个采样时刻的状态监控数据,记第k种运行状态下采样时刻为t时第m个传感器设备的测量数据为其中,k=0表示正常运行状态,k=1,2,…,K表示故障状态序号,t=1,2,…,Tk,Tk表示在第k种运行状态下的采样时刻数量,m=1,2,…,M;则第k种运行状态下采样时刻为t时得到的数据向量
对于正常运行状态下的数据矩阵Z0,计算数据向量均值mean(Z0)和标准差std(Z0),计算公式如下:
其中,上标T表示转置;
其中,h=1,2,…,Hk,Hk表示第k种运行状态下所提取到的时间序列子序列的数量;
S5:构建基于AM-TCN的故障诊断模型,包括注意力机制层、时间卷积网络、全连接层和SoftMax层,其中:
注意力机制层用于接收输入序列,为序列中不同时刻的状态监控数据赋予不同权重,得到加权后的时间序列并输出至时间卷积网络,具体方法如下:
记输入序列为S:
记输入序列S通过注意力机制加权得到的时间序列为C:
时间卷积网络用于对输入的加权后的时间序列提取特征并输出至全连接层;时间卷积网络由D层时间卷积块堆叠得到,每个时间卷积块包括扩张因果卷积层和残差连接层;时间序列C中第n个时刻的M维数据向量在经过时间卷积网络处理后得到的特征F(n)采用如下公式表示:
其中,Activation(·)表示ReLU激活函数,d表示扩张因果卷积层的扩张因子,R表示扩张因果卷积层的卷积核尺寸,表示在时间序列C中第(n-d)·r个时刻的数据向量,当(n-d)·r≤0,为0向量,f(r)表示可学习的扩张因果卷积层中的卷积核参数,r=0,1,…,R-1;
全连接层将接收到的特征进行处理得到分类向量并发送至SoftMax层;
SoftMax层对接收到分类向量进行分类得到输入序列对应的运行状态序号的预测值;
S6:将步骤S4得到的各个训练样本中的输入序列作为模型输入,所对应和运行状态编号k作为期望输出,对步骤S5构建的基于AME-TCN的故障诊断模型进行训练;
S7:在工业过程的实际运行过程中,采用步骤S1中的相同方法采集得到N个采样时刻的状态监控数据,并采用步骤S2中的相同方法根据正常运行状态下的均值mean(Z0)和标准差std(Z0)进行标准化处理,记第n个采样时刻时第m个传感器设备的标准化测量数据为Xn′,m,构成时间序列S′:
将时间序列S′输入至步骤S6中训练好的基于AM-TCN的故障诊断模型,得到诊断结果。
本发明基于AM-TCN的故障诊断方法,首先在工业过程的正常和各个故障运行状态下,采用传感器设备采集状态监控数据,构建时间序列训练样本;然后构建基于AM-TCN的故障诊断模型,包括注意力机制层、时间卷积网络、全连接层和SoftMax层,其中时间卷积网络由多个时间卷积块堆叠而成;采用训练样本对基于AM-TCN的故障诊断模型进行训练;在工业过程的实际运行过程,采集状态监控数据并构建时间序列,将时间序列输入训练好的基于AM-TCN的故障诊断模型中,得到故障诊断结果。
本发明所构建的基于AM-TCN的故障诊断模型,通过注意力机制强调更重要的变量对故障诊断的贡献,避免了部分对故障诊断无关的变量对模型决策的误导作用,使得模型更加鲁棒;同时利用时间卷积网络优于CNN和RNN的长时间序列建模能力来获取时间相关性,提取判别特征,从而充分挖掘数据之间的时间相关性;通过结合注意力机制和时间卷积网络,最终使得故障诊断的准确性和鲁棒性得到显著提高。
附图说明
图1是本发明基于AM-TCN的故障诊断方法的具体实施方式流程图;
图2是本发明中基于AM-TCN的故障诊断模型的结构图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明基于AM-TCN的故障诊断方法的具体实施方式流程图。如图1所示,本发明基于AM-TCN的故障诊断方法的具体步骤包括:
S101:收集历史状态监控数据。
在工业过程的正常运行状态和预设K种故障运行状态下,采用M个传感器设备分别采集得到Tk个采样时刻的状态监控数据,记第k种运行状态下采样时刻为t时第m个传感器设备的测量数据为其中,k=0表示正常运行状态,k=1,2,…,K表示故障状态序号,t=1,2,…,Tk,Tk表示在第k种运行状态下的采样时刻数量,m=1,2,…,M。则第k种运行状态下采样时刻为t时得到的数据向量
S102:数据标准化:
为了使得步骤S101所采集的数据能更好的展示工业设备不同运行状态下的数据特点,需要先对数据进行标准化处理,具体方法如下:
对于正常运行状态下的数据矩阵Z0,计算数据向量均值mean(Z0)和标准差std(Z0),计算公式如下:
S103:构建时间序列:
其中,上标T表示转置。
S104:滑动窗口采样生成训练样本:
S105:构建基于AM-TCN的故障诊断模型:
为了实现工业设备的故障诊断,本发明需要构建基于AM-TCN的故障诊断模型。图2是本发明中基于AM-TCN的故障诊断模型的结构图。如图2所示,本发明基于AM-TCN的故障诊断模型包括注意力机制层、时间卷积网络、全连接层和SoftMax层,下面分别对各个组成部分进行详细说明:
注意力机制层用于接收输入序列,为序列中不同时刻的状态监控数据赋予不同权重,得到加权后的时间序列并输出至时间卷积网络,具体方法如下:
记输入序列为S:
记输入序列S通过注意力机制加权得到的时间序列为C:
时间卷积网络用于对输入的加权后的时间序列提取特征并输出至全连接层。时间卷积网络由D层时间卷积块堆叠得到,每个时间卷积块包括扩张因果卷积层和残差连接层。时间序列C中第n个时刻的M维数据向量在经过时间卷积网络处理后得到的特征F(n)采用如下公式表示:
其中,Activation(·)表示ReLU激活函数,d表示扩张因果卷积层的扩张因子,R表示扩张因果卷积层的卷积核尺寸,表示在时间序列C中第(n-d)·r个时刻的数据向量,当(n-d)·r≤0,为0向量,f(r)表示可学习的扩张因果卷积层中的卷积核参数,r=0,1,…,R-1。
全连接层将接收到的特征进行处理得到分类向量并发送至SoftMax层。
SoftMax层对接收到分类向量进行分类得到输入序列对应的运行状态序号的预测值。
全连接层和softmax层是神经网络中的常用单元,其具体过程在此不再赘述。
S106:训练基于AM-TCN的故障诊断模型:
将步骤S104得到的各个训练样本中的输入序列作为模型输入,所对应和运行状态编号k作为期望输出,对步骤S105构建的基于AME-TCN的故障诊断模型进行训练。
本实施例在模型训练时使用Adam优化算法,该算法相对于普通的随机梯度下降算法(SGD)有更好的训练效果。此外,选择交叉熵损失函数作为模型训练的损失函数,交叉熵损失函数是分类模型的一种常用损失函数,其具体计算方法在此不再赘述。当模型训练的迭代次数大于预设阈值或者交叉熵的值小于预设值时,则模型训练结束,得到训练好的基于AM-TCN的故障诊断模型。
S107:故障诊断:
在工业过程的实际运行过程中,采用步骤S101中的相同方法采集得到N个采样时刻的状态监控数据,并采用步骤S2中的相同方法根据正常运行状态下的均值mean(Z0)和标准差std(Z0)进行标准化处理,记第n个采样时刻时第m个传感器设备的标准化测量数据为Xn′,m,构成时间序列S′:
将时间序列S′输入至步骤S106中训练好的基于AM-TCN的故障诊断模型,得到诊断结果。
为了更好地说明本发明的技术效果,采用一个具体实例对本发明进行实验验证。本实施例中采集TE过程在正常运行状态和20种故障运行状态下,则52个传感器设备分别在4800个采样时刻测量得到的状态监控数据。TE过程是由田纳西-伊斯曼化学品公创建的基于一个真实化工过程的仿真,其目的是为评价过程控制和监控方法提供一个现实的工业过程。TE过程是一个很复杂的非线性过程,整个过程涉及变量多,总共包括12个控制变量和41个测量变量。
本实施例中采用基于长短时记忆网络(LSTM)和1维卷积神经网络(1D CNN)的故障诊断方法作为对比方法,其训练集和测试集与本发明相同。采用F1分数(F1 Score)作为评价指标衡量故障诊断模型的性能,F1 Score兼顾了模型的分类精确率和召回率,是一个更全面的模型性能评价指标。F1 Score越大表明故障诊断模型的性能越好。
经研究发现,在20种故障运行状态中,故障3,9,15是极难正确诊断的故障类型,许多方法不能很好对这三种故障进行准确的故障诊断。因此本次实验验证也着重对这三种故障的准确率进行了单独统计。表1是本实施例中本发明AM-TCN模型在故障3,9,15的F1Score和20类故障的平均F1 Score与LSTM和1D CNN的故障诊断结果对比表。
表1
从表1可以看出,本发明的故障F1 Score最高,由于故障F1 Score值越高,表示对故障的诊断效果越好,因此可以看出本发明方法在工业生产系统的故障诊断上具有优异的诊断效果。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (1)
1.一种基于AM-TCN的故障诊断方法,其特征在于,包括以下步骤:
S1:在工业过程的正常运行状态和预设K种故障运行状态下,采用M个传感器设备分别采集得到Tk个采样时刻的状态监控数据,记第k种运行状态下采样时刻为t时第m个传感器设备的测量数据为其中,k=0表示正常运行状态,k=1,2,…,K表示故障状态序号,t=1,2,…,Tk,Tk表示在第k种运行状态下的采样时刻数量,m=1,2,…,M;则第k种运行状态下采样时刻为t时得到的数据向量
对于正常运行状态下的数据矩阵Z0,计算数据向量均值mean(Z0)和标准差std(Z0),计算公式如下:
其中,上标T表示转置;
其中,h=1,2,…,Hk,Hk表示第k种运行状态下所提取到的时间序列子序列的数量;
S5:构建基于AM-TCN的故障诊断模型,包括注意力机制层、时间卷积网络、全连接层和SoftMax层,其中:
注意力机制层用于接收输入序列,为序列中不同时刻的状态监控数据赋予不同权重,得到加权后的时间序列并输出至时间卷积网络,具体方法如下:
记输入序列为S:
记输入序列S通过注意力机制加权得到的时间序列为C:
时间卷积网络用于对输入的加权后的时间序列提取特征并输出至全连接层;时间卷积网络由D层时间卷积块堆叠得到,每个时间卷积块包括扩张因果卷积层和残差连接层;时间序列C中第n个时刻的M维数据向量在经过时间卷积网络处理后得到的特征F(n)采用如下公式表示:
其中,Activation(·)表示ReLU激活函数,d表示扩张因果卷积层的扩张因子,R表示扩张因果卷积层的卷积核尺寸,表示在时间序列C中第(n-d)·r个时刻的数据向量,当(n-d)·r≤0,为0向量,f(r)表示可学习的扩张因果卷积层中的卷积核参数,r=0,1,…,R-1;
全连接层将接收到的特征进行处理得到分类向量并发送至SoftMax层;
SoftMax层对接收到分类向量进行分类得到输入序列对应的运行状态序号的预测值;
S6:将步骤S4得到的各个训练样本中的输入序列作为模型输入,所对应和运行状态编号k作为期望输出,对步骤S5构建的基于AME-TCN的故障诊断模型进行训练;
S7:在工业过程的实际运行过程中,采用步骤S1中的相同方法采集得到N个采样时刻的状态监控数据,并采用步骤S2中的相同方法根据正常运行状态下的均值mean(Z0)和标准差std(Z0)进行标准化处理,记第n个采样时刻时第m个传感器设备的标准化测量数据为X′n,m,构成时间序列S′:
将时间序列S′输入至步骤S6中训练好的基于AM-TCN的故障诊断模型,得到诊断结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111589058.0A CN114297921A (zh) | 2021-12-23 | 2021-12-23 | 基于am-tcn的故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111589058.0A CN114297921A (zh) | 2021-12-23 | 2021-12-23 | 基于am-tcn的故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114297921A true CN114297921A (zh) | 2022-04-08 |
Family
ID=80970119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111589058.0A Pending CN114297921A (zh) | 2021-12-23 | 2021-12-23 | 基于am-tcn的故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114297921A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114970630A (zh) * | 2022-06-01 | 2022-08-30 | 中国人民解放军63796部队 | 一种时序数据多尺度分段的模型训练方法 |
CN116720073A (zh) * | 2023-08-10 | 2023-09-08 | 江苏金恒信息科技股份有限公司 | 一种基于分类器的异常检测提取方法与系统 |
-
2021
- 2021-12-23 CN CN202111589058.0A patent/CN114297921A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114970630A (zh) * | 2022-06-01 | 2022-08-30 | 中国人民解放军63796部队 | 一种时序数据多尺度分段的模型训练方法 |
CN114970630B (zh) * | 2022-06-01 | 2024-04-19 | 中国人民解放军63796部队 | 一种时序数据多尺度分段的模型训练方法 |
CN116720073A (zh) * | 2023-08-10 | 2023-09-08 | 江苏金恒信息科技股份有限公司 | 一种基于分类器的异常检测提取方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111273623B (zh) | 基于Stacked LSTM的故障诊断方法 | |
CN113642754B (zh) | 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法 | |
CN112580263B (zh) | 基于时空特征融合的涡扇发动机剩余使用寿命预测方法 | |
CN111914873A (zh) | 一种两阶段云服务器无监督异常预测方法 | |
CN114297921A (zh) | 基于am-tcn的故障诊断方法 | |
CN108875772B (zh) | 一种基于堆叠稀疏高斯伯努利受限玻尔兹曼机和强化学习的故障分类模型及方法 | |
CN111222549A (zh) | 一种基于深度神经网络的无人机故障预测方法 | |
CN116757534A (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
CN111046961B (zh) | 基于双向长短时记忆单元和胶囊网络的故障分类方法 | |
CN111914897A (zh) | 一种基于孪生长短时间记忆网络的故障诊断方法 | |
CN113743016B (zh) | 基于自编码器和回声状态网络的发动机剩余寿命预测方法 | |
CN102265227A (zh) | 用于在机器状况监视中创建状态估计模型的方法和设备 | |
CN108897354B (zh) | 一种基于深度置信网络的铝熔炼过程炉膛温度预测方法 | |
Gao et al. | A process fault diagnosis method using multi‐time scale dynamic feature extraction based on convolutional neural network | |
CN109240276B (zh) | 基于故障敏感主元选择的多块pca故障监测方法 | |
CN111324110A (zh) | 一种基于多块收缩自动编码器的发酵过程故障监测方法 | |
CN114297918A (zh) | 基于全注意力深度网络和动态集成学习的航空发动机剩余寿命预测方法 | |
CN112116002A (zh) | 一种检测模型的确定方法、验证方法和装置 | |
CN112904810A (zh) | 基于有效特征选择的流程工业非线性过程监测方法 | |
CN111079348B (zh) | 一种缓变信号检测方法和装置 | |
CN115438897A (zh) | 一种基于blstm神经网络的工业过程产品质量预测方法 | |
CN113159225B (zh) | 多变量工业过程故障分类方法 | |
CN116821804A (zh) | 一种基于多特征融合的压裂泵单向阀故障在线监测方法 | |
CN115659271A (zh) | 传感器异常检测方法、模型训练方法、系统、设备及介质 | |
CN114932582B (zh) | 一种基于Bi-GRU自编码器的机器人小概率失效预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |