CN115187832A

CN115187832A - 一种基于深度学习与格拉姆角场图像的能源系统故障诊断方法

Info

Publication number: CN115187832A
Application number: CN202210731437.7A
Authority: CN
Inventors: 阮应君; 郑铭桦; 裴迪; 钱凡悦
Original assignee: Tongji University
Current assignee: Tongji University
Priority date: 2022-06-24
Filing date: 2022-06-24
Publication date: 2022-10-14

Abstract

本发明涉及一种基于深度学习与格拉姆角场图像的能源系统故障诊断方法，该方法依据能源系统各工况下的历史运行数据，将多项运行参数的一维时间序列转换为二维的GAF图像，建立起图像样本集；在此基础上，利用深度学习中的生成式网络对故障图像样本进行样本扩充，平衡样本集；依据平衡后的图像样本集离线训练基于深度学习的故障诊断模型，对实际运行数据的GAF图像进行分类，实现对能源系统的在线故障诊断。与现有技术相比，本发明具有，保障能源系统的供能可靠性与设备安全性，具有较高诊断精度等优点。

Description

一种基于深度学习与格拉姆角场图像的能源系统故障诊断方法

技术领域

本发明涉及能源系统故障诊断技术领域，尤其是涉及一种基于深度学习与格拉姆角场图像的能源系统故障诊断方法。

背景技术

能源是人们生产与生活中所必不可少的，保证能源系统供能可靠性与稳定性尤为重要。然而，能源系统的结构十分庞大且复杂，各设备之间关联密切，系统不确定性因素较多，一旦系统发生故障，通过传统的人工检测方法难以迅速地对故障作出检测与诊断，这不仅会造成能源浪费与设备损伤，而且会直接影响到用户端的用能，造成不必要的损失。因此，需要一项智能化的能源系统故障诊断技术，能快速、准确地检测与诊断出系统故障，为后续系统恢复性控制提供可靠依据。

另外，由于能源系统故障发生概率较小，系统大部分时间都处于正常运行状态，因此系统数据集中正常样本与故障样本会存在数量不平衡的现象，这会影响到最终诊断模型的诊断精度，还导致故障样本被误分类为正常样本，造成严重的后果，目前还没有诊断方法能够有效解决该问题。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于深度学习与格拉姆角场图像的能源系统故障诊断方法。

本发明的目的可以通过以下技术方案来实现：

一种基于深度学习与格拉姆角场图像的能源系统故障诊断方法，该方法包括如下步骤：

步骤1：采集能源系统历史运行数据，并记录所发生的故障类型与发生的时间段。

本步骤中，所采集的能源系统历史运行数据应包括正常运行工况下的数据与所需诊断的故障类型工况下系统的运行数据，而且需记录好所发生的故障类型与故障发生的时间，以便后续为数据样本赋予标签。

步骤2：对所收集得到的系统运行数据进行预处理工作。具体包括以下步骤：

步骤2.1：缺失值填充。搜寻采集数据中的缺失值，并利用线性插值的方法进行填充；线性插值方法如式1所示：

式中，x₀、x₁分别表示为缺失值的前后时间点；y₀、y₁分别表示为缺失值前后时间点所对应的数值；x、

分别表示为缺失值的时间点与填充值。

步骤2.2：机组启停阶段数据剔除。确定机组启动与关停两段非稳态运行的时间，并将这两个阶段中的数据直接剔除。

步骤2.3：异常值剔除。依据拉伊达准则(3σ准则)搜寻出数据中的异常值，进行剔除后利用线性插值的方法进行填充。

拉伊达准则(3σ准则)如公式(2)所示：

式中，X表示系统某参数运行数据的时间序列；x_i表示在第i个时间点上该参数的数值，i＝1,2,…,n；n表示时间序列长度；μ为X的期望；σ为X的标准差；x_j为X中的异常值，位于第j个时间点，通常利用贝塞尔公式进行标准差计算：

表示x₁,x₂,…,x_n的平均值。剔除异常值x_j后，利用式(1)对其进行线性插值填充。

步骤2.4：数据归一化处理。将数据统一归一化到[0，1]，避免因数据之间数量级不同而造成影响。

归一化处理的公式如下：

式中，X＝{x₁,x₂,…,x_n}表示系统某项参数运行数据的时间序列；x_i表示在第i个时间点上该参数的数值；n表示时间序列长度；min(X)表示该参数运行数据的时间序列中的最小值；max(X)表示该参数运行数据的时间序列中的最大值。

步骤3：采用最大相关最小冗余(mRMR)技术对系统运行参数进行筛选，筛选出十个运行参数作为输入特征。

利用最大相关最小冗余(mRMR)技术进行特征选择具体包括以下步骤：

步骤3.1：利用互信息度量系统各参数与系统故障之间的相关性，并对各参数进行降序排列；具体地：

首先确定特征与故障标签相关性。特征与故障之间的非线性相关性可用互信息度量，如公式(4)所示：

式中，f_i表示数据集中某一特征向量；f_i ^j表示特征向量中的第j个元素；c和c_i分别表示标签向量和标签向量中的第i个元素；I(f_i,c)表示某一特征与故障标签的互信息度量。

步骤3.2：确定初始特征子集，向前选择新的特征加入子集，计算新的特征子集与故障之间相关性和子集冗余度，通过相关性与冗余度的比值，重新对特征进行排序；

其中，关于特征子集与故障标签相关性的度量：特征子集包含多个特征向量，特征子集与故障标签的相关性量化评分，如公式(5)所示：

式中，S表示数据集中某一特征子集；|S|表示特征子集中所包含的特征数量；D(S,c)表示特征子集与故障标签的相关性度量。

关于特征子集的冗余性度量：如果特征子集中两个特征f_i与f_j之间的互信息值较高，则说明两个特征之间存在冗余。特征子集S的冗余度评分，如公式(6)所示：

进一步地，对于特征的评选指标：根据特征与故障标签的互信息值，对所有特征进行降序排列。确定初始特征子集，向前选择新的特征加入特征子集，新的特征入选的评选标准，如公式(7)所示：

步骤3.3：选择排名前十的最佳特征作为模型输入特征。

对所有特征进行mRMR计算后，得到了新的特征排序，排名靠前的特征则是与故障标签高度相关且特征之间冗余度较低的优秀特征。选取前十个特征作为输入特征进行后续工作。

步骤4：设置合适大小的时间窗口与滑动步长，对十个输入特征的时间序列进行分割，形成多个数据样本，每个样本对应着一种系统运行工况。

步骤5：将数据样本中各特征的时间序列首尾相接，形成一维序列，并利用格拉姆角场转换矩阵，将其转换为二维的GAF(Gramian Angular Field，格拉姆角场)图像。

步骤6：根据每个数据样本对应的运行工况，为所转换得到的GAF图像赋予标签，构建起图像样本集。

更进一步地，GAF图像样本集的建立过程如下：

首先，设置合适大小的时间窗口与滑动步长对输入特征的一维时间序列进行分割，形成多个数据样本，每个数据样本都对应着一种系统运行工况；

其次，将数据样本中各输入特征的时间序列以首尾相接的形式拼接成一维序列

其中，

代表第i个输入特征的第j个时间点上的数据；i＝1,2,…,10，共十个输入特征；j＝1,2,…,t；t代表所设置的时间窗口尺寸。

随后，将一维序列X_seq进行极坐标转换，序列中的时间戳转换为极坐标系中的半径值，序列的数值转换为极坐标系中的角度值，如公式(8)所示：

式中，

代表X_seq中第i个数据，数值范围处于[0,1]，其对应的时间戳为t_i；N代表时间戳的总数；θ_i代表X_seq中第i个数据所对应的极坐标信号的极角；r代表第i个数据所对应的极坐标信号的极半径。

依据类格拉姆角场转换矩阵，将映射到极坐标系的一维序列转换成二维的GAF图像。类格拉姆角场转换矩阵如公式(9)所示：

式中，Gram matrix为转换矩阵，N为一维序列中信号个数。

根据每个数据样本所对应的系统运行工况，为GAF图像附上相应的标签。为方便后续监督式学习，应将运行工况标签转换成数字标签。最终形成GAF图像样本集。

步骤7：搭建CWGAN-GP生成式网络，利用图像样本集中所有的故障样本对网络进行训练。

步骤8：向训练好的CWGAN-GP输入一定数量服从正态分布的“噪声”与故障标签条件，从而生成出对应的故障样本，实现故障样本的扩充，平衡样本集。

为解决模型训练过程中的样本不平衡问题，本发明将对故障样本进行扩充，以平衡样本集，其包括以下步骤：

首先，搭建CWGAN-GP生成式网络，网络结构包括一个生成网络与一个判别网络，通过生成网络进行图像生成，并利用判别网络对图像进行真假判断。其次，向生成器输入服从正态分布的“噪声”与标签条件，生成一定数量的样本，并为样本附上两个标签，一个是伪样本标签，一个是故障标签。再者，为图像样本集中的故障样本附上真样本标签，并与上述生成样本结合成判别网络的训练样本。在本发明中，“噪声”为服从正态分布的随机向量。

判别网络在训练时，不断地提高自身判别训练样本真伪的能力与判别样本所属类别的能力，并将判别结果反馈到生成网络当中。生成网络根据判别网络所反馈过来的结果进行训练，能够提高所生成图像的质量，使图像更接近于所属类别的真实图像。判别网络与生成网络在不断地博弈学习后达到纳什平衡。最终，可以向训练好的CWGAN-GP中的生成网络输入一定数量的“噪声”与标签条件，从而生成与标签条件相对应故障样本，实现样本集平衡。

作为进一步的优选方式，为了GAN模型训练更稳定，避免梯度消失等问题，将利用瓦瑟斯坦距离(Wassertein Distance)来表征真实故障样本分布与生成故障样本分布之间的差距，并作为生成网络与判别网络的损失函数，而且在判别网络的损失函数中添加一项梯度惩罚项(Gradient Penalty，GP)，最终构成了WGAN-GP模型。梯度惩罚项如公式(10)所示：

式中，x_r,x_g分别代表真实分布与生成分布的样本；

分别代表插值分布样本与插值分布，∈是在[0,1]范围内的随机数；gp是梯度惩罚项，λ是梯度惩罚项的权重，通常取10；

表示的是判别网络对插值分布样本的真假度评价。

在WGAN-GP的基础上添加图像标签进行训练，使生成网络按照输入标签值生成相对应故障样本，最终构成CWGAN-GP模型用于故障样本生成。其中CWGAN-GP中生成网络与判别网络的损失函数如公式(11)所示：

式中，y代表附加条件值，即图像标签；L(D),L(G)分别是判别网络与生成网络的损失函数；x_r,x_g分别代表真实分布与生成分布的样本；p_r,p_g分别代表真实样本分布与生成样本分布。

步骤9：搭建2D-CNN图像分类网络，利用平衡后的图像样本集对网络进行训练；通过对GAF图像的分类实现故障诊断。

本步骤的故障诊断模型的建立包括以下步骤：

步骤9.1：搭建二维卷积生成网络(2D-CNN)图像分类模型，网络包括输入层、卷积层、池化层、全连接层与输出层。通过卷积层与池化层提取二维图像中图像特征，通过全连接层拟合图像特征与故障类型之间的非线性关系，通过输出层输出图像属于各类别的概率，概率最大者则为诊断结果。

步骤9.2：为避免模型出现过拟合现象，网络中添加批量归一化层与Dropout层。

步骤9.3：将平衡后图像样本集按8：2的数量比分为训练集与测试集，训练集按批次输入到诊断模型中进行训练，提高模型的诊断精度，通过多次训练，直至模型收敛。

步骤9.4：利用测试集对诊断模型进行测试，通过多项精度评价指标对诊断模型进行全面评价，如混淆矩阵、准确率、查全率与F1分数等指标。

步骤9.5：向训练好的故障诊断模型输入实际运行数据所转换得到的GAF图像，则可以快速输出图像属于的运行工况，实现在线故障诊断。

本发明提供的基于深度学习与格拉姆角场图像的能源系统故障诊断方法，相较于现有技术至少包括如下有益效果：

1)本发明首先利用最大相关最小冗余(mRMR)技术对能源系统的运行参数进行筛选，选出十个参数作为诊断模型的输入特征；特征筛选工作既能减少输入特征的个数还能保证模型具有较高的诊断精度；而且由于输入特征数量减少，模型训练速度会加快，对计算机的算力要求也降低，根据特征筛选结果，还可以适当减免实际能源系统中的部分传感器，降低系统的初投资成本。

2)本发明利用格拉姆角场矩阵将多项输入特征的一维时间序列转换为二维的GAF图像，由于极坐标系可实现时间序列与极坐标的唯一映射关系，从而保留完整的原始数据信息，而且还保留数据中的时间特性；除此之外，通过将输入特征的时间序列拼接成一维序列再进行GAF图像转换，可凝练出特征数据之间的耦合关系，通过后续2D-CNN提取耦合特征。

3)本发明利用CWGAN-GP生成式网络对故障样本进行扩充，生成大量的故障图像，解决了样本不平衡的问题；利用平衡后的故障样本训练诊断模型，能提高模型的诊断精度，且能减少“假阳性”诊断结果的出现；CWGAN-GP相比于普通的生成式网络，其训练更加稳定，所生成的样本质量更高，且可根据输入的标签条件生成相对应的故障样本。

4)本发明利用CNN作为诊断模型对图像样本进行分类，实现对能源系统故障检测与诊断，CNN具有局部感知、稀疏连接与权重共享等优势，能很好地提取出图像中的深层特征，拟合出特征与故障之间的非线性关系，具有较高的诊断精度，而且无需专家知识的加入，能实现高度智能化。

附图说明

图1为本发明实施例提供的基于深度学习与格拉姆角场图像的能源系统故障诊断方法的具体实施流程示意图；

图2为本发明实施例提供的步骤S1数据预处理具体实施流程示意图；

图3为本发明实施例提供的步骤S2特征选择工作的具体实施流程与原理示意图；

图4为本发明实施例提供的步骤S3多特征时间序列转换为二维GAF图像的具体实施流程与原理示意图；

图5为本发明实施例提供的CWGAN-GP模型训练原理的示意图；

图6为本发明实施例提供的CWGAN-GP模型中生成网络结构与参数设置示意图；

图7为本发明实施例提供的CWGAN-GP模型中判别网络结构与参数设置示意图；

图8为本发明实施例提供的2D-CNN的原理示意图；

图9为本发明实施例提供的2D-CNN诊断模型结构与参数设置示意图；

图10为本发明实施例提供的未平衡样本集所训练得到的诊断模型测试集混淆矩阵；

图11为本发明实施例提供的平衡后样本集所训练得到的诊断模型测试集混淆矩阵；

图12为本发明实施例提供的基于深度学习与格拉姆角场图像的能源系统故障诊断方法针对离心式冷水机组各类型系统工况的诊断精度与总体的诊断精度示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

实施例

本发明涉及一种基于深度学习与格拉姆角场图像的能源系统故障诊断方法，旨在解决现有技术中响应速度慢，诊断精度低，对早期故障不敏感，过多依赖专家经验等问题，实现能源系统故障的快速、准确的检测与诊断。

随着人工智能技术的不断成熟，以机器学习为核心的故障诊断技术得到广泛应用。基于机器学习的故障诊断技术是依靠算法模型提取系统数据中的潜在特征，并通过对模型进行多次训练，能得到数据特征与系统故障之间的非线性关系。尽管基于机器学习的故障诊断技术已经取得了较好的效果，但机器学习算法通常结构较浅、可调参数较少，从而限制了模型对能源系统历史运行数据深层特征的提取能力，进而限制了模型对非平稳性关系的学习能力。

随着计算机算力不断提升，在20世纪初期，深度学习方法被提出。深度学习方法是在机器学习方法的基础上，对算法结构作进一步加深，能提取到数据的深层特征，而且对结构进行了改进，通过不同的改进方式实现不同的功能。深度学习的方法已广泛应用到各个领域，如图像识别、语音处理和文本处理等，都能得到很好的效果。在故障诊断领域，深度学习方法能够从大量的运行数据中提取深层特征，学习到数据与故障之间的复杂非线性关系，进而准确地对故障作出检测与诊断，无需专家知识的加入，实现高度智能化。卷积神经网络(CNN)作为一种经典的深度学习算法，具有局部感知、权重共享、稀疏连接等优势，十分适合处理图像数据，因此在图像识别领域被广泛关注。而能源系统各参数之间存在着耦合关系，故障的发生会引起多个参数发生不同程度的变化，为了故障诊断精度更高，应充分考虑输入特征之间的耦合关系，为此将多项输入特征的一维时间序列转换为二维的GAF(Gramian Angular Field，格拉姆角场)图像，不仅能保留着数据的时序特征，还能够提炼出数据间的耦合特征。将数据样本转换成图像样本，再利用CNN对图像进行识别，实现故障诊断。

基于上述内容，本发明的设计思路在于将采用生成式网络对故障样本进行扩充，平衡样本集，再进行故障诊断模型的训练。本发明搭建CWGAN-GP生成式网络，网络结构包括一个生成网络与一个判别网络，通过生成网络进行图像生成，并利用判别网络对图像进行真假判断。其次，向生成器输入“噪声”(“噪声”指服从正态分布的随机向量)与标签条件，生成一定数量的样本，并为样本附上两个标签，一个是伪样本标签，一个是故障标签。再者，为图像样本集中的故障样本附上真样本标签，并与上述生成样本结合成判别网络的训练样本。

具体方法步骤为：

S1：采集能源系统各种工况下的历史运行数据，并对数据进行预处理。

S2：采用最大相关最小冗余(mRMR)技术进行特征选择，筛选出十个系统参数作为输入特征。

S3：将输入特征的一维时间序列转换为二维的GAF图像，并根据时间序列所处的系统运行工况，为图像附上对应的标签，建立起GAF图像样本集。

S4：搭建深度学习中的生成式网络，利用步骤S3所建立的图像样本集中的故障样本进行模型训练。

S5：向生成式网络输入“噪声”与附加条件，生成一定数量的各类型故障样本，实现样本扩充，平衡样本集。

S6：搭建基于深度学习的故障诊断模型，利用步骤S5平衡后图像样本集对模型进行训练，能准确得到图像所属的故障类型。

S7：对步骤S6的故障诊断模型作全面的精度评价。

以下实施例所使用的实验数据为美国采暖制冷空调工程师协会(ASHRAE)开源的离心式冷水机组故障实验数据(ASHRAE-1043-RP)。依据实施例中的实验数据验证本发明所提出的基于深度学习与格拉姆角场图像的能源系统故障诊断方法，其具体实施方式流程如图1所示。

实施例中所采用的是一台90冷吨离心式冷水机组故障实验数据，其中包含了七种故障类型的运行数据与正常工况下的运行数据。七种故障类型分别是：冷凝器结垢、压缩机润滑油过量、制冷剂中参杂不凝气体、冷凝器水流量减少、蒸发器水流量减少、制冷剂泄漏与制冷剂过充，每种故障都包含有四种不同的故障程度。记录机组运行数据的时间粒度为10秒。由于实施例中直接采用开源的数据集，该数据集已对机组各工况下的运行数据作了详尽地记录与整理，故无需进行数据采集步骤。

然而，在采集离心式冷水机组运行数据的过程中会存在着传感器故障或信号中断等问题，因此数据集中会出现异常值与缺失值，而且冷水机组启停阶段的运行数据处于非稳态阶段，并不具有参考价值。因此要对所采用的数据集进行数据预处理工作，其具体的实施步骤如图2所示。

首先，利用线性插值的方法对数据中的缺失值进行填充；其次，剔除冷水机组在启停阶段的非稳态运行数据；再者，依据拉伊达准则(3σ准则)检测出冷水机组运行数据各参数中的异常值，剔除后利用线性插值的方式进行填充；最后，为了避免各参数数据之间数量级差异而造成的不良影响，依据各参数的最大值与最小值，对数据进行归一化处理，将数据统一到0到1的范围内。

离心式冷水机组故障实验数据集共收集了64项运行参数，其中43项测量参数与21项计算参数。为了提高故障诊断模型的训练效率与诊断性能，需对运行参数进行特征选择工作，利用最大相关最小冗余(mRMR)技术从64项运行参数中筛选出与系统工况相关性最高的十项参数作为输入特征。特征选择工作的流程图与示意图，如图3所示。

首先，计算各参数与故障标签之间的互信息系数，表征参数与故障标签之间的相关性，并依据互信息系数，将参数按降序排列。

其次，确定一个初始特征子集，向前选择新的特征加入子集，计算新的特征子集与故障之间相关性和子集冗余度，通过相关性与冗余度的比值，重新对特征进行排序。

最后，选择排名前十的最佳特征作为故障诊断模型的输入特征。其中包括以下特征：冷凝器进水温度、蒸发器出水温度、压缩机效率、冷凝器出水温度、供油压力、蒸发器进水温度、冷凝器内制冷剂压力、蒸发器冷却速率、冷凝器的渐进温度与冷凝器中制冷剂的过冷温度。

本实施例中所筛选出的十个输入特征的时间序列将按本发明所述的GAF图像转换方法转换为二维图像样本，GAF图像转换的具体流程与各步骤示意图，如图4所示。

首先，设置时间窗口为2分钟，滑动步长为1分钟，将所输入的十个特征时间序列进行分割，获得多个时间序列样本，每个样本中包括十个输入特征长度为2分钟的时间序列。其次，将每个样本中十个特征的时间序列进行首尾拼接形成一维序列，并转变序列的时域。再者，将一维序列中的信号值进行极坐标转换，其转换公式如下所示，序列信号值对应着极坐标中的极角，时间戳对应着极坐标中的半径。

式中，

最后，将极坐标化后的一维序列代入到类格拉姆角场矩阵当中，得到二维的GAF图像。

每段时间序列都对应着一种冷水机组的运行工况，因此每张GAF图像也有相对应的运行工况，为每张图像附上数字标签，代表着机组不同的运行工况。最终可得到正常工况图像样本6928张，其余七类故障图像样本各433张，图像样本集总量为9959张。

在本实施例中正常样本数量与各类故障样本的数量比为16：1，存在样本不平衡问题，将采用本发明中的CWGAN-GP进行故障样本生成，平衡样本集，CWGAN-GP模型训练原理示意图，如图5所示。通过添加故障标签条件实现指定故障类型样本的生成，通过生成网络与判别网络相互博弈，最终达到纳什平衡，实现诊断网络性能的优化。利用样本集中所有的故障样本对CWGAN-GP模型进行训练后，可通过向生成网络输入服从正态分布的“噪声”向量与故障标签，则能输出相对应的故障样本。最终，利用CWGAN-GP模型生成各类故障各6495张图像样本，使各类故障样本数与正常样本数保持一致，均为6928张图像，总图像样本集数量为55424张图像。

CWGAN-GP模型中生成网络的结构与超参数设置，如图6所示，判别网络的结构与超参数设置，如图7所示。生成网络包含三层反卷积层与三层卷积层，反卷积层的作用是对尺寸较小的图像进行扩张，而卷积层的作用是提取图像中的有效特征；判别网络则包含四层卷积层，用于提取输入图像的潜在特征以对图像进行判断。每层网络的参数设置情况在图6与图7中均有说明。

将平衡后的GAF图像样本集按接近8：2的比例分为训练集与测试集，其中每类图像的占比与总样本集保持一致。因此，训练集中包含50424张图像，各类图像包含6303张图像；测试集中包含5000张图像，各类图像包含625张图像。

搭建2D-CNN对GAF图像进行分类，2D-CNN原理示意图，如图8所示。网络模型主要包括输入层、卷积层、最大池化层、全连接层以及输出层。在本实施例中，所搭建的CNN具体的结构与超参数设置，如图9所示，网络共包含输入层、三层卷积层、三层最大池化层、三层全连接层与输出层，各层网络的具体参数设置在图9中均有说明。卷积层用于提取图像特征，池化层用于缩小参数规模，全连接层则用于拟合特征与故障之间的复杂非线性关系，最后输出层通过Softmax函数得到所输入图像属于各类别的概率，其中概率最大的类别则为网络的判断结果。

利用GAF图像训练集对所搭建的2D-CNN进行训练，经过多次迭代后网络趋于收敛。利用测试集对模型性能进行测试，基于未平衡的样本集与平衡后的样本集的混淆矩阵，如图10、图11所示，图10为未平衡样本集的混淆矩阵，图11为平衡后样本集的混淆矩阵(其中，标签“0”代表离心式冷水机组正常运行，标签“1”代表冷凝器结垢故障，标签“2”代表压缩机润滑油过量故障，标签“3”代表制冷剂中含有不凝气体故障，标签“4”代表冷凝器水流量减少故障，标签“5”代表蒸发器水流量减少故障，标签“6”代表制冷剂泄漏故障，标签“7”代表制冷剂过充故障)，混淆矩阵对角线代表着故障诊断模型能正确预测出样本所代表的系统运行工况的个数。从混淆矩阵中可以看出，未平衡的样本集所训练出来的诊断模型虽已达到较高的精度，但会出现“假阳性”的诊断结果，而平衡后的样本集所训练出来的模型精度会有所提高，且减少了“假阳性”结果的发生。图12中所表示的是故障诊断模型对于各类型工况的诊断精度与总体的诊断精度，可见未平衡样本集所训练得到的故障诊断模型总体诊断精度为89.80％，平衡后样本集所训练得到的故障诊断模型总体诊断精度为96.22％，精度提升了6.42％，已达到较高水平。除此之外，平衡样本后的诊断模型对各类别故障的诊断精度也有所提高，且对每种类型的故障的诊断精度都达到95％以上。上述结果表明本发明所提供的基于深度学习与格拉姆角场图像的能源系统故障诊断方法具有优越的效果。

本发明将能源系统输入特征时间序列转换为二维的GAF图像，既保留了原始数据的时序特征，又能提炼出各特征之间的耦合特征。在此基础上，针对样本不平衡的问题，利用深度学习中的生成式网络——CWGAN-GP模型对故障图像样本进行扩充，平衡所构建的图像样本集。依据平衡后的样本集训练所提出的2D-CNN图像分类模型，利用2D-CNN对图像强大的特征提取能力，提取GAF图像的关键特征，实现图像分类，从而实现了能源系统的故障检测与诊断。上述实施例证明，本发明所提出的基于深度学习与格拉姆角场图像的能源系统故障诊断方法能对离心式冷水机组的多种故障进行准确诊断，其诊断精度较高，通过对比平衡与不平衡样本集所训练出的模型的诊断精度，本发明通过解决样本不平衡问题，在一定程度上提高了故障诊断模型的诊断精度。因此，本发明所提出的基于深度学习与格拉姆角场图像的能源系统故障诊断方法对能源系统的故障检测与诊断具有极高的实用价值，为智能化的故障诊断提供了一个可行的方案。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的工作人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于深度学习与格拉姆角场图像的能源系统故障诊断方法，其特征在于，包括下列步骤：

1)采集能源系统各种工况下的历史运行数据，并对历史运行数据进行预处理；

2)采用最大相关最小冗余技术进行特征选择，筛选出十个系统参数作为输入特征；

3)将输入特征的一维时间序列转换为二维的GAF图像，并根据时间序列所处的系统运行工况，为二维的GAF图像附上对应的标签，建立GAF图像样本集；

4)搭建深度学习中的生成式网络，利用步骤3)所建立的GAF图像样本集中的故障样本进行模型训练；

5)向生成式网络输入噪声与附加条件，生成各类型故障样本，实现样本扩充，平衡GAF图形样本集；

6)搭建基于深度学习的故障诊断模型，利用步骤5)平衡后的GAF图像样本集对模型进行训练，获取图像所属的故障类型；

7)向训练好的故障诊断模型输入实际运行数据所转换得到的GAF图像，输出图像所属运行工况，实现在线故障诊断。

2.根据权利要求1所述的基于深度学习与格拉姆角场图像的能源系统故障诊断方法，其特征在于，步骤1)中，对历史运行数据进行预处理的具体步骤包括：

11)检索历史运行数据中缺失值所在位置，利用线性插值方法对缺失值进行填充；

12)将机组启停阶段的数据剔除；

13)依据拉伊达准则剔除系统运行数据异常值，并利用线性插值方法进行数据填充；

14)对步骤13)处理后的数据进行归一化处理。

3.根据权利要求1所述的基于深度学习与格拉姆角场图像的能源系统故障诊断方法，其特征在于，步骤2)的具体步骤包括：

21)采用互信息度量获取特征与故障之间的非线性相关性；

22)获取特征子集与故障标签相关性的度量；

23)确定特征子集的冗余性度量；

24)根据特征与故障标签的互信息值，对所有特征进行降序排列，确定初始特征子集，向前选择新的特征加入特征子集；

25)对所有特征进行mRMR计算后，得到新的特征排序，选取前十个特征作为输入特征进行后续工作。

4.根据权利要求1所述的基于深度学习与格拉姆角场图像的能源系统故障诊断方法，其特征在于，步骤3)中，建立GAF图像样本集的具体步骤包括：

31)设置时间窗口尺寸与窗口滑动步长，对附上对应的标签的二维的GAF图像截取多段输入特征的时间序列，获取多个数据样本；

32)针对一个数据样本，将各输入特征的时间序列首尾相连拼接成一维序列；

33)将步骤32)所构成的一维序列进行极坐标变换；

34)通过类格拉姆角场矩阵，将映射到极坐标系的一维序列转换成二维的GAF图像。

5.根据权利要求1所述的基于深度学习与格拉姆角场图像的能源系统故障诊断方法，其特征在于，在步骤4)中，所述生成式网络为深度学习中生成对抗网络，深度学习中生成对抗网络模型包括用于生成图像的生成网络与用于判断图像真假的判别网络，在深度学习中生成对抗网络模型的训练过程中，令生成网络与判别网络相互博弈学习以达到纳什平衡。

6.根据权利要求5所述的基于深度学习与格拉姆角场图像的能源系统故障诊断方法，其特征在于，在深度学习中生成对抗网络模型的训练过程中，利用瓦瑟斯坦距离表征真实故障样本分布与生成故障样本分布之间的差距，并作为生成网络与判别网络的损失函数，在判别网络的损失函数中添加一项梯度惩罚项构成WGAN-GP模型。

7.根据权利要求6所述的基于深度学习与格拉姆角场图像的能源系统故障诊断方法，其特征在于，在深度学习中生成对抗网络模型的训练过程中，通过在WGAN-GP模型的基础上添加图像标签进行训练，使生成网络按照输入标签值生成相对应故障样本，最终构成用于故障样本生成的CWGAN-GP模型；其中CWGAN-GP模型中生成网络与判别网络的损失函数为：

式中，y位附加条件值，即图像标签；L(D),L(G)分别为判别网络与生成网络的损失函数；x_r,x_g分别为真实分布与生成分布的样本；p_r,p_g分别为真实样本分布与生成样本分布。

8.根据权利要求7所述的基于深度学习与格拉姆角场图像的能源系统故障诊断方法，其特征在于，达到纳什平衡的具体内容为：

在深度学习中生成对抗网络模型的训练过程中，利用少量真实的故障样本图像多次训练CWGAN-GP直至模型收敛；向生成网络输入服从正态分布的噪声与故障图像标签条件，输出相应数量的与输入标签所对应的故障样本图像，进而扩充故障样本，使得样本集达到平衡。

9.根据权利要求1所述的基于深度学习与格拉姆角场图像的能源系统故障诊断方法，其特征在于，步骤6)中，基于深度学习的故障诊断模型采用搭建的二维卷积神经网络模型，搭建的二维卷积神经网络模型包括输入层、三层卷积层、三层最大池化层、三层全连接层、输出层以及三层批量归一化层与三层Dropout层。

10.根据权利要求9所述的基于深度学习与格拉姆角场图像的能源系统故障诊断方法，其特征在于，二维卷积神经网络的训练过程包括下列步骤：

61)从平衡后的GAF图像样本集中随机等比例抽取训练样本与测试样本，用于训练与测试诊断模型；

62)将图像样本训练集输入至搭建好的二维卷积神经网络模型中进行模型训练；

63)根据梯度下降的原理，利用Adam优化器对模型中的可变参数进行优化，通过多次迭代训练，使模型趋于收敛；

64)将测试样本集输入至诊断模型中，二维卷积神经网络模型的输出层通过Softmax函数输出样本归属于各个类别的概率，其中概率最大的类别即为模型所诊断的结果；

65)根据测试结果，对诊断模型进行全面精度评价。