CN116701948B - 管道故障诊断方法及系统、存储介质和管道故障诊断设备 - Google Patents
管道故障诊断方法及系统、存储介质和管道故障诊断设备 Download PDFInfo
- Publication number
- CN116701948B CN116701948B CN202310968582.1A CN202310968582A CN116701948B CN 116701948 B CN116701948 B CN 116701948B CN 202310968582 A CN202310968582 A CN 202310968582A CN 116701948 B CN116701948 B CN 116701948B
- Authority
- CN
- China
- Prior art keywords
- data
- pipeline
- fault diagnosis
- network
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000003745 diagnosis Methods 0.000 title claims abstract description 71
- 238000003860 storage Methods 0.000 title claims abstract description 9
- 239000003208 petroleum Substances 0.000 claims abstract description 19
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims abstract description 6
- 238000009826 distribution Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 19
- 230000004913 activation Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 8
- 230000001965 increasing effect Effects 0.000 claims description 7
- 238000012512 characterization method Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 5
- 239000002131 composite material Substances 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000007704 transition Effects 0.000 claims description 4
- 238000005728 strengthening Methods 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims 1
- 238000010276 construction Methods 0.000 claims 1
- 230000001737 promoting effect Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 8
- 230000002411 adverse Effects 0.000 abstract description 5
- 238000001514 detection method Methods 0.000 abstract description 2
- 208000009119 Giant Axonal Neuropathy Diseases 0.000 description 9
- 201000003382 giant axonal neuropathy 1 Diseases 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000036541 health Effects 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000032683 aging Effects 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013256 Gubra-Amylin NASH model Methods 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
管道故障诊断方法及系统、存储介质和管道故障诊断设备,属于机械故障检测与诊断技术领域,用于解决现有的智能诊断模型在小样本、不平衡数据集下准确率较低的问题。技术要点:利用传感器采集管道故障数据以及正常数据,组成真实数据集;构建时序生成网络,学习真实数据时序特征和类别特征,生成更加符合工程实际的管道数据;构建判别网络,判别其输入数据是否为真实数据;根据质量与多样性指标确定时序生成网络下一模态;利用Adam优化器交替更新时序生成网络与判别网络直至收敛;将训练好的时序生成网络用于扩充管道数据集,实现石油管道故障类别识别。本发明有效克服小样本、不平衡数据集对管道故障诊断的不利影响,进而提升管道故障诊断的可靠性。
Description
技术领域
本发明涉及一种面向小样本、不平衡数据的石油管道故障诊断方法及系统、存储介质和管道故障诊断设备,涉及石油管道的故障诊断技术,属于机械故障检测与诊断技术领域。
背景技术
长输管道是现代石油与天然气运输的重要载体。长输管道具有管径大、压力高、输量大、运距长等特点。我国长输管道运行年限久,管体老化破损等现象异常突出。近年来,由于管道老化腐蚀等原因造成的油气外泄事件给人民生活和社会经济都带来了无法弥补的严重后果。因此,保证长输管道安全稳定运行具有重要的现实意义。随着人工智能技术在工业故障诊断领域的深入应用,从传感器数据中挖掘故障特征,并利用深度神经网络识别故障类别,已经成为了新的技术手段。
尽管当前智能方法很大程度上提高了故障诊断精度,但在实际工程中,长输管道长期运作在正常状态下,导致收集的故障管道数据数量远远小于正常管道数据数量。此外,长输管道通常采用埋地方式敷设,服役环境复杂,采集高质量管道数据的成本十分昂贵。这些现实情况最终形成了小样本、不平衡数据集。通常来讲,深度神经网络是带有海量参数的多层神经网络。充足且平衡的数据集可以帮助深度神经网络更好地拟合参数,提高泛化能力。在这样的约束下,小样本、不平衡数据集将会导致实际场景下的诊断准确率明显偏向数据集中的多数类管道数据,从而导致高漏报率和误报率。因此,受小样本、不平衡数据集的影响,现有石油管道故障诊断模型准确率较低,难以满足工程要求。
发明内容
现有的石油管道智能诊断模型或方法面对小样本、不平衡数据集时性能退化,无法克服小样本、不平衡数据集对故障诊断的不利影响,导致管道故障诊断在实际工程中的准确率较低的问题。
本发明为解决上述技术问题所采用的技术方案是:
一种面向小样本、不平衡数据的管道故障诊断方法,所述方法包括如下步骤:
步骤1:采集传感器数据,构建真实数据集,其中/>为第/>个真实管道数据,由/>个采样点组成;/>为第/>个数据标签;/>为数据数量;
步骤2:从高斯分布中采样,构建随机变量集,其中/>为第/>个随机变量,/>为随机变量的数量;
步骤3:构建多模态时序对抗网络,包括一个时序生成网络和一个判别网络/>:时序生成网络/>由五层反卷积和一层全连接网络构成,采用ReLu作为中间层激活函数,Tanh作为输出层激活函数;判别网络/>由四层卷积和两层全连接网络构成,采用ReLu作为中间层激活函数,Sigmoid作为输出层激活函数;
步骤4:构建时序趋势学习模块,利用分段线性表征法将真实数据和合成数据/>划分为不同模式的区段,计算对应区段真实数据和合成数据的相似性,具体形式如下:
其中,是权重系数;/>代表第/>区间段时间序列的长度;/>代表第/>个合成数据的第/>区间所属模式;/>代表第/>个真实数据的第/>区间所属模式;
步骤5:构建同类特征学习模块,加大同类别判别特征相似度,具体形式如下:
其中,为类别总数;/>表示再生核希尔伯特空间;/>代表非线性映射;/>代表类别分布;
步骤6:构建不同类特征学习模块,加大不同类别判别特征区分度,具体形式如下:
步骤7:基于Adam优化器,交替更新时序生成网络与判别网络的参数集合,以最小化如下目标函数:
其中,为真实数据分布;/> 为随机变量分布;/>为权重系数;
步骤8:利用质量与多样性指标评估当前时序生成网络所属模态:
其中,为平衡系数;/>代表所有指标中的最小值;/>代表所有指标中的最大值;
步骤9:根据质量与多样性指标所属范围,控制的取值。具体实现方式如下:当时,/>;当/>时,/>;当/>时,/>;当/>时,/>;
步骤10:重复依次执行步骤4至步骤9迭代优化时序生成网络和判别网络;待多模态时序对抗网络训练完成后,将步骤2中获得的随机变量输入到时序生成网络中生成管道数据,进而扩充诊断训练集;
步骤11:利用步骤10获得的石油管道数据集训练管道故障诊断模型,得到管道故障类别。
一种面向小样本、不平衡数据集的管道故障诊断系统,该系统具有与上述技术方案的步骤对应的程序模块,运行时执行上述的面向小样本、不平衡数据集的管道故障诊断方法中的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现上述的面向小样本、不平衡数据集的管道故障诊断方法的步骤。
一种石油管道故障诊断设备,所述石油管道故障诊断设备包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上所述的面向小样本、不平衡数据集的管道故障诊断方法。
本发明提出的一种面向小样本、不平衡数据的管道故障诊断方法的技术要点:首先,该方法通过加强真实数据与合成数据之间时序趋势的一致性,提高了合成管道数据的真实性。此外,该方法通过加大真实数据与合成数据之间同类别特征的相似度和不同类别特征的区分度,提高了合成管道数据的可判别性。最后,该方法通过生成高质量、多样性强的管道数据扩充了管道数据集,有效克服了小样本、不平衡数据集对诊断性能的不利影响,提高了管道故障诊断准确率和在实际工程中的精度,具有可操作性和实用价值。
本发明考虑了合成数据与真实数据之间时间趋势的相似性和类别特征的统一性,能够有效克服小样本、不平衡数据对管道故障诊断的不利影响,大大提升管道故障诊断的可靠性,解决了现有的石油管道智能诊断模型在小样本、不平衡数据集下准确率较低的问题。
本发明利用传感器采集管道故障数据以及正常数据,组成真实数据集;构建时序生成网络,学习真实数据时序特征和类别特征,目的是生成更加符合工程实际的管道数据;构建判别网络,判别其输入数据是否为真实数据;根据质量与多样性指标确定时序生成网络下一模态;利用Adam优化器交替更新时序生成网络与判别网络直至收敛;将训练好的时序生成网络用于扩充管道数据集,实现石油管道故障类别识别。
本发明提出的方法,统计特性更接近于真实数据,有效降低了诊断误报率和漏报率,提高了管道故障诊断准确率。本发明所述方法经仿真实验和实际应用,均验证了本发明所声称的技术效果和实用性。
本发明的有效性和优点在发明内容中体现在:
1、本发明采用深度神经网络进行构建,具有优越的非线性表征能力、特征提取能力和可操作性。
2、本发明采用时序趋势学习模块,提高合成数据时间结构的真实性,在整体趋势角度保证了合成数据的质量。
3、本发明采用同类特征学习模块和不同类特征学习模块,提高合成数据判别特征的可靠性,从深度特征角度保证合成数据的有效性。本发明引入马尔可夫链实现四种模态的自适应切换优化,提升训练稳定性。
附图说明
图1是根据本发明实施例的多模态时序对抗网络故障诊断流程框图;
图2是本发明实施例的合成数据与真实数据的可视化实例图,图中横坐标表示时间,纵坐标表示振幅,实线代表合成数据,虚线代表真实数据;
图3是TCGN算法的网络结构示意图;图中:基于马尔可夫链的多模态切换策略框架图内,生成器与判别器框内的英文代表采用的网络结构与激活函数,例如,ConvTranspose1d代表一维反卷积,BatchNorm1d代表一维批标准化操作,ReLu代表非线性激活函数等,其他英文含义也是本领域公知含义;
图4是真实样本和生成样本的比较图;
图5是真实分布和生成分布之间的统计学相似性仿真界面截图。
具体实施方式
下面结合附图对本发明作进一步说明:
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
图1是本发明技术方案中的多模态时序对抗网络故障诊断流程框图,整体流程由Python语言编程实现。参照图1,一种面向小样本、不平衡数据的管道故障诊断方法,包括以下步骤:
步骤1:采集传感器数据,构建真实数据集,其中/>为第/>个真实管道数据,由/>个采样点组成;/>为第/>个数据标签;/>为数据数量;
步骤2:从高斯分布中采样,构建随机变量集,其中/>为第/>个随机变量,为随机变量的数量;
步骤3:构建多模态时序对抗网络,包括一个时序生成网络和一个判别网络/>:时序生成网络/>由五层反卷积和一层全连接网络构成,采用ReLu作为中间层激活函数,Tanh作为输出层激活函数;判别网络/>由四层卷积和两层全连接网络构成,采用ReLu作为中间层激活函数,Sigmoid作为输出层激活函数;
步骤4:构建时序趋势学习模块,利用分段线性表征法将真实数据和合成数据/>划分为不同模式的区段,计算对应区段真实数据和合成数据的相似性,具体形式如下:
其中,是权重系数;/>代表第/>区间段时间序列的长度;/>代表第/>个合成数据的第/>区间所属模式;/>代表第/>个真实数据的第/>区间所属模式;
步骤5:构建同类特征学习模块,加大同类别判别特征相似度,具体形式如下:
其中,为类别总数;/>表示再生核希尔伯特空间;/>代表非线性映射;/>代表类别分布;
步骤6:构建不同类特征学习模块,加大不同类别判别特征区分度,具体形式如下:
步骤7:基于Adam优化器,交替更新时序生成网络与判别网络的参数集合,以最小化如下目标函数:
其中,为真实数据分布;/> 为随机变量分布;/>为权重系数;
步骤8:利用质量与多样性指标评估当前时序生成网络所属模态:
其中,为平衡系数;/>代表所有指标中的最小值;/>代表所有指标中的最大值;
步骤9:根据质量与多样性指标所属范围,控制的取值。具体实现方式如下:当时,/>;当/>时,/>;当/>时,/>;当/>时,/>;
步骤10:重复依次执行步骤4至步骤9迭代优化时序生成网络和判别网络;待多模态时序对抗网络训练完成后,将步骤2中获得的随机变量输入到时序生成网络中生成管道数据,进而扩充诊断训练集;
步骤11:利用步骤10获得的石油管道数据集训练管道故障诊断模型,得到管道故障类别。
在步骤1中,利用传感器采集不同严重程度的管道故障数据以及正常运行状态下的管道数据,构建真实数据集。
在步骤1中,数据集包含大泄漏、中泄漏、小泄漏以及正常四种类别。
在步骤7中, 作为平衡步骤4的时序趋势学习模块、步骤5的同类特征学习模块和步骤6的不同类特征学习模块的平衡系数,需要利用步骤8和步骤9共同构成的多模态切换策略决定。
所述多模态切换策略由马尔可夫链来实现,其主要原理在于根据设定的概率矩阵令模型在不同状态下进行跳转,多模态切换策略的实现过程为:
GAN是一种深度生成模型,其基本思想源自于博弈论中的二人零和博弈,目的是估测真实数据的潜在分布并从中随机生成新的数据。标准GAN算法由一个生成器和一个判别器构成,生成器以潜在随机变量为输入,输出与真实数据相似的合成数据。而判别器的任务是精准区分真实数据与合成数据, 两者交替更新,直至纳什平衡。由此,可以得到生成器损失函数为:
式(1)中, G和D分别表征生成器和判别器;z代表潜在变量,是其概率分布;/>代表判别器的输入是真实数据而非合成数据的概率,其损失函数为:
式(2)中,x表示真实数据;代表真实数据的分布。
本发明提出基于马尔可夫链的多模态时序对比生成模型(Time-SeriesContrastive Generative Network, TCGN):
为了维持不同学习任务之间的动态平衡,设计了一种基于马尔可夫链的多模态切换策略,有效提高了合成数据的质量,TCGN算法的整体结构,如图3所示。下面对TCGN算法的原理进行详细说明。
(3)探索模态{ = 3}
TCGN算法的主要任务是加强同类别合成数据与真实数据之间的相互关联,提升合成序列判别特征的可靠性。该模态的损失函数描述如下:
式(15)中,γ是调整生成损失和类内损失比例的超参数。
(4)收敛模态{ = 4}
为了加速生成器进入全局最优区域的进程,在此模态,我们仅采用了单一生成损失,加快模型收敛速度。该模态的损失函数可表述为如下形式:
在训练的开始阶段,设定生成器为生成模态,在经过演化因子评估后,马尔可夫链会以一定的概率预测生成器在下一阶段的所属模态,此过程的转移概率矩阵可以定义为:
本发明所使用的训练数据采自于管道仿真平台中的电压传感器。管道总长度为180m,实验过程中设置压力为0.5Mpa,流速为10m3/h,信号的采样频率为1024Hz. 根据阀门开合度,数据集中包括大泄漏、中泄漏、小泄漏、正常四种健康状态,总样本量为2000,每种健康状况下样本量为500。
TCGN算法由两个模型组成,即生成器和判别器,其架构如表1和表2所示。在TCGN算法的训练过程中,总迭代次数为2000;每次循环中,判别器训 练次数为5,生成器训练次数为10;批量大小为100;训练采用的优化器为Adam,学习率为1e-4;均为0.01;平衡超参数/>为0.001。本发明中所提及的算法均由PyTorch框架搭建,在NVIDIA GEFORCE RTX 3090GPU上训练。
表 1 判别器模型结构
表 2 生成器模型结构
为了全面评估TCGN算法的生成性能,本发明选取了7种数据增强方法进行对比。详细介绍如下:
(1)SMOTE:该方法以每个样本点的k个近邻样本点为依据,随机选择N个邻近点进行插值,从而达到合成数据的目的;(2)变分自动编码器(Variational Auto-Encoders,VAE): 该方法以真实数据为模型输入,利用深度自编码优化无监督重构误差,并缩小隐层输出分布与标准正态分布之间的距离,提高生成数据质量;(3)LSGAN:该方法采用平方误差作为目标函数,从而提高GAN模型的训练稳定性;(4)ACGAN:不同于传统的对抗框架(即, 仅包含一个生成器与一个判别器),该方法额外采用了一个辅助分类器输出数据的类别概率,并优化分类损失。ACGAN不仅能产生特定标签的数据,还可以提高生成数据的质量;(5)InfoGAN:该方法以随机变量与可解释特征为模型输入,其目的是增强生成数据与可解释特征之间的相似度,从而有效控制数据模式;(6)TTS-GAN:该方法采用Transformer结构构建生成器与判别器,其中时间序列数据被看作是一个高度等于1的图像;(7)MAD-GANs:该方法以长短期记忆递归神经网络(LSTM-RNN)为基础结构建立生成器与判别器,目的是捕捉时间序列分布的时间相关性。
为了比较生成的样本和相应的真实样本之间的相似性,将生成的管道数据以折线图的方式进行呈现,如图4所示,其中第一行为大泄漏,第二行为中泄漏,第三行为小泄漏,第四行为正常状态。首先,从图4(a)-(b)中可以看出,SMOTE算法与VAE算法很难恢复真实数据时间维度上的振幅变化,导致合成序列仅具有大致趋势而不具备有效判别特征,图4(c)-(e)中的合成数据虽然在变化趋势与幅值方面都与真实数据接近,但这些算法弱化了管道数据的时间属性,导致合成数据中包含过多的噪声,无法用于扩充管道数据集。此外,由于TTS-GAN算法与MAD-GANs算法采用了适用于学习时间序列的网络结构,因此生成的数据较之前的算法特征更加显著,但仍包含一定的噪声,如图4(f)-(g)所示。不同于上述对比算法,TCGN算法很好地学习了样本空间的时间信息与判别特征,这使得合成管道数据的局部细节与整体结构都更加自然和平滑。
为了进一步验证合成数据的有效性,利用MMD作为量化生成算法性能的一个统计指标MMD的基本思想在于:以两个分布之间差距最大的阶矩作为度量两个分布相似性的标准。一般来说,该值越小就意味着两个分布越相似。图5展示了不同健康状态下的实验结果。从柱状图的分布中可以看出,TCGN算法明显优于所有的对比算法,在四种健康状态中均取得了最佳的统计结果,具体来说,SMOTE算法和VAE算法的所有健康状态MMD值均超过3.0。同时,LSGAN,ACGAN,InfoGAN,TTS-GAN的MMD值均高于2.0。此外,从图中可以看出,MAD-GANs取得了相对较好的统计结果。尽管如此, TCGN算法的大泄漏、小泄漏、正常状态的MMD值均在1.5以下,小于几乎所有算法的MMD值(中泄漏状态与MAD-GAN持平)。通过以上分析,可以得出结论:TCGN算法生成的管道数据,其统计特性更接近于真实数据。
本发明通过引入基于马尔可夫链的多模态切换策略,实现了TCGN算法在生成、刻画、探索、收敛四个模态之间的自适应切换优化,有效提高了合成数据的质量。将所提出的TCGN算法应用于管道数据增强,成功解决了小样本和类不平衡问题。实验结果表明TCGN算法在视觉评估和量化指标方面均优于一些已存在的数据增强算法,显著提升了管道故障诊断准确率。
本发明提出的算法(方法)是本发明底层的技术内核,基于所述算法能衍生出各种产品。
基于本发明提出的算法(方法)利用程序语言开发出一种面向小样本、不平衡数据集的管道故障诊断系统,该系统具有与上述技术方案的步骤对应的程序模块,运行时执行上述的面向小样本、不平衡数据集的管道故障诊断方法中的步骤。
将开发出的系统(软件)的计算机程序存储在计算机可读存储介质上,所述计算机程序配置为由处理器调用时实现上述的面向小样本、不平衡数据集的管道故障诊断方法的步骤。即将本发明物化在载体上,成为一种计算机程序产品。
一种石油管道故障诊断设备,其特征在于:所述石油管道故障诊断设备包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的面向小样本、不平衡数据集的管道故障诊断方法。石油管道故障诊断设备作本发明应用的终端产品。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
本发明中的计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置PLD),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,都在本发明的保护范围之内。
实施例:以石油管道的故障诊断为案例,对本发明方法的有效性进行验证。
从石油管道故障仿真平台获取真实数据集。该数据集包含四种类别:正常、大泄漏、中泄漏、小泄漏。故障数据在压力0.5MPa的状态下获取,数据采集频率为1024Hz。数据集中正常状态数据量为500个,大泄漏、中泄漏、小泄漏的数据量为250个,每个数据中包含1024个采样点。
基于采集的管道数据集,验证本发明的可行性。为了减小随机因素的影响,所有的诊断实验被重复十次,计算十次诊断准确率的均值。
如图2所示,本发明方法可以有效地保留管道数据的时间趋势,提高了时间结构的真实性,使得生成的数据与对应类别真实数据之间具有极高的相似性。此外,可以发现,不同类别的生成数据之间也具有明显的区分性,因此可以显著提升故障诊断准确率。
如表1所示,本发明方法取得了误报率为0.00%,漏报率为0.03%,准确率为99.97%的诊断精度。这说明本发明方法的诊断准确率高,验证了本方法在克服小样本、不平衡数据集上的可行性。另外选取两种故障诊断方法与本方法进行比较。方法一具有与本发明相同结构的对抗框架,区别在于无时序趋势学习模块。从表中可以看出,方法一的误报率为10.12%,漏报率为14.11%,准确率为85.89,准确率低于本方法。方法二具有与本发明相同结构的对抗框架,区别在于无同类特征学习模块和不同类特征学习模块。从表中可以看出,方法二的误报率为4.06%,漏报率为18.47%,准确率为81.83%,准确率明显低于本方法。通过对比本发明与两种其他诊断方法,可以发现本发明有效克服了小样本、不平衡数据集对故障诊断的不利影响,降低了诊断误报率和漏报率,提高了诊断准确率。
表1 管道故障诊断误报率、漏报率、准确率
诊断方法 | 误报率 | 漏报率 | 准确率 |
本发明 | 0.00 | 0.03 | 99.97 |
方法一 | 10.12 | 14.11 | 85.89 |
方法二 | 4.06 | 18.47 | 81.83 |
综上,本发明提出的方法,统计特性更接近于真实数据,有效降低了诊断误报率和漏报率,提高了管道故障诊断准确率。本发明所述方法经仿真实验和实际应用,均验证了本发明所声称的技术效果和实用性。
Claims (7)
1.一种面向小样本、不平衡数据集的管道故障诊断方法,所述管道故障诊断方法为石油管道故障诊断方法,其特征在于,实现过程为:
步骤1:采集传感器数据,构建真实数据集其中/>为第i个真实管道数据,由N个采样点组成;/>为第i个数据标签;nr为数据数量;
步骤2:从高斯分布中采样,构建随机变量集其中zj为第j个随机变量,nt为随机变量的数量;
步骤3:构建多模态时序对抗网络,包括一个时序生成网络Gt和一个判别网络D:时序生成网络Gt由五层反卷积和一层全连接网络构成,采用ReLu作为中间层激活函数,Tanh作为输出层激活函数;判别网络D由四层卷积和两层全连接网络构成,采用ReLu作为中间层激活函数,Sigmoid作为输出层激活函数;
步骤4:构建时序趋势学习模块,利用分段线性表征法将真实数据和合成数据划分为不同模式的区段,计算对应区段真实数据和合成数据的相似性,具体形式如下:
其中,ωq,h=lq,h/N是权重系数;lq,h代表第q区间段时间序列的长度;代表第h个合成数据的第q区间段所属模式;/>代表第h个真实数据的第q区间段所属模式;Q表示区间段数量;
步骤5:构建同类特征学习模块,加大同类别判别特征相似度,具体形式如下:
其中,K为类别总数;表示再生核希尔伯特空间;/>代表非线性映射;Pk代表类别分布;
步骤6:构建不同类特征学习模块,加大不同类别判别特征区分度,具体形式如下:
步骤7:基于Adam优化器,交替更新时序生成网络与判别网络的参数集合,以最小化如下目标函数:
其中,为真实数据分布;/>为随机变量分布;α,β,λ为超参数;
步骤8:利用质量与多样性指标评估当前时序生成网络所属模态:
其中,μ为平衡系数;Smin代表所有指标中的最小值;Smax代表所有指标中的最大值;S表示质量与多样性指标的评估分数;
步骤9:根据质量与多样性指标所属范围,控制平衡超参数α,β,λ的取值;
步骤10:重复依次执行步骤4至步骤9迭代优化时序生成网络和判别网络;待多模态时序对抗网络训练完成后,将步骤2中获得的随机变量输入到时序生成网络中生成管道数据,进而扩充诊断训练集;
步骤11:利用步骤10获得的石油管道数据集训练管道故障诊断模型,利用训练好的管道故障诊断模型得到管道故障类别;
在步骤7中,α,β,λ作为平衡步骤4的时序趋势学习模块、步骤5的同类特征学习模块和步骤6的不同类特征学习模块的超参数,需要利用步骤8和步骤9共同构成的多模态切换策略决定;
所述多模态切换策略由马尔可夫链来实现,其主要原理在于根据设定的概率矩阵令模型在不同状态下进行跳转;
多模态切换策略的实现过程为:
将TCGN的生成器分为四种不同的模态,即生成、刻画、探索和收敛,并引入马尔可夫链实现四种模态的自适应切换优化以提升训练稳定性;
假设ξ(h),h≥0,ξ(h)是在有限状态空间R={1,2,...,M}中取值的马尔可夫链,其概率转移矩阵P=(pij)M×M可以通过下式得出:
P={ξ(h+1)=j|ξ(h)=i}=pij(9)
式(9)中,pij≥0,i,j∈R,代表从i到j的转移概率,且
基于马尔可夫链的多模态切换策略的原理如下:根据生成器当前迭代次数下的所属模态来预测下一时刻的生成器模态,从而完成不同任务之间的切换学习,引入演化因子Ef来判定生成器所属模态,Ef的定义如下:
式(10)中,Smin代表所有指标中的最小值;Smax代表所有指标中的最大值;质量与多样性指标的评估分数S的计算方式如下:
式(11)中,第一项是判别分数均值,代表合成数据的真实性;第二项是判别器的负对数梯度范数,表征合成数据的多样性;μ为平衡系数;
根据演化因子Ef的值,可以评估生成器的当前模态,如下所示:
式(12)中,ξ(h)=1代表生成模态;ξ(h)=2代表刻画模态;ξ(h)=3代表探索模态;ξ(h)=4代表收敛模态,S表示质量与多样性指标的评估分数,具体细节描述如下:
(1)生成模态{ξ(h)=1}
TCGN算法的主要目的是完成从无序潜在变量到时序结构的映射;在生成模态,TCGN联合优化生成器损失与TTC损失,以提升合成数据时间维度的真实性,如下所示:
式(13)中,α是平衡生成损失和TTC损失的超参数;
(2)刻画模态{ξ(h)=2}
TCGN算法的任务是学习不同类别真实数据和合成数据之间的差异,促进模型学习决策边界;在此模态,TCGN联合优化了生成器损失与类间损失,如下所示:
式(14)中,β是控制生成损失与类间损失平衡的超参数;
(3)探索模态{ξ(h)=3}
TCGN算法的主要任务是加强同类别合成数据与真实数据之间的相互关联,提升合成序列判别特征的可靠性;该模态的损失函数描述如下:
式(15)中,λ是调整生成损失和类内损失比例的超参数;
(4)收敛模态{ξ(h)=4}
为加速生成器进入全局最优区域的进程,在此模态仅采用单一生成损失加快模型收敛速度,该模态的损失函数可表述为如下形式:
在训练的开始阶段,设定生成器为生成模态,在经过演化因子评估后,马尔可夫链会以一定的概率预测生成器在下一阶段的所属模态,此过程的转移概率矩阵可以定义为:
2.根据权利要求1所述的一种面向小样本、不平衡数据集的管道故障诊断方法,其特征在于,在步骤1中,利用传感器采集不同严重程度的管道故障数据以及正常运行状态下的管道数据,构建真实数据集。
3.根据权利要求1所述的一种面向小样本、不平衡数据集的管道故障诊断方法,其特征在于,在步骤1中,数据集包含大泄漏、中泄漏、小泄漏以及正常四种类别。
4.根据权利要求1、2或3任一项权利要求所述的一种面向小样本、不平衡数据集的管道故障诊断方法,其特征在于,在步骤9中,根据质量与多样性指标所属范围,控制平衡系数α,β,λ的取值,具体实现方式如下:当0≤Ef<0.25时,α=1,β=λ=0;当0.25≤Ef<0.5时,α=λ=0,β=1;当0.5≤Ef<0.75时,α=β=0,λ=1;当0.75≤Ef<1时,α=β=λ=0。
5.一种面向小样本、不平衡数据集的管道故障诊断系统,其特征在于:该系统具有与上述权利要求1-4任一项权利要求的步骤对应的程序模块,运行时执行上述的面向小样本、不平衡数据集的管道故障诊断方法中的步骤。
6.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现权利要求1-4中任一项所述的面向小样本、不平衡数据集的管道故障诊断方法的步骤。
7.一种石油管道故障诊断设备,其特征在于:所述石油管道故障诊断设备包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的面向小样本、不平衡数据集的管道故障诊断方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310968582.1A CN116701948B (zh) | 2023-08-03 | 2023-08-03 | 管道故障诊断方法及系统、存储介质和管道故障诊断设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310968582.1A CN116701948B (zh) | 2023-08-03 | 2023-08-03 | 管道故障诊断方法及系统、存储介质和管道故障诊断设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116701948A CN116701948A (zh) | 2023-09-05 |
CN116701948B true CN116701948B (zh) | 2024-01-23 |
Family
ID=87824289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310968582.1A Active CN116701948B (zh) | 2023-08-03 | 2023-08-03 | 管道故障诊断方法及系统、存储介质和管道故障诊断设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116701948B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114022311A (zh) * | 2021-11-16 | 2022-02-08 | 东北大学 | 基于时序条件生成对抗网络的综合能源系统数据补偿方法 |
CN114692506A (zh) * | 2022-04-13 | 2022-07-01 | 浙江工业大学 | 一种基于改进TimeGAN模型的小样本故障诊断方法 |
WO2023044979A1 (zh) * | 2021-09-27 | 2023-03-30 | 苏州大学 | 类不平衡数据集下的机械故障智能诊断方法 |
CN115906949A (zh) * | 2022-11-22 | 2023-04-04 | 东北石油大学三亚海洋油气研究院 | 一种石油管道故障诊断方法及系统、存储介质和石油管道故障诊断设备 |
-
2023
- 2023-08-03 CN CN202310968582.1A patent/CN116701948B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023044979A1 (zh) * | 2021-09-27 | 2023-03-30 | 苏州大学 | 类不平衡数据集下的机械故障智能诊断方法 |
CN114022311A (zh) * | 2021-11-16 | 2022-02-08 | 东北大学 | 基于时序条件生成对抗网络的综合能源系统数据补偿方法 |
CN114692506A (zh) * | 2022-04-13 | 2022-07-01 | 浙江工业大学 | 一种基于改进TimeGAN模型的小样本故障诊断方法 |
CN115906949A (zh) * | 2022-11-22 | 2023-04-04 | 东北石油大学三亚海洋油气研究院 | 一种石油管道故障诊断方法及系统、存储介质和石油管道故障诊断设备 |
Non-Patent Citations (2)
Title |
---|
A Novel Parameter-Optimized Recurrent Attention Network for Pipeline Leakage Detection;Dong, Hongli et al;《IEEE-CAA JOURNAL OF AUTOMATICA SINICA》;第10卷(第4期);第1064-1076页 * |
基于多模态生成对抗网络的多元时序数据异常检测;张仁斌等;《计算机科学》;第50卷(第05期);第355-362页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116701948A (zh) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | A fault diagnosis method for wind turbines gearbox based on adaptive loss weighted meta-ResNet under noisy labels | |
US11507049B2 (en) | Method for detecting abnormity in unsupervised industrial system based on deep transfer learning | |
CN109345507B (zh) | 一种基于迁移学习的大坝图像裂缝检测方法 | |
CN109408389B (zh) | 一种基于深度学习的代码缺陷检测方法及装置 | |
CN110728654B (zh) | 一种基于深度残差神经网络的管道自动检测和分类方法 | |
Yin et al. | Wasserstein generative adversarial network and convolutional neural network (WG-CNN) for bearing fault diagnosis | |
CN109389171B (zh) | 基于多粒度卷积降噪自动编码器技术的医疗图像分类方法 | |
CN110020712B (zh) | 一种基于聚类的优化粒子群bp网络预测方法和系统 | |
CN110657984A (zh) | 一种基于强化胶囊网络的行星齿轮箱故障诊断方法 | |
CN113255573B (zh) | 基于混合簇中心标签学习的行人重识别方法和存储介质 | |
CN114969995A (zh) | 一种基于改进麻雀搜索与声发射的滚动轴承早期故障智能诊断方法 | |
CN116028876A (zh) | 一种基于迁移学习的滚动轴承故障诊断方法 | |
CN115791174B (zh) | 一种滚动轴承异常诊断方法、系统、电子设备及存储介质 | |
CN113923104A (zh) | 基于小波神经网络的网络故障诊断方法、设备及存储介质 | |
CN112132102A (zh) | 一种深度神经网络结合人工蜂群优化的智能故障诊断方法 | |
CN116628592A (zh) | 一种基于改进型生成式对抗网络的动设备故障诊断方法 | |
CN111191823A (zh) | 一种基于深度学习的生产物流预测方法 | |
CN114166509A (zh) | 一种电机轴承故障预测方法 | |
CN116701948B (zh) | 管道故障诊断方法及系统、存储介质和管道故障诊断设备 | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理系统 | |
CN117150402A (zh) | 基于生成式对抗网络的电力数据异常检测方法及模型 | |
CN116595465A (zh) | 基于自编码器和数据增强的高维稀疏数据离群点检测方法及系统 | |
CN114817856B (zh) | 一种基于结构信息保持域适应网络的抽油机故障诊断方法 | |
CN114048837A (zh) | 一种基于分布式类脑图的深度神经网络模型加固方法 | |
CN115600134A (zh) | 基于域动态对抗自适应的轴承迁移学习故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |