CN110514366A - 一种小样本条件下管道微弱泄漏检测方法 - Google Patents
一种小样本条件下管道微弱泄漏检测方法 Download PDFInfo
- Publication number
- CN110514366A CN110514366A CN201910778384.2A CN201910778384A CN110514366A CN 110514366 A CN110514366 A CN 110514366A CN 201910778384 A CN201910778384 A CN 201910778384A CN 110514366 A CN110514366 A CN 110514366A
- Authority
- CN
- China
- Prior art keywords
- sample
- virtual
- true
- leakage
- indicate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F17—STORING OR DISTRIBUTING GASES OR LIQUIDS
- F17D—PIPE-LINE SYSTEMS; PIPE-LINES
- F17D5/00—Protection or supervision of installations
- F17D5/02—Preventing, monitoring, or locating loss
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M3/00—Investigating fluid-tightness of structures
- G01M3/02—Investigating fluid-tightness of structures by using fluid or vacuum
- G01M3/26—Investigating fluid-tightness of structures by using fluid or vacuum by measuring rate of loss or gain of fluid, e.g. by pressure-responsive devices, by flow detectors
- G01M3/28—Investigating fluid-tightness of structures by using fluid or vacuum by measuring rate of loss or gain of fluid, e.g. by pressure-responsive devices, by flow detectors for pipes, cables or tubes; for pipe joints or seals; for valves ; for welds
- G01M3/2807—Investigating fluid-tightness of structures by using fluid or vacuum by measuring rate of loss or gain of fluid, e.g. by pressure-responsive devices, by flow detectors for pipes, cables or tubes; for pipe joints or seals; for valves ; for welds for pipes
- G01M3/2815—Investigating fluid-tightness of structures by using fluid or vacuum by measuring rate of loss or gain of fluid, e.g. by pressure-responsive devices, by flow detectors for pipes, cables or tubes; for pipe joints or seals; for valves ; for welds for pipes using pressure measurements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Mechanical Engineering (AREA)
- Complex Calculations (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供一种小样本条件下管道微弱泄漏检测方法,涉及管道泄漏检测技术领域。本发明步骤如下:步骤1:获取真实样本集,并根据真实样本集生成虚拟样本集;步骤2:对真实样本集和虚拟样本集进行组合特征提取,所述组合特征提取包括7种统计特征和1组符号化变换特征;步骤3:根据7种统计特征和1组符号化变换特征采用朴素贝叶斯方法和最小二乘支持向量机方法分别建立朴素贝叶斯网络管道小泄漏辨识模型和最小二乘支持向量机管道小泄漏辨识模型,并利用模型对管道进行小泄漏检测。本方法从增加微弱泄漏样本数量和深度挖掘微弱泄漏样本特征两方面来构造微弱泄漏辨识模型,大大提高了管道微弱泄漏的检测准确率,保障输油管道的安全运行。
Description
技术领域
本发明涉及管道泄漏检测技术领域,尤其涉及一种少量样本条件下管道微弱泄漏检测方法。
背景技术
管道运输是油气资源的主要运输方式,其安全稳定运行具有重大意义,对油气传输过程中的管道小泄漏的精确检测是保障管道安全稳定运行的一种切实有效的手段。近年来,机器学习方法在数据驱动建模方面得到广泛应用,但是也存在一些弊端;
在管道微弱泄漏检测时,存在着如下两个问题:
(1)实际生产过程中,微弱泄漏的样本较少,无法满足机器学习对于高精度建模的需求,而微弱泄漏往往也会导致较为严重的后果,是必须要准确检测并及时处理的。
(2)微弱泄漏信号的特征往往比较隐晦,传统的特征提取方法对于特征的挖掘不够充分,无法满足高精度微弱泄漏辨识模型的需求。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种小样本条件下管道微弱泄漏检测方法,本方法从增加微弱泄漏样本数量和深度挖掘微弱泄漏样本特征两方面来构造微弱泄漏辨识模型,大大提高了管道微弱泄漏的检测准确率,保障输油管道的安全运行。
为解决上述技术问题,本发明所采取的技术方案是:
本发明提供一种小样本条件下管道微弱泄漏检测方法,包括如下步骤:
步骤1:获取真实样本集,并根据真实样本集生成虚拟样本集,所述真实样本集包括真实正常样本集XN和真实微弱泄漏样本集XS,所述虚拟样本集包括初代虚拟正常样本集GN和初代虚拟微弱泄漏样本集GS;
步骤2:对真实样本集和虚拟样本集进行组合特征提取,所述组合特征提取包括7种统计特征和1组符号化变换特征;
步骤3:根据步骤2中得到的7种统计特征和1组符号化变换特征采用朴素贝叶斯方法和最小二乘支持向量机方法分别建立朴素贝叶斯网络管道小泄漏辨识模型和最小二乘支持向量机管道小泄漏辨识模型,根据辨识模型对管道进行泄漏检测。
所述步骤1具体步骤如下:
步骤1.1:获取真实样本集XN,并根据该样本集中的真实正常样本生成粗糙的虚拟正常样本,生成粗糙的虚拟正常样本集
通过对真实正常样本集内的样本进行统计分析、数据的拟合、相似性的评价的分析,发现已知真实正常样本的数据规律,生成粗糙的虚拟正常样本
其中t表示时间,即样本的检测长度,t={1,2,…,L};k1表示真实正常样本的斜率;ε为传输过程中各种噪声引起的数据波动;YO1为设定的压力初值,该值根据输油管道正常的压力范围设定;
步骤1.2:根据正常样本的约束对步骤1.1中生成的粗糙虚拟正常样本集内的数据进行调整,将不符合约束条件的样本剔除,生成初代虚拟正常样本集
其中根据正常样本约束,虚拟正常样本满足:
其中,表示粗糙虚拟正常样本GN内样本的最小取值和最大取值,t(GN)代表粗糙的虚拟正常样本XN′的检测长度;tmin、tmax表示粗糙的虚拟正常样本的最小检测长度和最大检测长度;表示任意正常样本XN中元素的最小波动,表示任意正常样本的均值,代表常数, 表示任意正常样本XN中元素的最大波动,代表常数,σ1表示泄漏报警阈值,△Ymin表示强干扰信号的最小值;表示正常样本波动的最大值;
步骤1.3:根据真实微弱泄漏样本约束对初代虚拟正常样本集内的数据进行调整,将不符合真实微弱泄漏样本约束条件的样本剔除,生成初代虚拟微弱泄漏样本集
根据真实微弱泄漏样本约束,虚拟微弱泄漏样本满足:
其中,表示虚拟微弱泄漏样本集GS内样本的最小取值和最大取值;表示虚拟微弱泄漏样本集GS内样本的最小检测长度和最大检测长度;表示虚拟微弱泄漏样本中元素的最小取值,表示任意小泄漏样本的均值,代表常数, 表示虚拟微弱泄漏样本中元素的最大取值,代表常数,σ2表示正常样本数据波动的最大值;△GS表示虚拟微弱泄漏的数据波动;△Z表示工况调整引起数据波动的最小值;
步骤1.4:根据皮尔森相关系数ρ和真实正常样本集XN对初代虚拟正常样本集GN中的每一个虚拟正常样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;根据皮尔森相关系数ρ和真实微弱泄漏样本集XS对初代虚拟微弱泄漏样本集GS中的每一个虚拟微弱泄漏样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;得到虚拟正常样本集和虚拟微弱泄漏样本集
所述步骤1.4中筛选方法为根据皮尔森相关系数公式计算初代虚拟正常样本与真实正常样本集XN内的每一个真实正常样本的皮尔森相关系数ρ,若ρ∈[0.6,0.8],则认为合格,,将初代虚拟正常样本集GN内的每一个虚拟正常样本按照筛选方法逐一计算;根据皮尔森相关系数公式计算初代虚拟微弱泄漏样本与真实微弱泄漏样本集XS内的每一个真实正常样本的皮尔森相关系数ρ,若ρ∈[0.6,0.8],则认为合格,将虚拟微弱泄漏样本集GS内的每一个虚拟微弱泄漏样本按照筛选方法逐一计算;
所述皮尔森相关系数公式如下:
其中,xU表示任意的真实样本,其中U=(N,S);E(·)为期望计算;表示样本xU的均值;gU表示任意的生成样本,表示样本gU的均值;表示样本xU内的第a个元素;表示样本gU内的第l个元素。
所述步骤2具体步骤如下:
步骤2.1:分别对真实正常样本集XN、真实微弱泄漏样本集XS、虚拟正常样本集GN′、虚拟微弱泄漏样本集GS′提取7种统计特征,得到真实正常样本的统计特征集合H={V1、V2、…、Vξ},真实微弱泄漏样本的统计特征集合H′={V′1、V′2、…、V′ζ};虚拟正常样本的统计特征集合J={D1、D2、…、Dn};虚拟微弱泄漏样本的统计特征集合J′={D′1、D′2、…、D′q};其中,Vξ代表第ξ个真实正常样本的统计特征集合,V′ξ代表第ζ个真实微弱泄漏样本的统计特征集合,Dn代表第n个虚拟正常样本的统计特征集合,D′q代表第q个虚拟微弱泄漏样本的统计特征集合;所述统计特征包括提取l周期内的最大压力上升信息fMPR、提取l周期内的最大压力下降信息fMPD、提取样本的峰谷值信息fPV、提取样本的变异系数fCV、提取信号幅值的方根信息fSRA、提取均方根信息fRMS、提取拟合系数的最大、最小值的集合fFC;
表达式如下;
提取l1时间间隔内内样本的最大压力上升信息
其中,代表样本集R内的第r个样本;其中R={XN、XS、GN′、GS′},r={1、2、…、θR},所述θR代表样本集R内的样本总数;表示样本的均值,bu表示样本的第u个元素, 代表样本内的元素总数;
提取l1时间间隔内内样本的最大压力下降信息
提取样本的峰谷值信息
提取样本的变异系数
其中表示样本的方差;
提取样本信号幅值的方根信息
提取样本均方根信息
提取样本的l2周期的线性拟合系数最大值和最小值的集合
其中fit(al2)表示样本中l2个连续元素的线性拟合系数,l2∈L;
步骤2.2:分别对真实正常样本集XN、真实微弱泄漏样本集XS、虚拟正常样本集GN′、虚拟微弱泄漏样本集GS′内的每个样本提取符号化变换特征fST,得到真实正常样本的符号化变换特征集合F={λ1、λ2、…、λξ},真实微弱泄漏样本的符号化变换特征集合F′={λ′1、λ′2、…、λ′ζ},虚拟正常样本的符号化变换特征集合T={β1、β2、…、βn},虚拟微弱泄漏样本的符号化变换特征集合T′={β′1、β′2、…、β′q};
提取方法为对样本计算其转移概率矩阵通过最大熵分割方法对样本变换得到根据得到的一维向量重复本提取方法提取所有样本的符号化变换特征;计算转移概率矩阵
其中pηy表示样本中元素从状态η变化到状态y的概率;
进行和变形,其中pη+表示样本中元素从状态η往上变化的概率,pη-表示样本中元素从状态η往下变化的概率;变形后记为
将变换成一维向量
对样本集{XN、XS、GN′、GS′}中每一个样本执行步骤2-2的特征提取操作,直至完成所有样本的特征提取;
步骤2.3:将真实正常样本的统计特征集合与真实正常样本的符号化变换特征集合内的特征进行融合,得到真实正常样本的融合特征集合将真实微弱泄漏样本的统计特征集合与真实微弱泄漏样本的符号化变换特征集合内的特征进行融合,得到真实微弱泄漏样本的融合特征集合将虚拟正常样本的统计特征集合与虚拟正常样本的符号化变换特征集合内的特征进行融合,得到虚拟正常样本的融合特征集合将虚拟微弱泄漏样本的统计特征集合与虚拟微弱泄漏样本的符号化变换特征集合第n个虚拟正常样本的特征融合为:
步骤2.4:获取未知运行状态的真实样本集合重复步骤2.1至步骤2.3,得到未知运行状态的真实样本的融合特征集合
所述步骤3具体步骤如下:
步骤3.1:根据步骤2得到的FXN、FXS、FGN、FGS、以及带有样本标签的L′(XN,XS,GN′,GS′)作为朴素贝叶斯网络管道小泄漏辨识模型的输入和输出,朴素贝叶斯网络管道小泄漏辨识模型如下:
其中代表最大准确率的模型;代表输出带有标签的真实样本集合X*;输出“0”代表带有小泄漏样本标签的样本,输出“1”代表带有正常样本标签的样本;
步骤3.2:根据步骤2得到的FXN、FXS、FGN、FGS、以及带有样本标签的L′(XN,XS,GN′,GS′)作为最小二乘支持向量机管道小泄漏辨识模型的输入和输出,最小二乘支持向量机管道小泄漏辨识模型如下:
采用上述技术方案所产生的有益效果在于:本发明提供的一种小样本条件下管道微弱泄漏检测方法,可有效解决管道传输过程中面临的微弱泄漏难以检测的问题;本方法中的组合特征提取方法能够全方位的提取小泄漏信息,使得特征向量对于小泄漏的表征更加充分;本方法从增加微弱泄漏样本数量和深度挖掘微弱泄漏样本特征两方面来构造微弱泄漏辨识模型,大大提高了管道微弱泄漏的检测准确率,保障输油管道的安全运行。
附图说明
图1为本发明实施例提供的小样本条件下的管道微弱泄漏检测流程图;
图2为本发明实施例提供的样本的组合特征提取流程图;
图3为本发明实施例提供的建立两种微弱泄漏辨识模型框图;
图4为本发明实施例提供的生成虚拟样本的测试结果图;
图5为本发明实施例提供的真实管道微弱泄漏的测试结果图,其中,a为朴素贝叶斯网络模型真实管道微弱泄漏的测试结果图,b为最小二乘支持向量机模型真实管道微弱泄漏的测试结果图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本实施例的方法如下所述。
采用压力变送器采集油气传输过程中管道的压力信息,并人工选取少量的正常样本和微弱泄漏样本,因为实际生产中微弱泄漏样本出现概率低,数量少,无法满足建立精确模型的要求。故本发明提供一种小样本条件下管道微弱泄漏检测方法,包括如下步骤:
步骤1:获取真实样本集,并根据真实样本集生成虚拟样本集,所述真实样本集包括真实正常样本集XN和真实微弱泄漏样本集XS,所述虚拟样本集包括初代虚拟正常样本集GN和初代虚拟微弱泄漏样本集GS;具体步骤如下:
步骤1.1:获取真实样本集XN,并根据该样本集中的真实正常样本生成粗糙的虚拟正常样本,生成粗糙的虚拟正常样本集
通过对真实正常样本集内的样本进行统计分析、数据的拟合、相似性的评价等分析,发现已知真实正常样本的数据规律,生成粗糙的虚拟正常样本
其中t表示时间,即样本的检测长度,t={1,2,…,L};k1表示真实正常样本的斜率;ε为传输过程中各种噪声引起的数据波动;YO1为设定的压力初值,该值根据输油管道正常的压力范围设定;
所述样本的分析思路如下:通过对于海量的正常样本分析以及我们的领域知识(长期从事管道泄漏检测方面的研究,对于管道压力数据有着比较深刻的了解)近似得到粗糙的与真实正常样本规律类似的虚拟正常样本生成模型,我们的数据库中包含了海量的正常样本,之所以先做了正常样本的生成,原因有三点:降低人工采样的成本,费时、费力;验证生成方法的有效性;小泄漏都是在正常样本的基础上进行衍化的。我们对于数据的分析包括:正常样本的统计分析、数据的拟合、相似性的评价等,最终实现三个目的:获取压力数据的量级——即正常生产过程中管道压力的合理范围;压力随着时间的衰减系数,即k1的取值;噪声引起的压力波动ε;
步骤1.2:根据正常样本的约束对步骤1.1中生成的粗糙虚拟正常样本集内的数据进行调整,将不符合约束条件的样本剔除,生成初代虚拟正常样本集
其中根据正常样本约束,虚拟正常样本满足:
其中表示粗糙虚拟正常样本GN内样本的最小取值和最大取值,t(GN)代表粗糙的虚拟正常样本XN′的检测长度;tmin、tmax表示粗糙的虚拟正常样本的最小检测长度和最大检测长度;表示任意正常样本XN中元素的最小波动,表示任意正常样本的均值,代表常数, 表示任意正常样本XN中元素的最大波动,代表常数,σ1表示泄漏报警阈值,△Ymin表示强干扰信号的最小值;表示正常样本波动的最大值;
步骤1.3:根据真实微弱泄漏样本约束对初代虚拟正常样本集内的数据进行调整,将不符合真实微弱泄漏样本约束条件的样本剔除,生成初代虚拟微弱泄漏样本集
根据真实微弱泄漏样本约束,虚拟微弱泄漏样本满足:
其中,表示虚拟微弱泄漏样本集GS内样本的最小取值和最大取值;表示虚拟微弱泄漏样本集GS内样本的最小检测长度和最大检测长度;表示虚拟微弱泄漏样本中元素的最小取值,表示任意小泄漏样本的均值,代表常数, 表示虚拟微弱泄漏样本中元素的最大取值,代表常数,σ2表示正常样本数据波动的最大值,所谓的正常样本数据是指小泄漏样本发生前后那段时间的正常样本,其波动是小于小泄漏发生时的数据波动的;△GS表示虚拟微弱泄漏的数据波动;△Z表示工况调整引起数据波动的最小值;
步骤1.4:根据皮尔森相关系数ρ和真实正常样本集XN对初代虚拟正常样本集GN中的每一个虚拟正常样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;根据皮尔森相关系数ρ和真实微弱泄漏样本集XS对初代虚拟微弱泄漏样本集GS中的每一个虚拟微弱泄漏样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;得到得到虚拟正常样本集和虚拟微弱泄漏样本集本发明中ρ的下限为0.6,ρ的上限为0.8,这样就使得生成的样本与有限个真实的样本既存在统计学上的相似性,又有一定的差异性,有效解决了工程中的小样本问题。
所述筛选方法为根据皮尔森相关系数公式计算初代虚拟正常样本与真实正常样本集XN内的每一个真实正常样本的皮尔森相关系数ρ,若ρ∈[0.6,0.8],则认为合格,将初代虚拟正常样本集GN内的每一个虚拟正常样本按照筛选方法逐一计算;根据皮尔森相关系数公式计算初代虚拟微弱泄漏样本与真实微弱泄漏样本集XS内的每一个真实正常样本的皮尔森相关系数ρ,若ρ∈[0.6,0.8],则认为合格,将初代虚拟微弱泄漏样本集GS内的每一个虚拟微弱泄漏样本按照筛选方法逐一计算;
所述皮尔森相关系数公式如下:
其中,xU表示任意的真实样本,其中U=(N,S);E(·)为期望计算;表示样本xU的均值;gU表示任意的生成样本,表示样本gU的均值;表示样本xU内的第a个元素;表示样本gU内的第l个元素。
步骤2:对真实样本集和虚拟样本集进行组合特征提取,所述组合特征提取包括7种统计特征和1组符号化变换特征;如图2所示,具体步骤如下:
步骤2.1:分别对真实正常样本集XN、真实微弱泄漏样本集XS、虚拟正常样本集GN′、虚拟微弱泄漏样本集GS′提取7种统计特征,得到真实正常样本的统计特征集合H={V1、V2、…、Vξ},真实微弱泄漏样本的统计特征集合H′={V′1、V′2、…、V′ζ};虚拟正常样本的统计特征集合J={D1、D2、…、Dn};虚拟微弱泄漏样本的统计特征集合J′={D′1、D′2、…、D′q};其中,Vξ代表第ξ个真实正常样本的统计特征集合,V′ξ代表第ζ个真实微弱泄漏样本的统计特征集合,Dn代表第n个虚拟正常样本的统计特征集合,D′q代表第q个虚拟微弱泄漏样本的统计特征集合;所述统计特征包括提取l周期内的最大压力上升信息fMPR、提取l周期内的最大压力下降信息fMPD、提取样本的峰谷值信息fPV、提取样本的变异系数fCV、提取信号幅值的方根信息fSRA、提取均方根信息fRMS、提取拟合系数的最大、最小值的集合fFC;
对样本进行充分挖掘,各种特征的表达式如下;
提取l1时间间隔内内样本的最大压力上升信息
其中,代表样本集R内的第r个样本;其中R={XN、XS、GN′、GS′},r={1、2、…、θR},所述θR代表样本集R内的样本总数;表示样本的均值,bu表示样本的第u个元素, 代表样本内的元素总数;
提取l1时间间隔内内样本的最大压力下降信息
提取样本的峰谷值信息
提取样本的变异系数
其中表示样本的方差;
提取样本信号幅值的方根信息
提取样本均方根信息
提取样本的l2周期的线性拟合系数最大值和最小值的集合
其中fit(al2)表示样本中l2个连续元素的线性拟合系数,l2∈L;
步骤2.2:分别对真实正常样本集XN、真实微弱泄漏样本集XS、虚拟正常样本集GN′、虚拟微弱泄漏样本集GS′内的每个样本提取符号化变换特征fST,得到真实正常样本的符号化变换特征集合F={λ1、λ2、…、λξ},真实微弱泄漏样本的符号化变换特征集合F′={λ′1、λ′2、…、λ′ζ},虚拟正常样本的符号化变换特征集合T={β1、β2、…、βn},虚拟微弱泄漏样本的符号化变换特征集合T′={β′1、β′2、…、β′q};
提取方法为对样本计算其转移概率矩阵通过最大熵分割方法对样本变换得到根据得到的一维向量重复本提取方法提取所有样本的符号化变换特征,即和其中表示第ξ个真实正常样本,表示生成的第i个虚拟正常样本,Sξ、表示真实正常样本的变换向量和虚拟正常样本的变换向量;计算转移概率矩阵
其中pηy表示样本中元素从状态η变化到状态y的概率;
为解决的维数灾难,进行和变形,其中pη+表示样本中元素从状态η往上变化的概率,pη-表示样本中元素从状态η往下变化的概率;变形后记为
最后,将变换成一维向量
对样本集{XN、XS、GN′、GS′}中每一个样本执行步骤2-2的特征提取操作,实现所有样本的特征提取工作。
步骤2.3:将真实正常样本的统计特征集合与真实正常样本的符号化变换特征集合内的特征进行融合,得到真实正常样本的融合特征集合将真实微弱泄漏样本的统计特征集合与真实微弱泄漏样本的符号化变换特征集合内的特征进行融合,得到真实微弱泄漏样本的融合特征集合将虚拟正常样本的统计特征集合与虚拟正常样本的符号化变换特征集合内的特征进行融合,得到虚拟正常样本的融合特征集合将虚拟微弱泄漏样本的统计特征集合与虚拟微弱泄漏样本的符号化变换特征集合完成从原始数据域到特征域的变换。
第n个虚拟正常样本的特征融合为:
步骤2.4:获取未知运行状态的真实样本集合重复步骤2.1至步骤2.3,得到未知运行状态的真实样本的融合特征集合
步骤3:根据步骤2中得到的7种统计特征和1组符号化变换特征分别采用朴素贝叶斯方法和最小二乘支持向量机方法分别建立朴素贝叶斯网络管道小泄漏辨识模型和最小二乘支持向量机管道小泄漏辨识模型,根据辨识模型对管道进行泄漏检测,实现对于管道小泄漏的精确检测。因为小泄漏样本的数量通常较少,无法建立较为精确的小泄漏识别模型,因此传统的泄漏检测方法会存在漏报率高(泄漏报警灵敏度太低情况下)或者误报率高(泄漏报警灵敏度太高情况下)的问题,本发明中的第一个工作就是解决小泄漏样本数量少的问题;[2]小泄漏样本的特征不明显,传统的特征提取方法对于小泄漏样本的挖掘不够充分,本发明中的组合特征提取方法能够全方位的提取小泄漏信息,使得特征向量对于小泄漏的表征更加充分。所以建立精确的小泄漏识别模型,实现对于小泄漏的准确辨识、精确检测;如图3所示,具体包括:
步骤3.1:根据步骤2得到的FXN、FXS、FGN、FGS、以及带有样本标签的L′(XN,XS,GN′,GS′)作为朴素贝叶斯网络管道小泄漏辨识模型的输入和输出,朴素贝叶斯网络管道小泄漏辨识模型(即微弱泄漏辨识模型1)如下:
其中代表最大准确率的模型;代表输出带有标签的真实样本集合X*;输出“0”代表带有小泄漏样本标签的样本,输出“1”代表带有正常样本标签的样本;
步骤3.2:根据步骤2得到的FXN、FXS、FGN、FGS、以及带有样本标签的L′(XN,XS,GN′,GS′)作为最小二乘支持向量机管道小泄漏辨识模型的输入和输出,最小二乘支持向量机管道小泄漏辨识模型(即微弱泄漏辨识模型2)如下:
本实施例中对模型可靠性进行测试。本发明实施实例分别以生成的虚拟样本和真实的微弱泄漏样本对本发明中的模型进行测试。
由于实际生产过程中微弱泄漏出现频率低,我们从历史数据中采集了40个微弱泄漏样本,为保持正负样本的平衡,正常样本亦选取50,用本发明中设计的虚拟样本生成方法,生成1000个虚拟正常样本和1000个虚拟微弱泄漏样本。参数选择如下:训练样本长度L=120,当使用朴素贝叶斯方法时符号化变换的分割参数N=5,当使用最小二乘支持向量机时符号化变化的分割参数N=4。
如图4所示,本发明提出的两种方法在虚拟样本中的测试结果,从结果中可以发现模型的准确率很高,说明了本发明的有效性。
如图5所示,为使用80个真实样本测试时的结果,可以看出,使用朴素贝叶斯方法时有5个样本(No.10,No.22,No.23,No.36和No.47)被误诊,测试准确率为93.75%。使用最小二乘支持向量机时,仅有4个样本(No.10,No.23,No.36和No.47)被误诊,测试准确率高达95%。这充分说明了本发明中所设计的方法有效性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。
Claims (5)
1.一种小样本条件下管道微弱泄漏检测方法,其特征在于:包括如下步骤:
步骤1:获取真实样本集,并根据真实样本集生成虚拟样本集,所述真实样本集包括真实正常样本集XN和真实微弱泄漏样本集XS,所述虚拟样本集包括初代虚拟正常样本集GN和初代虚拟微弱泄漏样本集GS;
步骤2:对真实样本集和虚拟样本集进行组合特征提取,所述组合特征提取包括7种统计特征和1组符号化变换特征;
步骤3:根据步骤2中得到的7种统计特征和1组符号化变换特征采用朴素贝叶斯方法和最小二乘支持向量机方法分别建立朴素贝叶斯网络管道小泄漏辨识模型和最小二乘支持向量机管道小泄漏辨识模型,根据辨识模型对管道进行泄漏检测。
2.根据权利要求1所述的一种小样本条件下管道微弱泄漏检测方法,其特征在于:所述步骤1具体步骤如下:
步骤1.1:获取真实样本集XN,并根据该样本集中的真实正常样本生成粗糙的虚拟正常样本,生成粗糙的虚拟正常样本集
通过对真实正常样本集内的样本进行统计分析、数据的拟合、相似性的评价的分析,发现已知真实正常样本的数据规律,生成粗糙的虚拟正常样本
其中t表示时间,即样本的检测长度,t={1,2,…,L};k1表示真实正常样本的斜率;ε为传输过程中各种噪声引起的数据波动;YO1为设定的压力初值,该值根据输油管道正常的压力范围设定;
步骤1.2:根据正常样本的约束对步骤1.1中生成的粗糙虚拟正常样本集内的数据进行调整,将不符合约束条件的样本剔除,生成初代虚拟正常样本集
其中根据正常样本约束,虚拟正常样本满足:
其中,表示粗糙虚拟正常样本GN内样本的最小取值和最大取值,t(GN)代表粗糙的虚拟正常样本XN′的检测长度;tmin、tmax表示粗糙的虚拟正常样本的最小检测长度和最大检测长度;表示任意正常样本XN中元素的最小波动,表示任意正常样本的均值,代表常数, 表示任意正常样本XN中元素的最大波动,代表常数,σ1表示泄漏报警阈值,△Ymin表示强干扰信号的最小值;表示正常样本波动的最大值;
步骤1.3:根据真实微弱泄漏样本约束对初代虚拟正常样本集内的数据进行调整,将不符合真实微弱泄漏样本约束条件的样本剔除,生成初代虚拟微弱泄漏样本集
根据真实微弱泄漏样本约束,虚拟微弱泄漏样本满足:
其中,表示虚拟微弱泄漏样本集GS内样本的最小取值和最大取值;表示虚拟微弱泄漏样本集GS内样本的最小检测长度和最大检测长度;表示虚拟微弱泄漏样本中元素的最小取值,表示任意小泄漏样本的均值,代表常数, 表示虚拟微弱泄漏样本中元素的最大取值,代表常数,σ2表示正常样本数据波动的最大值;△GS表示虚拟微弱泄漏的数据波动;△Z表示工况调整引起数据波动的最小值;
步骤1.4:根据皮尔森相关系数ρ和真实正常样本集XN对初代虚拟正常样本集GN中的每一个虚拟正常样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;根据皮尔森相关系数ρ和真实微弱泄漏样本集XS对初代虚拟微弱泄漏样本集GS中的每一个虚拟微弱泄漏样本进行筛选,若筛选合格,则保留虚拟正常样本,若不合格,则剔除;得到虚拟正常样本集和虚拟微弱泄漏样本集
3.根据权利要求2所述的一种小样本条件下管道微弱泄漏检测方法,其特征在于:所述步骤1.4中筛选方法为根据皮尔森相关系数公式计算初代虚拟正常样本与真实正常样本集XN内的每一个真实正常样本的皮尔森相关系数ρ,若ρ∈[0.6,0.8],则认为合格,,将初代虚拟正常样本集GN内的每一个虚拟正常样本按照筛选方法逐一计算;根据皮尔森相关系数公式计算初代虚拟微弱泄漏样本与真实微弱泄漏样本集XS内的每一个真实正常样本的皮尔森相关系数ρ,若ρ∈[0.6,0.8],则认为合格,将虚拟微弱泄漏样本集GS内的每一个虚拟微弱泄漏样本按照筛选方法逐一计算;
所述皮尔森相关系数公式如下:
其中,xU表示任意的真实样本,其中U=(N,S);E(·)为期望计算;表示样本xU的均值;gU表示任意的生成样本,表示样本gU的均值;表示样本xU内的第a个元素;表示样本gU内的第l个元素。
4.根据权利要求2所述的一种小样本条件下管道微弱泄漏检测方法,其特征在于:所述步骤2具体步骤如下:
步骤2.1:分别对真实正常样本集XN、真实微弱泄漏样本集XS、虚拟正常样本集GN′、虚拟微弱泄漏样本集GS′提取7种统计特征,得到真实正常样本的统计特征集合H={V1、V2、…、Vξ},真实微弱泄漏样本的统计特征集合H′={V′1、V′2、…、V′ζ};虚拟正常样本的统计特征集合J={D1、D2、…、Dn};虚拟微弱泄漏样本的统计特征集合J′={D′1、D′2、…、D′q};其中,Vξ代表第ξ个真实正常样本的统计特征集合,V′ξ代表第ζ个真实微弱泄漏样本的统计特征集合,Dn代表第n个虚拟正常样本的统计特征集合,D′q代表第q个虚拟微弱泄漏样本的统计特征集合;所述统计特征包括提取l周期内的最大压力上升信息fMPR、提取l周期内的最大压力下降信息fMPD、提取样本的峰谷值信息fPV、提取样本的变异系数fCV、提取信号幅值的方根信息fSRA、提取均方根信息fRMS、提取拟合系数的最大、最小值的集合fFC;
表达式如下;
提取l1时间间隔内内样本的最大压力上升信息
其中,代表样本集R内的第r个样本;其中R={XN、XS、GN′、GS′},r={1、2、…、θR},所述θR代表样本集R内的样本总数;表示样本的均值,bu表示样本的第u个元素, 代表样本内的元素总数;
提取l1时间间隔内内样本的最大压力下降信息
提取样本的峰谷值信息
提取样本的变异系数
其中表示样本的方差;
提取样本信号幅值的方根信息
提取样本均方根信息
提取样本的l2周期的线性拟合系数最大值和最小值的集合
其中fit(al2)表示样本中l2个连续元素的线性拟合系数,l2∈L;
步骤2.2:分别对真实正常样本集XN、真实微弱泄漏样本集XS、虚拟正常样本集GN′、虚拟微弱泄漏样本集GS′内的每个样本提取符号化变换特征fST,得到真实正常样本的符号化变换特征集合F={λ1、λ2、…、λξ},真实微弱泄漏样本的符号化变换特征集合F′={λ′1、λ′2、…、λ′ζ},虚拟正常样本的符号化变换特征集合T={β1、β2、…、βn},虚拟微弱泄漏样本的符号化变换特征集合T′={β′1、β′2、…、β′q};
提取方法为对样本计算其转移概率矩阵通过最大熵分割方法对样本变换得到根据得到的一维向量重复本提取方法提取所有样本的符号化变换特征;计算转移概率矩阵
其中pηy表示样本中元素从状态η变化到状态y的概率;
进行和变形,其中pη+表示样本中元素从状态η往上变化的概率,pη-表示样本中元素从状态η往下变化的概率;变形后记为
将变换成一维向量
对样本集{XN、XS、GN′、GS′}中每一个样本执行步骤2.2的特征提取操作,直至完成所有样本的特征提取;
步骤2.3:将真实正常样本的统计特征集合与真实正常样本的符号化变换特征集合内的特征进行融合,得到真实正常样本的融合特征集合将真实微弱泄漏样本的统计特征集合与真实微弱泄漏样本的符号化变换特征集合内的特征进行融合,得到真实微弱泄漏样本的融合特征集合将虚拟正常样本的统计特征集合与虚拟正常样本的符号化变换特征集合内的特征进行融合,得到虚拟正常样本的融合特征集合将虚拟微弱泄漏样本的统计特征集合与虚拟微弱泄漏样本的符号化变换特征集合
第n个虚拟正常样本的特征融合为:
步骤2.4:获取未知运行状态的真实样本集合重复步骤2.1至步骤2.3,得到未知运行状态的真实样本的融合特征集合
5.根据权利要求4所述的一种小样本条件下管道微弱泄漏检测方法,其特征在于:所述步骤3具体步骤如下:
步骤3.1:根据步骤2得到的FXN、FXS、FGN、FGS、以及带有样本标签的L′(XN,XS,GN′,GS′)作为朴素贝叶斯网络管道小泄漏辨识模型的输入和输出,朴素贝叶斯网络管道小泄漏辨识模型如下:
其中代表最大准确率的模型;代表输出带有标签的真实样本集合X*;输出“0”代表带有小泄漏样本标签的样本,输出“1”代表带有正常样本标签的样本;
步骤3.2:根据步骤2得到的FXN、FXS、FGN、FGS、以及带有样本标签的L′(XN,XS,GN′,GS′)作为最小二乘支持向量机管道小泄漏辨识模型的输入和输出,最小二乘支持向量机管道小泄漏辨识模型如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910778384.2A CN110514366B (zh) | 2019-08-22 | 2019-08-22 | 一种小样本条件下管道微弱泄漏检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910778384.2A CN110514366B (zh) | 2019-08-22 | 2019-08-22 | 一种小样本条件下管道微弱泄漏检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110514366A true CN110514366A (zh) | 2019-11-29 |
CN110514366B CN110514366B (zh) | 2021-03-05 |
Family
ID=68626284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910778384.2A Active CN110514366B (zh) | 2019-08-22 | 2019-08-22 | 一种小样本条件下管道微弱泄漏检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110514366B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112085075A (zh) * | 2020-08-26 | 2020-12-15 | 中国安全生产科学研究院 | 基于贝叶斯网络推理模型的管道腐蚀泄漏火灾推演系统 |
CN113670536A (zh) * | 2021-07-06 | 2021-11-19 | 浙江浙能台州第二发电有限责任公司 | 火电厂用电用水监测和信息化管理方法 |
CN114637882A (zh) * | 2022-05-17 | 2022-06-17 | 深圳市华世智能科技有限公司 | 基于计算机图形技术生成带标记样本的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2069756B1 (en) * | 2006-09-12 | 2011-07-27 | Extrasolution S.r.l. | Method for measuring the gas permeability of containers and sealing members in general |
CN106482912A (zh) * | 2016-11-29 | 2017-03-08 | 中国工程物理研究院激光聚变研究中心 | 一种真空设备泄漏检测及定位方法 |
US20170076563A1 (en) * | 2015-09-15 | 2017-03-16 | General Electric Company | Systems and methods to provide pipeline damage alerts |
CN110008568A (zh) * | 2019-03-29 | 2019-07-12 | 中国人民解放军战略支援部队航天工程大学 | 小样本下装备平均修复时间的非统计估计模型 |
CN110110779A (zh) * | 2019-04-29 | 2019-08-09 | 北京化工大学 | 基于核密度估计和Copula函数的虚拟样本生成方法 |
-
2019
- 2019-08-22 CN CN201910778384.2A patent/CN110514366B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2069756B1 (en) * | 2006-09-12 | 2011-07-27 | Extrasolution S.r.l. | Method for measuring the gas permeability of containers and sealing members in general |
US20170076563A1 (en) * | 2015-09-15 | 2017-03-16 | General Electric Company | Systems and methods to provide pipeline damage alerts |
CN106482912A (zh) * | 2016-11-29 | 2017-03-08 | 中国工程物理研究院激光聚变研究中心 | 一种真空设备泄漏检测及定位方法 |
CN110008568A (zh) * | 2019-03-29 | 2019-07-12 | 中国人民解放军战略支援部队航天工程大学 | 小样本下装备平均修复时间的非统计估计模型 |
CN110110779A (zh) * | 2019-04-29 | 2019-08-09 | 北京化工大学 | 基于核密度估计和Copula函数的虚拟样本生成方法 |
Non-Patent Citations (2)
Title |
---|
利节 等: "输气管道微泄漏检测的深度神经网络模型研究", 《重庆科技学院学报(自然科学版)》 * |
王少锋 等: "基于声发射的管接头微泄漏定量诊断研究", 《内蒙古石油化工》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112085075A (zh) * | 2020-08-26 | 2020-12-15 | 中国安全生产科学研究院 | 基于贝叶斯网络推理模型的管道腐蚀泄漏火灾推演系统 |
CN112085075B (zh) * | 2020-08-26 | 2021-04-20 | 中国安全生产科学研究院 | 基于贝叶斯网络推理模型的管道腐蚀泄漏火灾推演系统 |
CN113670536A (zh) * | 2021-07-06 | 2021-11-19 | 浙江浙能台州第二发电有限责任公司 | 火电厂用电用水监测和信息化管理方法 |
CN113670536B (zh) * | 2021-07-06 | 2024-03-05 | 浙江浙能台州第二发电有限责任公司 | 火电厂用电用水监测和信息化管理方法 |
CN114637882A (zh) * | 2022-05-17 | 2022-06-17 | 深圳市华世智能科技有限公司 | 基于计算机图形技术生成带标记样本的方法 |
CN114637882B (zh) * | 2022-05-17 | 2022-08-19 | 深圳市华世智能科技有限公司 | 基于计算机图形技术生成带标记样本的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110514366B (zh) | 2021-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110514366A (zh) | 一种小样本条件下管道微弱泄漏检测方法 | |
CN104712542B (zh) | 一种基于物联网的往复压缩机敏感特征提取与故障诊断方法 | |
CN101614786B (zh) | 基于frft和ifsvc的功率电子电路在线智能故障诊断方法 | |
CN103544392B (zh) | 基于深度学习的医学气体识别方法 | |
CN109102032A (zh) | 一种基于深度森林和自编码的泵站机组诊断方法 | |
CN108343599B (zh) | 一种基于多粒度级联森林的水泵机组智能故障诊断方法 | |
CN108414923A (zh) | 一种基于深度置信网络特征提取的模拟电路故障诊断方法 | |
CN112508105B (zh) | 一种采油机故障检测与检索方法 | |
CN109670714B (zh) | 基于隶属度分析的船舶燃气轮机综合状态评估方法 | |
CN110500217A (zh) | 基于可测数据特征的柴油机共轨系统油泵故障检测方法 | |
CN110298085A (zh) | 基于XGBoost和随机森林算法的模拟电路故障诊断方法 | |
CN105138770B (zh) | 基于间接可靠性特征量的航天产品可靠性仿真评估方法 | |
CN110472689B (zh) | 基于集成高斯过程回归的有杆泵抽油井动液面软测量方法 | |
CN104198912A (zh) | 一种基于数据挖掘的硬件电路fmea分析方法 | |
CN110502277A (zh) | 一种基于bp神经网络的代码坏味检测方法 | |
CN110263807A (zh) | 基于auto-encoder的异常行为检测方法 | |
CN112183643A (zh) | 基于声发射的硬岩拉剪破裂识别方法及装置 | |
CN109886433A (zh) | 智能识别城市燃气管道缺陷的方法 | |
CN108520267A (zh) | 一种基于时空特征的水文遥测数据异常检测方法 | |
CN110318731A (zh) | 一种基于gan的抽油井故障诊断方法 | |
CN112985574A (zh) | 基于模型融合的光纤分布式声波传感信号高精度分类识别方法 | |
CN114444663A (zh) | 一种基于时间卷积网络的供水管网泄漏检测与定位方法 | |
CN106126883A (zh) | 油套管质量水平评价方法 | |
CN107766560A (zh) | 客服服务流程的评价方法和系统 | |
Liu et al. | Discrimination between earthquake P waves and microtremors via a generative adversarial network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |