基于EMD分解与LSTM的油气管道第三方施工预警方法
技术领域
本发明属于油气管道预警技术领域,具体涉及基于EMD分解与LSTM的油气管道第三方施工预警方法。
背景技术
第三方在管道安全范围内的施工统称为“第三方施工”。长期以来,为维护油气管道的完整性和防止第三方施工破坏,投入了巨大的人力和财力,但是油气管道第三方施工,随机性强,不易预测和控制导致监视难度大。
分布式光纤振动传感器是近年来发展的一种用于实时测量空间振动分布的光纤传感系统。与管道同沟铺设的光缆作为传感介质,感知管道沿线的风险,通过机器学习算法,对管道沿线入侵事件进行智能识别,实现对管道的实时监测、定位、预警和报警。例如,公开号为CN108932480A的专利文献公开了一种基于1D-CNN的分布式光纤传感信号特征学习与分类方法,对获取的各空间点的分布式光纤传感声音、振动信号进行时间分割,建立典型事件信号数据集;构建一维卷积神经网络1D-CNN模型,利用典型事件信号数据训练集对网络进行迭代更新训练得到最优网络参数,利用最优网络学习并提取不同类型事件的1D-CNN可分辨特征,得到典型事件信号特征集;利用典型事件信号特征集训练不同类型分类器后,筛选出最佳分类器。测试时将测试数据输入最优1D-CNN网络得到事件可分辨特征,再输入最佳分类器得到分类结果。
由于油气管道沿线的干扰性活动复杂,容易对分布式光纤振动传感器采集的
波形数据造成干扰,从而无法准确地识别第三方施工,造成预警的精度不高。
发明内容
针对现有技术中存在的上述不足之处,本发明提供基于EMD分解与LSTM的油气管道第三方施工预警方法。
为了达到上述发明目的,本发明采用以下技术方案:
基于EMD分解与LSTM的油气管道第三方施工预警方法,包括以下步骤:
S1、通过管道沿线铺设的分布式光纤系统实时采集
波形数据,并对波形数据
进行阈值触发,以获取可疑波段;
S2、对可疑波段的信号依次进行小波降噪,得到可疑波段的去噪信号;
S3、从可疑波段的去噪信号提取相应的时序特征,还对可疑波段的去噪信号进行EMD分解以得到IMF能量谱;
S4、对时序特征、IMF能量谱进行归一化处理,以输入LSTM分类模型,实时判断可疑波段的信号对应的振动源是否为第三方施工;
S5、若是,则执行报警;若否,则转至步骤S1。
作为优选方案,所述步骤S1中,阈值触发包括:
将
波形数据进行分段截取,每段波形前后取40%重叠进行波形分段,判断各
段波形的最大值是否超过预设阈值;若是,则将相应的波形段作为可疑波段;若否,则继续
采集
波形数据。
作为优选方案,所述步骤S2,具体包括:
对可疑波段的信号采用DB6小波进行分解,分解后得到高频重构系数和低频重构系数;
对高频重构系数进行阈值量化,去除噪声信号的小波系数,得到有用信号的小波系数;
将有用信号的小波系数和低频重构系数进行小波重构,得到可疑波段的去噪信号。
作为优选方案,所述对可疑波段的信号采用DB6小波进行六层分解。
作为优选方案,所述步骤S3中,时序特征为十五维时序特征,包括波形的最大值、最小值、峰峰值、能量、平均值、绝对平均值、均方根、方差、标准差、峰值因子、偏度因子、间隙因子、波形因子、脉冲因子、裕度因子。
作为优选方案,所述步骤S3中,对可疑波段的去噪信号进行EMD分解,得到六维IMF短时能量谱。
作为优选方案,所述步骤S4中,对时序特征、IMF能量谱进行归一化处理,包括:
对十五维时序特征与六维IMF短时能量谱进行归一化处理,将波形数据归一化到[0,1]区间内。
作为优选方案,所述LSTM分类模型的训练过程,包括:
采集分布式光纤系统的历史波形数据,获取正常波形数据和第三方施工作业时刻、高速汽车行驶、工厂轰鸣、动物经过对应的报警波形数据;
对报警波形数据和正常波形数据进行小波降噪之后,提取各类型波形的时序特征和IMF能量谱,并进行归一化处理;
将归一化处理后的各类型波形的时序特征和IMF能量谱作为LSTM模型的输入,进行离线训练,得到LSTM分类模型。
作为优选方案,所述LSTM分类模型的训练过程中,以分类交叉熵为损失函数,训练LSTM模型。
作为优选方案,所述离线训练,包括:
构建前向LSTM网络:把将归一化处理后的各类型的报警波形的时序特征和IMF能量谱作为LSTM模型输入向量,隐藏单元为40个,batch_size=1000,epoch=500;利用随机初始化权重矩阵和系数;
构建全连接分类层:将前向LSTM网络送入全连接层,使用softmax分类函数和分类交叉熵作为损失函数,输出信号分类结果;
迭代训练分类器模型:使用梯度下降法不断更新参数,观测分类识别成功率与损失值,实现第三方施工识别,以确定LSTM分类模型。
本发明与现有技术相比,有益效果是:
本发明的基于EMD分解与LSTM的油气管道第三方施工预警方法,能够对光纤传感扰动信号实现精准、快速的分类识别,解决管道周界安防报警分类误差、识别效率低等问题。
本发明通过分析
波形数据的时序特征,将波形的最大值作为一级判断条
件,超过阈值时继续小波分解重构,实现降噪,对降噪后的波形进行时序特征的提取和经验
模态分解,获取其各分量IMF对应的短时能量谱;将时序特征和IMF对应的短时能量谱作为
LSTM模型的输入,运用LSTM算法构建分类器,实现了对光纤传感扰动信号的分类识别,兼顾
了信号的全局特征和细节特征,可用于其他各类光纤传感的识别系统中,有较强的普适性
和可移植性,提高管道沿线第三方施工的识别准确率。
附图说明
图2是本发明实施例1的基于EMD分解与LSTM的油气管道第三方施工预警方法的流程图;
图3是本发明实施例1的小波降噪的流程图;
图4是本发明实施例1的经验模态分解EMD的原理图;
图5是本发明实施例1的LSTM神经网络记忆单元的前向传播计算过程示意图;
图6是本发明实施例1的注意力机制框架图。
具体实施方式
为了更清楚地说明本发明实施例,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
实施例1:
本实施例在长输油气管道沿线铺设分布式光纤传感器,其与油气管道同样深埋在地下
3-5米左右,用
技术检测的光纤中沿轴向向后的后向瑞利散射光强,根据传回的后
向瑞利散射光的相干干涉结果定位扰动事件的发生具体位置,并根据干涉波形的差异性,
对振动源进行准确分类识别。
具体地,如图1所示,本实施例的
分布式光纤系统,由三大部分组成,包括
分布式光纤振动传感器、数据采集模块和计算机。
分布式光纤振动传感器具体包括:超窄线宽激光器、声光调制器、掺饵光纤放大器、环形器、沿管道铺设的分布式光纤;
数据采集模块包括光电探测器、拉曼放大和数据采集卡;
计算机作为传感器主机。
在实际的工程应用中,超窄线宽激光器、声光调制器、环形器、光电探测器以及其它相应的电源、驱动、检测电路和通信接口可集成在传感器主机中;传感光纤布置在外场的传感光缆中。超窄线宽激光器作为光源发出的激光经声光调制器调制为光脉冲,光脉冲通过环形器注入传感光纤,传感光纤中后向瑞利散射光在脉冲宽度内发生相干干涉,干涉光强经过环形器被探测器检测,经放大后通过数据采集卡进入主机进行数据处理和结果显示。
超窄线宽激光器为整个
分布式光纤扰动传感系统的光源,为系统提供超
窄线宽光信号,保证整个
分布式光纤扰动传感系统能够正常工作。超窄线宽激光
器光源的中心波长为1550nm,线宽约3kHz。
激光调制模块由上述声光调制器、掺饵光纤放大器和环形器构成。激光光源发出的连续激光,经过声光调制器调制为脉冲宽度约为486ns的脉冲信号,调制后的脉冲光经过光放大器被放大后通过环形器进入传感和传导模块。
分布式光纤由一根标准的G652单模光纤构成,传感和传导功能均由这一条光纤完成。后向瑞利散射信号沿光纤向光传输方向的反方向传递通过环形器进入信号接收模块。
数据采集模块,负责将信号传回计算机进行后续处理。接收到的后向瑞利散射光信号由光电探测器转换为电信号,完成信号放大和存储。
在分布式光纤每相隔50米位置设立一个重点监测防区,即防区1、防区2、…、防区
n,用于检测该防区点半径25米区域内的施工情况。当有扰动作用在传感光纤上时,由于弹
光效应,受到扰动位置的光相位产生变化,引起对应位置后向散射光的相位发生变化,脉冲
宽度内散射光的干涉光强也会发生相应变化。将
不同时刻的后向瑞利散射光干涉
光强曲线做差,差值曲线上光干涉信号发生剧烈变化的位置,对应扰动发生的位置,计算方
法如公式(1)所示:
其中,z表示扰动发生的位置,c表示真空中的光速,n表示折射率,t表示系统发出脉冲与探测器接收到后向瑞利散射信号之间的时间差。
同样,根据干涉光强曲线的波动情况,采用适宜的方式处理,结合相关算法,可以实现准确判断是否存在挖机等第三方危险施工情况。
基于上述现有的系统构架,如图2所示,本实施例的基于EMD分解与LSTM的油气管道第三方施工预警方法,包括以下步骤:
S1、通过管道沿线铺设的分布式光纤系统实时采集
波形数据,并对波形数据
进行阈值触发,以获取可疑波段;
具体地,在管道沿线铺设分布式光纤,利用相位敏感光时域反射计
的干涉机
理,从光纤中不同部分反射回来的瑞利散射光同时到达光电探测器而发生干涉,用于探测
管道沿线的各类振动情况,再根据振动波形的差异性,推测出振动源的类型。当发现振动源
为挖机等第三方施工时,发出报警,及时安排相关人员进行早期干预,防止管道遭受破坏。
其中,对波形数据进行阈值触发,具体包括:将
波形数据进行分段截取,
每段波形前后取40%重叠进行波形分段,判断各段波形的最大值是否超过预设阈值;若是,
则将相应的波形段作为可疑波段;若否,则继续采集
波形数据。例如:每100个数据
点作为单次分析对象,为保障前后数据片段的时序关联性,前后数据片段设置40%的重合
率,即1-100为第一片段、61-160为第二片段、以此类推;若某一数据段的波形最大值大于设
定的阈值,则认为该数据段为可疑信号,需做进一步分析;否则,认定为无施工情形,继续采
集
波形数据。
当确定可疑波段之后,进行下一步骤S2。
S2、对可疑波段的信号依次进行小波降噪,得到可疑波段的去噪信号;小波降噪的过程具体包括:
对可疑波段的信号采用DB6小波进行分解,分解后得到高频重构系数和低频重构系数;
对高频重构系数进行阈值量化,去除噪声信号的小波系数,得到有用信号的小波系数;
将有用信号的小波系数和低频重构系数进行小波重构,得到可疑波段的去噪信号。
为降低环境噪声带来的影响,对可疑波段的信号进行小波降噪处理;对于含噪声
的信号采用DB6小波进行分解,选择软阈值处理方式对每分解层的高频分量进行阈值处理。
具体地,如图3所示,可疑波段的
波形x(t) 采用DB6小波进行分解,得到的高频重
构系数(简称高频系数)和低频重构系数(简称低频系数);其中,高频重构系数中既有有用
信号也有噪声,由于噪声的小波系数比较小而有用信号的小波系数较大,通过选择合适的
阈值,对每分解层的高频分量进行阈值量化,去除噪声比例高的小波系数,保留有用信号的
小波系数,最后再由低频重构系数和有用信号的小波系数进行小波重构,得到可疑波段的
去噪信号,简称降噪信号。
具体过程如下:
将可疑波段的
波形x(t)进行多尺度小波分解,利用DB6小波对x(t)进行六层
分解,得到高频重构系数和低频重构系数。
由于不同类型的事件具有不同的频率分量,因此它们在分解分量中具有不同的集中分布。
因此,可以选择性地重组相应的频率分量。选择高频部分的重构系数进行小波重构,得到需要的振动信号。
得到可疑波段的去噪信号之后,进行下一步骤S3。
S3、从可疑波段的去噪信号提取相应的时序特征,还对可疑波段的去噪信号进行EMD分解以得到IMF能量谱;
具体地,波形的时序特征即为分布式光纤波形随着时间的变化情况,部分时序特征可由肉眼直观感受,如波形的最大值、最小值、超出某条预警线的点数等,某些特征需要进行一定的运算得到,如一段时间内的波形平均值、方差、短时能量等等,不同原因引起的波形振动其在相关的时序特征上往往有一定的差异性。如表1所示,波形的时序特征具体包括以下十五个特征:最大值、最小值、峰峰值、能量、平均值、绝对平均值、均方根、方差、标准差、峰值因子、偏度因子、间隙因子、波形因子、脉冲因子、裕度因子。
表1针对波形提取的时序特征
时序特征 |
计算公式 |
最大值(PK) |
max(X) |
最小值(min) |
min(X) |
峰峰值(PK-PK) |
[max(X)-min(X)]/2 |
能量(E) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\286277dest_path_image004.jpg |
平均值(A) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\456228dest_path_image006.jpg |
绝对平均值(Arv) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\585858dest_path_image008.jpg |
均方根(RMS) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\996635dest_path_image010.jpg |
方差(var) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\84677dest_path_image012.jpg |
标准差(SD) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\210764dest_path_image014.jpg |
峰值因子(Kur) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\206402dest_path_image016.jpg |
偏度因子(Skew) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\203177dest_path_image018.jpg |
间隙因子(CL) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\665383dest_path_image020.jpg |
波形因子(Sf) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\216450dest_path_image022.jpg |
脉冲因子(If) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\281358dest_path_image024.jpg |
裕度因子(Cf) |
说明: 说明: 说明: 说明: 说明: 说明: 说明: 说明: C:\Program Files (x86)\gwssi\CPC客户端\cases\inventions\f78cfa06-a349-428f-a0ff-215d9fe86745\new\100002\398218dest_path_image026.jpg |
另外,本实施例对可疑波段的去噪信号进行EMD分解,得到六维IMF短时能量谱,包括:经验模态分解EMD之后的1-5层IMF对应的短时能量谱和res对应的短时能量谱。
经验模态分解EMD:经验模态分解是一种处理非线性、非平稳时变序列的方法,该方法根据数据自身的时间尺度特征自适应分解信号,其筛选过程是将复杂时序数据分解为有限个本征模函数(Intrinsic Mode Function, IMF),分解得到的IMF分量包含了原数据在不同时间尺度的波动信息。其中,EMD分解的原理如图4所示,IMFL为第L层的EMD分解得到的信号本征模函数;resL为经过L层分解之后的信号残差分量;EL和EL+1为第L层IMF对应的短时能量谱和res对应的短时能量谱;本实施例的L取值为5。
对于小波重构后的时序样本数据
,首先计算
上的局部最大值、最小值,
分别对局部最大值、最小值进行插值拟合得到原始数据
的上下包络
和
序列,然后计算上下包络序列的均值,得到均值序列
:
再将
作为原始序列,重复
k次直至平均曲线趋于零为止,记
,
是否停止EMD判断条件为:
SD为筛分门限,在本实施例中,其取值为0.2。从
中减去
,得到移除最高
频成分的残差序列
。
重复上述筛选过程,得到后续IMF分量,直至
小于预定误差或
是
单调函数,终止模态分解过程。
其中,
是
i层分解信号,
n是分解级别的总数,
是
n层分解后的剩余信
号。
本实施例中,考虑分解的时效性与实用性,做五层EMD分解,即n=5。
得到EMD分解的各阶IMF分量后,提取各个IMF分量对应的短时能量谱:
至此,得到了十五维时序特征与六维IMF短时能量谱,共21维特征,然后继续下一步骤S4。
S4、对时序特征、IMF能量谱进行归一化处理,以输入LSTM分类模型,实时判断可疑波段的信号对应的振动源是否为第三方施工;
对上述21维特征做归一化处理,将波形数据归一化到[0,1]区间内,所采用的归一化方法为:
RNN网络模型由于梯度消失的问题,而LSTM算法可以避免梯度消失问题。另外,LSTM最大的优点是可以记忆上一次状态,学习序列前后之间的关系。LSTM神经网络由众多记忆单元组成,记忆单元中应用多种控制器的形式对上一单元输出、当前单元输入、上一单元状态进行判断,控制丢弃或增加信息,从而实现遗忘或记忆功能。以一个记忆单元为例,LSTM神经网络的前向传播计算过程如图5所示。
由于本实施例共有21维的特征输入,特征维度相对较多,本实施例在LSTM神经网络中引入注意力机制(Attention Model),从而加强对某些重要特征的权重值。其主要工作步骤如下:
(1)Q与K进行相似度计算得到权值;
(2)对上述权值进行归一化处理;
(3)用归一化的权值与V加权求和。
此时加权求和的结果即为注意力值,基本框架如图6所示,Q是给定目标中的某个元素Query,K是source中构成元素的(Key,Value)中的一部分,也就是Key,通过计算Q和各个K的相关性,得到每个K对应Value的权重系数,然后对Value进行加权求和,即得到了最终的Attention数值。
其中,本实施例的LSTM分类模型的训练过程,包括:
采集分布式光纤系统的历史波形数据,获取正常波形数据和第三方施工作业时刻、高速汽车行驶、工厂轰鸣、动物经过对应的报警波形数据;其中,所有样本数据按照7:3划分,70%作为训练集,30%作为模型测试集;
对报警波形数据和正常波形数据进行小波降噪之后,提取各类型波形的时序特征和IMF能量谱共21维特征,并进行归一化处理;其中,具体过程可以参考上述小波降噪、提取特征、归一化处理的原理及过程,在此不赘述。
将归一化处理后的各类型波形的时序特征和IMF能量谱作为LSTM模型的输入,进行离线训练,得到LSTM分类模型。具体地,将归一化处理后的21维特征作为LSTM模型的输入,事件标签(即是否为第三方施工)做为模型分类输出,以分类交叉熵为损失函数,训练LSTM模型。具体包括以下过程:
一、构建前向LSTM网络:把将归一化处理后的各类型的报警波形的时序特征和IMF能量谱,即21维特征,作为LSTM模型输入向量;隐藏单元hidden dimension=40,太少则拟合效果不好,太多则会过拟合,可根据变化调节;batch_size=10000,epoch=200;利用随机初始化权重矩阵和系数;
二、构建全连接分类层:将前向LSTM网络送入全连接层,使用softmax分类函数和分类交叉熵作为损失函数,输出信号分类结果;
其中,softmax的计算公式为,其中x即为当前值,通过softmax将其转换到[0,1]区间内:
三、迭代训练分类器模型:使用梯度下降法不断更新参数,观测分类识别成功率与损失值,以确定LSTM分类模型。再用测试集数据测试LSTM分类模型的分类效果。
得到离线训练完成的LSTM分类模型之后,实时地对波形数据进行小波降噪、特征提取、归一化,将21维特征输入至训练完成的LSTM分类模型进行分类预测,实时判断可疑波段的信号对应的振动源是否为第三方施工。
本实施例对连续3次预测结果为挖机等第三方施工危险信号的波段进行及时报警,提升了预警的精度。
实施例2:
本实施例的基于EMD分解与LSTM的油气管道第三方施工预警方法与实施例1的不同之处在于:
预警触发的阈值不限于实施例1所述的连续3次预测结果为挖机等第三方施工危险信号的波段,也可以仅1次即可,或者2次、4次、5次,以满足不同应用的需求。
其他步骤可以参考实施例1。
以上所述仅是对本发明的优选实施例及原理进行了详细说明,对本领域的普通技术人员而言,依据本发明提供的思想,在具体实施方式上会有改变之处,而这些改变也应视为本发明的保护范围。