基于时域特征与时空信息的管道沿线第三方施工预警方法
技术领域
本发明属于油气管道沿线安防技术领域,具体涉及基于时域特征与时空信息的管道沿线第三方施工预警方法。
背景技术
第三方在管道安全范围内的施工统称为“第三方施工”。长期以来,为维护油气管道的完整性和防止第三方施工破坏,投入了巨大的人力和财力,但是油气管道第三方施工,随机性强,不易预测和控制导致监视难度大,目前管道人工巡线是作为控制第三方施工风险、确保管道运行安全的主要手段,依靠徒步巡线、在施工高发时段加强巡护、主动查找管道沿线的挖掘机、开沟机、打井队等大型作业设备来对第三方施工进行监视,防患于未然,降低第三方施工带来破坏的可能性。
分布式光纤振动传感器是近年来发展的一种用于实时测量空间振动分布的光纤传感系统。与管道同沟铺设的光缆作为传感介质,感知管道沿线的风险,通过机器学习算法,对管道沿线入侵事件进行智能识别,实现对管道的实时监测、定位、预警和报警。例如,天津大学的曲志刚等在油气管道安全分布式光纤预警系统研究的一文中提及,利用其中的三条单膜光纤构成分布式微振动测试传感器,实时地检测管道沿途所发生的泄漏及其他异常事件,并采用基于小波包分析的“峭度-状态”法辨别管道沿线所发生的异常情况,最后对现场实验数据及其信号处理结果进行分析,结果表明预警系统可以有效地对管道周围发生的泄漏和其他异常情况进行检测和辨别。另外,公开号为CN108932480A的专利文献公开了一种基于1D-CNN的分布式光纤传感信号特征学习与分类方法,对获取的各空间点的分布式光纤传感声音、振动信号进行时间分割,建立典型事件信号数据集;构建一维卷积神经网络1D-CNN模型,利用典型事件信号数据训练集对网络进行迭代更新训练得到最优网络参数,利用最优网络学习并提取不同类型事件的1D-CNN可分辨特征,得到典型事件信号特征集;利用典型事件信号特征集训练不同类型分类器后,筛选出最佳分类器。测试时将测试数据输入最优1D-CNN网络得到事件可分辨特征,再输入最佳分类器得到分类结果。
由于油气管道分布范围广,所经过的地形、地貌不同,附近的干扰性活动复杂,若仅对管道沿线的振动源做单一的同类处理,而忽视管道沿线的土壤、土质、人类生活等环境特点的影响,难以实现对沿线施工情况的准确预警。
发明内容
针对现有技术中存在的上述不足之处,本发明提供基于时域特征与时空信息的管道沿线第三方施工预警方法。
为了达到上述发明目的,本发明采用以下技术方案:
基于时域特征与时空信息的管道沿线第三方施工预警方法,包括以下步骤:
S1、通过管道沿线铺设的分布式光纤传感器实时采集管道沿线的波形数据,并对波形数据进行阈值触发及数据预处理,获取可疑波段及其对应的可疑防区;
S2、根据可疑波段的波形提取相应的时域特征,并获取可疑防区对应的时间段特征和地理特征;
S3、将时域特征、时间段特征及地理特征输入XGBoost分类模型,实时判断可疑波段的波形对应的振动源是否为第三方施工,以便进行预警。
作为优选方案,所述步骤S1中,阈值触发包括:
将采集的波形数据,按10s为一小段处理单元,每小段波形前后取40%重叠进行波形分段,选取每小段波形内最大值超过预设阈值的波形段作为可疑波段。
所述步骤S1中,数据预处理包括依次对可疑波段的波形数据进行滤波降噪、滑动窗口处理、一阶差分处理。
作为优选方案,所述步骤S2中,根据可疑波段的波形提取相应的时域特征,包括:
对可疑波段的波形直接进行时域特征的提取,和/或对可疑波段的波形先进行差分处理再进行时域特征的提取,得到可疑波段对应的时域特征。
作为优选方案,所述时域特征包括最大值、最小值、峰峰值、能量、平均值、绝对平均值、均方根、方差、标准差、峰值因子、偏度因子、间隙因子、波形因子、脉冲因子、裕度因子。
作为优选方案,所述步骤S2中,得到可疑波段对应的时域特征之后,采用主成分分析法PCA进行降维处理,降维至15维。
作为优选方案,所述时间段特征包括是否白天、是否工作日、是否节假日、是否上下班高峰期、是否特殊会议日期,所述时间段特征采用独热编码。
作为优选方案,所述地理特征包括:
地质方面:是否农田、是否公路、是否池塘河流、是否城市、是否山林;
附近设施方面:是否存在工厂、是否高速公路、是否有密集活动的场合、附近人流量程度;
光纤掩埋方面:报警点距离、光纤掩埋深度。
作为优选方案,所述XGBoost分类模型的训练过程,包括:
采集分布式光纤传感器的历史波形数据,获取正常波形数据和第三方施工作业时刻、高速汽车行驶、工厂轰鸣、动物经过对应的报警波形数据;
对正常波形数据和报警波形数据进行数据预处理之后,提取各类型波形的时域特征,以离线方式将各类型波形的时域特征以及各防区的时间段特征、地理特征输入XGBoost模型进行训练,得到XGBoost分类模型。
作为优选方案,所述XGBoost分类模型的AUC大于0.92。
本发明与现有技术相比,有益效果是:
(1)本发明考虑了各防区时间段特点(上下班高峰期、早晚、节假日等)、地理特征(土地土质、人类活动情况、是否存在工厂、高速等特殊噪音源),并结合波形的时域特征,对管道沿线第三方施工实现智能预警;
(2)本发明结合了防区的时间段特征、防区的地理特征和波形的时域特征,再依靠机器学习的XGBoost模型,可实现对不同防区的智能化预警,有效提升报警的准确率;
(3)本发明的投入成本低,见效快,可直接应用于管道保护预警,降低劳动强度,提高管道保护的效率;
(4)本发明有效降低人工巡线成本,且易推广,在不同场景包括栅栏防护、电信电缆保护等均可适用。
附图说明
图1是本发明实施例1的基于时域特征与时空信息的管道沿线第三方施工预警方法的流程图;
图2是本发明实施例1的分布式光纤原始波形数据的数据预处理的流程图;
图3是本发明实施例1的波形时域特征提取的流程图;
图4是本发明实施例1的PCA数据降维的流程图;
图5是本发明实施例1的XGBoost分类原理图;
图6是本发明实施例1的XGBoost分类模型的训练流程图。
具体实施方式
为了更清楚地说明本发明实施例,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
实施例1:
如图1所示,本实施例的基于时域特征与时空信息的管道沿线第三方施工预警方法,包括以下步骤:
通过管道沿线铺设的分布式光纤传感器实时采集管道沿线的
波形数据,并
对
波形数据进行阈值触发以及数据预处理,获取可疑波段及其对应的可疑防区;
具体地,在管道沿线铺设分布式光纤传感器,利用相位敏感光时域反射计
的
干涉机理,从光纤中不同部分反射回来的瑞利散射光同时到达光探测器而发生干涉,用于
探测管道沿线的各类振动情况,再根据振动波形的差异性,推测出振动源的类型。当发现振
动源为挖机等第三方施工时,发出报警,及时安排相关人员进行早期干预,防止管道遭受破
坏。
对于分布式光纤传感器传回的振动波形,主要依据其在时域上的特征,即时域特征。
首先,进行阈值触发,具体包括:上述实时采集管道沿线的
波形数据,按
10s为一小段处理单元,每小段波形前后取40%重叠,即0-10s为第一段,6-16s为第二段,12-
22s为第三段,以此类推。选取每小段波形内最大值超过预设阈值的波形段作为可疑波段,
并确定可疑波段对应的可疑防区。
然后,对可疑波段的波形数据进行数据预处理操作,如图2所示,数据预处理主要包括滤波降噪处理、滑动窗口处理、一阶差分处理,得到更纯粹的可疑波段的波形。
确定可疑波段的波形以及可疑防区之后,进行下一步骤S2。
S2、根据可疑波段的波形提取相应的时域特征,并获取可疑防区对应的时间段特征和地理特征;
其中,如图3所示,根据可疑波段的波形提取相应的时域特征,包括:对可疑波段的波形直接进行时域特征的提取,还对可疑波段的波形先进行差分处理再进行时域特征的提取,得到可疑波段的时域特征。即同时保留差分处理前和差分处理后波形的时域特征。
具体地,波形的时域特征即为分布式光纤波形随着时间的变化情况,部分时域特征可由肉眼直观感受,如波形的最大值、最小值、超出某条预警线的点数等,某些特征需要进行一定的运算得到,如一段时间内的波形平均值、方差、短时能量等等,不同原因引起的波形振动其在相关的时域特征上往往有一定的差异性。如表1所示,波形的时域特征具体包括以下15个特征:最大值、最小值、峰峰值、能量、平均值、绝对平均值、均方根、方差、标准差、峰值因子、偏度因子、间隙因子、波形因子、脉冲因子、裕度因子。
表1针对波形提取的时域特征
本实施例提取得到的30维度的时域特征之间的某些特征往往存在一定的相关性,其会增加问题分析的复杂性,此时引入主成分分析法PCA,对这30维度的特征数据进行降维处理,降维至15维。主成分分析法主要是依据各个特征间的通过计算数据矩阵的协方差矩阵,然后得到协方差矩阵的特征值特征向量,选择特征值最大(即方差最大)的k个特征所对应的特征向量组成的矩阵。这样就可以将数据矩阵转换到新的空间当中,实现数据特征的降维。
如图4所示,PCA数据降维的原理具体包括:
对于数据集矩阵X m*n ,X i 表示数据的第i维,m为特征数量,n为数据维度;
(1)对所有特征去平均值,即每一位特征减去各自的平均值
;
(3)通过SVD计算协方差矩阵特征值和特征向量;
(4)对特征值从大到小排序,选择其中最大的k个。然后将其对应的k个特征向量分别作
为列向量组成的k*n的特征向量矩阵
;
获取可疑波段的波形的时域特征之后,再结合可疑防区对应的时间段特征、防区的地理特征。
具体地,在可疑防区的时间段特征上,防区的不同时间段的振动信号分析,环境的干扰特性必然有一定的差异。时间维度上,主要考量是否日昼、是否工作日/节假日、是否上下班高峰时间段,例如:上班高峰时间段7-9点,下班高峰时间段17-19点,对不同的时间段采用0/1的独热编码,从而在不同时间段采取不同的预警处理。按照独热编码方式,例如:工作日编码为1,非工作日编码为0,其他以此类推。
本实施例的可疑防区的时间段特征含有的特征共有5个,分别为:是否白天,是否工作日,是否节假日,是否上下班高峰期,是否特殊会议日期;特殊会议例如两会、G20等,开会期间施工会下降。
另外,不同防区的环境的可能活动有着较大的差异性,必然要根据防区特点因地适宜的进行智能化设定。在地理空间维度上,主要考虑各防区的土质地貌、是否存在高速公路、农田、河流等区域,分布式光纤掩埋深度、人流密度,是否存在工厂等,对公路、河流地形,是否工厂、高速公路等做独热编码,对光纤深度、人流密度等,大致分为0、1、2、3、4类,例如人流密度分布对应基本没人、人少、一半、人较多、人很多。对不同特点的防区,设立适宜的预警处理。
本实施例的可疑防区的地理特征对应的特征数共有11个,分别为:
地质方面的:是否农田,是否公路,是否池塘河流,是否城市,是否山林;
附近设施方面的:是否存在工厂、是否高速公路、是否有较为密集活动的场合、附近人流量程度;
光纤掩埋方面的:报警点距离,对应光纤掩埋深度。
待时域特征、时间段特征及地理特征均获取完成后,进行归一化处理,对于独热编码的特征无需进行归一化处理;接着进行下一步骤S3;
S3、将时域特征、时间段特征及地理特征输入XGBoost分类模型,实时判断可疑波段的波形对应的振动源是否为第三方施工,以便进行预警。
其中,XGBoost算法是一种集成学习方法,其将多个弱分类器集成在一起形成一个强分类器。XGBoost分类模型以弱分类器为基础,采用提升方法,加权表决进行分类,其分类原理如图5所示。
具体地,如图6所示,本实施例的XGBoost分类模型的训练过程,包括:
采集分布式光纤传感器的历史波形数据,获取正常波形数据和第三方施工作业时刻、高速汽车行驶、工厂轰鸣、动物经过对应的报警波形数据;
对正常波形数据和报警波形数据进行数据预处理之后,提取各类型波形的时域特征,以离线方式将各类型波形的时域特征以及各防区的时间段特征、地理特征输入XGBoost模型进行训练,得到预测模型,即XGBoost分类模型。模型训练过程中对波形数据依次进行数据预处理,提取时域特征,并结合时间段特征、地理特征进行离线训练模型,具体可以参考上述数据处理以及特征提取的方式,在此不赘述。
将离线训练完成的防区阈值导入到实际的分布式光纤振动预警系统中,实现对振动信号分析阀值的智能设定,准确对是否存在第三方危险施工情况做出判断,以便进行预警。
另外,在训练XGBoost模型时,主要通过交叉检验调整XGBoost模型的相关超参数,XGBoost的参数可分为:通用参数、Booster参数、学习目标参数三个大类。
在优化目标上,引入混淆矩阵,对于一个事件的报警,其误报、漏报都有着一定的成本,其主要对应于混淆矩阵中的真正率和假正率。
真阳率TRP = TP/(TP+FN):预测为正例的样本占实际正例样本数量的比例,描述了分类器对正例类别的敏感程度;
伪阳率FPR = FP/(FP+TN):预测为正例的样本占实际负例样本数量的比例FPR越低,说明模型的效果越好。
而真阳率和伪阳率往往无法同时满足,其一般满足如下的曲线变化规律,即为ROC曲线。
AUC表达的是ROC曲线的面积,其计算方法同时考虑了分类器对于正例和负例的分类能力,在样本不平衡的情况下,依然能够对分类器作出合理的评价。
本实施例得到基于大量数据训练的XGBoost分类模型之后,部署在实时的预警系统之中,实时的获取阈值触发后波形的时序特征、防区时间段特征、防区地理特征作为模型输入,实时判断出引起波形振动的是否为第三方施工,并给出相应的报警信息。经过测试表明,本实施例的XGBoost分类模型的AUC大于0.92。
实施例2:
本实施例的基于时域特征与时空信息的管道沿线第三方施工预警方法与实施例1的不同之处在于:
在可疑波段的波形提取相应的时域特征的过程中:
仅保留可疑波段的波形提取的时域特征,作为可疑波段对应的时域特征;
或者,仅保留对可疑波段的波形先进行差分处理再进行提取的时域特征,作为可疑波段对应的时域特征;
以满足不同的应用需求。
其他步骤可以参考实施例1。
以上所述仅是对本发明的优选实施例及原理进行了详细说明,对本领域的普通技术人员而言,依据本发明提供的思想,在具体实施方式上会有改变之处,而这些改变也应视为本发明的保护范围。