背景技术
长输管道是国家能源供应大动脉和国民经济的重点工程,肩负着提供能源保障的重要责任,它们的安全运行有重大的社会和经济意义。近年来,城市及城镇建设、交通设施建设日益频繁,第三方破坏引发的管道泄漏事故呈上升趋势,给管道系统的安全造成严重威胁。
许多安全防护要求级别高的场所,例如油库、机场、监狱和文博场馆等,大多处于城郊结合部,周边城乡结合、周界漫长、地形复杂,场站区周围虽设立围墙、铁艺等,但周界距离跨度较大,人员侵入无法第一时间知晓,给场所的安全带来重大安全隐患。
分布式光纤传感技术可以满足这两种场景的安防要求。分布式光纤传感技术是以光波为载体,光纤为媒质,感知和传输外界环境中的声波、振动、温度、应变等理化参量,并进行智能识别处理的一种新型传感技术。分布式光纤振动监测系统是分布式光纤传感的一个重要分支,利用光纤中的散射光对管道和周界动态进行实时监测和智能分析,可以准确识别管道外破行为和周界入侵等事件,并精确定位。
现在管道和周界场景下的模式识别在事件分类准确率和事件定位上还存在一定的改善空间。缺点如下:
(1)光纤振动信号中,除了入侵等事件信号,还容易受现场环境噪声以及其它非破坏事件的影响,在后期处理时仅使用单一的原始振动信号,导致识别效果不好,环境适应性差。所以本发明中将振动信号与人工提取特征结合起来,进行多维特征融合,能够有效提升识别效果。
(2)光纤振动信号未使用有效的手段排除固定频率信号的干扰,本发明中采用了巴特沃斯高通滤波对一部分固定频率信号进行滤除。
(3)人工提取的时空域特征可以描述信号的冲击特性、频率分布等,但单一的时空域特征不易区分事件,容易造成误报;深度学习网络提取的特征具有高维多元的特点,但存在与实际信号特性关联度不高的问题,而本发明将人工和深度学习两者融合,既可以加大数据利用率,也可以提高识别的准确率。
因此,本发明提出一种基于多维特征融合的分布式光纤传感事件预警方法。
发明内容
1、发明目的。
本发明提供了一种基于多维特征融合的分布式光纤传感事件预警方法,通过本方法可以辅助预警模型学习到信号更有用的特征,从而更准确地分类不同场景下的异常事件,降低误报率,并对事件发生位置进行准确预警,适用于分布式光纤传感的事件的感知与定位,应用于分布式光纤振动监测系统上,对沿线管道突发的外破事件和周界的入侵事件进行定位及预警。
2、技术解决方案。
本发明的技术任务是按以下方式实现的:
一种基于多维特征融合的分布式光纤传感事件预警方法,包括以下步骤:
步骤1、采集光纤的原始信号数据;
步骤2、将采集好的原始信号数据进行巴特沃斯高通滤波处理;
步骤3、使用滤波后的信号数据计算每个位置点的24个时频域特征,得到人工提取特征数据;
步骤4、将滤波后的信号数据进行256倍降采样,计算出power信号;
步骤5、基于深度学习SSD算法,融合power信号以及人工提取特征数据构建深度学习模型,包括数据融合模块和事件识别定位两个模块;在数据融合模块中将两类数据拼接起来做双通道,用卷积层做通道合并;在事件识别定位模块中引入SSD网络,计算出power信号的多尺度特征,并进行事件分类及定位;
步骤6、将处理后的信号数据整理成训练数据,对处理后的信号数据进行事件标注,标记出具体事件的类别及位置,生成json文件,使用平移变换及镜像变换数据增强技术,平移事件的位置或对事件进行镜像变换,根据变换位置更改对应的json文件标注信息;
步骤7、读取json文件,并按照8:1:1的比例划分为训练集、验证集和测试集,加入模型中进行模型训练,设置预选框合适的最小最大边长以及适量的训练批次和轮数,并记录模型每20轮在验证集上的准确率、召回率、损失;
步骤8、选择在测试集上表现最好的模型best_test.pt,使用模型best_test.pt进行入侵或破坏事件识别,并将模型返回的事件类型及位置数据封装成告警信息,推送到安防预警系统平台。
优选的,步骤1中,通过分布式光纤振动监测系统采集管道或者周界附近由于振动引起的原始信号数据,共有人员行走、人攀爬、机械挖掘和人工挖掘四类事件,每类事件的数据采集一小时。
优选的,步骤3中,在采集的数据信号中,根据光纤铺设的实际距离长度设置采集卡的合适的采样点数,每个点分别对应光纤不同位置,计算每个位置点的24维时频域信号特征值,时域12维,频域12维。
优选的,12维时域特征中,均值是信号的平均值,均方根值反映信号的能量大小,均方差反应信号相对平均值的波动程度,方根幅值表征振动信号波动的大小或强弱,峰值描述信号最大瞬时幅值,峰值因子代表峰值在波形中的极端程度,脉冲因子是信号峰值与整流平均值的比值,裕度因子是裕度因子是信号峰值与方根幅值的比值,峰度用于度量信号偏离某分布的情况,峭度定义为随机变量的四阶中心矩除以标准差的四次幂,峭度因子是四阶中心矩和标准差的四次方的比值,波形因子是四阶中心矩和标准差的四次方的比值。
优选的,频域是通过傅里叶变换将时域进行变换,包括:平均频率,重心频率,均方频率,频率方差,均方根频率,频率幅值方差,频域幅值偏度指标,频域幅值峭度指标,频率标准差,频域频率歪度,频域频率峭度,平方根比率。
优选的,步骤4中,通过差分平均法进行256倍降采样。
优选的,步骤5中,构造多尺度卷积层,卷积核大小分别为3×3、5×5,将两个通道的数据输入卷积层进行处理,得到的两种特征结果相加,实现两类数据的融合。
优选的,引入SSD网络,用多尺度特征图进行检测,使用卷积对不同特征图提取检测结果,生成多种宽高比的anchor,其中存储着位置信息和分类信息,通过非极大值抑制去除冗余的anchor,得到最终的位置和分类信息,完成事件的定位及识别。
优选的,步骤8中,进行入侵或破坏事件识别的识别步骤为:保存固定时间间隔的信号数据,将计算滤波后power信号和人工提取特征数据的过程封装至预警平台,经过预警模型预测后返回事件类型及位置数据,并将模型返回的数据封装成告警信息,推送到安防预警系统平台。
3、技术效果。
本发明通过提供一种基于多维特征融合的分布式光纤传感事件预警方法,有效提高了事件的识别及定位精度,其技术效果体现在:
a)本方法实现了对光纤传输管道和周界环境的破坏行为自动化监测,有效降低人工巡检,节省人工劳动及巡检费用。
b)使用巴特沃斯高通滤波进行初步的数据增强,可以将噪声及其他干扰信号的进行部分滤除,使信号变得更干净、清楚、易分,从而使深度学习网络学习到更深层、更精确的各类事件特征。
c)虽然深度学习自学习的特征有更强的表达能力,但也因此更容易发生过拟合现象,借助人工提取的表层特征,与其相融合,可以在一定程度上辅助模型学习到更有用的特征,也可以有效降低模型过拟合的概率。
d)本方法基于SSD算法,即使在低分辨率输入图像上也能实现简单的端到端训练和高精度,在提高速度与精度之间有更好的权衡。
具体实施方式
参照附图1以具体的实施例对本发明的基于多维特征融合的分布式光纤传感事件预警方法作一下详细地说明。
实施例包括以下步骤和内容:
步骤1、采集光纤的原始信号数据,通过分布式光纤振动监测系统采集管道或者周界附近由于振动引起的原始信号数据。本实施例中光纤长度为8192m,一般情况下采样频率为2000Hz/s,每条数据以3s为时间单位采集,数据尺寸为1×6000×8192。共有人员行走、人攀爬、机械挖掘和人工挖掘四类事件,每类事件的数据采集一小时。
原始信号数据既包含需进行分类的各类事件的有效数据,也包含了环境噪声等无用数据。
步骤2、将采集好的原始信号数据进行巴特沃斯高通滤波处理,滤波后的信号数据与原始信号数据相比,减小了有效信号中混合的无用噪声对信号的影响,使有效信号清晰易分,提高信号抗干扰性、信噪比以及分析的精度,滤波前后的信号数据对比如附图2所示。
本步骤的目的是进行数据增强。在原始数据基础上,使用巴特沃斯高通滤波器,对数据进行高通滤波,计算出滤波后的数据。滤波计算过程如式:
其中,
表示滤波函数,/>
为截止频率,/>
为频率点/>
与频域中心的距离。
步骤3、使用滤波后的信号数据计算每个位置点的24个时频域特征,得到人工提取特征数据。单条数据的人工提取特征尺寸为1×24×8192。
本步骤的目的是进行人工提取特征数据。在采集的数据信号中,根据光纤铺设的实际距离长度,设置采集卡的合适的采样点数,每个点分别对应光纤不同位置,计算每个位置点的24维时频域信号特征值,时域12维,频域12维,它们是衡量信号特征的重要指标。具体特征计算过程如式:
12维时域特征计算公式中,振动信号为
,(i = 1~ N,N为采样点数)。
a)均值是信号的平均值。
b)均方根(RMS)又叫有效值。将所有值平方求和,求其均值,再开平方,就得到均方根值。均方根值是对时间平均的,用来反映信号的能量大小。
c)均方差,是方差的算数平方根,反应数据的离散程度。它反应信号相对平均值的波动程度。标准差数值越小,反应信号数值分布更靠近平均值,反之越大则表示信号相对平均值更分散。
d)方根幅值,表征振动信号波动的大小或强弱。
e)峰值,描述信号最大瞬时幅值。
f)峰值因子,是信号峰值与均方根的比值,代表的是峰值在波形中的极端程度。用来检测信号中是否存在冲击的统计指标。
g)脉冲因子,是信号峰值与整流平均值(绝对值的平均值)的比值,也是用来检测信号中是否存在冲击的统计指标。
h)裕度因子,是裕度因子是信号峰值与方根幅值的比值,体现了信号的一种冲击特性。如果这个值过大,则说明信号中有很强的冲击性。
i)峰度,用于度量信号偏离某分布的情况,正态分布的峰度为3。当时间序列的曲线峰值比正态分布的高时,峰度大于3;当比正态分布的低时,峰度小于3。
j)峭度,峭度定义为随机变量的四阶中心矩除以标准差的四次幂,是无量纲因子,用来检验信号偏离正态分布的程度。
k)峭度因子,是四阶中心矩和标准差的四次方的比值。是表示波形平缓程度的,用于描述变量的分布,是对振动信号冲击特性的反应。正态分布的峭度等于3,峭度小于3时分布的曲线会较“平”,大于3时分布的曲线较“陡”。
l)波形因子,是四阶中心矩和标准差的四次方的比值。是表示波形平缓程度的,用于描述变量的分布,是对振动信号冲击特性的反应。正态分布的峭度等于3,峭度小于3时分布的曲线会较“平”,大于3时分布的曲线较“陡”。
频域是通过傅里叶变换将时域进行变换,在12维频域特征计算公式中,
为待处理振动信号列表。
m)平均频率,频域幅值平均值。
n)重心频率,用来描述信号在频谱中分量较大的信号成分的频率,反映信号功率谱的分布情况。即对于给定的频带范围,低于重心频率的频率范围内包含的能量是信号总能量的一半。
o)均方频率,均方频率是信号频率平方的加权平均。
p)频率方差,是频率标准差的平方,是衡量功率谱能量分散程度的另一个维度。
q)均方根频率,可以看做惯性半径,可以反馈出信号的频率分布。
r)频率幅值方差。
s)频域幅值偏度指标。
t)频域幅值峭度指标。
u)频率标准差,重心频率为中心的惯性半径,描述功率谱能量分布的分散程度。信号频率分布越离散,标准差越大。
v)频域频率歪度,反应振动信号的非对称性。
w)频域频率峭度,反应振动信号的冲击特性。
x)平方根比率。
24维特征公式中,均为已有数学公式,非自定义公式。
步骤4、将滤波后的信号数据进行256倍降采样,计算出power信号,此时power信号数据尺寸约为1×24×8192。
本步骤的目的是进行数据降采样。滤波后的原始数据通过差分平均法进行256倍降采样,降低数据尺寸,且降采样后数据可以反映出信号的能量幅值,降采样后的数据简称为Power信号。使用差分平均法计算Power信号过程如式:
其中,N为帧数,M为平均点数,N与M均为采集卡内设定的参数,有经验值可参考,X指原始信号序列
。
步骤5、基于深度学习SSD算法,融合power信号以及人工提取特征数据构建深度学习模型,如附图3所示。所述深度学习模型主要分数据融合模块和事件识别定位两个模块。在数据融合模块中将两类数据拼接起来做双通道,用卷积层做通道合并;在事件识别定位模块中引入SSD网络,计算出power信号的多尺度特征,并进行事件分类及定位。具体过程如下:
a)首先是数据融合模块,是在通道上进行合并。两类需要融合的数据在前期处理过程中尺寸已经保持一致,故此处不需再进行转换操作,各取n条数据,尺寸为n×24×8192,在通道上直接进行合并,如附图4所示。滤波后的Power信号作为通道一的数据,人工提取特征数据作为通道二的数据。构造多尺度卷积层,卷积核大小分别为3×3、5×5,将两个通道的数据输入卷积层进行处理,得到的两种特征结果相加,实现两类数据的融合。
数据融合的具体过程表示如下式所示:
其中,
表示多尺度卷积结果,/>
表示卷积核的大小,FP表示滤波后Power信号,AF表示人工提取特征,/>
表示激活函数sigmoid,/>
表示特征融合后进行多尺度卷积的最终特征图。
b)其次是事件识别定位模块,多尺度特征图是SSD网络的显著特点之一,引入SSD网络,用多尺度特征图进行检测,即大小不同的特征图,来对不同尺寸的信号进行适应,后使用卷积对不同特征图提取检测结果,网络会生成多种宽高比的预设边界框,别称anchor,其中存储着位置信息和分类信息,通过非极大值抑制,去除冗余的anchor,保留最好的一个,即可以得到最终的位置和分类信息,完成事件的定位及识别。
将融合好的特征数据输入到事件识别定位模块中,经过不同卷积层的处理,提取出检测分类结果,共有人员行走、人攀爬、机械挖掘和人工挖掘四类事件。基于anchor得到预测框,首先根据类别置信度确定其类别(置信度最大者)与置信度值,并过滤掉属于背景的预测框,然后根据置信度阈值(如0.5)过滤掉阈值较低的预测框。通过非极大值抑制算法,过滤掉重叠度较大的预测框。
步骤6、将处理后的信号整理成训练数据,对处理后的数据进行事件标注,标记出具体事件的类别及位置,生成json文件。使用平移变换及镜像变换数据增强技术,平移事件的位置或对事件进行镜像变换,提高模型对于位置预测的泛化能力,同时根据变换位置更改对应的json文件标注信息。
步骤7、读取json文件,并按照8:1:1的比例划分为训练集、验证集、测试集,加入模型中进行训练,设置预选框合适的最小最大边长以及适量的训练批次和轮数。设置预选框最小边长0.2、最大边长0.9、训练批数32、训练轮数200等,进行模型训练,并记录模型每20轮在验证集上的准确率、召回率、损失等指标。
步骤8、选择在测试集上表现最好的模型best_test.pt,使用模型best_test.pt进行入侵或破坏事件识别,并将模型返回的事件类型及位置数据封装成告警信息,推送到安防预警系统平台。整个事件识别并预警的流程如附图5所示。
选择在测试集上mAP值最高的(mAP值是用来评估模型的分类和定位性能的重要指标)的模型,将此模型部署到安防预警系统平台上,进行入侵或破坏事件识别,识别步骤为,保存固定时间间隔的信号数据,将计算滤波后power信号和人工提取特征数据的过程封装至预警平台,经过预警模型预测后会返回事件类型及位置数据,并将模型返回的数据封装成告警信息,推送到安防预警系统平台。
以上结合附图对本发明的部分实施例进行性了详细说明,但本发明不仅仅受限于上述实施例中的实现方式。在不脱离本发明的宗旨前提下所做的各种变形或变化,均属于该专利。不应依此限制本发明的保护范围。