CN111160106A - 一种基于gpu的光纤振动信号特征提取及分类的方法及系统 - Google Patents

一种基于gpu的光纤振动信号特征提取及分类的方法及系统 Download PDF

Info

Publication number
CN111160106A
CN111160106A CN201911221988.3A CN201911221988A CN111160106A CN 111160106 A CN111160106 A CN 111160106A CN 201911221988 A CN201911221988 A CN 201911221988A CN 111160106 A CN111160106 A CN 111160106A
Authority
CN
China
Prior art keywords
data
invasive
characteristic
signal
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911221988.3A
Other languages
English (en)
Other versions
CN111160106B (zh
Inventor
杨啸宇
桂小刚
王静
臧元章
江兆凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Microwave Technology CETC 50 Research Institute
Original Assignee
Shanghai Institute of Microwave Technology CETC 50 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institute of Microwave Technology CETC 50 Research Institute filed Critical Shanghai Institute of Microwave Technology CETC 50 Research Institute
Priority to CN201911221988.3A priority Critical patent/CN111160106B/zh
Publication of CN111160106A publication Critical patent/CN111160106A/zh
Application granted granted Critical
Publication of CN111160106B publication Critical patent/CN111160106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Signal Processing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供了一种基于GPU的光纤振动信号特征提取及分类的方法,包括:步骤M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;步骤M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;步骤M3:提取出数据S1归一化特征X;步骤M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;所述测试数据为待利用训练模型测得到入侵或非入侵特征标签的光纤振动信号。本发明结合语音、音频等特征选取算法提取光纤振动信号特征,解决了传统光纤振动信号特征提取效果不佳的弊病。

Description

一种基于GPU的光纤振动信号特征提取及分类的方法及系统
技术领域
本发明涉及光纤振动信号处理技术领域,具体地,涉及一种基于GPU的光纤振动信号特征提取及分类的方法及系统。
背景技术
目前在世界范围研发的光纤振动信号特征主要集中在时域,CUDA是一种支持GPU多线程并行化加速的计算工具,因其能通过GPC(图形处理器簇,缩写:GPC)、SM(流多处理器,缩写:SM)、Warp(GPU执行程序时的调度单位,缩写:Warp)、SP(流式处理器,缩写:SP)对超大数据量实现SIMD(单指令多数据流,缩写:SIMD)处理方式,已经成为数据处理必不可少的高性能计算统一计算设备架构,它利用NVIDIA CUDA C编译器生成每个内核特定于体系结构的cubin文件来前向兼容PTX(并行线程执行,缩写:PTX)版本。另外,国内外相关的光纤振动信号特征提取研究包括,天津大学利用小波变换技术提取信号特征向量,并结合ICA(独立成分分析,缩写:ICA)求出源信号估计值进而得到的相关系数确定入侵类型。印度理工学院从信号中提取出共振频率、归一化振幅和共振频率下的归一化面积三个特征输入三层前馈神经网络结构进行训练以识别损伤位置。西班牙阿尔卡拉大学提取基于声迹的谱含量特征结合模式识别系统分类机械活动。
现有的与基于光纤振动信号特征相关专利技术主要集中在各个专用领域的子系统实现,专利申请CN103968933A公开了基于模糊域特征的光纤振动信号识别方法,利用模糊函数得到特征,再利用RF分类器训练训练集,解决现有识别方法在采样率较低且入侵事件较为类似情况下识别率较低的问题。专利申请CN110210326A公开了一种基于光纤振动信号的在线列车识别及速度估计方法,通过经验模态分解和统计分析获得用于数据分类的统计学特征,引入动态惩罚系数的支持向量机为每个采样点离线训练相应的子分类器对特征向量进行分类在线计算列车位置。专利申请CN108509850A公开了一种基于分布式光纤系统的入侵信号识别算法,通过计算信号能量值判断振动异常事件,再进行固有时间尺度分解提取特征值输入Softmax分类器训练智能识别入侵信号。专利申请CN110222670A公开了一种光缆振动中断预警系统的分类器训练方法,利用信号样本的幅度、持续时间、信号一阶差分值的最大绝对值作为特征向量,再使用分类器对测试组样本进行分类。
基于Φ-OTDR(相敏光时域反射,缩写:Φ-OTDR)的外围安全监控系统很难有效消除干扰且识别入侵缺乏准确性。时域分析中短时能量、短时过零率等特征在任何入侵前后都显示出相同的变化趋势,以这种方式很难准确地识别各种入侵类型。信号能很好地判断是否存在振动,判断振动类型的效果也很差。在频域分析中由于全局变换的傅立叶变换不能有效地提取非线性和非平稳光纤振动信号的瞬时频率和瞬时状态,因此小波变换也用于频域分析中以处理不同尺度的光纤振动信号,但小波变换的本质是加权平均综合评价函数且二层架构识别机制是含窗傅里叶变换,其仍受不确定性原理限制,在较高频率分辨率下无法保证信号的局部细节,且小波能量分布特征只反映了不同频带中的能量分布,而不反映能量随时间的变化。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于GPU的光纤振动信号特征提取及分类的方法及系统。
根据本发明提供的一种基于GPU的光纤振动信号特征提取及分类的方法,包括:
步骤M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
步骤M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
步骤M3:提取出数据S1归一化特征X;
步骤M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号。
优选地,所述步骤M1提取特征数据集合S包括:
步骤M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;
步骤M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
步骤M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为预设值大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为预设时间内信号超过阈值Am的次数Fm,表达式为:
Figure BDA0002301108820000031
其中,λ表示时域中单个位置点的连续时间变化值;m表示位置点索引、n表示离散时间索引,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。
优选地,所述步骤M2包括:
步骤M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Figure BDA0002301108820000032
Sdm=1/Scm (5)
Sen,m=Sn,m+B (6)
Sfn,m=Sen,m×Sdm (7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
步骤M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2 (8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引。
优选地,所述步骤M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;并且利用Numba编译器对算法函数进行封装加速运算;
所述LFBEs算法利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量部分;
所述TEE算法由Teager能量算子和香农熵构成,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1) (9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
Figure BDA0002301108820000041
Figure BDA0002301108820000042
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小;
所述HZCRR算法是指过零率大于片段中预设值倍平均过零率的帧数比,HZCRR表达式的计算方法为:
Figure BDA0002301108820000043
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,
Figure BDA0002301108820000044
是片段中的平均过零率,sgn[]是符号函数。
优选地,所述步骤M4包括:
步骤M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是
Figure BDA0002301108820000051
对应输入特征X;根节点的输入(x,X)基于分裂标准函数
Figure BDA0002301108820000056
分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
Figure BDA0002301108820000052
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;
Figure BDA0002301108820000053
处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
Figure BDA0002301108820000054
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习;
步骤M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
Figure BDA0002301108820000055
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
本发明提供的一种基于GPU的光纤振动信号特征提取及分类的系统,包括:
模块M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
模块M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
模块M3:提取出数据S1归一化特征X;
模块M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号。
优选地,所述模块M1提取特征数据集合S包括:
模块M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;
模块M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
模块M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为预设值大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为预设时间内信号超过阈值Am的次数Fm,表达式为:
Figure BDA0002301108820000061
其中,λ表示时域中单个位置点的连续时间变化值;m表示位置点索引、n表示离散时间索引,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。
优选地,所述模块M2包括:
模块M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Figure BDA0002301108820000062
Sdm=1/Scm (5)
Sen,m=Sn,m+B (6)
Sfn,m=Sen,m×Sdm (7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
模块M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2 (8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引。
优选地,所述模块M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;并且利用Numba编译器对算法函数进行封装加速运算;
所述LFBEs算法利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量部分;
所述TEE算法由Teager能量算子和香农熵构成,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1) (9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
Figure BDA0002301108820000071
Figure BDA0002301108820000072
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小;
所述HZCRR算法是指过零率大于片段中预设值倍平均过零率的帧数比,HZCRR表达式的计算方法为:
Figure BDA0002301108820000081
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,
Figure BDA0002301108820000082
是片段中的平均过零率,sgn[]是符号函数。
优选地,所述模块M4包括:
模块M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是
Figure BDA0002301108820000083
对应输入特征X;根节点的输入(x,X)基于分裂标准函数
Figure BDA0002301108820000087
分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
Figure BDA0002301108820000084
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;
Figure BDA0002301108820000085
处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
Figure BDA0002301108820000086
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习;
模块M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
Figure BDA0002301108820000091
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
与现有技术相比,本发明具有如下的有益效果:
1、本发明结合语音、音频等特征选取算法提取光纤振动信号特征,解决了传统光纤振动信号特征提取效果不佳的弊病;
2、本发明实现了提取特征算法GPU加速的创新,结合CUDA平台高效执行算法;
3、本发明利用RF分类器训练信号特征实现测试信号高准确率分类。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明方法流程图;
图2为LFBEs特征提取框图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
本发明提供的一种基于GPU的光纤振动信号特征提取及分类的方法及系统,结合峭度因子、裕度因子、语音特征LFBEs(对数滤波器组能量,缩写:LFBEs)、语音特征TEE(Teager能量信息熵,缩写:TEE)、音频特征HZCRR(高过零率帧比率,缩写:HZCRR)、等算法提取光纤振动信号特征;结合NVIDIA CUDA计算平台利用Numba编译器运用GPU处理大数据量;基于RF(随机森林,缩写:RF)训练特征判断入侵信号,具有运行速度快、分类准确率高的优点。
本发明提供的一种基于GPU的光纤振动信号特征提取及分类的方法,包括:
步骤M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
具体地,所述步骤M1提取特征数据集合S包括:
步骤M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;因为在数据提取过程中,通过观察信号时域波形,干扰点会出现在随时间不变的位置,且其值大于过阈值率,易被误判。
步骤M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
待提取点的位置可能随着时间动态变化,如火车振动非入侵点。在时域-空间动态图中,随着时间进行,以目标点出现的首次位置为起始位置。
步骤M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为1024大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为0.3秒(时域中单个位置点的连续1024个时间变化值)内信号超过阈值Am的次数Fm,表达式为:
Figure BDA0002301108820000101
其中,m表示位置点索引,n表示离散时间索引值,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。
步骤M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
具体地,所述步骤M2包括:
步骤M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Figure BDA0002301108820000102
Sdm=1/Scm (5)
Sen,m=Sn,m+B (6)
Sfn,m=Sen,m×Sdm (7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
步骤M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2 (8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引。
步骤M3:提取出数据S1归一化特征X;
具体地,所述步骤M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;在求取特征的过程中,利用Numba编译器@autojit装饰器的GPU化方法对算法函数进行封装加速运算,其作用是对算法函数进行加速运算;
所述LFBEs算法过程如图2所示,相对MFCC(梅尔频率倒谱系数,缩写:MFCC),利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量某些部分,而这只有在运用矢量量化到傅立叶频域中才可能;
所述TEE算法由Teager能量算子和香农熵构成,自适应参数选择中常用的四阶累积统计量——峰度在遇到随机脉冲会急剧增加引起误差,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1) (9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
Figure BDA0002301108820000111
Figure BDA0002301108820000121
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小。
所述HZCRR算法是指过零率大于片段中1.5倍平均过零率的帧数比,HZCRR表达式的计算方法为:
Figure BDA0002301108820000122
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,
Figure BDA0002301108820000123
是片段中的平均过零率,sgn[]是符号函数。
步骤M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
具体地,所述步骤M4包括:
步骤M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是
Figure BDA0002301108820000124
对应输入特征X;根节点的输入(x,X)基于分裂标准函数
Figure BDA0002301108820000127
分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
Figure BDA0002301108820000125
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;
Figure BDA0002301108820000126
处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点,通过叶节点来进行分类的;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
Figure BDA0002301108820000131
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习,得到训练模型m。
条件概率用来求解在平均整棵树Ti∈T的推断概率pc(c|x)。
训练阶段得到训练模型的过程,就是模型不断学习输入特征的过程;
树中的每个非叶节点记录了使用哪个特征来进行类别的判断,每个叶节点则代表了最后判断的类别。根节点到每个叶节点均形成一条分类的路径规则。要分类就需要得到叶节点,但如果特征多,通过限制最大叶子节点数,可以防止过拟合。
步骤M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
Figure BDA0002301108820000132
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号。
推断阶段就是预测阶段,利用训练模型预测测试数据,得到测试数据的入侵或非入侵特征标签。
本发明提供的一种基于GPU的光纤振动信号特征提取及分类的系统,包括:
模块M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
具体地,所述模块M1提取特征数据集合S包括:
模块M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;因为在数据提取过程中,通过观察信号时域波形,干扰点会出现在随时间不变的位置,且其值大于过阈值率,易被误判。
模块M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
待提取点的位置可能随着时间动态变化,如火车振动非入侵点。在时域-空间动态图中,随着时间进行,以目标点出现的首次位置为起始位置。
模块M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为1024大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为0.3秒(时域中单个位置点的连续1024个时间变化值)内信号超过阈值Am的次数Fm,表达式为:
Figure BDA0002301108820000141
其中,m表示位置点索引,n表示离散时间索引值,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。
模块M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
具体地,所述模块M2包括:
模块M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Figure BDA0002301108820000142
Sdm=1/Scm (5)
Sen,m=Sn,m+B (6)
Sfn,m=Sen,m×Sdm (7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
模块M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2 (8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引。
模块M3:提取出数据S1归一化特征X;
具体地,所述模块M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;在求取特征的过程中,利用Numba编译器@autojit装饰器的GPU化方法对算法函数进行封装加速运算,其作用是对算法函数进行加速运算;任意一种方式可以提取出一个特征,多种方式得到多种特征作为后续输入;
所述LFBEs算法过程如图2所示,相对MFCC(梅尔频率倒谱系数,缩写:MFCC),利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量某些部分,而这只有在运用矢量量化到傅立叶频域中才可能;
所述TEE算法由Teager能量算子和香农熵构成,自适应参数选择中常用的四阶累积统计量——峰度在遇到随机脉冲会急剧增加引起误差,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1) (9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
Figure BDA0002301108820000151
Figure BDA0002301108820000152
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小。
所述HZCRR算法是指过零率大于片段中1.5倍平均过零率的帧数比,HZCRR表达式的计算方法为:
Figure BDA0002301108820000161
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,
Figure BDA0002301108820000162
是片段中的平均过零率,sgn[]是符号函数。
模块M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
具体地,所述模块M4包括:
模块M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是
Figure BDA0002301108820000163
对应输入特征X;根节点的输入(x,X)基于分裂标准函数
Figure BDA0002301108820000164
分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
Figure BDA0002301108820000165
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;
Figure BDA0002301108820000166
处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点,通过叶节点来进行分类的;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
Figure BDA0002301108820000167
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习,得到训练模型m。
条件概率用来求解在平均整棵树Ti∈T的推断概率pc(c|x)。
训练阶段得到训练模型的过程,就是模型不断学习输入特征的过程;
树中的每个非叶节点记录了使用哪个特征来进行类别的判断,每个叶节点则代表了最后判断的类别。根节点到每个叶节点均形成一条分类的路径规则。要分类就需要得到叶节点,但如果特征多,通过限制最大叶子节点数,可以防止过拟合。
模块M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
Figure BDA0002301108820000171
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号。
推断阶段就是预测阶段,利用训练模型预测测试数据,得到测试数据的入侵或非入侵特征标签。
为了更好的理解本发明,下面结合CUDA平台库和Spyder软件等现有技术,对本发明作详细说明。
本发明方法对原始数据进行入侵与否数据提取、预处理、特征提取、RF分类器训练模型、数据分类等步骤的加速处理,这种结合语音、音频等特征利用RF训练分类处理步骤使得可以判断入侵与否的待测信号,该方法是通过在CUDA平台利用装饰器封装函数加速算法处理,在RF中利用GridSearchCV函数得到最佳参数估计值(子模型数和学习率的最优解),进而训练数据得到模型分类待测数据。1.最佳参数估计值指子模型数和学习率的最优解;原始提取的经过标记的一维数据通过步长1024大小窗口截取为待提取特征数据,再依次求取待提取数据的峭度因子、裕度因子、LFBEs、TEE和HZCRR等5个特征进行降维,在求取特征的过程中,均利用Numba编译器中@autojit装饰器的GPU化方法对算法函数进行封装加速运算。
Numba为一个库,它设计来用于动态地编译小型函数。为Python的函数明确类型标识,会即时执行,Numba实现了巧妙的类型猜测算法,并通过编译包含类型信息的函数版本来提高执行时间。Numba诣在改善执行数值计算的代码性能,优化大量使用数组的应用程序。Python非常灵巧,因为Numba不断变化地执行源码。因面向程序编译调度而设计Numba,与常见的NumPy库相似,在针对程序编译设计里利用GPU并行加速。Numba结合NumPy,并用它产生执行有效的代码,从而在GPU或多核CPU上运行。编译如附加一个函数Decorator来引导Numba运行GPU。
再利用RF对降维后的数据集训练得到模型,其中RF用到Python库sklearn中RandomForestClassifier随机森林分类器函数进行训练,并利用GridSearchCV函数对所设置的所有参数做所有的可能排列组合测试,然后取得一个最佳参数,估计RandomForestClassifier函数中最佳森林中树的数量n_estimators参数值。采用基于基尼不纯度和信息增益熵的基尼标准衡量树分割质量。最佳分割的特征数量,推荐,其中为特征数量。
随机森林基于集成学习Bagging思想,是通过自助采用的方法生成众多并行式分类器,通过少数服从多数的原则来确定最终的结果。决策树就是一棵树,多棵树就称作森林,那么随机森林主要是解决决策树泛化能力弱的缺点,一棵决策树是一个决策的可能性,都有一个决策权,所有树的结果综合在一起的分类能力肯定强于单棵树,所以随机森林基于这一思想进行分类。随机森林的随机主要体现在两个方面,一个是随机选取样本,一个是随机选取特征,随机森林是构建多棵决策树,每一棵树是从整个训练样本集中随机选取固定数量的样本集,然后再选取固定数量的特征集来构建一棵决策树,就相当于样本数和特征数都是总样本数和总特征集的一个子集构建决策树,且它是一个有放回的抽取过程,分类的结果根据少数服从多数原则。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种基于GPU的光纤振动信号特征提取及分类的方法,其特征在于,包括:
步骤M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
步骤M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
步骤M3:提取出数据S1归一化特征X;
步骤M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号。
2.根据权利要求1所述的一种基于GPU的光纤振动信号特征提取及分类的方法,其特征在于,所述步骤M1提取特征数据集合S包括:
步骤M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;
步骤M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
步骤M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为预设值大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为预设时间内信号超过阈值Am的次数Fm,表达式为:
Figure FDA0002301108810000011
其中,λ表示时域中单个位置点的连续时间变化值;m表示位置点索引、n表示离散时间索引,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。
3.根据权利要求1所述的一种基于GPU的光纤振动信号特征提取及分类的方法,其特征在于,所述步骤M2包括:
步骤M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Figure FDA0002301108810000021
Sdm=1/Scm (5)
Sen,m=Sn,m+B (6)
Sfn,m=Sen,m×Sdm (7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
步骤M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2 (8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引。
4.根据权利要求1所述的一种基于GPU的光纤振动信号特征提取及分类的方法,其特征在于,所述步骤M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;并且利用Numba编译器对算法函数进行封装加速运算;
所述LFBEs算法利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量部分;
所述TEE算法由Teager能量算子和香农熵构成,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1) (9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
Figure FDA0002301108810000031
Figure FDA0002301108810000032
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小;
所述HZCRR算法是指过零率大于片段中预设值倍平均过零率的帧数比,HZCRR表达式的计算方法为:
Figure FDA0002301108810000033
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,
Figure FDA0002301108810000034
是片段中的平均过零率,sgn[]是符号函数。
5.根据权利要求1所述的一种基于GPU的光纤振动信号特征提取及分类的方法,其特征在于,所述步骤M4包括:
步骤M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是
Figure FDA0002301108810000035
对应输入特征X;根节点的输入(x,X)基于分裂标准函数
Figure FDA0002301108810000038
分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
Figure FDA0002301108810000036
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;
Figure FDA0002301108810000037
处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
Figure FDA0002301108810000041
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习;
步骤M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
Figure FDA0002301108810000042
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
6.一种基于GPU的光纤振动信号特征提取及分类的系统,其特征在于,包括:
模块M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
模块M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
模块M3:提取出数据S1归一化特征X;
模块M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号。
7.根据权利要求6所述的一种基于GPU的光纤振动信号特征提取及分类的系统,其特征在于,所述模块M1提取特征数据集合S包括:
模块M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;
模块M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
模块M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为预设值大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为预设时间内信号超过阈值Am的次数Fm,表达式为:
Figure FDA0002301108810000051
其中,λ表示时域中单个位置点的连续时间变化值;m表示位置点索引、n表示离散时间索引,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。
8.根据权利要求6所述的一种基于GPU的光纤振动信号特征提取及分类的系统,其特征在于,所述模块M2包括:
模块M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Figure FDA0002301108810000052
Sdm=1/Scm (5)
Sen,m=Sn,m+B (6)
Sfn,m=Sen,m×Sdm (7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
模块M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2 (8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引。
9.根据权利要求6所述的一种基于GPU的光纤振动信号特征提取及分类的系统,其特征在于,所述模块M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;并且利用Numba编译器对算法函数进行封装加速运算;
所述LFBEs算法利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量部分;
所述TEE算法由Teager能量算子和香农熵构成,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1) (9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
Figure FDA0002301108810000061
Figure FDA0002301108810000062
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小;
所述HZCRR算法是指过零率大于片段中预设值倍平均过零率的帧数比,HZCRR表达式的计算方法为:
Figure FDA0002301108810000063
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,
Figure FDA0002301108810000064
是片段中的平均过零率,sgn[]是符号函数。
10.根据权利要求6所述的一种基于GPU的光纤振动信号特征提取及分类的系统,其特征在于,所述模块M4包括:
模块M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是
Figure FDA0002301108810000065
对应输入特征X;根节点的输入(x,X)基于分裂标准函数
Figure FDA0002301108810000075
分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
Figure FDA0002301108810000071
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;
Figure FDA0002301108810000072
处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
Figure FDA0002301108810000073
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习;
模块M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
Figure FDA0002301108810000074
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
CN201911221988.3A 2019-12-03 2019-12-03 一种基于gpu的光纤振动信号特征提取及分类的方法及系统 Active CN111160106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911221988.3A CN111160106B (zh) 2019-12-03 2019-12-03 一种基于gpu的光纤振动信号特征提取及分类的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911221988.3A CN111160106B (zh) 2019-12-03 2019-12-03 一种基于gpu的光纤振动信号特征提取及分类的方法及系统

Publications (2)

Publication Number Publication Date
CN111160106A true CN111160106A (zh) 2020-05-15
CN111160106B CN111160106B (zh) 2023-12-12

Family

ID=70556343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911221988.3A Active CN111160106B (zh) 2019-12-03 2019-12-03 一种基于gpu的光纤振动信号特征提取及分类的方法及系统

Country Status (1)

Country Link
CN (1) CN111160106B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112433148A (zh) * 2020-11-13 2021-03-02 海南电网有限责任公司海南输变电检修分公司 一种从振动信号中提取断路器机构动作时间的方法
CN112836591A (zh) * 2021-01-14 2021-05-25 清华大学深圳国际研究生院 一种油气长输管道光纤预警信号特征提取方法
CN113743154A (zh) * 2020-05-28 2021-12-03 宁波陆禾科技有限公司 一种基于图像特征识别的光纤振动信号处理与识别方法
CN115342900A (zh) * 2022-08-15 2022-11-15 东北石油大学 一种基于随机森林的激光自混合干涉微振动测量方法及系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5313266A (en) * 1992-08-17 1994-05-17 Keolian Robert M Demodulators for optical fiber interferometers with [3×3] outputs
WO2011006210A1 (en) * 2009-07-17 2011-01-20 Future Fibre Technologies Pty Ltd Intrusion detection
CN106503642A (zh) * 2016-10-18 2017-03-15 长园长通新材料股份有限公司 一种应用于光纤传感系统的振动模型建立方法
CN106600870A (zh) * 2016-12-31 2017-04-26 上海华魏光纤传感技术有限公司 一种分布式光纤围栏振动入侵识别系统
CN107180521A (zh) * 2017-04-19 2017-09-19 天津大学 基于综合特征的光纤周界安防入侵事件识别方法及装置
CN107395590A (zh) * 2017-07-19 2017-11-24 福州大学 一种基于pca和随机森林分类的入侵检测方法
CN107576380A (zh) * 2017-09-20 2018-01-12 北京邮电大学 一种面向φ‑otdr技术的三维振动信号分类方法
CN108496148A (zh) * 2015-11-12 2018-09-04 剑桥触控科技有限公司 处理来自触摸屏面板的信号
CN108694416A (zh) * 2018-05-23 2018-10-23 重庆科技学院 基于多特征融合算法的振动光纤入侵事件检测方法
CN108932480A (zh) * 2018-06-08 2018-12-04 电子科技大学 基于1d-cnn的分布式光纤传感信号特征学习与分类方法
CN109033632A (zh) * 2018-07-26 2018-12-18 北京航空航天大学 一种基于深度量子神经网络的趋势预测方法
CN109489800A (zh) * 2018-12-14 2019-03-19 广东世港信息科技有限公司 一种分布式光缆振动安全预警系统中的扰动事件识别方法
CN110458071A (zh) * 2019-08-01 2019-11-15 北京邮电大学 一种基于dwt-dfpa-gbdt的光纤振动信号特征提取与分类方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5313266A (en) * 1992-08-17 1994-05-17 Keolian Robert M Demodulators for optical fiber interferometers with [3×3] outputs
WO2011006210A1 (en) * 2009-07-17 2011-01-20 Future Fibre Technologies Pty Ltd Intrusion detection
CN108496148A (zh) * 2015-11-12 2018-09-04 剑桥触控科技有限公司 处理来自触摸屏面板的信号
CN106503642A (zh) * 2016-10-18 2017-03-15 长园长通新材料股份有限公司 一种应用于光纤传感系统的振动模型建立方法
CN106600870A (zh) * 2016-12-31 2017-04-26 上海华魏光纤传感技术有限公司 一种分布式光纤围栏振动入侵识别系统
CN107180521A (zh) * 2017-04-19 2017-09-19 天津大学 基于综合特征的光纤周界安防入侵事件识别方法及装置
CN107395590A (zh) * 2017-07-19 2017-11-24 福州大学 一种基于pca和随机森林分类的入侵检测方法
CN107576380A (zh) * 2017-09-20 2018-01-12 北京邮电大学 一种面向φ‑otdr技术的三维振动信号分类方法
CN108694416A (zh) * 2018-05-23 2018-10-23 重庆科技学院 基于多特征融合算法的振动光纤入侵事件检测方法
CN108932480A (zh) * 2018-06-08 2018-12-04 电子科技大学 基于1d-cnn的分布式光纤传感信号特征学习与分类方法
US20180357542A1 (en) * 2018-06-08 2018-12-13 University Of Electronic Science And Technology Of China 1D-CNN-Based Distributed Optical Fiber Sensing Signal Feature Learning and Classification Method
CN109033632A (zh) * 2018-07-26 2018-12-18 北京航空航天大学 一种基于深度量子神经网络的趋势预测方法
CN109489800A (zh) * 2018-12-14 2019-03-19 广东世港信息科技有限公司 一种分布式光缆振动安全预警系统中的扰动事件识别方法
CN110458071A (zh) * 2019-08-01 2019-11-15 北京邮电大学 一种基于dwt-dfpa-gbdt的光纤振动信号特征提取与分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
S. TUNÇ YILMAZ, UMUT D. ÖZUGˇUREL, KARAHAN BULUT, M. NACI INCI: "Vibration amplitude analysis with a single frame using a structured light pattern of a four-core optical fibre", OPTICS COMMUNICATIONS, vol. 249, no. 4, pages 515 - 522 *
刘勇: "基于随机森林分类器的∅-OTDR传感系统模式识别研究", pages 45 - 55 *
姜大闯,潘鸣,俞旭辉等: "基于GPU的振动光纤入侵探测数据预处理算法", vol. 17, no. 17, pages 899 - 903 *
江兆凤,於景瞵,臧元章,俞旭辉: "分布式振动光纤信号识别算法研究", vol. 41, no. 41, pages 65 - 69 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743154A (zh) * 2020-05-28 2021-12-03 宁波陆禾科技有限公司 一种基于图像特征识别的光纤振动信号处理与识别方法
CN112433148A (zh) * 2020-11-13 2021-03-02 海南电网有限责任公司海南输变电检修分公司 一种从振动信号中提取断路器机构动作时间的方法
CN112836591A (zh) * 2021-01-14 2021-05-25 清华大学深圳国际研究生院 一种油气长输管道光纤预警信号特征提取方法
CN112836591B (zh) * 2021-01-14 2024-02-27 清华大学深圳国际研究生院 一种油气长输管道光纤预警信号特征提取方法
CN115342900A (zh) * 2022-08-15 2022-11-15 东北石油大学 一种基于随机森林的激光自混合干涉微振动测量方法及系统
CN115342900B (zh) * 2022-08-15 2024-04-30 东北石油大学 一种基于随机森林的激光自混合干涉微振动测量方法及系统

Also Published As

Publication number Publication date
CN111160106B (zh) 2023-12-12

Similar Documents

Publication Publication Date Title
CN111160106B (zh) 一种基于gpu的光纤振动信号特征提取及分类的方法及系统
Hsieh et al. A streamlined encoder/decoder architecture for melody extraction
Sigtia et al. Improved music feature learning with deep neural networks
Colonna et al. An incremental technique for real-time bioacoustic signal segmentation
Cakir et al. Multi-label vs. combined single-label sound event detection with deep neural networks
Xie et al. Investigation of acoustic and visual features for acoustic scene classification
Brown et al. Automatic rain and cicada chorus filtering of bird acoustic data
Mulimani et al. Segmentation and characterization of acoustic event spectrograms using singular value decomposition
Piczak The details that matter: Frequency resolution of spectrograms in acoustic scene classification
Colangelo et al. Enhancing audio surveillance with hierarchical recurrent neural networks
Ge et al. Explaining deep learning models for spoofing and deepfake detection with SHapley Additive exPlanations
Mohammad et al. On comparing SSA-based change point discovery algorithms
Schlüter et al. Unsupervised feature learning for speech and music detection in radio broadcasts
Liu et al. A parallel fusion approach to piano music transcription based on convolutional neural network
CN112464721A (zh) 微地震事件自动识别方法及装置
Imran et al. An analysis of audio classification techniques using deep learning architectures
CN115510909A (zh) 一种dbscan进行异常声音特征的无监督算法
Wazir et al. Spectrogram-based classification of spoken foul language using deep CNN
Martín-Morató et al. A case study on feature sensitivity for audio event classification using support vector machines
CN113447287A (zh) 异常检测装置和方法
Smith et al. An end-to-end vechicle classification pipeline using vibrometry data
Agarwal et al. A method for voice activity detection using K-means clustering
O’Hanlon et al. The fifthnet chroma extractor
Diez Gaspon et al. Deep learning for natural sound classification
Liu et al. Reinforcement learning based neural architecture search for audio tagging

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant