CN111160106B - 一种基于gpu的光纤振动信号特征提取及分类的方法及系统 - Google Patents
一种基于gpu的光纤振动信号特征提取及分类的方法及系统 Download PDFInfo
- Publication number
- CN111160106B CN111160106B CN201911221988.3A CN201911221988A CN111160106B CN 111160106 B CN111160106 B CN 111160106B CN 201911221988 A CN201911221988 A CN 201911221988A CN 111160106 B CN111160106 B CN 111160106B
- Authority
- CN
- China
- Prior art keywords
- data
- training
- signal
- node
- invasive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 239000013307 optical fiber Substances 0.000 title claims abstract description 49
- 238000000605 extraction Methods 0.000 title description 10
- 238000012549 training Methods 0.000 claims abstract description 109
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 52
- 238000012360 testing method Methods 0.000 claims abstract description 41
- 238000007781 pre-processing Methods 0.000 claims abstract description 20
- 230000009545 invasion Effects 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims description 42
- 238000007637 random forest analysis Methods 0.000 claims description 33
- 230000008569 process Effects 0.000 claims description 24
- 238000003066 decision tree Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 19
- 239000013598 vector Substances 0.000 claims description 17
- 238000012935 Averaging Methods 0.000 claims description 12
- 230000001133 acceleration Effects 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000005538 encapsulation Methods 0.000 claims description 6
- 230000002708 enhancing effect Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000035945 sensitivity Effects 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 4
- 230000007547 defect Effects 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract description 4
- 238000013175 transesophageal echocardiography Methods 0.000 description 23
- 238000012545 processing Methods 0.000 description 7
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 6
- 239000000835 fiber Substances 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013075 data extraction Methods 0.000 description 3
- 238000012880 independent component analysis Methods 0.000 description 3
- 238000000253 optical time-domain reflectometry Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Signal Processing (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Complex Calculations (AREA)
Abstract
本发明提供了一种基于GPU的光纤振动信号特征提取及分类的方法,包括:步骤M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;步骤M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;步骤M3:提取出数据S1归一化特征X;步骤M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;所述测试数据为待利用训练模型测得到入侵或非入侵特征标签的光纤振动信号。本发明结合语音、音频等特征选取算法提取光纤振动信号特征,解决了传统光纤振动信号特征提取效果不佳的弊病。
Description
技术领域
本发明涉及光纤振动信号处理技术领域,具体地,涉及一种基于GPU的光纤振动信号特征提取及分类的方法及系统。
背景技术
目前在世界范围研发的光纤振动信号特征主要集中在时域,CUDA是一种支持GPU多线程并行化加速的计算工具,因其能通过GPC(图形处理器簇,缩写:GPC)、SM(流多处理器,缩写:SM)、Warp(GPU执行程序时的调度单位,缩写:Warp)、SP(流式处理器,缩写:SP)对超大数据量实现SIMD(单指令多数据流,缩写:SIMD)处理方式,已经成为数据处理必不可少的高性能计算统一计算设备架构,它利用NVIDIA CUDA C编译器生成每个内核特定于体系结构的cubin文件来前向兼容PTX(并行线程执行,缩写:PTX)版本。另外,国内外相关的光纤振动信号特征提取研究包括,天津大学利用小波变换技术提取信号特征向量,并结合ICA(独立成分分析,缩写:ICA)求出源信号估计值进而得到的相关系数确定入侵类型。印度理工学院从信号中提取出共振频率、归一化振幅和共振频率下的归一化面积三个特征输入三层前馈神经网络结构进行训练以识别损伤位置。西班牙阿尔卡拉大学提取基于声迹的谱含量特征结合模式识别系统分类机械活动。
现有的与基于光纤振动信号特征相关专利技术主要集中在各个专用领域的子系统实现,专利申请CN103968933A公开了基于模糊域特征的光纤振动信号识别方法,利用模糊函数得到特征,再利用RF分类器训练训练集,解决现有识别方法在采样率较低且入侵事件较为类似情况下识别率较低的问题。专利申请CN110210326A公开了一种基于光纤振动信号的在线列车识别及速度估计方法,通过经验模态分解和统计分析获得用于数据分类的统计学特征,引入动态惩罚系数的支持向量机为每个采样点离线训练相应的子分类器对特征向量进行分类在线计算列车位置。专利申请CN108509850A公开了一种基于分布式光纤系统的入侵信号识别算法,通过计算信号能量值判断振动异常事件,再进行固有时间尺度分解提取特征值输入Softmax分类器训练智能识别入侵信号。专利申请CN110222670A公开了一种光缆振动中断预警系统的分类器训练方法,利用信号样本的幅度、持续时间、信号一阶差分值的最大绝对值作为特征向量,再使用分类器对测试组样本进行分类。
基于Φ-OTDR(相敏光时域反射,缩写:Φ-OTDR)的外围安全监控系统很难有效消除干扰且识别入侵缺乏准确性。时域分析中短时能量、短时过零率等特征在任何入侵前后都显示出相同的变化趋势,以这种方式很难准确地识别各种入侵类型。信号能很好地判断是否存在振动,判断振动类型的效果也很差。在频域分析中由于全局变换的傅立叶变换不能有效地提取非线性和非平稳光纤振动信号的瞬时频率和瞬时状态,因此小波变换也用于频域分析中以处理不同尺度的光纤振动信号,但小波变换的本质是加权平均综合评价函数且二层架构识别机制是含窗傅里叶变换,其仍受不确定性原理限制,在较高频率分辨率下无法保证信号的局部细节,且小波能量分布特征只反映了不同频带中的能量分布,而不反映能量随时间的变化。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于GPU的光纤振动信号特征提取及分类的方法及系统。
根据本发明提供的一种基于GPU的光纤振动信号特征提取及分类的方法,包括:
步骤M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
步骤M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
步骤M3:提取出数据S1归一化特征X;
步骤M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号。
优选地,所述步骤M1提取特征数据集合S包括:
步骤M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;
步骤M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
步骤M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为预设值大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为预设时间内信号超过阈值Am的次数Fm,表达式为:
其中,λ表示时域中单个位置点的连续时间变化值;m表示位置点索引、n表示离散时间索引,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。
优选地,所述步骤M2包括:
步骤M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Sdm=1/Scm (5)
Sen,m=Sn,m+B (6)
Sfn,m=Sen,m×Sdm (7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
步骤M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2 (8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引。
优选地,所述步骤M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;并且利用Numba编译器对算法函数进行封装加速运算;
所述LFBEs算法利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量部分;
所述TEE算法由Teager能量算子和香农熵构成,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1) (9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小;
所述HZCRR算法是指过零率大于片段中预设值倍平均过零率的帧数比,HZCRR表达式的计算方法为:
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,是片段中的平均过零率,sgn[]是符号函数。
优选地,所述步骤M4包括:
步骤M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是对应输入特征X;根节点的输入(x,X)基于分裂标准函数分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习;
步骤M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
本发明提供的一种基于GPU的光纤振动信号特征提取及分类的系统,包括:
模块M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
模块M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
模块M3:提取出数据S1归一化特征X;
模块M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号。
优选地,所述模块M1提取特征数据集合S包括:
模块M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;
模块M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
模块M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为预设值大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为预设时间内信号超过阈值Am的次数Fm,表达式为:
其中,λ表示时域中单个位置点的连续时间变化值;m表示位置点索引、n表示离散时间索引,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。
优选地,所述模块M2包括:
模块M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Sdm=1/Scm (5)
Sen,m=Sn,m+B (6)
Sfn,m=Sen,m×Sdm (7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
模块M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2 (8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引。
优选地,所述模块M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;并且利用Numba编译器对算法函数进行封装加速运算;
所述LFBEs算法利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量部分;
所述TEE算法由Teager能量算子和香农熵构成,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1) (9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小;
所述HZCRR算法是指过零率大于片段中预设值倍平均过零率的帧数比,HZCRR表达式的计算方法为:
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,是片段中的平均过零率,sgn[]是符号函数。
优选地,所述模块M4包括:
模块M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是对应输入特征X;根节点的输入(x,X)基于分裂标准函数分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习;
模块M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
与现有技术相比,本发明具有如下的有益效果:
1、本发明结合语音、音频等特征选取算法提取光纤振动信号特征,解决了传统光纤振动信号特征提取效果不佳的弊病;
2、本发明实现了提取特征算法GPU加速的创新,结合CUDA平台高效执行算法;
3、本发明利用RF分类器训练信号特征实现测试信号高准确率分类。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明方法流程图;
图2为LFBEs特征提取框图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
本发明提供的一种基于GPU的光纤振动信号特征提取及分类的方法及系统,结合峭度因子、裕度因子、语音特征LFBEs(对数滤波器组能量,缩写:LFBEs)、语音特征TEE(Teager能量信息熵,缩写:TEE)、音频特征HZCRR(高过零率帧比率,缩写:HZCRR)、等算法提取光纤振动信号特征;结合NVIDIA CUDA计算平台利用Numba编译器运用GPU处理大数据量;基于RF(随机森林,缩写:RF)训练特征判断入侵信号,具有运行速度快、分类准确率高的优点。
本发明提供的一种基于GPU的光纤振动信号特征提取及分类的方法,包括:
步骤M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
具体地,所述步骤M1提取特征数据集合S包括:
步骤M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;因为在数据提取过程中,通过观察信号时域波形,干扰点会出现在随时间不变的位置,且其值大于过阈值率,易被误判。
步骤M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
待提取点的位置可能随着时间动态变化,如火车振动非入侵点。在时域-空间动态图中,随着时间进行,以目标点出现的首次位置为起始位置。
步骤M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为1024大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为0.3秒(时域中单个位置点的连续1024个时间变化值)内信号超过阈值Am的次数Fm,表达式为:
其中,m表示位置点索引,n表示离散时间索引值,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。
步骤M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
具体地,所述步骤M2包括:
步骤M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Sdm=1/Scm (5)
Sen,m=Sn,m+B (6)
Sfn,m=Sen,m×Sdm (7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
步骤M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2 (8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引。
步骤M3:提取出数据S1归一化特征X;
具体地,所述步骤M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;在求取特征的过程中,利用Numba编译器@autojit装饰器的GPU化方法对算法函数进行封装加速运算,其作用是对算法函数进行加速运算;
所述LFBEs算法过程如图2所示,相对MFCC(梅尔频率倒谱系数,缩写:MFCC),利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量某些部分,而这只有在运用矢量量化到傅立叶频域中才可能;
所述TEE算法由Teager能量算子和香农熵构成,自适应参数选择中常用的四阶累积统计量——峰度在遇到随机脉冲会急剧增加引起误差,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1) (9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小。
所述HZCRR算法是指过零率大于片段中1.5倍平均过零率的帧数比,HZCRR表达式的计算方法为:
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,是片段中的平均过零率,sgn[]是符号函数。
步骤M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
具体地,所述步骤M4包括:
步骤M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是对应输入特征X;根节点的输入(x,X)基于分裂标准函数分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点,通过叶节点来进行分类的;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习,得到训练模型m。
条件概率用来求解在平均整棵树Ti∈T的推断概率pc(c|x)。
训练阶段得到训练模型的过程,就是模型不断学习输入特征的过程;
树中的每个非叶节点记录了使用哪个特征来进行类别的判断,每个叶节点则代表了最后判断的类别。根节点到每个叶节点均形成一条分类的路径规则。要分类就需要得到叶节点,但如果特征多,通过限制最大叶子节点数,可以防止过拟合。
步骤M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号。
推断阶段就是预测阶段,利用训练模型预测测试数据,得到测试数据的入侵或非入侵特征标签。
本发明提供的一种基于GPU的光纤振动信号特征提取及分类的系统,包括:
模块M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
具体地,所述模块M1提取特征数据集合S包括:
模块M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;因为在数据提取过程中,通过观察信号时域波形,干扰点会出现在随时间不变的位置,且其值大于过阈值率,易被误判。
模块M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
待提取点的位置可能随着时间动态变化,如火车振动非入侵点。在时域-空间动态图中,随着时间进行,以目标点出现的首次位置为起始位置。
模块M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为1024大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为0.3秒(时域中单个位置点的连续1024个时间变化值)内信号超过阈值Am的次数Fm,表达式为:
其中,m表示位置点索引,n表示离散时间索引值,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。
模块M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
具体地,所述模块M2包括:
模块M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Sdm=1/Scm (5)
Sen,m=Sn,m+B (6)
Sfn,m=Sen,m×Sdm (7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
模块M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2 (8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引。
模块M3:提取出数据S1归一化特征X;
具体地,所述模块M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;在求取特征的过程中,利用Numba编译器@autojit装饰器的GPU化方法对算法函数进行封装加速运算,其作用是对算法函数进行加速运算;任意一种方式可以提取出一个特征,多种方式得到多种特征作为后续输入;
所述LFBEs算法过程如图2所示,相对MFCC(梅尔频率倒谱系数,缩写:MFCC),利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量某些部分,而这只有在运用矢量量化到傅立叶频域中才可能;
所述TEE算法由Teager能量算子和香农熵构成,自适应参数选择中常用的四阶累积统计量——峰度在遇到随机脉冲会急剧增加引起误差,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1) (9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小。
所述HZCRR算法是指过零率大于片段中1.5倍平均过零率的帧数比,HZCRR表达式的计算方法为:
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,是片段中的平均过零率,sgn[]是符号函数。
模块M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
具体地,所述模块M4包括:
模块M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是对应输入特征X;根节点的输入(x,X)基于分裂标准函数分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点,通过叶节点来进行分类的;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习,得到训练模型m。
条件概率用来求解在平均整棵树Ti∈T的推断概率pc(c|x)。
训练阶段得到训练模型的过程,就是模型不断学习输入特征的过程;
树中的每个非叶节点记录了使用哪个特征来进行类别的判断,每个叶节点则代表了最后判断的类别。根节点到每个叶节点均形成一条分类的路径规则。要分类就需要得到叶节点,但如果特征多,通过限制最大叶子节点数,可以防止过拟合。
模块M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号。
推断阶段就是预测阶段,利用训练模型预测测试数据,得到测试数据的入侵或非入侵特征标签。
为了更好的理解本发明,下面结合CUDA平台库和Spyder软件等现有技术,对本发明作详细说明。
本发明方法对原始数据进行入侵与否数据提取、预处理、特征提取、RF分类器训练模型、数据分类等步骤的加速处理,这种结合语音、音频等特征利用RF训练分类处理步骤使得可以判断入侵与否的待测信号,该方法是通过在CUDA平台利用装饰器封装函数加速算法处理,在RF中利用GridSearchCV函数得到最佳参数估计值(子模型数和学习率的最优解),进而训练数据得到模型分类待测数据。1.最佳参数估计值指子模型数和学习率的最优解;原始提取的经过标记的一维数据通过步长1024大小窗口截取为待提取特征数据,再依次求取待提取数据的峭度因子、裕度因子、LFBEs、TEE和HZCRR等5个特征进行降维,在求取特征的过程中,均利用Numba编译器中@autojit装饰器的GPU化方法对算法函数进行封装加速运算。
Numba为一个库,它设计来用于动态地编译小型函数。为Python的函数明确类型标识,会即时执行,Numba实现了巧妙的类型猜测算法,并通过编译包含类型信息的函数版本来提高执行时间。Numba诣在改善执行数值计算的代码性能,优化大量使用数组的应用程序。Python非常灵巧,因为Numba不断变化地执行源码。因面向程序编译调度而设计Numba,与常见的NumPy库相似,在针对程序编译设计里利用GPU并行加速。Numba结合NumPy,并用它产生执行有效的代码,从而在GPU或多核CPU上运行。编译如附加一个函数Decorator来引导Numba运行GPU。
再利用RF对降维后的数据集训练得到模型,其中RF用到Python库sklearn中RandomForestClassifier随机森林分类器函数进行训练,并利用GridSearchCV函数对所设置的所有参数做所有的可能排列组合测试,然后取得一个最佳参数,估计RandomForestClassifier函数中最佳森林中树的数量n_estimators参数值。采用基于基尼不纯度和信息增益熵的基尼标准衡量树分割质量。最佳分割的特征数量,推荐,其中为特征数量。
随机森林基于集成学习Bagging思想,是通过自助采用的方法生成众多并行式分类器,通过少数服从多数的原则来确定最终的结果。决策树就是一棵树,多棵树就称作森林,那么随机森林主要是解决决策树泛化能力弱的缺点,一棵决策树是一个决策的可能性,都有一个决策权,所有树的结果综合在一起的分类能力肯定强于单棵树,所以随机森林基于这一思想进行分类。随机森林的随机主要体现在两个方面,一个是随机选取样本,一个是随机选取特征,随机森林是构建多棵决策树,每一棵树是从整个训练样本集中随机选取固定数量的样本集,然后再选取固定数量的特征集来构建一棵决策树,就相当于样本数和特征数都是总样本数和总特征集的一个子集构建决策树,且它是一个有放回的抽取过程,分类的结果根据少数服从多数原则。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (4)
1.一种基于GPU的光纤振动信号特征提取及分类的方法,其特征在于,包括:
步骤M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
步骤M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
步骤M3:提取出数据S1归一化特征X;
步骤M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号;
所述步骤M1提取特征数据集合S包括:
步骤M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;
步骤M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
步骤M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为预设值大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为预设时间内信号超过阈值Am的次数Fm,表达式为:
其中,λ表示时域中单个位置点的连续时间变化值;m表示位置点索引、n表示离散时间索引,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号;
所述步骤M2包括:
步骤M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Sdm=1/Scm(5)
Sen,m=Sn,m+B(6)
Sfn,m=Sen,m×Sdm(7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
步骤M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2(8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引;
所述步骤M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;并且利用Numba编译器对算法函数进行封装加速运算;
所述LFBEs算法利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量部分;
所述TEE算法由Teager能量算子和香农熵构成,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1)(9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小;
所述HZCRR算法是指过零率大于片段中预设值倍平均过零率的帧数比,HZCRR表达式的计算方法为:
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,是片段中的平均过零率,sgn[]是符号函数。
2.根据权利要求1所述的一种基于GPU的光纤振动信号特征提取及分类的方法,其特征在于,所述步骤M4包括:
步骤M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是对应输入特征X;根节点的输入(x,X)基于分裂标准函数/>分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习;
步骤M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
3.一种基于GPU的光纤振动信号特征提取及分类的系统,其特征在于,包括:
模块M1:接收光纤振动信号数据,并进行入侵和非入侵数据提取,得到提取特征数据集合S;
模块M2:对提取特征数据集合S进行预处理,再利用高通滤波器去除低频干扰得到数据S1;
模块M3:提取出数据S1归一化特征X;
模块M4:对特征X进行训练得到训练模型m,再对测试数据进行分类;
所述训练模型m是输入数据训练得到的对应参数;把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签;
所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号;
所述模块M1提取特征数据集合S包括:
模块M1.1:利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置;
模块M1.2:再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定;
模块M1.3:目标起始、终止位置确定后,利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据,再通过步长为预设值大小矩形窗口截取为待提取特征的信号集合S;
所述短时过阈值率为预设时间内信号超过阈值Am的次数Fm,表达式为:
其中,λ表示时域中单个位置点的连续时间变化值;m表示位置点索引、n表示离散时间索引,diff表示微分运算,sgn表示符号函数,y(n,m)表示第m个位置点、第n个离散时间索引的时域信号;
所述模块M2包括:
模块M2.1:对提取特征数据集合S进行预处理,预处理包括对振动信号数据进行拉平得到Sf,表达式为:
Sam=mean(Sn,m) (2)
Sbm=Sam+B (3)
Sdm=1/Scm (5)
Sen,m=Sn,m+B (6)
Sfn,m=Sen,m×Sdm (7)
其中,首先对信号集合S沿时间维度求平均得到每个位置点均值Sam,再对Sam加上偏置B得到Sbm,再对Sbm前M后N位置点求平均得到Scm,再对Scm每个值求导数得到Sdm,再对信号集合S每个值加上偏置B得到Sen,m,最后对Sen,m每列与Sdm对应相乘得到拉平信号Sf;
模块M2.2:对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1,其过程表达如下:
S1n=b0Sfn+b1Sfn-1+b2Sfn-2-a1S1n-1-a2S1n-2 (8)
其中:其中b0,b1,b2,a1,a2均为滤波系数,由采样率和截止频率决定,下标n表示时间索引;
所述模块M3包括:利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X;并且利用Numba编译器对算法函数进行封装加速运算;
所述LFBEs算法利用非线性频谱灵敏度提高了噪声鲁棒性识别,LFBEs中的加权距离测量使矢量量化器将重点转移到向量部分;
所述TEE算法由Teager能量算子和香农熵构成,Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点,熵能反映信号的稀疏性;
一维离散信号s(n)的Teager能量算子计算方法为:
Ψ[s(n)]=[s(n)]2-s(n+1)s(n-1) (9)
其中,n表示时间索引值;
TEE表达式的计算方法为:
其中,pn、Q(n)表示求取TEE的中间变量;N表示时间索引最大值;abs()表示求绝对值;
原始信号随着脉冲冲击的变多,信号的稀疏性变高,TEE值变小;
所述HZCRR算法是指过零率大于片段中预设值倍平均过零率的帧数比,HZCRR表达式的计算方法为:
其中,N是总帧数,n是帧索引,ZCR(n)是第n帧过零率,是片段中的平均过零率,sgn[]是符号函数。
4.根据权利要求3所述的一种基于GPU的光纤振动信号特征提取及分类的系统,其特征在于,所述模块M4包括:
模块M4.1:利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m;
随机森林T中每个决策树包括:一个根节点、分裂节点和叶节点;每棵树的输入数据的输入位置是对应输入特征X;根节点的输入(x,X)基于分裂标准函数/>分类到一个子节点,其中fn(·)表示在节点n提取一个学习特征,即输入特征X得到的对应参数;节点n的分裂标准函数表示如下:
其中,ωi表示决策树权重;nf表示计算每个特征的数据点数;Xx表示输入数据的输入位置;处对应的输入特征X;
树的深度越深,其包含越多分支,且获取越多数据信息;当树的当前深度大于最大深度,或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高,或者剩余太少特征X,将产生叶节点;后代节点的分类终止于输入数据到达一个叶节点;当叶节点形成时,在推断过程中存储条件概率;每一类的叶节点条件概率p使用叶节点h的数据点数量计算,条件概率公式如下:
其中,nc表示每一类数据点个数,c表示一类的索引;n(h,c)表示在叶节点h每类数据点数量,叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数;条件概率在训练阶段学习,且在推断阶段使用;叶节点也在训练过程中学习;
模块M4.2:根据得到的训练模型m,对测试数据进行分类;
训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点;平均整棵树Ti∈T的条件概率分布来计算一类c的数据点x推断概率pc(c|x),公式如下:
其中,nt是随机森林树T的个数;
推断概率pc(c|x)表示作为入侵与非入侵的概率,概率越高,可能性越大。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911221988.3A CN111160106B (zh) | 2019-12-03 | 2019-12-03 | 一种基于gpu的光纤振动信号特征提取及分类的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911221988.3A CN111160106B (zh) | 2019-12-03 | 2019-12-03 | 一种基于gpu的光纤振动信号特征提取及分类的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111160106A CN111160106A (zh) | 2020-05-15 |
CN111160106B true CN111160106B (zh) | 2023-12-12 |
Family
ID=70556343
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911221988.3A Active CN111160106B (zh) | 2019-12-03 | 2019-12-03 | 一种基于gpu的光纤振动信号特征提取及分类的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111160106B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113743154A (zh) * | 2020-05-28 | 2021-12-03 | 宁波陆禾科技有限公司 | 一种基于图像特征识别的光纤振动信号处理与识别方法 |
CN112433148B (zh) * | 2020-11-13 | 2021-12-31 | 海南电网有限责任公司海南输变电检修分公司 | 一种从振动信号中提取断路器机构动作时间的方法 |
CN112836591B (zh) * | 2021-01-14 | 2024-02-27 | 清华大学深圳国际研究生院 | 一种油气长输管道光纤预警信号特征提取方法 |
CN115342900B (zh) * | 2022-08-15 | 2024-04-30 | 东北石油大学 | 一种基于随机森林的激光自混合干涉微振动测量方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5313266A (en) * | 1992-08-17 | 1994-05-17 | Keolian Robert M | Demodulators for optical fiber interferometers with [3×3] outputs |
WO2011006210A1 (en) * | 2009-07-17 | 2011-01-20 | Future Fibre Technologies Pty Ltd | Intrusion detection |
CN106503642A (zh) * | 2016-10-18 | 2017-03-15 | 长园长通新材料股份有限公司 | 一种应用于光纤传感系统的振动模型建立方法 |
CN106600870A (zh) * | 2016-12-31 | 2017-04-26 | 上海华魏光纤传感技术有限公司 | 一种分布式光纤围栏振动入侵识别系统 |
CN107180521A (zh) * | 2017-04-19 | 2017-09-19 | 天津大学 | 基于综合特征的光纤周界安防入侵事件识别方法及装置 |
CN107395590A (zh) * | 2017-07-19 | 2017-11-24 | 福州大学 | 一种基于pca和随机森林分类的入侵检测方法 |
CN107576380A (zh) * | 2017-09-20 | 2018-01-12 | 北京邮电大学 | 一种面向φ‑otdr技术的三维振动信号分类方法 |
CN108496148A (zh) * | 2015-11-12 | 2018-09-04 | 剑桥触控科技有限公司 | 处理来自触摸屏面板的信号 |
CN108694416A (zh) * | 2018-05-23 | 2018-10-23 | 重庆科技学院 | 基于多特征融合算法的振动光纤入侵事件检测方法 |
CN108932480A (zh) * | 2018-06-08 | 2018-12-04 | 电子科技大学 | 基于1d-cnn的分布式光纤传感信号特征学习与分类方法 |
CN109033632A (zh) * | 2018-07-26 | 2018-12-18 | 北京航空航天大学 | 一种基于深度量子神经网络的趋势预测方法 |
CN109489800A (zh) * | 2018-12-14 | 2019-03-19 | 广东世港信息科技有限公司 | 一种分布式光缆振动安全预警系统中的扰动事件识别方法 |
CN110458071A (zh) * | 2019-08-01 | 2019-11-15 | 北京邮电大学 | 一种基于dwt-dfpa-gbdt的光纤振动信号特征提取与分类方法 |
-
2019
- 2019-12-03 CN CN201911221988.3A patent/CN111160106B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5313266A (en) * | 1992-08-17 | 1994-05-17 | Keolian Robert M | Demodulators for optical fiber interferometers with [3×3] outputs |
WO2011006210A1 (en) * | 2009-07-17 | 2011-01-20 | Future Fibre Technologies Pty Ltd | Intrusion detection |
CN108496148A (zh) * | 2015-11-12 | 2018-09-04 | 剑桥触控科技有限公司 | 处理来自触摸屏面板的信号 |
CN106503642A (zh) * | 2016-10-18 | 2017-03-15 | 长园长通新材料股份有限公司 | 一种应用于光纤传感系统的振动模型建立方法 |
CN106600870A (zh) * | 2016-12-31 | 2017-04-26 | 上海华魏光纤传感技术有限公司 | 一种分布式光纤围栏振动入侵识别系统 |
CN107180521A (zh) * | 2017-04-19 | 2017-09-19 | 天津大学 | 基于综合特征的光纤周界安防入侵事件识别方法及装置 |
CN107395590A (zh) * | 2017-07-19 | 2017-11-24 | 福州大学 | 一种基于pca和随机森林分类的入侵检测方法 |
CN107576380A (zh) * | 2017-09-20 | 2018-01-12 | 北京邮电大学 | 一种面向φ‑otdr技术的三维振动信号分类方法 |
CN108694416A (zh) * | 2018-05-23 | 2018-10-23 | 重庆科技学院 | 基于多特征融合算法的振动光纤入侵事件检测方法 |
CN108932480A (zh) * | 2018-06-08 | 2018-12-04 | 电子科技大学 | 基于1d-cnn的分布式光纤传感信号特征学习与分类方法 |
CN109033632A (zh) * | 2018-07-26 | 2018-12-18 | 北京航空航天大学 | 一种基于深度量子神经网络的趋势预测方法 |
CN109489800A (zh) * | 2018-12-14 | 2019-03-19 | 广东世港信息科技有限公司 | 一种分布式光缆振动安全预警系统中的扰动事件识别方法 |
CN110458071A (zh) * | 2019-08-01 | 2019-11-15 | 北京邮电大学 | 一种基于dwt-dfpa-gbdt的光纤振动信号特征提取与分类方法 |
Non-Patent Citations (7)
Title |
---|
Vibration amplitude analysis with a single frame using a structured light pattern of a four-core optical fibre;S. Tunç Yılmaz, Umut D. Özugˇurel, Karahan Bulut, M. Naci Inci;Optics Communications;第249卷(第4-6期);515-522 * |
刘勇.基于随机森林分类器的∅-OTDR传感系统模式识别研究.中国优秀硕士学位论文全文数据库 信息科技辑.2018,(第6期),45-55. * |
姜大闯,潘鸣,俞旭辉等.基于GPU的振动光纤入侵探测数据预处理算法.太赫兹科学与电子信息学报.2019,第17卷(第17期),899-903. * |
李学伟,吴今培.实用元胞自动机导论.北京交通大学出版社,2013,120. * |
栾悉道,谢毓湘等.多媒体情报处理技术.国防工业出版社,2016,90. * |
江兆凤,於景瞵,臧元章,俞旭辉.分布式振动光纤信号识别算法研究.电子测量技术.2018,第41卷(第41期),65-69. * |
褚东亮.旋转机械非平稳信号分析即故障诊断技术.首都经济贸易大学出版社,2019,110. * |
Also Published As
Publication number | Publication date |
---|---|
CN111160106A (zh) | 2020-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111160106B (zh) | 一种基于gpu的光纤振动信号特征提取及分类的方法及系统 | |
Udmale et al. | Application of spectral kurtosis and improved extreme learning machine for bearing fault classification | |
US11467570B2 (en) | Anomalous sound detection apparatus, anomaly model learning apparatus, anomaly detection apparatus, anomalous sound detection method, anomalous sound generation apparatus, anomalous data generation apparatus, anomalous sound generation method and program | |
US11480497B2 (en) | Anomalous sound detection training apparatus, acoustic feature extraction apparatus, anomalous sound sampling apparatus, and methods and programs for the same | |
Hsieh et al. | A streamlined encoder/decoder architecture for melody extraction | |
Sigtia et al. | Improved music feature learning with deep neural networks | |
De Oliveira et al. | Bird acoustic activity detection based on morphological filtering of the spectrogram | |
Cakir et al. | Multi-label vs. combined single-label sound event detection with deep neural networks | |
Brown et al. | Automatic rain and cicada chorus filtering of bird acoustic data | |
Xie et al. | Bioacoustic signal classification in continuous recordings: Syllable-segmentation vs sliding-window | |
Mohammad et al. | On comparing SSA-based change point discovery algorithms | |
Wang et al. | Convolutional neural network-based moving ground target classification using raw seismic waveforms as input | |
Zhong et al. | Recognition and prediction of ground vibration signal based on machine learning algorithm | |
Imran et al. | An analysis of audio classification techniques using deep learning architectures | |
CN113780094A (zh) | 基于混合高斯模型和隐马尔可夫模型的周界入侵识别方法 | |
Xie et al. | Machine learning control charts for monitoring serially correlated data | |
Castro-Cabrera et al. | Adaptive classification using incremental learning for seismic-volcanic signals with concept drift | |
Smith et al. | An end-to-end vechicle classification pipeline using vibrometry data | |
Agarwal et al. | A method for voice activity detection using K-means clustering | |
Lee et al. | Impact of Deep Learning Optimizers and Hyperparameter Tuning on the Performance of Bearing Fault Diagnosis | |
CN114974302A (zh) | 环境声音事件检测方法、装置和介质 | |
Look et al. | Building Robust Classifiers with Generative Adversarial Networks for Detecting Cavitation in Hydraulic Turbines. | |
Malfante et al. | Machine learning for automatic classification of volcano-seismic signatures | |
Vesperini et al. | Hierarchic conv nets framework for rare sound event detection | |
CN117529668B (zh) | 用于提供训练数据以使得神经网络能够分析nmr测量中的信号的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |