CN111160106B

CN111160106B - 一种基于gpu的光纤振动信号特征提取及分类的方法及系统

Info

Publication number: CN111160106B
Application number: CN201911221988.3A
Authority: CN
Inventors: 杨啸宇; 桂小刚; 王静; 臧元章; 江兆凤
Original assignee: Shanghai Institute of Microwave Technology CETC 50 Research Institute
Current assignee: Shanghai Institute of Microwave Technology CETC 50 Research Institute
Priority date: 2019-12-03
Filing date: 2019-12-03
Publication date: 2023-12-12
Anticipated expiration: 2039-12-03
Also published as: CN111160106A

Abstract

本发明提供了一种基于GPU的光纤振动信号特征提取及分类的方法，包括：步骤M1：接收光纤振动信号数据，并进行入侵和非入侵数据提取，得到提取特征数据集合S；步骤M2：对提取特征数据集合S进行预处理，再利用高通滤波器去除低频干扰得到数据S1；步骤M3：提取出数据S1归一化特征X；步骤M4：对特征X进行训练得到训练模型m,再对测试数据进行分类；所述训练模型m是输入数据训练得到的对应参数；把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签；所述测试数据为待利用训练模型测得到入侵或非入侵特征标签的光纤振动信号。本发明结合语音、音频等特征选取算法提取光纤振动信号特征，解决了传统光纤振动信号特征提取效果不佳的弊病。

Description

一种基于GPU的光纤振动信号特征提取及分类的方法及系统

技术领域

本发明涉及光纤振动信号处理技术领域，具体地，涉及一种基于GPU的光纤振动信号特征提取及分类的方法及系统。

背景技术

目前在世界范围研发的光纤振动信号特征主要集中在时域，CUDA是一种支持GPU多线程并行化加速的计算工具，因其能通过GPC(图形处理器簇，缩写：GPC)、SM(流多处理器，缩写：SM)、Warp(GPU执行程序时的调度单位，缩写：Warp)、SP(流式处理器，缩写：SP)对超大数据量实现SIMD(单指令多数据流，缩写：SIMD)处理方式，已经成为数据处理必不可少的高性能计算统一计算设备架构，它利用NVIDIA CUDA C编译器生成每个内核特定于体系结构的cubin文件来前向兼容PTX(并行线程执行，缩写：PTX)版本。另外，国内外相关的光纤振动信号特征提取研究包括，天津大学利用小波变换技术提取信号特征向量，并结合ICA(独立成分分析，缩写：ICA)求出源信号估计值进而得到的相关系数确定入侵类型。印度理工学院从信号中提取出共振频率、归一化振幅和共振频率下的归一化面积三个特征输入三层前馈神经网络结构进行训练以识别损伤位置。西班牙阿尔卡拉大学提取基于声迹的谱含量特征结合模式识别系统分类机械活动。

现有的与基于光纤振动信号特征相关专利技术主要集中在各个专用领域的子系统实现，专利申请CN103968933A公开了基于模糊域特征的光纤振动信号识别方法，利用模糊函数得到特征，再利用RF分类器训练训练集，解决现有识别方法在采样率较低且入侵事件较为类似情况下识别率较低的问题。专利申请CN110210326A公开了一种基于光纤振动信号的在线列车识别及速度估计方法，通过经验模态分解和统计分析获得用于数据分类的统计学特征，引入动态惩罚系数的支持向量机为每个采样点离线训练相应的子分类器对特征向量进行分类在线计算列车位置。专利申请CN108509850A公开了一种基于分布式光纤系统的入侵信号识别算法，通过计算信号能量值判断振动异常事件，再进行固有时间尺度分解提取特征值输入Softmax分类器训练智能识别入侵信号。专利申请CN110222670A公开了一种光缆振动中断预警系统的分类器训练方法，利用信号样本的幅度、持续时间、信号一阶差分值的最大绝对值作为特征向量，再使用分类器对测试组样本进行分类。

基于Φ-OTDR(相敏光时域反射，缩写：Φ-OTDR)的外围安全监控系统很难有效消除干扰且识别入侵缺乏准确性。时域分析中短时能量、短时过零率等特征在任何入侵前后都显示出相同的变化趋势，以这种方式很难准确地识别各种入侵类型。信号能很好地判断是否存在振动，判断振动类型的效果也很差。在频域分析中由于全局变换的傅立叶变换不能有效地提取非线性和非平稳光纤振动信号的瞬时频率和瞬时状态，因此小波变换也用于频域分析中以处理不同尺度的光纤振动信号，但小波变换的本质是加权平均综合评价函数且二层架构识别机制是含窗傅里叶变换，其仍受不确定性原理限制，在较高频率分辨率下无法保证信号的局部细节，且小波能量分布特征只反映了不同频带中的能量分布，而不反映能量随时间的变化。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种基于GPU的光纤振动信号特征提取及分类的方法及系统。

根据本发明提供的一种基于GPU的光纤振动信号特征提取及分类的方法，包括：

步骤M1：接收光纤振动信号数据，并进行入侵和非入侵数据提取，得到提取特征数据集合S；

步骤M2：对提取特征数据集合S进行预处理，再利用高通滤波器去除低频干扰得到数据S1；

步骤M3：提取出数据S1归一化特征X；

步骤M4：对特征X进行训练得到训练模型m,再对测试数据进行分类；

所述训练模型m是输入数据训练得到的对应参数；把测试数据输入到训练模型中能得到测试数据的入侵或非入侵特征标签；

所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号。

优选地，所述步骤M1提取特征数据集合S包括：

步骤M1.1：利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置；

步骤M1.2：再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定；

步骤M1.3：目标起始、终止位置确定后，利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据，再通过步长为预设值大小矩形窗口截取为待提取特征的信号集合S；

所述短时过阈值率为预设时间内信号超过阈值A_m的次数F_m，表达式为：

其中，λ表示时域中单个位置点的连续时间变化值；m表示位置点索引、n表示离散时间索引，diff表示微分运算，sgn表示符号函数，y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。

优选地，所述步骤M2包括：

步骤M2.1：对提取特征数据集合S进行预处理，预处理包括对振动信号数据进行拉平得到Sf，表达式为：

Sa_m＝mean(S_n,m) (2)

Sb_m＝Sa_m+B (3)

Sd_m＝1/Sc_m (5)

Se_n,m＝S_n,m+B (6)

Sf_n,m＝Se_n,m×Sd_m (7)

其中，首先对信号集合S沿时间维度求平均得到每个位置点均值Sa_m，再对Sa_m加上偏置B得到Sb_m，再对Sb_m前M后N位置点求平均得到Sc_m，再对Sc_m每个值求导数得到Sd_m，再对信号集合S每个值加上偏置B得到Se_n,m，最后对Se_n,m每列与Sd_m对应相乘得到拉平信号Sf；

步骤M2.2：对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1，其过程表达如下：

S1_n＝b₀Sf_n+b₁Sf_n-1+b₂Sf_n-2-a₁S1_n-1-a₂S1_n-2 (8)

其中：其中b₀,b₁,b₂,a₁,a₂均为滤波系数，由采样率和截止频率决定，下标n表示时间索引。

优选地，所述步骤M3包括：利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X；并且利用Numba编译器对算法函数进行封装加速运算；

所述LFBEs算法利用非线性频谱灵敏度提高了噪声鲁棒性识别，LFBEs中的加权距离测量使矢量量化器将重点转移到向量部分；

所述TEE算法由Teager能量算子和香农熵构成，Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点，熵能反映信号的稀疏性；

一维离散信号s(n)的Teager能量算子计算方法为：

Ψ[s(n)]＝[s(n)]²-s(n+1)s(n-1) (9)

其中，n表示时间索引值；

TEE表达式的计算方法为：

其中，p_n、Q(n)表示求取TEE的中间变量；N表示时间索引最大值；abs()表示求绝对值；

原始信号随着脉冲冲击的变多，信号的稀疏性变高，TEE值变小；

所述HZCRR算法是指过零率大于片段中预设值倍平均过零率的帧数比，HZCRR表达式的计算方法为：

其中，N是总帧数，n是帧索引，ZCR(n)是第n帧过零率，是片段中的平均过零率，sgn[]是符号函数。

优选地，所述步骤M4包括：

步骤M4.1：利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m；

随机森林T中每个决策树包括：一个根节点、分裂节点和叶节点；每棵树的输入数据的输入位置是对应输入特征X；根节点的输入(x,X)基于分裂标准函数分类到一个子节点，其中f_n(·)表示在节点n提取一个学习特征，即输入特征X得到的对应参数；节点n的分裂标准函数表示如下：

其中，ω_i表示决策树权重；n_f表示计算每个特征的数据点数；X_x表示输入数据的输入位置；处对应的输入特征X；

树的深度越深，其包含越多分支，且获取越多数据信息；当树的当前深度大于最大深度，或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高，或者剩余太少特征X，将产生叶节点；后代节点的分类终止于输入数据到达一个叶节点；当叶节点形成时，在推断过程中存储条件概率；每一类的叶节点条件概率p使用叶节点h的数据点数量计算，条件概率公式如下：

其中，n_c表示每一类数据点个数，c表示一类的索引；n(h,c)表示在叶节点h每类数据点数量，叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数；条件概率在训练阶段学习，且在推断阶段使用；叶节点也在训练过程中学习；

步骤M4.2：根据得到的训练模型m，对测试数据进行分类；

训练过的随机森林T,即训练模型m,利用每棵树将特征X上的每个数据点划分为子节点直到它到达叶节点；平均整棵树T_i∈T的条件概率分布来计算一类c的数据点x推断概率p_c(c|x),公式如下：

其中，n_t是随机森林树T的个数；

推断概率p_c(c|x)表示作为入侵与非入侵的概率，概率越高，可能性越大。

本发明提供的一种基于GPU的光纤振动信号特征提取及分类的系统，包括：

模块M1：接收光纤振动信号数据，并进行入侵和非入侵数据提取，得到提取特征数据集合S；

模块M2：对提取特征数据集合S进行预处理，再利用高通滤波器去除低频干扰得到数据S1；

模块M3：提取出数据S1归一化特征X；

模块M4：对特征X进行训练得到训练模型m,再对测试数据进行分类；

优选地，所述模块M1提取特征数据集合S包括：

模块M1.1：利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置；

模块M1.2：再利用时域幅度图对光纤振动信号数据进行目标起始、终止位置确定；

模块M1.3：目标起始、终止位置确定后，利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据，再通过步长为预设值大小矩形窗口截取为待提取特征的信号集合S；

优选地，所述模块M2包括：

模块M2.1：对提取特征数据集合S进行预处理，预处理包括对振动信号数据进行拉平得到Sf，表达式为：

Sa_m＝mean(S_n,m) (2)

Sb_m＝Sa_m+B (3)

Sd_m＝1/Sc_m (5)

Se_n,m＝S_n,m+B (6)

Sf_n,m＝Se_n,m×Sd_m (7)

模块M2.2：对拉平信号Sf利用高通滤波器去除低频干扰得到数据S1，其过程表达如下：

S1_n＝b₀Sf_n+b₁Sf_n-1+b₂Sf_n-2-a₁S1_n-1-a₂S1_n-2 (8)

优选地，所述模块M3包括：利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X；并且利用Numba编译器对算法函数进行封装加速运算；

一维离散信号s(n)的Teager能量算子计算方法为：

Ψ[s(n)]＝[s(n)]²-s(n+1)s(n-1) (9)

其中，n表示时间索引值；

TEE表达式的计算方法为：

优选地，所述模块M4包括：

模块M4.1：利用随机森林T结合入侵与非入侵特征标签对特征X进行训练得到训练模型m；

模块M4.2：根据得到的训练模型m，对测试数据进行分类；

其中，n_t是随机森林树T的个数；

与现有技术相比，本发明具有如下的有益效果：

1、本发明结合语音、音频等特征选取算法提取光纤振动信号特征，解决了传统光纤振动信号特征提取效果不佳的弊病；

2、本发明实现了提取特征算法GPU加速的创新，结合CUDA平台高效执行算法；

3、本发明利用RF分类器训练信号特征实现测试信号高准确率分类。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明方法流程图；

图2为LFBEs特征提取框图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

本发明提供的一种基于GPU的光纤振动信号特征提取及分类的方法及系统，结合峭度因子、裕度因子、语音特征LFBEs(对数滤波器组能量，缩写：LFBEs)、语音特征TEE(Teager能量信息熵，缩写：TEE)、音频特征HZCRR(高过零率帧比率，缩写：HZCRR)、等算法提取光纤振动信号特征；结合NVIDIA CUDA计算平台利用Numba编译器运用GPU处理大数据量；基于RF(随机森林，缩写：RF)训练特征判断入侵信号，具有运行速度快、分类准确率高的优点。

本发明提供的一种基于GPU的光纤振动信号特征提取及分类的方法，包括：

具体地，所述步骤M1提取特征数据集合S包括：

步骤M1.1：利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置；因为在数据提取过程中，通过观察信号时域波形，干扰点会出现在随时间不变的位置，且其值大于过阈值率，易被误判。

待提取点的位置可能随着时间动态变化，如火车振动非入侵点。在时域-空间动态图中，随着时间进行，以目标点出现的首次位置为起始位置。

步骤M1.3：目标起始、终止位置确定后，利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据，再通过步长为1024大小矩形窗口截取为待提取特征的信号集合S；

所述短时过阈值率为0.3秒(时域中单个位置点的连续1024个时间变化值)内信号超过阈值A_m的次数F_m，表达式为：

其中，m表示位置点索引，n表示离散时间索引值，diff表示微分运算，sgn表示符号函数，y(n,m)表示第m个位置点、第n个离散时间索引的时域信号。

具体地，所述步骤M2包括：

Sa_m＝mean(S_n,m) (2)

Sb_m＝Sa_m+B (3)

Sd_m＝1/Sc_m (5)

Se_n,m＝S_n,m+B (6)

Sf_n,m＝Se_n,m×Sd_m (7)

S1_n＝b₀Sf_n+b₁Sf_n-1+b₂Sf_n-2-a₁S1_n-1-a₂S1_n-2 (8)

步骤M3：提取出数据S1归一化特征X；

具体地，所述步骤M3包括：利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X；在求取特征的过程中，利用Numba编译器@autojit装饰器的GPU化方法对算法函数进行封装加速运算，其作用是对算法函数进行加速运算；

所述LFBEs算法过程如图2所示，相对MFCC(梅尔频率倒谱系数，缩写：MFCC)，利用非线性频谱灵敏度提高了噪声鲁棒性识别，LFBEs中的加权距离测量使矢量量化器将重点转移到向量某些部分，而这只有在运用矢量量化到傅立叶频域中才可能；

所述TEE算法由Teager能量算子和香农熵构成，自适应参数选择中常用的四阶累积统计量——峰度在遇到随机脉冲会急剧增加引起误差，Teager能量算子在增强振动信号脉冲特性中具有良好的瞬时能量跟踪特点，熵能反映信号的稀疏性；

一维离散信号s(n)的Teager能量算子计算方法为：

Ψ[s(n)]＝[s(n)]²-s(n+1)s(n-1) (9)

其中，n表示时间索引值；

TEE表达式的计算方法为：

原始信号随着脉冲冲击的变多，信号的稀疏性变高，TEE值变小。

所述HZCRR算法是指过零率大于片段中1.5倍平均过零率的帧数比，HZCRR表达式的计算方法为：

具体地，所述步骤M4包括：

树的深度越深，其包含越多分支，且获取越多数据信息；当树的当前深度大于最大深度，或者训练模型预测得到入侵或非入侵特征标签在一类中节点概率可信度高，或者剩余太少特征X，将产生叶节点，通过叶节点来进行分类的；后代节点的分类终止于输入数据到达一个叶节点；当叶节点形成时，在推断过程中存储条件概率；每一类的叶节点条件概率p使用叶节点h的数据点数量计算，条件概率公式如下：

其中，n_c表示每一类数据点个数，c表示一类的索引；n(h,c)表示在叶节点h每类数据点数量，叶节点的形成基于树的最大深度、概率分布p(c|h)和节点训练数据x个数；条件概率在训练阶段学习，且在推断阶段使用；叶节点也在训练过程中学习，得到训练模型m。

条件概率用来求解在平均整棵树T_i∈T的推断概率p_c(c|x)。

训练阶段得到训练模型的过程，就是模型不断学习输入特征的过程；

树中的每个非叶节点记录了使用哪个特征来进行类别的判断，每个叶节点则代表了最后判断的类别。根节点到每个叶节点均形成一条分类的路径规则。要分类就需要得到叶节点，但如果特征多，通过限制最大叶子节点数，可以防止过拟合。

步骤M4.2：根据得到的训练模型m，对测试数据进行分类；

其中，n_t是随机森林树T的个数；

推断阶段就是预测阶段，利用训练模型预测测试数据，得到测试数据的入侵或非入侵特征标签。

具体地，所述模块M1提取特征数据集合S包括：

模块M1.1：利用短时过阈值率寻找光纤振动信号数据的非干扰点起始位置；因为在数据提取过程中，通过观察信号时域波形，干扰点会出现在随时间不变的位置，且其值大于过阈值率，易被误判。

模块M1.3：目标起始、终止位置确定后，利用离散差分绝对均值及振幅平均值为阈值提取出原始数据在起始、终止位置间经过入侵和非入侵的非干扰点的一维时域数据，再通过步长为1024大小矩形窗口截取为待提取特征的信号集合S；

具体地，所述模块M2包括：

Sa_m＝mean(S_n,m) (2)

Sb_m＝Sa_m+B (3)

Sd_m＝1/Sc_m (5)

Se_n,m＝S_n,m+B (6)

Sf_n,m＝Se_n,m×Sd_m (7)

S1_n＝b₀Sf_n+b₁Sf_n-1+b₂Sf_n-2-a₁S1_n-1-a₂S1_n-2 (8)

模块M3：提取出数据S1归一化特征X；

具体地，所述模块M3包括：利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X；在求取特征的过程中，利用Numba编译器@autojit装饰器的GPU化方法对算法函数进行封装加速运算，其作用是对算法函数进行加速运算；任意一种方式可以提取出一个特征，多种方式得到多种特征作为后续输入；

一维离散信号s(n)的Teager能量算子计算方法为：

Ψ[s(n)]＝[s(n)]²-s(n+1)s(n-1) (9)

其中，n表示时间索引值；

TEE表达式的计算方法为：

具体地，所述模块M4包括：

条件概率用来求解在平均整棵树T_i∈T的推断概率p_c(c|x)。

模块M4.2：根据得到的训练模型m，对测试数据进行分类；

其中，n_t是随机森林树T的个数；

为了更好的理解本发明，下面结合CUDA平台库和Spyder软件等现有技术，对本发明作详细说明。

本发明方法对原始数据进行入侵与否数据提取、预处理、特征提取、RF分类器训练模型、数据分类等步骤的加速处理，这种结合语音、音频等特征利用RF训练分类处理步骤使得可以判断入侵与否的待测信号，该方法是通过在CUDA平台利用装饰器封装函数加速算法处理，在RF中利用GridSearchCV函数得到最佳参数估计值(子模型数和学习率的最优解)，进而训练数据得到模型分类待测数据。1.最佳参数估计值指子模型数和学习率的最优解；原始提取的经过标记的一维数据通过步长1024大小窗口截取为待提取特征数据，再依次求取待提取数据的峭度因子、裕度因子、LFBEs、TEE和HZCRR等5个特征进行降维，在求取特征的过程中，均利用Numba编译器中@autojit装饰器的GPU化方法对算法函数进行封装加速运算。

Numba为一个库，它设计来用于动态地编译小型函数。为Python的函数明确类型标识，会即时执行，Numba实现了巧妙的类型猜测算法，并通过编译包含类型信息的函数版本来提高执行时间。Numba诣在改善执行数值计算的代码性能，优化大量使用数组的应用程序。Python非常灵巧，因为Numba不断变化地执行源码。因面向程序编译调度而设计Numba，与常见的NumPy库相似，在针对程序编译设计里利用GPU并行加速。Numba结合NumPy，并用它产生执行有效的代码，从而在GPU或多核CPU上运行。编译如附加一个函数Decorator来引导Numba运行GPU。

再利用RF对降维后的数据集训练得到模型，其中RF用到Python库sklearn中RandomForestClassifier随机森林分类器函数进行训练，并利用GridSearchCV函数对所设置的所有参数做所有的可能排列组合测试，然后取得一个最佳参数，估计RandomForestClassifier函数中最佳森林中树的数量n_estimators参数值。采用基于基尼不纯度和信息增益熵的基尼标准衡量树分割质量。最佳分割的特征数量，推荐，其中为特征数量。

随机森林基于集成学习Bagging思想，是通过自助采用的方法生成众多并行式分类器，通过少数服从多数的原则来确定最终的结果。决策树就是一棵树，多棵树就称作森林，那么随机森林主要是解决决策树泛化能力弱的缺点，一棵决策树是一个决策的可能性，都有一个决策权，所有树的结果综合在一起的分类能力肯定强于单棵树，所以随机森林基于这一思想进行分类。随机森林的随机主要体现在两个方面，一个是随机选取样本，一个是随机选取特征，随机森林是构建多棵决策树，每一棵树是从整个训练样本集中随机选取固定数量的样本集，然后再选取固定数量的特征集来构建一棵决策树，就相当于样本数和特征数都是总样本数和总特征集的一个子集构建决策树，且它是一个有放回的抽取过程，分类的结果根据少数服从多数原则。

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以，本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件，而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构；也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

Claims

1.一种基于GPU的光纤振动信号特征提取及分类的方法，其特征在于，包括：

步骤M3：提取出数据S1归一化特征X；

所述测试数据为待利用训练模型测得入侵或非入侵特征标签的光纤振动信号；

所述步骤M1提取特征数据集合S包括：

其中，λ表示时域中单个位置点的连续时间变化值；m表示位置点索引、n表示离散时间索引，diff表示微分运算，sgn表示符号函数，y(n,m)表示第m个位置点、第n个离散时间索引的时域信号；

所述步骤M2包括：

Sa_m＝mean(S_n,m) (2)

Sb_m＝Sa_m+B (3)

Sd_m＝1/Sc_m(5)

Se_n,m＝S_n,m+B(6)

Sf_n,m＝Se_n,m×Sd_m(7)

S1_n＝b₀Sf_n+b₁Sf_n-1+b₂Sf_n-2-a₁S1_n-1-a₂S1_n-2(8)

其中：其中b₀,b₁,b₂,a₁,a₂均为滤波系数，由采样率和截止频率决定，下标n表示时间索引；

所述步骤M3包括：利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X；并且利用Numba编译器对算法函数进行封装加速运算；

一维离散信号s(n)的Teager能量算子计算方法为：

Ψ[s(n)]＝[s(n)]²-s(n+1)s(n-1)(9)

其中，n表示时间索引值；

TEE表达式的计算方法为：

2.根据权利要求1所述的一种基于GPU的光纤振动信号特征提取及分类的方法，其特征在于，所述步骤M4包括：

随机森林T中每个决策树包括：一个根节点、分裂节点和叶节点；每棵树的输入数据的输入位置是对应输入特征X；根节点的输入(x,X)基于分裂标准函数/>分类到一个子节点，其中f_n(·)表示在节点n提取一个学习特征，即输入特征X得到的对应参数；节点n的分裂标准函数表示如下：

步骤M4.2：根据得到的训练模型m，对测试数据进行分类；

其中，n_t是随机森林树T的个数；

3.一种基于GPU的光纤振动信号特征提取及分类的系统，其特征在于，包括：

模块M3：提取出数据S1归一化特征X；

所述模块M1提取特征数据集合S包括：

所述模块M2包括：

Sa_m＝mean(S_n,m) (2)

Sb_m＝Sa_m+B (3)

Sd_m＝1/Sc_m (5)

Se_n,m＝S_n,m+B (6)

Sf_n,m＝Se_n,m×Sd_m (7)

S1_n＝b₀Sf_n+b₁Sf_n-1+b₂Sf_n-2-a₁S1_n-1-a₂S1_n-2 (8)

所述模块M3包括：利用包括峭度因子、裕度因子、LFBEs算法、TEE算法和HZCRR算法提取出数据S1归一化特征X；并且利用Numba编译器对算法函数进行封装加速运算；

一维离散信号s(n)的Teager能量算子计算方法为：

Ψ[s(n)]＝[s(n)]²-s(n+1)s(n-1) (9)

其中，n表示时间索引值；

TEE表达式的计算方法为：

4.根据权利要求3所述的一种基于GPU的光纤振动信号特征提取及分类的系统，其特征在于，所述模块M4包括：

模块M4.2：根据得到的训练模型m，对测试数据进行分类；

其中，n_t是随机森林树T的个数；