CN113011302B

CN113011302B - 一种基于卷积神经网络的雷声信号识别系统及方法

Info

Publication number: CN113011302B
Application number: CN202110266522.6A
Authority: CN
Inventors: 章涵; 谷山强; 李健; 严碧武; 吴敏; 苏杰; 雷梦飞; 陈扬; 许远根; 王宇; 李涛
Original assignee: Wuhan NARI Ltd
Current assignee: Wuhan NARI Ltd
Priority date: 2021-03-11
Filing date: 2021-03-11
Publication date: 2022-04-01
Anticipated expiration: 2041-03-11
Also published as: CN113011302A

Abstract

本发明公开了一种基于卷积神经网络的雷声信号识别系统及方法，针对雷声训练集数据进行雷声类型人工标注，建立雷声分类标签定位文件，提取雷声训练集数据的梅尔频率倒谱系数，基于卷积神经网络对梅尔频率倒谱系数进行训练获得雷声分类识别模型，最终实现待识别声音数据的分类识别。本发明方法利用深度学习方法提高传统雷声信号检测方法的鲁棒性和准确率，以满足雷声定位系统对识别结果的实时高效需求，不仅能够克服多种环境噪声对雷声信号识别过程中的干扰，而且还能适用于源自不同通道位置的特征各异的雷声信号。

Description

一种基于卷积神经网络的雷声信号识别系统及方法

技术领域

本发明涉及雷电信号监测技术领域，尤其涉及一种基于卷积神经网络的雷声信号识别系统及方法。

背景技术

雷电是自然界中影响人类活动的严重灾害之一，不仅会造成人员伤亡，也会给我国航空航天、电子工业、石油化工、交通、森林等行业造成不可估量的经济损失。近年来，因雷电引起的事故频发，使得社会各界人士越来越重视对雷电的实时监测和防护。

对雷电的实时监测是防雷减灾的基础，国内于上世纪八十年代末开始研究雷电定位技术，并从上世纪九十年代开始至今相继在30多个省建立了雷电定位系统，现已实现全国联网。雷电定位系统综合多个探测站所获取的雷电电磁信号，经由中心站统一处理后，实时推算出雷击发生的时间、位置、雷电流幅值等，定位精度达到了500m。雷电探测站的监测范围为30-300km，即在30km的近距离范围内会出现探测盲区。当前某些防雷重点区域比如变电站、油库、军事据点等需要对近距离范围内的雷电进行实时监测，而雷电定位系统难以满足这些迫切需求。

雷声定位是通过探测雷击时产生的声音信号和电磁信号，并根据二者到达信号接收设备的时间差来估算雷声声源与探测站间的距离，其探测范围为15km，探测精度达到了20-100m，满足对重点防雷区域雷电活动实时监测的要求。在探测雷声信号时，需要对所关注的区域进行实时声音信号监测，并从中筛选出用于雷声定位的有效数据，即需要对原始监测数据进行雷声识别。

目前常用的雷声识别方法为统计分析雷声数据库中声音信号的特征，选取具有较好区分性的特征参数，然后将待识别声音与模板声音两者的参数值进行匹配分析，根据匹配结果识别是否为雷声信号。但是，雷声信号会随着雷电的形式、强弱以及远近的不同而变化多样，利用传统的波形、频率等特征已无法满足强随机性雷声的识别。近几年，深度学习方法作为人工智能的一个分支，被广泛应用于语音识别、基因组学、量子化学等许多领域，深度学习技术为雷声信号检测提供了一种新型有效的方法。

发明内容

本发明的目的就是要提出一种基于卷积神经网络的雷声信号识别系统及方法，旨在利用深度学习方法提高传统雷声信号检测方法的鲁棒性和准确率，以满足雷声定位系统对识别结果的实时高效需求，不仅能够克服多种环境噪声对雷声信号识别过程中的干扰，而且还能适用于源自不同通道位置的特征各异的雷声信号。

为实现此目的，本发明所设计的基于卷积神经网络的雷声信号识别系统，它包括人工标注模块、训练集数据预处理模块、特征提取模块、模型学习模块、待识别声音数据预处理模块和分类识别模块；所述人工标注模块针对雷声训练集数据进行雷声类型人工标注，建立雷声分类标签定位文件；所述训练集数据预处理模块针对所述人工标注模块输出的雷声训练集数据进行降采样处理，生成降采样后的雷声训练集数据；所述特征提取模块用于从所述训练集数据预处理模块降采样处理后输出的雷声训练集数据中提取梅尔频率倒谱系数；所述模型学习模块基于卷积神经网络对所述特征提取模块输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练，获得雷声分类识别模型；所述待识别声音数据预处理模块针对待识别声音数据进行分帧、降采样和滤波预处理得到预处理后的待识别声音数据；所述特征提取模块还用于从所述待识别声音数据预处理模块预处理后输出的待识别声音数据中提取梅尔频率倒谱系数；所述分类识别模块结合所述模型学习模块输出的雷声分类识别模型获得待识别声音数据对应雷声信号[1,0]和非雷声信号[0,1]两个类别的概率，当待识别声音数据对应雷声信号[1,0]的概率大于设定阈值时，则认为待识别信号为雷声信号。

一种基于卷积神经网络的雷声信号识别方法，它包括如下步骤：

S1，所述人工标注模块针对雷声训练集数据进行雷声类型人工标注，建立雷声分类标签定位文件；

S2，所述训练集数据预处理模块针对所述人工标注模块输出的雷声训练集数据进行降采样处理，同时生成与降采样后的雷声训练集数据相匹配的雷声分类标签定位文件；

S3，所述特征提取模块用于从所述训练集数据预处理模块降采样处理后输出的雷声训练集数据中提取梅尔频率倒谱系数；

S4，所述模型学习模块基于卷积神经网络对所述特征提取模块输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练，获得雷声分类识别模型；

S5，所述待识别声音数据预处理模块针对待识别声音数据进行分帧、降采样和带通滤波预处理得到预处理后的待识别声音数据；

S6，所述特征提取模块从所述待识别声音数据预处理模块预处理后输出的待识别声音数据中提取梅尔频率倒谱系数；

S7，所述分类识别模块结合所述模型学习模块输出的雷声分类识别模型获得待识别声音数据对应雷声信号[1,0]和非雷声信号[0,1]两个类别的概率，当待识别声音数据对应雷声信号[1,0]的概率大于设定阈值时，则认为待识别信号为雷声信号。

本发明的有益效果：

1、本发明利用深度学习方法提高传统雷声信号检测方法的鲁棒性和准确率，以满足雷声定位系统对识别结果的实时高效需求；

2、本发明不仅能够克服多种环境噪声对雷声信号识别过程中的干扰，能够适用于源自不同通道位置的特征各异的雷声信号，同时，本发明可以区分出多种类别的雷声信号。

附图说明

图1为本发明的系统结构示意图；

图2为本发明的卷积神经网络结构示意图；

图3为本发明的方法流程图；

其中，1-人工标注模块、2-训练集数据预处理模块、3-特征提取模块、4-模型学习模块、5-待识别声音数据预处理模块和6-分类识别模块。

具体实施方式

以下结合附图和具体实施例对本发明作进一步的详细说明：

本发明所设计的基于卷积神经网络的雷声信号识别系统，如图1所示，它包括人工标注模块1、训练集数据预处理模块2、特征提取模块3、模型学习模块4、待识别声音数据预处理模块5和分类识别模块6；所述人工标注模块1针对雷声训练集数据进行雷声类型人工标注，建立雷声分类标签定位文件，所述雷声训练集数据与雷声分类标签定位文件一一对应；所述训练集数据预处理模块2通过resample函数针对所述人工标注模块1输出的雷声训练集数据进行降采样处理，生成降采样后的雷声训练集数据；所述特征提取模块3用于从所述训练集数据预处理模块2降采样处理后输出的雷声训练集数据中提取梅尔频率倒谱系数(MFCC)，雷声训练集数据梅尔频率倒谱系数与雷声分类标签定位文件一一对应；所述模型学习模块4基于卷积神经网络(CNN)对所述特征提取模块3输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练，获得雷声分类识别模型；所述待识别声音数据预处理模块5针对待识别声音数据进行分帧、降采样和带通滤波预处理得到预处理后的待识别声音数据；所述特征提取模块3还用于从所述待识别声音数据预处理模块5预处理后输出的待识别声音数据中提取梅尔频率倒谱系数(MFCC)；所述分类识别模块6结合所述模型学习模块4输出的雷声分类识别模型获得待识别声音数据对应雷声信号[1,0]和非雷声信号[0,1]两个类别的概率，当待识别声音数据对应雷声信号[1,0]的概率大于设定阈值时，则认为待识别信号为雷声信号。

上述技术方案中，所述人工标注模块1的数据输出至所述训练集数据预处理模块2，所述训练集数据预处理模块2的数据输出至所述特征提取模块3，所述特征提取模块3的数据输出至所述模型学习模块，所述模型学习模块4数据输出所述分类识别模块6，所述待识别声音数据预处理模块5的数据输出至所述特征提取模块3，所述特征提取模块3的数据输出至所述分类识别模块6。

上述技术方案中，所述雷声训练集数据包括由雷声探测采集设备采集获得的雷声历史数据和非雷声历史数据，所述待识别声音数据为雷声采集设备实时获得的声音数据。上述技术方案中，所述人工标注模块1建立的雷声分类标签定位文件里的信息包括雷声信号类别、开始时间、结束时间和标签值，所述雷声历史数据的标签值为1，所述非雷声历史数据的标签值为0。

上述技术方案中，所述训练集数据预处理模块2的降采样处理的采样频率小于5kHz，本实施例优选为4kHz。

上述技术方案中，所述特征提取模块3提取梅尔频率倒谱系数的具体方法为：

S41，预加重处理：将所述训练集数据预处理模块2降采样处理后输出的雷声训练集数据进行高通滤波，用于实现雷声训练集数据的预加重处理，提升高频部分，使信号的频谱变得平坦，保持在低频到高频的整个频带中，能用同样的信噪比求频谱；所述高通滤波采用的滤波器函数为H(z)＝1-μz^-1，式中，H(z)为高通滤波器传递函数，μ为高通滤波器传递系数，z为高通滤波器传递因子，μ的值介于0.9-1.0之间，本实施例中μ优选为0.9357；

S42，分帧处理：将步骤S41输出的雷声训练集数据进行分帧处理，帧长为N_FFT，两相邻帧数据之间的重叠长度为0.5N_FFT，本实施例中N优选为128；

S43，加窗处理：将每一帧数据乘以汉明窗，以增加帧左端和右端的连续性；设分帧后的信号为x(n),n＝0,1,…,N_FFT-1,式中n表示分帧后声音信号的每帧所在采样点位，则乘上汉明窗后x'(n)＝x(n)×w(n)，w(n)形式如下：

设雷声训练集数据被分成了M帧数据段，由声音数据加汉明窗后的第m帧数据段表示为x_m＝[x_m(0),x_m(1),...,x_m(N_FFT-1)]^T，式中，x_m(N_FFT-1)表示第m帧数据中采样点位位于N_FFT-1处的声音信号，T代表转置；

S44，快速傅里叶变换：对步骤S43输出的各帧数据段进行快速傅里叶变换得到各帧数据段的频谱Y_m(k)：

式中，k代表傅里叶变换后的频率值，e表示自然对数，m和M与步骤S43中的含义相同；

S45，三角带通滤波：将步骤S44输出的频谱通过一个Q阶Mel尺度的三角形滤波器组Ψ_q，q＝1,2,...,Q，Q通常取22-26，本实施例中Q优选为24，计算公式如下：

式中，q表示三角滤波器组的阶数，y_m(q)表示经过第q阶Mel尺度的三角形滤波器组变换后的声音数据频谱，Ψ_q(k)表示频率为k时的三角滤波变换函数；

S46，提取梅尔频率倒谱系数：将步骤S45输出的频谱经离散余弦变换(DCT)得到各帧数据段的梅尔频率倒谱系数，计算公式如下：

式中，c_m(p)表示各帧数据段的梅尔频率倒谱系数，l表示三角滤波器组的阶数，y_m(l+1)表示经过l+1阶Mel尺度的三角形滤波器组变换后的声音数据频谱，p表示梅尔频率倒谱系数阶数，P表示梅尔频率倒谱系数的总阶数，本实施例中P优选为12，针对各帧数据段可以获得一个尺寸大小为P×M的梅尔频率倒谱矩阵F，基于该矩阵将生成3通道张量作为最终的梅尔频率倒谱系数，所述3通道张量包括梅尔频率倒谱矩阵Δ₀＝F[:,1:M-2]、F的一阶差分Δ₁＝F[:,2:M-1]-F[:,1:M-2]和F的二阶差分Δ₂＝F[:,3:M]-F[:,2:M-1]，式中F[:,1:M-2]表示行列式F中列数为1:M-2的所有数值，F[:,2:M-1]表示行列式F中列数为2:M-2的所有数值，F[:,3:M]表示行列式F中列数为3:M的所有数值，F[:,2:M-1]表示行列式F中列数为2:M-1的所有数值，最终生成的梅尔频率倒谱系数矩阵的大小为P×M×3。

上述技术方案中，所述模型学习模块4中的卷积神经网络模型包括主要包括：一个输入层、4个卷积层C1、C2、C3、C4、2个池化层P1、P2、一个全连接层和一个输出层，如图2所示；

第一层为输入层，输入层输入所述特征提取模块3输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件，输入层与卷积层C1相连接；

第二层为卷积层C1，激活函数为ReLU，用于提取第一层输出的雷声训练集数据梅尔频率倒谱系数的低级特征，生成卷积层C1低级特征矩阵，卷积层C1与卷积层C2相连接；

第三层为卷积层C2，激活函数为ReLU，用于提取卷积层C1低级特征矩阵的复杂特征，生成卷积层C2复杂特征矩阵，卷积层C2与池化层P1相连接；

第四层为池化层P1，用于降低卷积层C2复杂特征矩阵的维度，生成池化层P1特征矩阵，池化层P1与卷积层C3相连接；

第五层为卷积层C3，激活函数为ReLU，用于提取池化层P1特征矩阵高层低级特征，生成卷积层C3高层低级特征矩阵，卷积层C3与卷积层C4相连接；

第六层为卷积层C4，激活函数为ReLU,用于提取卷积层C3高层低级特征矩阵的复杂特征，生成卷积层C4复杂特征矩阵，卷积层C4与池化层P2相连接；

第七层为池化层P2，用于降低卷积层C4复杂特征矩阵的维度生成池化层P2特征矩阵，池化层P2与全连接层相连接；

第八层为全连接层，用于将第七层输出的池化层P2特征矩阵变换成为一维特征向量，实现特征矩阵的降维目的，使得特征向量能够与类别形成对应关系；

第九层为输出层，用于将第八层输出的一维特征向量通过softmax激活函数映射到雷声信号[1,0]和非雷声信号[0,1]两个类别上，最终，对应雷声信号[1,0]和非雷声信号[0,1]两个类别输出一个概率，当待识别声音数据对应雷声信号[1,0]的概率大于设定阈值时，则认为待识别信号为雷声信号。

上述技术方案中，所述待识别声音数据预处理模块5的信号预处理具体方法为：首先，对雷声原始信号进行分帧处理，以保证每帧内的雷声信号是平稳的，有利于后续的特征识别，本实施例中帧长优选为3s，帧移优选为2s；其次，将分帧后的3s时长雷声信号数据进行降采样，以减少数据量提升识别分析效率，降采样的采样频率的范围为1-5kHz，本实施例优选为4kHz；最后，对降采样后的3s时长雷声信号数据进行带通滤波处理以去除噪声干扰信号，带通滤波的下限截止频率为100Hz、上限截止频率为1000Hz。

一种基于卷积神经网络的雷声信号识别方法，如图3所示，它包括如下步骤：

S1，人工标注：所述人工标注模块1针对雷声训练集数据进行雷声类型人工标注，建立雷声分类标签定位文件；

S2，训练集数据预处理：所述训练集数据预处理模块2针对所述人工标注模块1输出的雷声训练集数据进行降采样处理，同时生成与降采样后的雷声训练集数据相匹配的雷声分类标签定位文件；

S3，训练集数据特征提取：所述特征提取模块3用于从所述训练集数据预处理模块2降采样处理后输出的雷声训练集数据中提取梅尔频率倒谱系数(MFCC)；

S4，模型学习：所述模型学习模块4基于卷积神经网络(CNN)对所述特征提取模块3输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练，获得雷声分类识别模型；

S5，待识别声音数据预处理：所述待识别声音数据预处理模块5针对待识别声音数据进行分帧、降采样和带通滤波预处理得到预处理后的待识别声音数据；

S6，待识别声音数据特征提取：所述特征提取模块3从所述待识别声音数据预处理模块5预处理后输出的待识别声音数据中提取梅尔频率倒谱系数(MFCC)；

S7，待识别声音数据分类识别：所述分类识别模块6结合所述模型学习模块4输出的雷声分类识别模型获得待识别声音数据对应雷声信号[1,0]和非雷声信号[0,1]两个类别的概率，当待识别声音数据对应雷声信号[1,0]的概率大于设定阈值时，则认为待识别信号为雷声信号。

上述技术方案中，所述雷声分类标签定位文件里的信息包括雷声信号类别、开始时间、结束时间和标签值，所述雷声历史数据的标签值为1，所述非雷声历史数据的标签值为0。

上述技术方案中，所述待识别声音数据信号预处理具体方法为：首先，对雷声原始信号进行分帧处理，帧长为3s，帧移为2s；其次，将分帧后的雷声信号数据进行降采样，降采样的采样频率的范围为1-5kHz，本实施例优选为4kHz；最后，对降采样后的雷声信号数据进行带通滤波处理以去除噪声干扰信号，带通滤波的下限截止频率的范围为50-200Hz，本实施例中优选为100Hz，带通滤波的上限截止频率的范围为800-1500Hz，本实施例中优选为1000Hz。

上述技术方案中，所述特征提取模块3从所述待识别声音数据预处理模块5预处理后输出的帧长3s的待识别声音数据中提取梅尔频率倒谱系数(MFCC)，获得的待识别声音数据梅尔频率倒谱系数矩阵大小为12×184×3。

上述技术方案中，所述模型学习模块4中的卷积神经网络模型包括主要包括：一个输入层、4个卷积层C1、C2、C3、C4、2个池化层P1、P2、一个全连接层和一个输出层；

第一层为输入层，输入层输入所述特征提取模块3输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件，输入的梅尔频率倒谱系数矩阵大小为12×184×3，输入层与卷积层C1相连接；

第二层为卷积层C1，卷积层C1为二维，卷积核尺寸为5×5，步长为1×1，激活函数为ReLU，用于提取第一层输出的雷声训练集数据梅尔频率倒谱系数的低级特征，生成卷积层C1低级特征矩阵，矩阵大小为12×184×6，卷积层C1与卷积层C2相连接；

第三层为卷积层C2，卷积层C2为二维，卷积核尺寸为3×3，步长为1×1，激活函数为ReLU，用于提取卷积层C1低级特征矩阵的复杂特征，生成卷积层C2复杂特征矩阵，矩阵大小为12×184×6，卷积层C2与池化层P1相连接；

第四层为池化层P1，池化层P1的核尺寸为3×3，步长为2×2，，用于降低卷积层C2复杂特征矩阵的维度，生成池化层P1特征矩阵，矩阵大小为5×91×6，池化层P1与卷积层C3相连接；

第五层为卷积层C3，卷积层C3为二维，卷积核尺寸为3×3，步长为1×1，激活函数为ReLU，用于提取池化层P1特征矩阵高层低级特征，生成卷积层C3高层低级特征矩阵，矩阵大小为5×91×8，卷积层C3与卷积层C4相连接；

第六层为卷积层C4，卷积层C4为二维，卷积核尺寸为3×3，步长为1×1，激活函数为ReLU，用于提取卷积层C3高层低级特征矩阵的复杂特征，生成卷积层C4复杂特征矩阵，矩阵大小为5×91×8，卷积层C4与池化层P2相连接；

第七层为池化层P2，池化层P2的核尺寸为3×3，步长为2×2，用于降低卷积层C4复杂特征矩阵的维度生成池化层P2特征矩阵，矩阵大小为2×45×8，池化层P2与全连接层相连接；

第八层为全连接层，用于将第七层输出的池化层P2特征矩阵变换成为一维特征向量，一维特征向量尺寸为1×720，实现特征矩阵的降维目的，使得特征向量能够与类别形成对应关系；

第九层为输出层，用于将第八层输出的一维特征向量通过softmax激活函数映射到雷声信号[1,0]和非雷声信号[0,1]两个类别上，最终，对应雷声信号[1,0]和非雷声信号[0,1]两个类别输出一个概率，当待识别信号对应雷声信号[1,0]的概率大于设定阈值时，则认为待识别信号为雷声信号。

本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种基于卷积神经网络的雷声信号识别系统，其特征在于：包括人工标注模块(1)、训练集数据预处理模块(2)、特征提取模块(3)、模型学习模块(4)、待识别声音数据预处理模块(5)和分类识别模块(6)；

所述人工标注模块(1)针对雷声训练集数据进行雷声类型人工标注，并根据雷声类型人工标注后的雷声训练集数据建立雷声分类标签定位文件；

所述训练集数据预处理模块(2)针对所述人工标注模块(1)输出的雷声类型人工标注后的雷声训练集数据进行降采样处理，生成降采样后的雷声训练集数据；

所述特征提取模块(3)用于从所述降采样后的雷声训练集数据中提取梅尔频率倒谱系数；

所述模型学习模块(4)基于卷积神经网络对所述特征提取模块(3)输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练，获得雷声分类识别模型；

所述待识别声音数据预处理模块(5)针对待识别声音数据进行分帧、降采样和带通滤波预处理得到预处理后的待识别声音数据；

所述特征提取模块(3)还用于从所述待识别声音数据预处理模块(5)输出的预处理后的待识别声音数据中提取梅尔频率倒谱系数；

所述分类识别模块(6)结合所述模型学习模块(4)输出的雷声分类识别模型获得待识别声音数据对应雷声信号和非雷声信号两个类别的概率，当待识别声音数据对应雷声信号的概率大于设定阈值时，则认为待识别信号为雷声信号；

所述特征提取模块(3)提取梅尔频率倒谱系数的具体方法为：

S41，将所述训练集数据预处理模块(2)降采样处理后输出的雷声训练集数据进行高通滤波，用于实现雷声训练集数据的预加重处理；所述高通滤波采用的滤波器函数为H(z)＝1-μz^-1，式中，H(z)为高通滤波器传递函数，μ为高通滤波器传递系数，z为高通滤波器传递因子；

S42，将步骤S41输出的雷声训练集数据进行分帧处理，帧长为N_FFT，两相邻帧数据之间的重叠长度为0.5N_FFT；

S43，将每一帧数据乘以汉明窗，设分帧后的声音信号为x(n),n＝0,1,…,N_FFT-1,式中n表示分帧后声音信号的每帧所在采样点位，则乘上汉明窗后x'(n)＝x(n)×w(n)，w(n)形式如下：

设雷声训练集数据被分成了M帧数据段，由声音数据加汉明窗后的第m帧数据表示为x_m＝[x_m(0),x_m(1),...,x_m(N_FFT-1)]^T，式中，x_m(N_FFT-1)表示第m帧数据中采样点位位于N_FFT-1处的声音信号，T代表转置；

S44，对步骤S43输出的各帧数据段进行快速傅里叶变换得到各帧数据段的频谱Y_m(k)：

S45，将步骤S44输出的频谱通过一个Q阶Mel尺度的三角形滤波器组Ψ_q，q＝1,2,...,Q，计算公式如下：

S46，将步骤S45输出的频谱经离散余弦变换得到各帧数据段的梅尔频率倒谱系数，计算公式如下：

式中，c_m(p)表示各帧数据段的梅尔频率倒谱系数，l表示三角滤波器组的阶数，y_m(l+1)表示经过l+1阶Mel尺度的三角形滤波器组变换后的声音数据频谱，p表示梅尔频率倒谱系数阶数，P表示梅尔频率倒谱系数的总阶数；

针对各帧数据段可以获得一个尺寸大小为P×M的梅尔频率倒谱矩阵F，基于该矩阵将生成3通道张量作为最终的梅尔频率倒谱系数，所述3通道张量包括梅尔频率倒谱矩阵Δ₀＝F[:,1:M-2]、F的一阶差分Δ₁＝F[:,2:M-1]-F[:,1:M-2]和F的二阶差分Δ₂＝F[:,3:M]-F[:,2:M-1]，式中F[:,1:M-2]表示行列式F中列数为1:M-2的所有数值，F[:,2:M-1]表示行列式F中列数为2:M-2的所有数值，F[:,3:M]表示行列式F中列数为3:M的所有数值，F[:,2:M-1]表示行列式F中列数为2:M-1的所有数值，最终生成的梅尔频率倒谱系数矩阵的大小为P×M×3。

2.根据权利要求1所述的基于卷积神经网络的雷声信号识别系统，其特征在于：

所述雷声训练集数据包括由雷声探测采集设备采集获得的雷声历史数据和非雷声历史数据，所述待识别声音数据为雷声采集设备实时获得的声音数据；

所述人工标注模块(1)建立的雷声分类标签定位文件里的信息包括雷声信号类别、开始时间、结束时间和标签值，所述雷声历史数据的标签值为1，所述非雷声历史数据的标签值为0。

3.根据权利要求1所述的基于卷积神经网络的雷声信号识别系统，其特征在于：所述训练集数据预处理模块(2)的降采样处理的采样频率的范围为1-5kHz。

4.根据权利要求1所述的基于卷积神经网络的雷声信号识别系统，其特征在于：所述模型学习模块(4)中的卷积神经网络模型包括主要包括：一个输入层、4个卷积层C1、C2、C3、C4、2个池化层P1、P2、一个全连接层和一个输出层；

第一层为输入层，输入层输入所述特征提取模块(3)输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件，输入层与卷积层C1相连接；

第八层为全连接层，用于将第七层输出的池化层P2特征矩阵变换成为一维特征向量；

5.根据权利要求1所述的基于卷积神经网络的雷声信号识别系统，其特征在于：所述待识别声音数据预处理模块(5)的信号预处理具体方法为：首先，对雷声原始信号进行分帧处理，帧长为A，帧移为2A/3；其次，将分帧后的雷声信号数据进行降采样，降采样的采样频率的范围为1-5kHz；最后，对降采样后的雷声信号数据进行带通滤波处理，带通滤波的下限截止频率的范围为50-200Hz，带通滤波的上限截止频率的范围为800-1500Hz。

6.一种基于权利要求1所述的基于卷积神经网络的雷声信号识别方法，其特征在于，它包括如下步骤：

S1，所述人工标注模块(1)针对雷声训练集数据进行雷声类型人工标注，建立雷声分类标签定位文件；

S2，所述训练集数据预处理模块(2)针对所述人工标注模块(1)输出的雷声训练集数据进行降采样处理，生成降采样后的雷声训练集数据；

S3，所述特征提取模块(3)从所述训练集数据预处理模块(2)降采样处理后输出的雷声训练集数据中提取梅尔频率倒谱系数；

S4，所述模型学习模块(4)基于卷积神经网络对所述特征提取模块(3)输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练，获得雷声分类识别模型；

S5，所述待识别声音数据预处理模块(5)针对待识别声音数据进行分帧、降采样和带通滤波预处理得到预处理后的待识别声音数据；

S6，所述特征提取模块(3)从所述待识别声音数据预处理模块(5)预处理后输出的待识别声音数据中提取梅尔频率倒谱系数；

S7，所述分类识别模块(6)结合所述模型学习模块(4)输出的雷声分类识别模型获得待识别声音数据对应雷声信号和非雷声信号两个类别的概率，当待识别声音数据对应雷声信号的概率大于设定阈值时，则认为待识别信号为雷声信号。

7.一种基于权利要求6所述的基于卷积神经网络的雷声信号识别方法，其特征在于：所述雷声分类标签定位文件里的信息包括雷声信号类别、开始时间、结束时间和标签值；所述训练集数据降采样处理的采样频率小于5kHz。

8.一种基于权利要求6所述的基于卷积神经网络的雷声信号识别方法，其特征在于：

所述模型学习模块(4)中的卷积神经网络模型包括主要包括：一个输入层、4个卷积层C1、C2、C3、C4、2个池化层P1、P2、一个全连接层和一个输出层；

9.一种基于权利要求6所述的基于卷积神经网络的雷声信号识别方法，其特征在于：所述待识别声音数据信号预处理具体方法为：首先，对雷声原始信号进行分帧处理，帧长为A，帧移为2A/3；其次，将分帧后的雷声信号数据进行降采样，降采样的采样频率的范围为1-5kHz；最后，对降采样后的雷声信号数据进行带通滤波处理，带通滤波的下限截止频率的范围为50-200Hz，带通滤波的上限截止频率的范围为800-1500Hz。