CN113011302B - 一种基于卷积神经网络的雷声信号识别系统及方法 - Google Patents
一种基于卷积神经网络的雷声信号识别系统及方法 Download PDFInfo
- Publication number
- CN113011302B CN113011302B CN202110266522.6A CN202110266522A CN113011302B CN 113011302 B CN113011302 B CN 113011302B CN 202110266522 A CN202110266522 A CN 202110266522A CN 113011302 B CN113011302 B CN 113011302B
- Authority
- CN
- China
- Prior art keywords
- thunder
- layer
- data
- training set
- convolutional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于卷积神经网络的雷声信号识别系统及方法,针对雷声训练集数据进行雷声类型人工标注,建立雷声分类标签定位文件,提取雷声训练集数据的梅尔频率倒谱系数,基于卷积神经网络对梅尔频率倒谱系数进行训练获得雷声分类识别模型,最终实现待识别声音数据的分类识别。本发明方法利用深度学习方法提高传统雷声信号检测方法的鲁棒性和准确率,以满足雷声定位系统对识别结果的实时高效需求,不仅能够克服多种环境噪声对雷声信号识别过程中的干扰,而且还能适用于源自不同通道位置的特征各异的雷声信号。
Description
技术领域
本发明涉及雷电信号监测技术领域,尤其涉及一种基于卷积神经网络的雷声信号识别系统及方法。
背景技术
雷电是自然界中影响人类活动的严重灾害之一,不仅会造成人员伤亡,也会给我国航空航天、电子工业、石油化工、交通、森林等行业造成不可估量的经济损失。近年来,因雷电引起的事故频发,使得社会各界人士越来越重视对雷电的实时监测和防护。
对雷电的实时监测是防雷减灾的基础,国内于上世纪八十年代末开始研究雷电定位技术,并从上世纪九十年代开始至今相继在30多个省建立了雷电定位系统,现已实现全国联网。雷电定位系统综合多个探测站所获取的雷电电磁信号,经由中心站统一处理后,实时推算出雷击发生的时间、位置、雷电流幅值等,定位精度达到了500m。雷电探测站的监测范围为30-300km,即在30km的近距离范围内会出现探测盲区。当前某些防雷重点区域比如变电站、油库、军事据点等需要对近距离范围内的雷电进行实时监测,而雷电定位系统难以满足这些迫切需求。
雷声定位是通过探测雷击时产生的声音信号和电磁信号,并根据二者到达信号接收设备的时间差来估算雷声声源与探测站间的距离,其探测范围为15km,探测精度达到了20-100m,满足对重点防雷区域雷电活动实时监测的要求。在探测雷声信号时,需要对所关注的区域进行实时声音信号监测,并从中筛选出用于雷声定位的有效数据,即需要对原始监测数据进行雷声识别。
目前常用的雷声识别方法为统计分析雷声数据库中声音信号的特征,选取具有较好区分性的特征参数,然后将待识别声音与模板声音两者的参数值进行匹配分析,根据匹配结果识别是否为雷声信号。但是,雷声信号会随着雷电的形式、强弱以及远近的不同而变化多样,利用传统的波形、频率等特征已无法满足强随机性雷声的识别。近几年,深度学习方法作为人工智能的一个分支,被广泛应用于语音识别、基因组学、量子化学等许多领域,深度学习技术为雷声信号检测提供了一种新型有效的方法。
发明内容
本发明的目的就是要提出一种基于卷积神经网络的雷声信号识别系统及方法,旨在利用深度学习方法提高传统雷声信号检测方法的鲁棒性和准确率,以满足雷声定位系统对识别结果的实时高效需求,不仅能够克服多种环境噪声对雷声信号识别过程中的干扰,而且还能适用于源自不同通道位置的特征各异的雷声信号。
为实现此目的,本发明所设计的基于卷积神经网络的雷声信号识别系统,它包括人工标注模块、训练集数据预处理模块、特征提取模块、模型学习模块、待识别声音数据预处理模块和分类识别模块;所述人工标注模块针对雷声训练集数据进行雷声类型人工标注,建立雷声分类标签定位文件;所述训练集数据预处理模块针对所述人工标注模块输出的雷声训练集数据进行降采样处理,生成降采样后的雷声训练集数据;所述特征提取模块用于从所述训练集数据预处理模块降采样处理后输出的雷声训练集数据中提取梅尔频率倒谱系数;所述模型学习模块基于卷积神经网络对所述特征提取模块输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练,获得雷声分类识别模型;所述待识别声音数据预处理模块针对待识别声音数据进行分帧、降采样和滤波预处理得到预处理后的待识别声音数据;所述特征提取模块还用于从所述待识别声音数据预处理模块预处理后输出的待识别声音数据中提取梅尔频率倒谱系数;所述分类识别模块结合所述模型学习模块输出的雷声分类识别模型获得待识别声音数据对应雷声信号[1,0]和非雷声信号[0,1]两个类别的概率,当待识别声音数据对应雷声信号[1,0]的概率大于设定阈值时,则认为待识别信号为雷声信号。
一种基于卷积神经网络的雷声信号识别方法,它包括如下步骤:
S1,所述人工标注模块针对雷声训练集数据进行雷声类型人工标注,建立雷声分类标签定位文件;
S2,所述训练集数据预处理模块针对所述人工标注模块输出的雷声训练集数据进行降采样处理,同时生成与降采样后的雷声训练集数据相匹配的雷声分类标签定位文件;
S3,所述特征提取模块用于从所述训练集数据预处理模块降采样处理后输出的雷声训练集数据中提取梅尔频率倒谱系数;
S4,所述模型学习模块基于卷积神经网络对所述特征提取模块输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练,获得雷声分类识别模型;
S5,所述待识别声音数据预处理模块针对待识别声音数据进行分帧、降采样和带通滤波预处理得到预处理后的待识别声音数据;
S6,所述特征提取模块从所述待识别声音数据预处理模块预处理后输出的待识别声音数据中提取梅尔频率倒谱系数;
S7,所述分类识别模块结合所述模型学习模块输出的雷声分类识别模型获得待识别声音数据对应雷声信号[1,0]和非雷声信号[0,1]两个类别的概率,当待识别声音数据对应雷声信号[1,0]的概率大于设定阈值时,则认为待识别信号为雷声信号。
本发明的有益效果:
1、本发明利用深度学习方法提高传统雷声信号检测方法的鲁棒性和准确率,以满足雷声定位系统对识别结果的实时高效需求;
2、本发明不仅能够克服多种环境噪声对雷声信号识别过程中的干扰,能够适用于源自不同通道位置的特征各异的雷声信号,同时,本发明可以区分出多种类别的雷声信号。
附图说明
图1为本发明的系统结构示意图;
图2为本发明的卷积神经网络结构示意图;
图3为本发明的方法流程图;
其中,1-人工标注模块、2-训练集数据预处理模块、3-特征提取模块、4-模型学习模块、5-待识别声音数据预处理模块和6-分类识别模块。
具体实施方式
以下结合附图和具体实施例对本发明作进一步的详细说明:
本发明所设计的基于卷积神经网络的雷声信号识别系统,如图1所示,它包括人工标注模块1、训练集数据预处理模块2、特征提取模块3、模型学习模块4、待识别声音数据预处理模块5和分类识别模块6;所述人工标注模块1针对雷声训练集数据进行雷声类型人工标注,建立雷声分类标签定位文件,所述雷声训练集数据与雷声分类标签定位文件一一对应;所述训练集数据预处理模块2通过resample函数针对所述人工标注模块1输出的雷声训练集数据进行降采样处理,生成降采样后的雷声训练集数据;所述特征提取模块3用于从所述训练集数据预处理模块2降采样处理后输出的雷声训练集数据中提取梅尔频率倒谱系数(MFCC),雷声训练集数据梅尔频率倒谱系数与雷声分类标签定位文件一一对应;所述模型学习模块4基于卷积神经网络(CNN)对所述特征提取模块3输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练,获得雷声分类识别模型;所述待识别声音数据预处理模块5针对待识别声音数据进行分帧、降采样和带通滤波预处理得到预处理后的待识别声音数据;所述特征提取模块3还用于从所述待识别声音数据预处理模块5预处理后输出的待识别声音数据中提取梅尔频率倒谱系数(MFCC);所述分类识别模块6结合所述模型学习模块4输出的雷声分类识别模型获得待识别声音数据对应雷声信号[1,0]和非雷声信号[0,1]两个类别的概率,当待识别声音数据对应雷声信号[1,0]的概率大于设定阈值时,则认为待识别信号为雷声信号。
上述技术方案中,所述人工标注模块1的数据输出至所述训练集数据预处理模块2,所述训练集数据预处理模块2的数据输出至所述特征提取模块3,所述特征提取模块3的数据输出至所述模型学习模块,所述模型学习模块4数据输出所述分类识别模块6,所述待识别声音数据预处理模块5的数据输出至所述特征提取模块3,所述特征提取模块3的数据输出至所述分类识别模块6。
上述技术方案中,所述雷声训练集数据包括由雷声探测采集设备采集获得的雷声历史数据和非雷声历史数据,所述待识别声音数据为雷声采集设备实时获得的声音数据。上述技术方案中,所述人工标注模块1建立的雷声分类标签定位文件里的信息包括雷声信号类别、开始时间、结束时间和标签值,所述雷声历史数据的标签值为1,所述非雷声历史数据的标签值为0。
上述技术方案中,所述训练集数据预处理模块2的降采样处理的采样频率小于5kHz,本实施例优选为4kHz。
上述技术方案中,所述特征提取模块3提取梅尔频率倒谱系数的具体方法为:
S41,预加重处理:将所述训练集数据预处理模块2降采样处理后输出的雷声训练集数据进行高通滤波,用于实现雷声训练集数据的预加重处理,提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱;所述高通滤波采用的滤波器函数为H(z)=1-μz-1,式中,H(z)为高通滤波器传递函数,μ为高通滤波器传递系数,z为高通滤波器传递因子,μ的值介于0.9-1.0之间,本实施例中μ优选为0.9357;
S42,分帧处理:将步骤S41输出的雷声训练集数据进行分帧处理,帧长为NFFT,两相邻帧数据之间的重叠长度为0.5NFFT,本实施例中N优选为128;
S43,加窗处理:将每一帧数据乘以汉明窗,以增加帧左端和右端的连续性;设分帧后的信号为x(n),n=0,1,…,NFFT-1,式中n表示分帧后声音信号的每帧所在采样点位,则乘上汉明窗后x'(n)=x(n)×w(n),w(n)形式如下:
设雷声训练集数据被分成了M帧数据段,由声音数据加汉明窗后的第m帧数据段表示为xm=[xm(0),xm(1),...,xm(NFFT-1)]T,式中,xm(NFFT-1)表示第m帧数据中采样点位位于NFFT-1处的声音信号,T代表转置;
S44,快速傅里叶变换:对步骤S43输出的各帧数据段进行快速傅里叶变换得到各帧数据段的频谱Ym(k):
式中,k代表傅里叶变换后的频率值,e表示自然对数,m和M与步骤S43中的含义相同;
S45,三角带通滤波:将步骤S44输出的频谱通过一个Q阶Mel尺度的三角形滤波器组Ψq,q=1,2,...,Q,Q通常取22-26,本实施例中Q优选为24,计算公式如下:
式中,q表示三角滤波器组的阶数,ym(q)表示经过第q阶Mel尺度的三角形滤波器组变换后的声音数据频谱,Ψq(k)表示频率为k时的三角滤波变换函数;
S46,提取梅尔频率倒谱系数:将步骤S45输出的频谱经离散余弦变换(DCT)得到各帧数据段的梅尔频率倒谱系数,计算公式如下:
式中,cm(p)表示各帧数据段的梅尔频率倒谱系数,l表示三角滤波器组的阶数,ym(l+1)表示经过l+1阶Mel尺度的三角形滤波器组变换后的声音数据频谱,p表示梅尔频率倒谱系数阶数,P表示梅尔频率倒谱系数的总阶数,本实施例中P优选为12,针对各帧数据段可以获得一个尺寸大小为P×M的梅尔频率倒谱矩阵F,基于该矩阵将生成3通道张量作为最终的梅尔频率倒谱系数,所述3通道张量包括梅尔频率倒谱矩阵Δ0=F[:,1:M-2]、F的一阶差分Δ1=F[:,2:M-1]-F[:,1:M-2]和F的二阶差分Δ2=F[:,3:M]-F[:,2:M-1],式中F[:,1:M-2]表示行列式F中列数为1:M-2的所有数值,F[:,2:M-1]表示行列式F中列数为2:M-2的所有数值,F[:,3:M]表示行列式F中列数为3:M的所有数值,F[:,2:M-1]表示行列式F中列数为2:M-1的所有数值,最终生成的梅尔频率倒谱系数矩阵的大小为P×M×3。
上述技术方案中,所述模型学习模块4中的卷积神经网络模型包括主要包括:一个输入层、4个卷积层C1、C2、C3、C4、2个池化层P1、P2、一个全连接层和一个输出层,如图2所示;
第一层为输入层,输入层输入所述特征提取模块3输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件,输入层与卷积层C1相连接;
第二层为卷积层C1,激活函数为ReLU,用于提取第一层输出的雷声训练集数据梅尔频率倒谱系数的低级特征,生成卷积层C1低级特征矩阵,卷积层C1与卷积层C2相连接;
第三层为卷积层C2,激活函数为ReLU,用于提取卷积层C1低级特征矩阵的复杂特征,生成卷积层C2复杂特征矩阵,卷积层C2与池化层P1相连接;
第四层为池化层P1,用于降低卷积层C2复杂特征矩阵的维度,生成池化层P1特征矩阵,池化层P1与卷积层C3相连接;
第五层为卷积层C3,激活函数为ReLU,用于提取池化层P1特征矩阵高层低级特征,生成卷积层C3高层低级特征矩阵,卷积层C3与卷积层C4相连接;
第六层为卷积层C4,激活函数为ReLU,用于提取卷积层C3高层低级特征矩阵的复杂特征,生成卷积层C4复杂特征矩阵,卷积层C4与池化层P2相连接;
第七层为池化层P2,用于降低卷积层C4复杂特征矩阵的维度生成池化层P2特征矩阵,池化层P2与全连接层相连接;
第八层为全连接层,用于将第七层输出的池化层P2特征矩阵变换成为一维特征向量,实现特征矩阵的降维目的,使得特征向量能够与类别形成对应关系;
第九层为输出层,用于将第八层输出的一维特征向量通过softmax激活函数映射到雷声信号[1,0]和非雷声信号[0,1]两个类别上,最终,对应雷声信号[1,0]和非雷声信号[0,1]两个类别输出一个概率,当待识别声音数据对应雷声信号[1,0]的概率大于设定阈值时,则认为待识别信号为雷声信号。
上述技术方案中,所述待识别声音数据预处理模块5的信号预处理具体方法为:首先,对雷声原始信号进行分帧处理,以保证每帧内的雷声信号是平稳的,有利于后续的特征识别,本实施例中帧长优选为3s,帧移优选为2s;其次,将分帧后的3s时长雷声信号数据进行降采样,以减少数据量提升识别分析效率,降采样的采样频率的范围为1-5kHz,本实施例优选为4kHz;最后,对降采样后的3s时长雷声信号数据进行带通滤波处理以去除噪声干扰信号,带通滤波的下限截止频率为100Hz、上限截止频率为1000Hz。
一种基于卷积神经网络的雷声信号识别方法,如图3所示,它包括如下步骤:
S1,人工标注:所述人工标注模块1针对雷声训练集数据进行雷声类型人工标注,建立雷声分类标签定位文件;
S2,训练集数据预处理:所述训练集数据预处理模块2针对所述人工标注模块1输出的雷声训练集数据进行降采样处理,同时生成与降采样后的雷声训练集数据相匹配的雷声分类标签定位文件;
S3,训练集数据特征提取:所述特征提取模块3用于从所述训练集数据预处理模块2降采样处理后输出的雷声训练集数据中提取梅尔频率倒谱系数(MFCC);
S4,模型学习:所述模型学习模块4基于卷积神经网络(CNN)对所述特征提取模块3输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练,获得雷声分类识别模型;
S5,待识别声音数据预处理:所述待识别声音数据预处理模块5针对待识别声音数据进行分帧、降采样和带通滤波预处理得到预处理后的待识别声音数据;
S6,待识别声音数据特征提取:所述特征提取模块3从所述待识别声音数据预处理模块5预处理后输出的待识别声音数据中提取梅尔频率倒谱系数(MFCC);
S7,待识别声音数据分类识别:所述分类识别模块6结合所述模型学习模块4输出的雷声分类识别模型获得待识别声音数据对应雷声信号[1,0]和非雷声信号[0,1]两个类别的概率,当待识别声音数据对应雷声信号[1,0]的概率大于设定阈值时,则认为待识别信号为雷声信号。
上述技术方案中,所述雷声分类标签定位文件里的信息包括雷声信号类别、开始时间、结束时间和标签值,所述雷声历史数据的标签值为1,所述非雷声历史数据的标签值为0。
上述技术方案中,所述待识别声音数据信号预处理具体方法为:首先,对雷声原始信号进行分帧处理,帧长为3s,帧移为2s;其次,将分帧后的雷声信号数据进行降采样,降采样的采样频率的范围为1-5kHz,本实施例优选为4kHz;最后,对降采样后的雷声信号数据进行带通滤波处理以去除噪声干扰信号,带通滤波的下限截止频率的范围为50-200Hz,本实施例中优选为100Hz,带通滤波的上限截止频率的范围为800-1500Hz,本实施例中优选为1000Hz。
上述技术方案中,所述特征提取模块3从所述待识别声音数据预处理模块5预处理后输出的帧长3s的待识别声音数据中提取梅尔频率倒谱系数(MFCC),获得的待识别声音数据梅尔频率倒谱系数矩阵大小为12×184×3。
上述技术方案中,所述模型学习模块4中的卷积神经网络模型包括主要包括:一个输入层、4个卷积层C1、C2、C3、C4、2个池化层P1、P2、一个全连接层和一个输出层;
第一层为输入层,输入层输入所述特征提取模块3输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件,输入的梅尔频率倒谱系数矩阵大小为12×184×3,输入层与卷积层C1相连接;
第二层为卷积层C1,卷积层C1为二维,卷积核尺寸为5×5,步长为1×1,激活函数为ReLU,用于提取第一层输出的雷声训练集数据梅尔频率倒谱系数的低级特征,生成卷积层C1低级特征矩阵,矩阵大小为12×184×6,卷积层C1与卷积层C2相连接;
第三层为卷积层C2,卷积层C2为二维,卷积核尺寸为3×3,步长为1×1,激活函数为ReLU,用于提取卷积层C1低级特征矩阵的复杂特征,生成卷积层C2复杂特征矩阵,矩阵大小为12×184×6,卷积层C2与池化层P1相连接;
第四层为池化层P1,池化层P1的核尺寸为3×3,步长为2×2,,用于降低卷积层C2复杂特征矩阵的维度,生成池化层P1特征矩阵,矩阵大小为5×91×6,池化层P1与卷积层C3相连接;
第五层为卷积层C3,卷积层C3为二维,卷积核尺寸为3×3,步长为1×1,激活函数为ReLU,用于提取池化层P1特征矩阵高层低级特征,生成卷积层C3高层低级特征矩阵,矩阵大小为5×91×8,卷积层C3与卷积层C4相连接;
第六层为卷积层C4,卷积层C4为二维,卷积核尺寸为3×3,步长为1×1,激活函数为ReLU,用于提取卷积层C3高层低级特征矩阵的复杂特征,生成卷积层C4复杂特征矩阵,矩阵大小为5×91×8,卷积层C4与池化层P2相连接;
第七层为池化层P2,池化层P2的核尺寸为3×3,步长为2×2,用于降低卷积层C4复杂特征矩阵的维度生成池化层P2特征矩阵,矩阵大小为2×45×8,池化层P2与全连接层相连接;
第八层为全连接层,用于将第七层输出的池化层P2特征矩阵变换成为一维特征向量,一维特征向量尺寸为1×720,实现特征矩阵的降维目的,使得特征向量能够与类别形成对应关系;
第九层为输出层,用于将第八层输出的一维特征向量通过softmax激活函数映射到雷声信号[1,0]和非雷声信号[0,1]两个类别上,最终,对应雷声信号[1,0]和非雷声信号[0,1]两个类别输出一个概率,当待识别信号对应雷声信号[1,0]的概率大于设定阈值时,则认为待识别信号为雷声信号。
本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (9)
1.一种基于卷积神经网络的雷声信号识别系统,其特征在于:包括人工标注模块(1)、训练集数据预处理模块(2)、特征提取模块(3)、模型学习模块(4)、待识别声音数据预处理模块(5)和分类识别模块(6);
所述人工标注模块(1)针对雷声训练集数据进行雷声类型人工标注,并根据雷声类型人工标注后的雷声训练集数据建立雷声分类标签定位文件;
所述训练集数据预处理模块(2)针对所述人工标注模块(1)输出的雷声类型人工标注后的雷声训练集数据进行降采样处理,生成降采样后的雷声训练集数据;
所述特征提取模块(3)用于从所述降采样后的雷声训练集数据中提取梅尔频率倒谱系数;
所述模型学习模块(4)基于卷积神经网络对所述特征提取模块(3)输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练,获得雷声分类识别模型;
所述待识别声音数据预处理模块(5)针对待识别声音数据进行分帧、降采样和带通滤波预处理得到预处理后的待识别声音数据;
所述特征提取模块(3)还用于从所述待识别声音数据预处理模块(5)输出的预处理后的待识别声音数据中提取梅尔频率倒谱系数;
所述分类识别模块(6)结合所述模型学习模块(4)输出的雷声分类识别模型获得待识别声音数据对应雷声信号和非雷声信号两个类别的概率,当待识别声音数据对应雷声信号的概率大于设定阈值时,则认为待识别信号为雷声信号;
所述特征提取模块(3)提取梅尔频率倒谱系数的具体方法为:
S41,将所述训练集数据预处理模块(2)降采样处理后输出的雷声训练集数据进行高通滤波,用于实现雷声训练集数据的预加重处理;所述高通滤波采用的滤波器函数为H(z)=1-μz-1,式中,H(z)为高通滤波器传递函数,μ为高通滤波器传递系数,z为高通滤波器传递因子;
S42,将步骤S41输出的雷声训练集数据进行分帧处理,帧长为NFFT,两相邻帧数据之间的重叠长度为0.5NFFT;
S43,将每一帧数据乘以汉明窗,设分帧后的声音信号为x(n),n=0,1,…,NFFT-1,式中n表示分帧后声音信号的每帧所在采样点位,则乘上汉明窗后x'(n)=x(n)×w(n),w(n)形式如下:
设雷声训练集数据被分成了M帧数据段,由声音数据加汉明窗后的第m帧数据表示为xm=[xm(0),xm(1),...,xm(NFFT-1)]T,式中,xm(NFFT-1)表示第m帧数据中采样点位位于NFFT-1处的声音信号,T代表转置;
S44,对步骤S43输出的各帧数据段进行快速傅里叶变换得到各帧数据段的频谱Ym(k):
式中,k代表傅里叶变换后的频率值,e表示自然对数,m和M与步骤S43中的含义相同;
S45,将步骤S44输出的频谱通过一个Q阶Mel尺度的三角形滤波器组Ψq,q=1,2,...,Q,计算公式如下:
式中,q表示三角滤波器组的阶数,ym(q)表示经过第q阶Mel尺度的三角形滤波器组变换后的声音数据频谱,Ψq(k)表示频率为k时的三角滤波变换函数;
S46,将步骤S45输出的频谱经离散余弦变换得到各帧数据段的梅尔频率倒谱系数,计算公式如下:
式中,cm(p)表示各帧数据段的梅尔频率倒谱系数,l表示三角滤波器组的阶数,ym(l+1)表示经过l+1阶Mel尺度的三角形滤波器组变换后的声音数据频谱,p表示梅尔频率倒谱系数阶数,P表示梅尔频率倒谱系数的总阶数;
针对各帧数据段可以获得一个尺寸大小为P×M的梅尔频率倒谱矩阵F,基于该矩阵将生成3通道张量作为最终的梅尔频率倒谱系数,所述3通道张量包括梅尔频率倒谱矩阵Δ0=F[:,1:M-2]、F的一阶差分Δ1=F[:,2:M-1]-F[:,1:M-2]和F的二阶差分Δ2=F[:,3:M]-F[:,2:M-1],式中F[:,1:M-2]表示行列式F中列数为1:M-2的所有数值,F[:,2:M-1]表示行列式F中列数为2:M-2的所有数值,F[:,3:M]表示行列式F中列数为3:M的所有数值,F[:,2:M-1]表示行列式F中列数为2:M-1的所有数值,最终生成的梅尔频率倒谱系数矩阵的大小为P×M×3。
2.根据权利要求1所述的基于卷积神经网络的雷声信号识别系统,其特征在于:
所述雷声训练集数据包括由雷声探测采集设备采集获得的雷声历史数据和非雷声历史数据,所述待识别声音数据为雷声采集设备实时获得的声音数据;
所述人工标注模块(1)建立的雷声分类标签定位文件里的信息包括雷声信号类别、开始时间、结束时间和标签值,所述雷声历史数据的标签值为1,所述非雷声历史数据的标签值为0。
3.根据权利要求1所述的基于卷积神经网络的雷声信号识别系统,其特征在于:所述训练集数据预处理模块(2)的降采样处理的采样频率的范围为1-5kHz。
4.根据权利要求1所述的基于卷积神经网络的雷声信号识别系统,其特征在于:所述模型学习模块(4)中的卷积神经网络模型包括主要包括:一个输入层、4个卷积层C1、C2、C3、C4、2个池化层P1、P2、一个全连接层和一个输出层;
第一层为输入层,输入层输入所述特征提取模块(3)输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件,输入层与卷积层C1相连接;
第二层为卷积层C1,激活函数为ReLU,用于提取第一层输出的雷声训练集数据梅尔频率倒谱系数的低级特征,生成卷积层C1低级特征矩阵,卷积层C1与卷积层C2相连接;
第三层为卷积层C2,激活函数为ReLU,用于提取卷积层C1低级特征矩阵的复杂特征,生成卷积层C2复杂特征矩阵,卷积层C2与池化层P1相连接;
第四层为池化层P1,用于降低卷积层C2复杂特征矩阵的维度,生成池化层P1特征矩阵,池化层P1与卷积层C3相连接;
第五层为卷积层C3,激活函数为ReLU,用于提取池化层P1特征矩阵高层低级特征,生成卷积层C3高层低级特征矩阵,卷积层C3与卷积层C4相连接;
第六层为卷积层C4,激活函数为ReLU,用于提取卷积层C3高层低级特征矩阵的复杂特征,生成卷积层C4复杂特征矩阵,卷积层C4与池化层P2相连接;
第七层为池化层P2,用于降低卷积层C4复杂特征矩阵的维度生成池化层P2特征矩阵,池化层P2与全连接层相连接;
第八层为全连接层,用于将第七层输出的池化层P2特征矩阵变换成为一维特征向量;
第九层为输出层,用于将第八层输出的一维特征向量通过softmax激活函数映射到雷声信号[1,0]和非雷声信号[0,1]两个类别上,最终,对应雷声信号[1,0]和非雷声信号[0,1]两个类别输出一个概率,当待识别信号对应雷声信号[1,0]的概率大于设定阈值时,则认为待识别信号为雷声信号。
5.根据权利要求1所述的基于卷积神经网络的雷声信号识别系统,其特征在于:所述待识别声音数据预处理模块(5)的信号预处理具体方法为:首先,对雷声原始信号进行分帧处理,帧长为A,帧移为2A/3;其次,将分帧后的雷声信号数据进行降采样,降采样的采样频率的范围为1-5kHz;最后,对降采样后的雷声信号数据进行带通滤波处理,带通滤波的下限截止频率的范围为50-200Hz,带通滤波的上限截止频率的范围为800-1500Hz。
6.一种基于权利要求1所述的基于卷积神经网络的雷声信号识别方法,其特征在于,它包括如下步骤:
S1,所述人工标注模块(1)针对雷声训练集数据进行雷声类型人工标注,建立雷声分类标签定位文件;
S2,所述训练集数据预处理模块(2)针对所述人工标注模块(1)输出的雷声训练集数据进行降采样处理,生成降采样后的雷声训练集数据;
S3,所述特征提取模块(3)从所述训练集数据预处理模块(2)降采样处理后输出的雷声训练集数据中提取梅尔频率倒谱系数;
S4,所述模型学习模块(4)基于卷积神经网络对所述特征提取模块(3)输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件进行训练,获得雷声分类识别模型;
S5,所述待识别声音数据预处理模块(5)针对待识别声音数据进行分帧、降采样和带通滤波预处理得到预处理后的待识别声音数据;
S6,所述特征提取模块(3)从所述待识别声音数据预处理模块(5)预处理后输出的待识别声音数据中提取梅尔频率倒谱系数;
S7,所述分类识别模块(6)结合所述模型学习模块(4)输出的雷声分类识别模型获得待识别声音数据对应雷声信号和非雷声信号两个类别的概率,当待识别声音数据对应雷声信号的概率大于设定阈值时,则认为待识别信号为雷声信号。
7.一种基于权利要求6所述的基于卷积神经网络的雷声信号识别方法,其特征在于:所述雷声分类标签定位文件里的信息包括雷声信号类别、开始时间、结束时间和标签值;所述训练集数据降采样处理的采样频率小于5kHz。
8.一种基于权利要求6所述的基于卷积神经网络的雷声信号识别方法,其特征在于:
所述模型学习模块(4)中的卷积神经网络模型包括主要包括:一个输入层、4个卷积层C1、C2、C3、C4、2个池化层P1、P2、一个全连接层和一个输出层;
第一层为输入层,输入层输入所述特征提取模块(3)输出的雷声训练集数据梅尔频率倒谱系数和对应的雷声分类标签定位文件,输入层与卷积层C1相连接;
第二层为卷积层C1,激活函数为ReLU,用于提取第一层输出的雷声训练集数据梅尔频率倒谱系数的低级特征,生成卷积层C1低级特征矩阵,卷积层C1与卷积层C2相连接;
第三层为卷积层C2,激活函数为ReLU,用于提取卷积层C1低级特征矩阵的复杂特征,生成卷积层C2复杂特征矩阵,卷积层C2与池化层P1相连接;
第四层为池化层P1,用于降低卷积层C2复杂特征矩阵的维度,生成池化层P1特征矩阵,池化层P1与卷积层C3相连接;
第五层为卷积层C3,激活函数为ReLU,用于提取池化层P1特征矩阵高层低级特征,生成卷积层C3高层低级特征矩阵,卷积层C3与卷积层C4相连接;
第六层为卷积层C4,激活函数为ReLU,用于提取卷积层C3高层低级特征矩阵的复杂特征,生成卷积层C4复杂特征矩阵,卷积层C4与池化层P2相连接;
第七层为池化层P2,用于降低卷积层C4复杂特征矩阵的维度生成池化层P2特征矩阵,池化层P2与全连接层相连接;
第八层为全连接层,用于将第七层输出的池化层P2特征矩阵变换成为一维特征向量;
第九层为输出层,用于将第八层输出的一维特征向量通过softmax激活函数映射到雷声信号[1,0]和非雷声信号[0,1]两个类别上,最终,对应雷声信号[1,0]和非雷声信号[0,1]两个类别输出一个概率,当待识别信号对应雷声信号[1,0]的概率大于设定阈值时,则认为待识别信号为雷声信号。
9.一种基于权利要求6所述的基于卷积神经网络的雷声信号识别方法,其特征在于:所述待识别声音数据信号预处理具体方法为:首先,对雷声原始信号进行分帧处理,帧长为A,帧移为2A/3;其次,将分帧后的雷声信号数据进行降采样,降采样的采样频率的范围为1-5kHz;最后,对降采样后的雷声信号数据进行带通滤波处理,带通滤波的下限截止频率的范围为50-200Hz,带通滤波的上限截止频率的范围为800-1500Hz。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110266522.6A CN113011302B (zh) | 2021-03-11 | 2021-03-11 | 一种基于卷积神经网络的雷声信号识别系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110266522.6A CN113011302B (zh) | 2021-03-11 | 2021-03-11 | 一种基于卷积神经网络的雷声信号识别系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113011302A CN113011302A (zh) | 2021-06-22 |
CN113011302B true CN113011302B (zh) | 2022-04-01 |
Family
ID=76405419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110266522.6A Active CN113011302B (zh) | 2021-03-11 | 2021-03-11 | 一种基于卷积神经网络的雷声信号识别系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113011302B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113449636B (zh) * | 2021-06-28 | 2024-03-12 | 苏州美糯爱医疗科技有限公司 | 一种基于人工智能的主动脉瓣狭窄严重程度自动分类方法 |
CN113960375A (zh) * | 2021-10-18 | 2022-01-21 | 特斯联科技集团有限公司 | 用于森林草原火灾预警的人工智能雷电探测系统及方法 |
CN114295195B (zh) * | 2021-12-31 | 2023-06-13 | 河海大学常州校区 | 基于特征提取的光纤传感振动信号的异常判断方法和系统 |
CN114330454A (zh) * | 2022-01-05 | 2022-04-12 | 东北农业大学 | 一种基于ds证据理论融合特征的生猪咳嗽声音识别方法 |
CN116825131A (zh) * | 2022-06-24 | 2023-09-29 | 南方电网调峰调频发电有限公司储能科研院 | 融合频带自向下注意力机制的电厂设备状态听觉监测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109493874A (zh) * | 2018-11-23 | 2019-03-19 | 东北农业大学 | 一种基于卷积神经网络的生猪咳嗽声音识别方法 |
CN110010155A (zh) * | 2019-04-11 | 2019-07-12 | 中国一拖集团有限公司 | 基于卷积神经网络和mfcc的颤振识别方法和系统 |
CN110246504A (zh) * | 2019-05-20 | 2019-09-17 | 平安科技(深圳)有限公司 | 鸟类声音识别方法、装置、计算机设备和存储介质 |
CN111666996A (zh) * | 2020-05-29 | 2020-09-15 | 湖北工业大学 | 一种基于attention机制的高精度设备源识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108806696B (zh) * | 2018-05-08 | 2020-06-05 | 平安科技(深圳)有限公司 | 建立声纹模型的方法、装置、计算机设备和存储介质 |
-
2021
- 2021-03-11 CN CN202110266522.6A patent/CN113011302B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109493874A (zh) * | 2018-11-23 | 2019-03-19 | 东北农业大学 | 一种基于卷积神经网络的生猪咳嗽声音识别方法 |
CN110010155A (zh) * | 2019-04-11 | 2019-07-12 | 中国一拖集团有限公司 | 基于卷积神经网络和mfcc的颤振识别方法和系统 |
CN110246504A (zh) * | 2019-05-20 | 2019-09-17 | 平安科技(深圳)有限公司 | 鸟类声音识别方法、装置、计算机设备和存储介质 |
CN111666996A (zh) * | 2020-05-29 | 2020-09-15 | 湖北工业大学 | 一种基于attention机制的高精度设备源识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113011302A (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113011302B (zh) | 一种基于卷积神经网络的雷声信号识别系统及方法 | |
Tran et al. | Acoustic-based emergency vehicle detection using convolutional neural networks | |
CN109036382B (zh) | 一种基于kl散度的音频特征提取方法 | |
EP3701528B1 (en) | Segmentation-based feature extraction for acoustic scene classification | |
CN109343046A (zh) | 基于多频多域深度学习的雷达步态识别方法 | |
CN105841961A (zh) | 一种基于Morlet小波变换和卷积神经网络的轴承故障诊断方法 | |
CN105047194A (zh) | 一种用于语音情感识别的自学习语谱图特征提取方法 | |
CN113566948A (zh) | 机器人化煤机故障音频识别及诊断方法 | |
CN111724770A (zh) | 一种基于深度卷积生成对抗网络的音频关键词识别方法 | |
Avci | An expert system for speaker identification using adaptive wavelet sure entropy | |
CN111616706A (zh) | 一种基于卷积神经网络的表面肌电信号分类方法及系统 | |
CN110647656A (zh) | 一种利用变换域稀疏化和压缩降维的音频检索方法 | |
CN110598628B (zh) | 一种基于集成深度学习的肌电信号手部运动识别方法 | |
CN115758082A (zh) | 一种轨道交通变压器故障诊断方法 | |
CN113707175B (zh) | 基于特征分解分类器与自适应后处理的声学事件检测系统 | |
CN109903749A (zh) | 基于关键点编码和卷积神经网络进行鲁棒的声音识别方法 | |
CN113555038A (zh) | 基于无监督领域对抗学习的说话人无关语音情感识别方法及系统 | |
CN116230020A (zh) | 一种语音情感识别分类方法 | |
CN114626424B (zh) | 一种基于数据增强的无声语音识别方法及装置 | |
CN113940638B (zh) | 基于频域双特征融合的脉搏波信号识别分类方法 | |
WO2023077592A1 (zh) | 一种智能心电信号处理方法 | |
Song et al. | Research on Scattering Transform of Urban Sound Events Detection Based on Self-Attention Mechanism | |
CN115312080A (zh) | 一种基于互补声学表征的语音情绪识别模型以及方法 | |
CN111785262B (zh) | 一种基于残差网络及融合特征的说话人年龄性别分类方法 | |
CN114898778A (zh) | 基于注意力时频网络的语音情感识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |