CN112257521A - 基于数据增强和时频分离的cnn水声信号目标识别方法 - Google Patents

基于数据增强和时频分离的cnn水声信号目标识别方法 Download PDF

Info

Publication number
CN112257521A
CN112257521A CN202011063007.XA CN202011063007A CN112257521A CN 112257521 A CN112257521 A CN 112257521A CN 202011063007 A CN202011063007 A CN 202011063007A CN 112257521 A CN112257521 A CN 112257521A
Authority
CN
China
Prior art keywords
time domain
frequency
samples
domain signal
original time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011063007.XA
Other languages
English (en)
Other versions
CN112257521B (zh
Inventor
沈同圣
刘峰
赵德鑫
罗再磊
李光明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Defense Technology Innovation Institute PLA Academy of Military Science
Original Assignee
National Defense Technology Innovation Institute PLA Academy of Military Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Defense Technology Innovation Institute PLA Academy of Military Science filed Critical National Defense Technology Innovation Institute PLA Academy of Military Science
Priority to CN202011063007.XA priority Critical patent/CN112257521B/zh
Publication of CN112257521A publication Critical patent/CN112257521A/zh
Application granted granted Critical
Publication of CN112257521B publication Critical patent/CN112257521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明公开了基于数据增强和时频分离的CNN水声信号目标识别方法,能够提高识别正确率。方案为:获取不同目标类别的水声信号作为样本,分帧得到原始时域信号样本,据此构建训练集和测试集。对原始时域信号样本进行数据增强和扩充。对扩展后原始时域信号样本提取Mel功率谱,采用随机时域掩蔽和频率掩蔽方式进行谱图数据的扩展。对扩展后的Mel功率谱进行标注,并归一化处理,作为待识别水声信号的频谱特征。采用训练集中样本得到的待识别水声信号的频谱特征,进行目标分类模型训练。采用测试集中样本得到的待识别水声信号的频谱特征,输入至训练好的目标分类模型进行分类识别测试,获得训练好的目标分类模型的分类精度。

Description

基于数据增强和时频分离的CNN水声信号目标识别方法
技术领域
本发明涉及水下目标识别领域,具体为基于数据增强和时频分离的CNN水声信号目标识别方法。
背景技术
水声信号被动目标识别对于海洋开发、国防安全都有着重大意义,由于海洋环境的时变性和目标特征的复杂性,该问题一直没有得到很好的解决。经过多年的发展,新的理论、技术、方法不断被提出和验证,目前一部分相对有效的技术已从实验室仿真过渡到硬件应用阶段。然而,要想达到依靠识别系统进行自动判断,还有很多新方法和新途径值得人们去探索。
水声信号目标识别受到海洋环境的影响,存在强烈的噪声干扰,且数据采集和标注的难度较大,通常需要在小样本情况下进行识别。此外,水声信号的类内差异性和类间相似性也制约着识别的效果,相同目标在不同的航行状态下可能呈现出不同的特征,而不同目标在吨位、航速、工作状态、环境变化等作用下,可能存在相似的特征。因此,水声目标识别一直是水声探测领域中重要的研究方向。
利用深度学习方法对水声信号进行分类需要大量的数据进行训练,如何在有限的样本下,提取具有更加包容性的特征向量并构建高精度和高效率的目标识别模型,这是水声信号目标识别中最具挑战性的任务。目前大多数水声信号识别系统都是在特定的条件下经过优化,以获得最佳的性能,这会导致识别系统在应用于新环境时存在泛化风险。
发明内容
有鉴于此,本发明提供了基于数据增强和时频分离的CNN水声信号目标识别方法,能够通过数据扩展和时频分类提供一种适用于小样本水声信号的识别方法,提高识别正确率。
为达到上述目的,本发明的技术方案包括如下步骤:
步骤1:获取不同目标类别的水声信号作为样本,对水声信号样本按照预设的时间步长进行分帧,得到原始时域信号样本,据此构建训练集和测试集。
步骤2:对原始时域信号样本进行数据增强和扩充,针对原始时域信号样本,在添加高斯噪声的基础上,采用时域拉伸和音调变换的方式进行扩展,得到第一次扩展后的数据。
针对原始时域信号样本,提取Mel功率谱,再采用随机时域掩蔽和频率掩蔽方式进行谱图数据的扩展,得到第二次扩展后的数据。
步骤3:按照原始时域信号所属目标类别对第一次扩展后的数据和第二次扩展后的数据进行标注,将第一次扩展后的数据提取Mel功率谱后,与第二次扩展后的数据一起进行归一化处理,作为待识别水声信号的频谱特征。
步骤5:利用训练集中样本得到的待识别水声信号的频谱特征,采用如下方式进行目标分类模型训练:
根据预设的频段划分界限将待识别水声信号的频谱特征划分为低频特征和高频特征,将低频特征和高频特征分别输入独立的卷积神经网络即CNN网络;对两个独立的CNN网络的输出特征进行串联,并利用两个全连接层实现目标分类。
步骤6:采用测试集中样本得到的待识别水声信号的频谱特征,输入至训练好的目标分类模型进行分类识别测试,获得训练好的目标分类模型的分类精度。
进一步地,步骤1中,获取不同目标类别的水声信号作为样本,对水声信号样本按照预设的时间步长进行分帧,得到原始时域信号X(n),据此构建训练集和测试集,具体为:
S101、对水听器采集的水声信号进行预处理,去除空白信号,得到水声信号样本,将水声信号样本按照5s时长进行分帧和标注,生成原始时域信号。
S102:、将原始时域信号样本进行随机划分,70%的原始时域信号样本取出作为训练集,30%的原始时域信号样本为测试集。
进一步地,步骤2,对原始时域信号样本进行数据增强和扩充,在添加高斯噪声的基础上,对原始时域信号样本采用时域拉伸和音调变换的方式进行扩展,具体为:
针对原始时域信号样本添加均值为0、方差为1的高斯白噪声,之后分别对每个原始时域信号样本进行时域拉伸和音调变化,其中,时域拉伸的参数为{0.8,0.9,1.1,1.2}。
进一步地,步骤3,对扩展后原始时域信号样本提取Mel功率谱,采用随机时域掩蔽和频率掩蔽方式进行谱图数据的扩展,具体为:
针对原始时域信号样本提取的Mel功率谱,采用随机时频掩蔽的方式进行数据扩展,时间掩蔽为在Mel功率谱中使t个连续的时间步长[t0,t0+t)被图像均值掩蔽,其中,t0为起始时间,t为掩蔽时长,t0取值从[0,τ-t)的均匀分布中随机选择,τ为信号帧长,t取值从[0,T]的均匀分布中随机选择。
频率掩蔽为在Mel功率谱中使f个连续的频率通道[f0,f0+f)被图像均值掩蔽,其中,f0为起始频率,f为掩蔽频段,f0取值从[0,υ-f)的均匀分布中随机选择,υ是Mel功率谱的总频带数,f取值从[0,F]的均匀分布中随机选择。
每帧信号Mel功率谱图的时间掩蔽数Nt=4,频率掩蔽数Nf=4,得到8倍的基于Mel功率谱的数据扩展结果,即扩展后的Mel功率谱。
进一步地,步骤4中,将扩展后的Mel功率谱进行归一化处理,具体为:将将扩展后的Mel功率谱按照相同的尺寸进行裁剪并进行归一化处理,裁剪尺寸为(128,200),对添加类别标注后作为待识别水声信号的频谱特征。
进一步地,步骤5中,根据预设的频段划分界限将待识别水声信号的频谱特征划分为低频特征和高频特征,具体为:将待识别水声信号的频谱特征的[0,64)维选择为低频特征,将[64,128)维选择为高频特征。
进一步地,步骤5中,在进行目标分类模型训练时,两个独立的CNN网络选择为ResNet;在CNN网络中,通过对池化层下采样操作进行改进,在频率轴方向不进行下采样,在时间轴进行下采样到1维,使得网络模型可学习到全局时间范围内的多频段特征。
有益效果:
本发明的优点在于:利用时域和时频结合的数据扩展技术,利用现有的少量数据样本获得更多的数据样本,增加网络训练的泛化性能;另一方面,在设计网络时考虑到频谱图中时频轴和高低频段代表了不同的特征含义,利用两个独立的网络分别进行学习,提高识别的正确率。
附图说明
图1是本发明所提出的水声信号目标识别方法流程图;
图2是本发明所提出的水声信号目标识别具体实施例的示意图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
本发明提供了基于数据增强和时频分离的CNN水声信号目标识别方法,其流程如图1所示,包括如下步骤:
步骤1:获取不同目标类别的水声信号作为样本,对水声信号样本按照预设的时间步长进行分帧,得到原始时域信号样本,据此构建训练集和测试集。
该步骤具体为:
S101、对水听器采集的水声信号进行预处理,去除空白信号,得到水声信号样本,将水声信号样本按照5s时长进行分帧和标注,生成原始时域信号。
S102:、将原始时域信号样本进行随机划分,70%的原始时域信号样本取出作为训练集,30%的原始时域信号样本为测试集。
步骤2:对原始时域信号样本进行数据增强和扩充,在添加高斯噪声的基础上,对原始时域信号样本采用时域拉伸和音调变换的方式进行扩展,得到第一次扩展后的数据。针对原始时域信号样本添加均值为0、方差为1的高斯白噪声,之后分别对每个原始时域信号样本进行时域拉伸和音调变化,其中,时域拉伸的参数为{0.8,0.9,1.1,1.2}。
对原始时域信号样本提取Mel功率谱,采用随机时域掩蔽和频率掩蔽方式进行谱图数据的扩展,得到第二次扩展后的数据。
本发明实施例中,对原始时域信号样本采样率统一下采样到22050Hz,并进行Mel功率谱特征提取,其中,每一帧的采样点选取2048个,滑动步长为1/4采样点数,将每一帧乘以汉明窗,以增加帧左端和右端的连续性,再利用STFT变换得到信号在频谱上的能量分布;将能量谱通过一组128维的三角形滤波器,并计算每个滤波器组输出的对数能量,得到128维的Mel功率谱。
针对原始信号提取的Mel功率谱,采用随机时频掩蔽的方式进行数据扩展,时间掩蔽为在Mel功率谱中使t个连续的时间步长[t0,t0+t)被图像均值掩蔽,其中,t0为起始时间,t为掩蔽时长,t0取值从[0,τ-t)的均匀分布中随机选择,τ为信号帧长,本发明中每帧时长为5s,τ=216,t取值从[0,T]的均匀分布中随机选择,本发明中取T=30。
频率掩蔽为在Mel功率谱中使f个连续的频率通道[f0,f0+f)被图像均值掩蔽,其中,f0为起始频率,f为掩蔽频段,f0取值从[0,υ-f)的均匀分布中随机选择,υ是Mel功率谱的总频带数,本发明中取υ=128,f取值从[0,F]的均匀分布中随机选择,本发明中取F=13。
每帧信号Mel功率谱图的时间掩蔽数Nt=4,频率掩蔽数Nf=4,因此,可得到8倍的基于时频谱图的数据扩展。
步骤3:按照原始时域信号所属目标类别对第一次扩展后的数据和第二次扩展后的数据进行标注,将第一次扩展后的数据提取Mel功率谱后,与第二次扩展后的数据一起进行归一化处理,作为待识别水声信号的频谱特征;
本发明实施例中,将原始信号和扩展生成数据的Mel功率谱按照相同的尺寸进行裁剪并进行归一化处理,裁剪尺寸为(128,200),对所有数据添加类别标注后作为带训练数据。
步骤4:采用训练集中样本得到的待识别水声信号的频谱特征,采用如下方式进行目标分类模型训练:
根据预设的频段划分界限将待识别水声信号的频谱特征划分为低频特征和高频特征,对低频特征和高频特征分别输入独立的卷积神经网络即CNN网络;对两个独立的CNN网络的输出特征进行串联,并利用两个全连接层实现目标分类。
由于不同信号源之间存在着差异,因此将Mel功率谱划分为低频段和高频段并利用两个独立的CNN网络进行训练,将Mel功率谱的[0,64)维选择为低频特征,将[64,128)维选择为高频特征,CNN网络输入的数据尺寸为(64,100)。
本发明设计的CNN网络中,在频率轴方向不进行下采样,两个路径特征图的频率维度保持64不变,在时间轴进行下采样到1维,本发明中,两个并行的CNN网络选择为ResNet。
将两个网络的输出特征进行串联,再利用两个全连接层实现目标的分类,第一个全连接层的维度为128,第二个全连接层的维度为目标类别的数量。在网络训练过程中,卷积层上的权值衰减为5×10-4,每一个卷积层之后连接一个无参数的批处理归一化(BatchNormalization)层防止训练过拟合。使用Adam优化器,选择交叉熵作为损失函数,批处理大小为64,动量为0.9,每个网络训练400个周期,初始学习速率为1×10-4,学习速率从100个周期到300个周期开始线性衰减,达到5×10-6后,再以最小学习速率5×10-6训练100个周期。
图2是本发明所提出的水声信号目标识别具体实施例的示意图。
步骤5:采用测试集中样本得到的待识别水声信号的频谱特征,输入至训练好的目标分类模型进行分类识别测试,获得训练好的目标分类模型的分类精度。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.基于数据增强和时频分离的CNN水声信号目标识别方法,其特征在于,包括如下步骤:
步骤1:获取不同目标类别的水声信号作为样本,对水声信号样本按照预设的时间步长进行分帧,得到原始时域信号样本,据此构建训练集和测试集;
步骤2:对原始时域信号样本进行数据增强和扩充,针对原始时域信号样本,在添加高斯噪声的基础上,采用时域拉伸和音调变换的方式进行扩展,得到第一次扩展后的数据;
针对原始时域信号样本,提取Mel功率谱,再采用随机时域掩蔽和频率掩蔽方式进行谱图数据的扩展,得到第二次扩展后的数据;
步骤3:按照原始时域信号所属目标类别对第一次扩展后的数据和第二次扩展后的数据进行标注,将第一次扩展后的数据提取Mel功率谱后,与第二次扩展后的数据一起进行归一化处理,作为待识别水声信号的频谱特征;
步骤4:利用训练集中样本得到的待识别水声信号的频谱特征,采用如下方式进行目标分类模型训练:
根据预设的频段划分界限将待识别水声信号的频谱特征划分为低频特征和高频特征,将低频特征和高频特征分别输入独立的卷积神经网络即CNN网络;对两个独立的CNN网络的输出特征进行串联,并利用两个全连接层实现目标分类;
步骤5:采用测试集中样本得到的待识别水声信号的频谱特征,输入至训练好的目标分类模型进行分类识别测试,获得训练好的目标分类模型的分类精度。
2.如权利要求1所述的方法,其特征在于,所述步骤1中,获取不同目标类别的水声信号作为样本,对水声信号样本按照预设的时间步长进行分帧,得到原始时域信号X(n),据此构建训练集和测试集,具体为:
S101、对水听器采集的水声信号进行预处理,去除空白信号,得到水声信号样本,将水声信号样本按照5s时长进行分帧和标注,生成原始时域信号;
S102:、将原始时域信号样本进行随机划分,70%的原始时域信号样本取出作为训练集,30%的原始时域信号样本为测试集。
3.如权利要求1或2所述的方法,其特征在于,所述步骤2,对原始时域信号样本进行数据增强和扩充,在添加高斯噪声的基础上,对原始时域信号样本采用时域拉伸和音调变换的方式进行扩展,具体为:
针对原始时域信号样本添加均值为0、方差为1的高斯白噪声,之后分别对每个原始时域信号样本进行时域拉伸和音调变化,其中,时域拉伸的参数为{0.8,0.9,1.1,1.2}。
4.如权利要求3所述的方法,其特征在于,所述步骤3,对扩展后原始时域信号样本提取Mel功率谱,采用随机时域掩蔽和频率掩蔽方式进行谱图数据的扩展,具体为:
针对原始时域信号样本提取的Mel功率谱,采用随机时频掩蔽的方式进行数据扩展,时间掩蔽为在Mel功率谱中使t个连续的时间步长[t0,t0+t)被图像均值掩蔽,其中,t0为起始时间,t为掩蔽时长,t0取值从[0,τ-t)的均匀分布中随机选择,τ为信号帧长,t取值从[0,T]的均匀分布中随机选择;
频率掩蔽为在Mel功率谱中使f个连续的频率通道[f0,f0+f)被图像均值掩蔽,其中,f0为起始频率,f为掩蔽频段,f0取值从[0,υ-f)的均匀分布中随机选择,υ是Mel功率谱的总频带数,f取值从[0,F]的均匀分布中随机选择;
每帧信号Mel功率谱图的时间掩蔽数Nt=4,频率掩蔽数Nf=4,得到8倍的基于Mel功率谱的数据扩展结果,即扩展后的Mel功率谱。
5.如权利要求4所述的方法,其特征在于,所述步骤4中,所述将扩展后的Mel功率谱进行归一化处理,具体为:
将将扩展后的Mel功率谱按照相同的尺寸进行裁剪并进行归一化处理,裁剪尺寸为(128,200),对添加类别标注后作为待识别水声信号的频谱特征。
6.如权利要求5所述的方法,其特征在于,所述步骤5中,所述根据预设的频段划分界限将待识别水声信号的频谱特征划分为低频特征和高频特征,具体为:
将待识别水声信号的频谱特征的[0,64)维选择为低频特征,将[64,128)维选择为高频特征。
7.如权利要求6所述的方法,其特征在于,所述步骤5中,在进行目标分类模型训练时,两个独立的CNN网络选择为ResNet;
在CNN网络中,通过对池化层下采样操作进行改进,在频率轴方向不进行下采样,在时间轴进行下采样到1维,使得网络模型可学习到全局时间范围内的多频段特征。
CN202011063007.XA 2020-09-30 2020-09-30 基于数据增强和时频分离的cnn水声信号目标识别方法 Active CN112257521B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011063007.XA CN112257521B (zh) 2020-09-30 2020-09-30 基于数据增强和时频分离的cnn水声信号目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011063007.XA CN112257521B (zh) 2020-09-30 2020-09-30 基于数据增强和时频分离的cnn水声信号目标识别方法

Publications (2)

Publication Number Publication Date
CN112257521A true CN112257521A (zh) 2021-01-22
CN112257521B CN112257521B (zh) 2023-04-07

Family

ID=74233524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011063007.XA Active CN112257521B (zh) 2020-09-30 2020-09-30 基于数据增强和时频分离的cnn水声信号目标识别方法

Country Status (1)

Country Link
CN (1) CN112257521B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112910813A (zh) * 2021-04-10 2021-06-04 青岛科技大学 基于lda-knn的水声信号自动调制识别方法
CN112990082A (zh) * 2021-04-06 2021-06-18 舟山精卫智能科技有限公司 一种水声脉冲信号的检测识别方法
CN113242197A (zh) * 2021-03-24 2021-08-10 厦门大学 基于人工智能的水声信号调制识别方法及系统
CN113470628A (zh) * 2021-07-14 2021-10-01 青岛信芯微电子科技股份有限公司 一种语音识别方法及装置
CN114636995A (zh) * 2022-03-16 2022-06-17 中国水产科学研究院珠江水产研究所 一种基于深度学习的水声信号检测方法及系统
CN115429289A (zh) * 2022-09-01 2022-12-06 天津大学 一种脑机接口训练数据扩增方法、装置、介质及电子设备
CN115878982A (zh) * 2022-12-08 2023-03-31 中国海洋大学 一种基于双频回波信号特征的水下目标识别方法及系统
CN116582195A (zh) * 2023-06-12 2023-08-11 浙江瑞通电子科技有限公司 一种基于人工智能的无人机信号频谱识别算法
CN116647376A (zh) * 2023-05-25 2023-08-25 中国人民解放军军事科学院国防科技创新研究院 一种基于声纹信息的水声网络节点身份认证方法
CN117595943A (zh) * 2024-01-17 2024-02-23 之江实验室 一种目标特征频点快速回溯分析方法、系统、设备及介质
CN117828306A (zh) * 2024-03-01 2024-04-05 青岛哈尔滨工程大学创新发展中心 一种基于船舶运动频谱特征的数据样本扩充方法及系统
CN117595943B (zh) * 2024-01-17 2024-05-14 之江实验室 一种目标特征频点快速回溯分析方法、系统、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107358258A (zh) * 2017-07-07 2017-11-17 西安电子科技大学 基于nsct双cnn通道和选择性注意机制的sar图像目标分类
CN108694346A (zh) * 2017-04-05 2018-10-23 中国科学院声学研究所 一种基于两级cnn的船舶辐射噪声信号识别方法
RU2681252C1 (ru) * 2018-04-16 2019-03-05 Федеральное Государственное Казенное Военное Образовательное Учреждение Высшего Образования "Тихоокеанское Высшее Военно-Морское Училище Имени С.О. Макарова" Министерства Обороны Российской Федерации (Г. Владивосток) Система обнаружения гидроакустических сигналов и их нейросетевой классификации
CN109978034A (zh) * 2019-03-18 2019-07-05 华南理工大学 一种基于数据增强的声场景辨识方法
RU2695985C1 (ru) * 2018-10-22 2019-07-29 Федеральное Государственное Казенное Военное Образовательное Учреждение Высшего Образования "Тихоокеанское Высшее Военно-Морское Училище Имени С.О. Макарова" Министерства Обороны Российской Федерации (Г. Владивосток) Нейросетевая система обнаружения и оперативной идентификации морских целей

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108694346A (zh) * 2017-04-05 2018-10-23 中国科学院声学研究所 一种基于两级cnn的船舶辐射噪声信号识别方法
CN107358258A (zh) * 2017-07-07 2017-11-17 西安电子科技大学 基于nsct双cnn通道和选择性注意机制的sar图像目标分类
RU2681252C1 (ru) * 2018-04-16 2019-03-05 Федеральное Государственное Казенное Военное Образовательное Учреждение Высшего Образования "Тихоокеанское Высшее Военно-Морское Училище Имени С.О. Макарова" Министерства Обороны Российской Федерации (Г. Владивосток) Система обнаружения гидроакустических сигналов и их нейросетевой классификации
RU2695985C1 (ru) * 2018-10-22 2019-07-29 Федеральное Государственное Казенное Военное Образовательное Учреждение Высшего Образования "Тихоокеанское Высшее Военно-Морское Училище Имени С.О. Макарова" Министерства Обороны Российской Федерации (Г. Владивосток) Нейросетевая система обнаружения и оперативной идентификации морских целей
CN109978034A (zh) * 2019-03-18 2019-07-05 华南理工大学 一种基于数据增强的声场景辨识方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
AI研习社: "用于语音识别的数据增强", 《HTTPS://CLOUD.TENCENT.COM/DEVELOPER/ARTICLE/1445868》 *
岳皓: "基于深度学习的水声信号特征提取和分类识别研究", 《中国优秀硕士学位论文全文数据库(电子期刊) 基础科学辑》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113242197A (zh) * 2021-03-24 2021-08-10 厦门大学 基于人工智能的水声信号调制识别方法及系统
CN112990082A (zh) * 2021-04-06 2021-06-18 舟山精卫智能科技有限公司 一种水声脉冲信号的检测识别方法
CN112910813A (zh) * 2021-04-10 2021-06-04 青岛科技大学 基于lda-knn的水声信号自动调制识别方法
CN113470628A (zh) * 2021-07-14 2021-10-01 青岛信芯微电子科技股份有限公司 一种语音识别方法及装置
CN114636995A (zh) * 2022-03-16 2022-06-17 中国水产科学研究院珠江水产研究所 一种基于深度学习的水声信号检测方法及系统
CN115429289A (zh) * 2022-09-01 2022-12-06 天津大学 一种脑机接口训练数据扩增方法、装置、介质及电子设备
CN115878982A (zh) * 2022-12-08 2023-03-31 中国海洋大学 一种基于双频回波信号特征的水下目标识别方法及系统
CN115878982B (zh) * 2022-12-08 2023-09-22 中国海洋大学 一种基于双频回波信号特征的水下目标识别方法及系统
CN116647376A (zh) * 2023-05-25 2023-08-25 中国人民解放军军事科学院国防科技创新研究院 一种基于声纹信息的水声网络节点身份认证方法
CN116647376B (zh) * 2023-05-25 2024-01-26 中国人民解放军军事科学院国防科技创新研究院 一种基于声纹信息的水声网络节点身份认证方法
CN116582195A (zh) * 2023-06-12 2023-08-11 浙江瑞通电子科技有限公司 一种基于人工智能的无人机信号频谱识别算法
CN116582195B (zh) * 2023-06-12 2023-12-26 浙江瑞通电子科技有限公司 一种基于人工智能的无人机信号频谱识别方法
CN117595943A (zh) * 2024-01-17 2024-02-23 之江实验室 一种目标特征频点快速回溯分析方法、系统、设备及介质
CN117595943B (zh) * 2024-01-17 2024-05-14 之江实验室 一种目标特征频点快速回溯分析方法、系统、设备及介质
CN117828306A (zh) * 2024-03-01 2024-04-05 青岛哈尔滨工程大学创新发展中心 一种基于船舶运动频谱特征的数据样本扩充方法及系统

Also Published As

Publication number Publication date
CN112257521B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN112257521B (zh) 基于数据增强和时频分离的cnn水声信号目标识别方法
Wang et al. TSTNN: Two-stage transformer based neural network for speech enhancement in the time domain
Lee et al. Sample-level deep convolutional neural networks for music auto-tagging using raw waveforms
CN111724770B (zh) 一种基于深度卷积生成对抗网络的音频关键词识别方法
JPH0792673B2 (ja) 認識用辞書学習方法
CN108198545B (zh) 一种基于小波变换的语音识别方法
CN103456302B (zh) 一种基于情感gmm模型权重合成的情感说话人识别方法
CN101404160A (zh) 一种基于音频识别的语音降噪方法
CN111044814B (zh) 一种对变压器直流偏磁异常进行辨识的方法及系统
Sarikaya et al. Subband based classification of speech under stress
CN113646833A (zh) 语音对抗样本检测方法、装置、设备及计算机可读存储介质
CN111341319A (zh) 一种基于局部纹理特征的音频场景识别方法及系统
CN112183582A (zh) 一种多特征融合的水下目标识别方法
CN107369451B (zh) 一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法
Adam et al. Spoken english alphabet recognition with mel frequency cepstral coefficients and back propagation neural networks
CN113111786B (zh) 基于小样本训练图卷积网络的水下目标识别方法
Zhao et al. Environmental sound classification based on adding noise
Adam et al. Wavelet cesptral coefficients for isolated speech recognition
Wang et al. Revealing the processing history of pitch-shifted voice using CNNs
CN115064182A (zh) 自适应梅尔滤波器在强噪声环境下风机故障特征识别方法
CN113129926A (zh) 语音情绪识别模型训练方法、语音情绪识别方法及装置
Park et al. Pretrained network-based sound event recognition for audio surveillance applications
Van Hout et al. Tackling unseen acoustic conditions in query-by-example search using time and frequency convolution for multilingual deep bottleneck features
CN112733927A (zh) 一种基于一维卷积神经网络的风叶声音边界定位方法和存储设备
Majeed et al. Hierarchical k-means algorithm applied on isolated malay digit speech recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant