CN115238738A - 构建水声目标识别模型的方法和装置 - Google Patents

构建水声目标识别模型的方法和装置 Download PDF

Info

Publication number
CN115238738A
CN115238738A CN202210792171.7A CN202210792171A CN115238738A CN 115238738 A CN115238738 A CN 115238738A CN 202210792171 A CN202210792171 A CN 202210792171A CN 115238738 A CN115238738 A CN 115238738A
Authority
CN
China
Prior art keywords
dense connection
connection network
module
training
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210792171.7A
Other languages
English (en)
Inventor
曾向阳
刘杰
王海涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202210792171.7A priority Critical patent/CN115238738A/zh
Publication of CN115238738A publication Critical patent/CN115238738A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明实施例公开了一种构建水声目标识别模型的方法和装置。该构建水声目标识别模型的方法包括:选择水声数据样本,并将水声数据样本分为训练样本和测试样本;通过训练样本训练稠密连接网络,得到训练后的稠密连接网络;将测试样本输入训练后的稠密连接网络,得到收敛的稠密连接网络。通过本发明,解决了相关技术中水声样本不足的问题,达到了避免复杂繁重的特征工程,并且极大地加强了特征重用,在一定程度上缓解了水声样本不足的技术效果。

Description

构建水声目标识别模型的方法和装置
技术领域
本发明涉及计算机技术应用领域,尤其涉及一种构建水声目标识别模型的方法和装置。
背景技术
水声目标识别是一项利用目标辐射噪声信号对目标进行分类的技术,基于传统统计模型的分类识别方法主要由预处理、特征提取与选择、分类器三步组成,常见的特征有功率谱、听觉谱、噪声包络信号识别(Detection of Envelope Modulation On Noise,简称DEMON)谱、低频分析记录(Low Frequency Analysis Recording,简称LOFAR)谱、小波特征、响度特征、梅尔倒谱系数(Mel-Frequency Cepstral Coefficients,简称MFCC)特征、感知线性预测(Perceptual Linear Predictive,简称PLP)特征等,能否提取到可靠的特征将会直接影响到水声目标的识别率。在大数据时代的背景下,人工神经网络的结构和算法不断优化,并在计算机图像识别领域取得了巨大的成功,同时,随着计算机硬件技术的飞速发展,神经网络的计算速度也获得了极大提高,从而进一步推动了神经网络的发展。如何利用深度神经网络完成水声目标识别任务也受到了越来越多的关注。深度神经网络可以直接从原始波形信号中自动提取特征,避免了复杂的特征提取和选择工作,而且利用神经网络也可以获得更高的识别率。
在实际工程应用中,水声数据获取困难且保密性较强,真实的水声目标数据非常稀少,用于训练目标识别模型的高质量水声样本进一步缩小。
针对目前相关技术中水声样本不足的问题,目前尚未得到有效的解决。
发明内容
本发明实施例提供了一种构建水声目标识别模型的方法和装置,以至少解决相关技术中水声样本不足的问题。
根据本发明实施例的一个方面,提供了一种构建水声目标识别模型的方法,包括:选择水声数据样本,并将水声数据样本分为训练样本和测试样本;通过训练样本训练稠密连接网络,得到训练后的稠密连接网络;将测试样本输入训练后的稠密连接网络,得到收敛的稠密连接网络。
可选的,选择水声数据样本,并将水声数据样本分为训练样本和测试样本包括:选择至少三类水声目标作为水声数据样本;依据预设比例将水声数据样本进行分类,得到训练样本和测试样本。
可选的,该方法还包括:构建稠密连接网络,其中,稠密连接网络包括:Steam模块、密集连接模块、Transition Layer模块和分类模块。
进一步地,可选的,该方法还包括:确定网络的超参数,其中,超参数包括损失函数,学习率、迭代次数及批大小;损失函数包括:交叉熵损失函数。
可选的,通过训练样本训练稠密连接网络,得到训练后的稠密连接网络包括:通过输入训练样本对稠密连接网络进行训练,得到训练样本对应的标签以及训练后的稠密连接网络。
进一步地,可选的,将测试样本输入训练后的稠密连接网络,得到收敛的稠密连接网络包括:将测试样本输入训练后的稠密连接网络对测试样本中的数据进行识别,得到识别结果;依据识别结果判定训练后的稠密连接网络是否收敛;在判定结果为是的情况下,得到收敛的稠密连接网络。
根据本发明实施例的另一个方面,提供了一种构建水声目标识别模型的装置,包括:选择模块,用于选择水声数据样本,并将水声数据样本分为训练样本和测试样本;训练模块,用于通过训练样本训练稠密连接网络,得到训练后的稠密连接网络;识别模块,用于将测试样本输入训练后的稠密连接网络,得到收敛的稠密连接网络。
可选的,选择模块包括:选择单元,用于选择至少三类水声目标作为水声数据样本;分类单元,用于依据预设比例将水声数据样本进行分类,得到训练样本和测试样本。
可选的,该装置还包括:构建模块,用于构建稠密连接网络,其中,稠密连接网络包括:Steam模块、密集连接模块、Transition Layer模块和分类模块。
进一步地,可选的,该装置还包括:参数确定模块,用于确定网络的超参数,其中,超参数包括损失函数,学习率、迭代次数及批大小;损失函数包括:交叉熵损失函数。
本发明实施例中,基于选择水声数据样本,并将水声数据样本分为训练样本和测试样本;通过训练样本训练稠密连接网络,得到训练后的稠密连接网络;将测试样本输入训练后的稠密连接网络,得到收敛的稠密连接网络。也就是说,本发明实施例能够解决了水声样本不足的问题,从而避免复杂繁重的特征工程,并且极大地加强了特征重用,在一定程度上缓解了水声样本不足的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例提供的一种水声目标识别方法的流程示意图;
图2为本发明实施例提供的一种构建水声目标识别模型的方法中Dense Block结构的示意图;
图3为本发明实施例提供的一种构建水声目标识别模型的装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于限定特定顺序。
根据本发明实施例的一个方面,提供了一种构建水声目标识别模型的方法,图1为本发明实施例提供的一种构建水声目标识别模型的方法的流程示意图。如图1所示,本申请实施例提供构建水声目标识别模型的方法包括:
步骤S102,选择水声数据样本,并将水声数据样本分为训练样本和测试样本;
可选的,步骤S102中选择水声数据样本,并将水声数据样本分为训练样本和测试样本包括:选择至少三类水声目标作为水声数据样本;依据预设比例将水声数据样本进行分类,得到训练样本和测试样本。
具体的,本申请实施例提供构建水声目标识别模型的方法采用的数据集为湖试数据集,该数据集是在丹江口湖上采集所得,湖试数据集共分为4类,是4种不同型号船只的辐射噪声,分别为铁皮船、曙航号、国泰号和新世纪号,利用两个8阵元线阵进行全天候数据采集。取每类目标的15个声音样本,每个样本时长为5s,对数据进行分帧后,随机选取其中的80%作为训练样本集,其余20%作为测试样本集。
可选的,本申请实施例提供构建水声目标识别模型的方法还包括:构建稠密连接网络,其中,稠密连接网络包括:Steam模块、密集连接模块、Transition Layer模块和分类模块。
具体的,图2为本发明实施例提供的一种构建水声目标识别模型的方法中DenseBlock结构的示意图,如图2所示,搭建DenseNet网络模型。DenseNet网络具体包含了Steam模块、密集连接模块(Dense Block)、Transition Layer模块和分类模块(ClassificationLayer):
(1)确定Steam模块的结构,Steam模块放置在整个网络的最前面,由一个卷积层和一个最大池化层构成,卷积层卷积核大小为3*1,步长为2,最大池化层池的尺寸为3*1,步长为2,通过该Steam模块,特征图减小为原来的1/4;
(2)确定Dense Block模块的结构。Dense Block模块是本发明网络的核心部分,其要点是采用了密集连接,即把前面所有层的特征图在Channel维度上进行拼接并作为该层的输入,通过这种密集连接的方式,本网络能够大大增强特征重用,在水声样本不足的情况下完成水声目标识别任务。本发明采用的基础单元块由一个卷积核大小为1*1的卷积层和一个卷积核大小为3*1的卷积层相连所构成,然后把数量不等的基础单元块采用密集连接的方式进行连接构成一个Dense Block模块,第1、2、3、4个Dense Block模块分别包含6、12、24、16个基础单元块;
(3)确定Transition Layer模块的结构。Transition Layer模块由一个卷积层和一个平均池化层组成,卷积层卷积核大小为1*1,步长为1,平均池化层池的尺寸为2*1,步长为2,通过该Transition Layer模块特征图的尺寸减小为原来的一半,能够加快模型训练速度;
(4)把上面搭建的4个Dense Block模块和3个Transition Layer模块交替连接;
(5)确定Classification Layer模块的结构。Classification Layer模块由一个平均池化层和一个全连接层组成,平均池化层池的尺寸为7*1,步长为21,然后采用softmax函数实现水声目标分类。
进一步地,可选的,本申请实施例提供构建水声目标识别模型的方法还包括:确定网络的超参数,其中,超参数包括损失函数,学习率、迭代次数及批大小;损失函数包括:交叉熵损失函数。
具体的,本申请实施例提供构建水声目标识别模型的方法中损失函数选择交叉熵损失函数,学习率设置为0.0001,迭代次数为100,批大小为128。
步骤S104,通过训练样本训练稠密连接网络,得到训练后的稠密连接网络;
可选的,步骤S104中通过训练样本训练稠密连接网络,得到训练后的稠密连接网络包括:通过输入训练样本对稠密连接网络进行训练,得到训练样本对应的标签以及训练后的稠密连接网络。
具体的,将步骤S102中划分出的训练样本集作为DenseNet网络的输入,对应标签作为期望的输出,完成对网络模型的训练。
步骤S106,将测试样本输入训练后的稠密连接网络,得到收敛的稠密连接网络。
可选的,步骤S106中将测试样本输入训练后的稠密连接网络,得到收敛的稠密连接网络包括:将测试样本输入训练后的稠密连接网络对测试样本中的数据进行识别,得到识别结果;依据识别结果判定训练后的稠密连接网络是否收敛;在判定结果为是的情况下,得到收敛的稠密连接网络。
具体的,将步骤S102中划分出的测试样本集输入到训练好的DenseNet网络模型中,测试模型的稳健性。最终模型在测试样本集上的识别率达到了0.9352,超过了卷积神经网络的0.8523。
综上,结合步骤S102至步骤S106,在实际应用中,水声数据的获取较为困难,出于保密原因,也很少有人在网上公开发表获取到的水声数据集,因此水声目标数据比较稀少,而本申请实施例提供构建水声目标识别模型的方法中提出的模型利用密集连接结构,极大地加强了特征重用,有效地解决了水声样本少的问题。此外,在传统统计模型中,往往需要手动选择要提取什么样的特征,因此能否提取到高质量的特征直接影响了最终的识别结果,而本申请实施例提供构建水声目标识别模型的方法采用的是神经网络,摆脱了繁重的特征工程,模型可以根据输入波形主动去学习相应特征,完成水声目标识别任务。
本发明实施例中,基于选择水声数据样本,并将水声数据样本分为训练样本和测试样本;通过训练样本训练稠密连接网络,得到训练后的稠密连接网络;将测试样本输入训练后的稠密连接网络,得到收敛的稠密连接网络。也就是说,本发明实施例能够解决了水声样本不足的问题,从而避免复杂繁重的特征工程,并且极大地加强了特征重用,在一定程度上缓解了水声样本不足的技术效果。
根据本发明实施例的另一个方面,提供了一种构建水声目标识别模型的装置,图3为本发明实施例提供的一种构建水声目标识别模型的装置的示意图,如图3所示,本申请实施例提供的构建水声目标识别模型的装置包括:选择模块32,用于选择水声数据样本,并将水声数据样本分为训练样本和测试样本;训练模块34,用于通过训练样本训练稠密连接网络,得到训练后的稠密连接网络;识别模块36,用于将测试样本输入训练后的稠密连接网络,得到收敛的稠密连接网络。
可选的,选择模块32包括:选择单元,用于选择至少三类水声目标作为水声数据样本;分类单元,用于依据预设比例将水声数据样本进行分类,得到训练样本和测试样本。
可选的,本申请实施例提供的构建水声目标识别模型的装置还包括:构建模块,用于构建稠密连接网络,其中,稠密连接网络包括:Steam模块、密集连接模块、TransitionLayer模块和分类模块。
进一步地,可选的,本申请实施例提供的构建水声目标识别模型的装置还包括:参数确定模块,用于确定网络的超参数,其中,超参数包括损失函数,学习率、迭代次数及批大小;损失函数包括:交叉熵损失函数。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种构建水声目标识别模型的方法,其特征在于,包括:
选择水声数据样本,并将所述水声数据样本分为训练样本和测试样本;
通过所述训练样本训练稠密连接网络,得到训练后的所述稠密连接网络;
将所述测试样本输入训练后的所述稠密连接网络,得到收敛的所述稠密连接网络。
2.根据权利要求1所述的方法,其特征在于,所述选择水声数据样本,并将所述水声数据样本分为训练样本和测试样本包括:
选择至少三类水声目标作为所述水声数据样本;
依据预设比例将所述水声数据样本进行分类,得到所述训练样本和所述测试样本。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
构建所述稠密连接网络,其中,所述稠密连接网络包括:Steam模块、密集连接模块、Transition Layer模块和分类模块。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
确定网络的超参数,其中,所述超参数包括损失函数,学习率、迭代次数及批大小;所述损失函数包括:交叉熵损失函数。
5.根据权利要求4所述的方法,其特征在于,所述通过所述训练样本训练稠密连接网络,得到训练后的所述稠密连接网络包括:
通过输入所述训练样本对所述稠密连接网络进行训练,得到所述训练样本对应的标签以及训练后的所述稠密连接网络。
6.根据权利要求5所述的方法,其特征在于,所述将所述测试样本输入训练后的所述稠密连接网络,得到收敛的所述稠密连接网络包括:
将所述测试样本输入训练后的所述稠密连接网络对所述测试样本中的数据进行识别,得到识别结果;
依据所述识别结果判定训练后的所述稠密连接网络是否收敛;
在判定结果为是的情况下,得到收敛的所述稠密连接网络。
7.一种构建水声目标识别模型的装置,其特征在于,包括:
选择模块,用于选择水声数据样本,并将所述水声数据样本分为训练样本和测试样本;
训练模块,用于通过所述训练样本训练稠密连接网络,得到训练后的所述稠密连接网络;
识别模块,用于将所述测试样本输入训练后的所述稠密连接网络,得到收敛的所述稠密连接网络。
8.根据权利要求7所述的装置,其特征在于,所述选择模块包括:
选择单元,用于选择至少三类水声目标作为所述水声数据样本;
分类单元,用于依据预设比例将所述水声数据样本进行分类,得到所述训练样本和所述测试样本。
9.根据权利要求7或8所述的装置,其特征在于,所述装置还包括:
构建模块,用于构建所述稠密连接网络,其中,所述稠密连接网络包括:Steam模块、密集连接模块、Transition Layer模块和分类模块。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
参数确定模块,用于确定网络的超参数,其中,所述超参数包括损失函数,学习率、迭代次数及批大小;所述损失函数包括:交叉熵损失函数。
CN202210792171.7A 2022-07-07 2022-07-07 构建水声目标识别模型的方法和装置 Pending CN115238738A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210792171.7A CN115238738A (zh) 2022-07-07 2022-07-07 构建水声目标识别模型的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210792171.7A CN115238738A (zh) 2022-07-07 2022-07-07 构建水声目标识别模型的方法和装置

Publications (1)

Publication Number Publication Date
CN115238738A true CN115238738A (zh) 2022-10-25

Family

ID=83670843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210792171.7A Pending CN115238738A (zh) 2022-07-07 2022-07-07 构建水声目标识别模型的方法和装置

Country Status (1)

Country Link
CN (1) CN115238738A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116108353A (zh) * 2023-04-12 2023-05-12 厦门大学 一种基于数据分组的小样本深度学习水声目标识别方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116108353A (zh) * 2023-04-12 2023-05-12 厦门大学 一种基于数据分组的小样本深度学习水声目标识别方法

Similar Documents

Publication Publication Date Title
CN108922560B (zh) 一种基于混合深度神经网络模型的城市噪声识别方法
CN109065030B (zh) 基于卷积神经网络的环境声音识别方法及系统
CN112216271B (zh) 一种基于卷积块注意机制的视听双模态语音识别方法
CN109559736B (zh) 一种基于对抗网络的电影演员自动配音方法
CN113488058B (zh) 一种基于短语音的声纹识别方法
CN110751044A (zh) 基于深度网络迁移特征与增广自编码的城市噪声识别方法
CN108198561A (zh) 一种基于卷积神经网络的翻录语音检测方法
CN116206185A (zh) 一种基于改进YOLOv7的轻量级小目标检测方法
CN117095694B (zh) 一种基于标签层级结构属性关系的鸟类鸣声识别方法
CN102810311A (zh) 说话人估计方法和说话人估计设备
CN116699096B (zh) 一种基于深度学习的水质检测方法和系统
CN111061873B (zh) 一种基于Attention机制的多通道的文本分类方法
CN115238738A (zh) 构建水声目标识别模型的方法和装置
CN113823293A (zh) 一种基于语音增强的说话人识别方法及系统
CN114234061B (zh) 一种基于神经网络的带压运行供水管道漏水音智能判别方法
CN113129908B (zh) 基于循环帧级特征融合的端到端猕猴声纹验证方法及系统
CN112035700B (zh) 一种基于cnn的语音深度哈希学习方法及系统
CN110580915B (zh) 基于可穿戴式设备的声源目标识别系统
CN114999525A (zh) 一种基于神经网络的轻量环境声音识别方法
CN110444225B (zh) 基于特征融合网络的声源目标识别方法
CN117275510A (zh) 一种基于多梯度流网络的小样本水声目标识别方法及系统
CN116884435A (zh) 一种基于音频提示学习的声音事件检测方法及装置
CN115909040A (zh) 一种基于自适应多特征融合模型的水声目标识别方法
CN113782051B (zh) 广播效果分类方法及系统、电子设备和存储介质
CN115293214A (zh) 一种基于样本扩充网络的水声目标识别模型优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination