CN111444832A - 基于卷积神经网络的鲸鱼叫声分类方法 - Google Patents

基于卷积神经网络的鲸鱼叫声分类方法 Download PDF

Info

Publication number
CN111444832A
CN111444832A CN202010220423.XA CN202010220423A CN111444832A CN 111444832 A CN111444832 A CN 111444832A CN 202010220423 A CN202010220423 A CN 202010220423A CN 111444832 A CN111444832 A CN 111444832A
Authority
CN
China
Prior art keywords
whale
neural network
training
convolutional neural
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010220423.XA
Other languages
English (en)
Inventor
李秀坤
徐天杨
于歌
黄健儿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202010220423.XA priority Critical patent/CN111444832A/zh
Publication of CN111444832A publication Critical patent/CN111444832A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供一种基于卷积神经网络的鲸鱼叫声分类方法,实现了对水下鲸鱼叫声信号的分类与识别。本发明利用分数阶傅里叶变换和线性调频小波变换提取鲸鱼叫声信号的时频特征,将其作为卷积神经网络的输入,进行网络模型的训练。通过对数据集进行有放回的抽取,得到多组数据集的子集,分别采用不同的网络结构对得到的数据集进行训练,得到不同的基模型。采用集成学习方式对得到的基模型进行结合,获得比单学习器更优越的性能,提高了目标的识别率。

Description

基于卷积神经网络的鲸鱼叫声分类方法
技术领域
本发明涉及一种基于卷积神经网络的鲸鱼叫声分类方法,属于水下目标分类领域。
背景技术
水声信号的分类识别是水声信号处理领域的热点问题,对于海洋生物信的声号检测尤其是海洋哺乳动物声信号的研究不仅为海洋开发以及水下设备研制提供重要的依据,而且对海洋生态环境以及海洋哺乳动物的保护方面的研究也具有重要意义。特征提取是影响水下目标信号识别的关键因素,对于非平稳的鲸鱼叫声信号,时频分析是研究其时域特性以及频率特征的有效方法。
分数阶傅里叶变换可以看作广义的傅里叶变换,是一种时频分析的有效工具。分数阶傅里叶变换早起应用于光学领域,近年来在信号处理领域已经得到迅速发展。在信号检测与参数估计方面,以完备正交的调频信号作为基函数,在匹配阶次域上,通过提取峰值参数可以实现线性调频信号的参数估计。利用线性调频信号在分数阶域最优阶次两侧的幅度特性,采用多分辨搜索方法可以快速搜索峰值位置。分数及傅里叶变换的时频旋转特性在几何角度阐述了分数阶的变换特点。在海杂波背景下应用分数阶傅里叶变变换可以实现小目标检测。分数阶傅里叶变换可以对具有线性调频特性的目标信号进行处理。
线性调频小波变换是一种参数化时频分析方法,可以根据信号的先验信息构造匹配的变换核,通过选择适当的参数获得集中性高且不存在交叉项干扰的时频表示。线性调频小波变换可以在时频面上利用任意斜率的直线来拟合时频曲线。对于分平稳的鲸鱼叫声信号,其包络与线性调频小波基的包络具有较高的匹配度,通过引入快速线性调频小波变换,构造一系列子小波滤波器对连续函数进行离散分析,将小波变换中的窗函数替换为线调频母小波窗函数,进行滤波即可得到的谱图为快速线调频小波变换谱图。采用线性调频小波变换通过上述方法对对鲸鱼叫声信号进行特征提取。
基于深度学习的特征提取是一种抽象特征的层次化学习方法。通过对样本数据的内在规律进行表征,形成表示属性的类别或特征,实现对数据的分布式特征表示,目前已经发展出多种深度学习框架,如卷积神经网络、深度置信网络以及递归神经网络等。这些结构已经成功应用于计算机视觉、语音识别以及生物信息学等领域。其中卷积神经网络取得了优秀的效果。卷积神经网络依靠自身的层次结构,通过层层迭代,对多维特征进行高度抽象,有助于提取目标的稳健特征。AlexNet模型和深度卷积神经网络在图像识别领域均取得良好效果。AlexNet采用线性整流函数作为激活函数,从根本上解决了梯度消失问题。残差网络不同于传统的网络结构,引入了残差的概念,通过对残差块的堆叠组成了残差网络结构,使得网络达到更深的层次,同时提升了性能。
在水下目标检测与识别领域,采用深度置信网络解决了被动声呐的水下目标识别问题;用于水声目标特征学习与识别的混合正则化深度置信网络,可以提高水声目标识别的正确率。采用改进的卷积神经网络水下目标识别框架,可以有效提高目标的识别率。在海洋动物的叫声分类的研究中,采用长短时记忆系统应用于鼠海豚的分类识别;应用受限玻尔兹曼机和稀疏自编码器对五种海洋哺乳动物叫声进行分类,在高信噪比下准确率达到较高识别率。
采用经典信号处理中的方法对鲸鱼叫声信号进行特征提取,以叫声数据的时频分布图像最为卷积神经网络的输入特征,分别采用不同的网络结构对模型进行训练,得到不同网络模型下对鲸鱼叫声信号的识别率。对得到的多个网络模型进行模型融合,提升机器学习的性能,提高对鲸鱼叫声信号的识别率。
发明内容
本发明的目的是为了提供一种基于卷积神经网络的鲸鱼叫声分类方法。
本发明的目的是这样实现的:步骤如下:
步骤1:对采集数据进行预处理:采用DCLDE2015和Mobysound的公开数据集,对采集数据进行剪切和提取,使得每段信号的时间长度在3-5秒;
步骤2:使用采样率变换的方法,对提取到的鲸鱼叫声信号进行采样率的统一;
步骤3:采用分数阶傅里叶变换方法进行特征提取;
步骤4:采用线性调频小波变换方法进行特征提取;
步骤5:令i=0,对提取到的鲸鱼叫声信号数据集H1、H2进行划分;随机抽取70%的原始数据集,将其划分为训练集和验证集,其中训练集数据占抽取数据总数的80%,验证集数据占抽取总数据的20%;四类含标签的数据均按照上述比例分配,将得到的数据集命名为H1-i和H2-i。
步骤6:令i←i+1,判断i<10是否成立:若成立,则执行步骤5;否则执行步骤7;
步骤7:采用AlexNet网络结构对得到的所有数据集分别进行训练,训练回合数为100;
步骤8:采用残差网络结构对上述数据集分别进行训练,训练回合数为100;
步骤9:对训练得到的40个网络模型,模型采用相同的权重,通过投票方式进行模型集成学习;
步骤10:得到最终的网络模型M,用于实测数据的分类。
本发明还包括这样一些结构特征:
1.步骤2将采样频率统一变换为2000Hz。
2.步骤3具体为:对信号做分数阶傅里叶变换,得到鲸鱼叫声信号在分数阶傅里叶变换域的时频分布特性图,将其保存为224*224的图片文件,并将此特征命名为H1,H1中包含有标签的四类鲸鱼叫声数据。
3.步骤4具体为:对信号做线性调频小波变换,得到鲸鱼叫声信号在时间-频率平面的分布特性图,将其保存为224*224的图片文件,将此特征命名为H2,H2中包含有标签的四类鲸鱼叫声数据。
4.步骤7中训练得到的模型分别记为A1-1、A1-2、…、A1-10、A2-1、A2-2、…、A2-10,共得到20个训练模型,记录每个模型的性能,包括训练集准确率、测试集准确率、召回率、F1值和受试者工作特性曲线下的面积。
5.步骤8得到的模型分别为R1-1、R1-2、…、R1-10、R2-1、R2-2、…、R2-10,得到20个训练模型,记录模型性能参数。
与现有技术相比,本发明的有益效果是:本发明实现了对水下鲸鱼叫声信号的分类与识别。本发明利用分数阶傅里叶变换和线性调频小波变换提取鲸鱼叫声信号的时频特征,将其作为卷积神经网络的输入,进行网络模型的训练。通过对数据集进行有放回的抽取,得到多组数据集的子集,分别采用不同的网络结构对得到的数据集进行训练,得到不同的基模型。采用集成学习方式对得到的基模型进行结合,获得比单学习器更优越的性能,提高了目标的识别率。
附图说明
图1为本发明执行流程图。
图2为分数阶傅里叶变换域中仿真鲸鱼呼叫信号的分布。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述。
齿鲸通过嘴唇发出声音,功能与人类的鼻腔相似。齿鲸通过嘴唇振动产生滴答声、哨声和短促信号[1]。须鲸利用喉部发声,通过收缩胸部和喉部肌肉改变声音的频率和幅度。座头鲸和宽吻海豚可以通过拍打尾巴产生30-12kHz的宽带信号[2]。齿鲸可以发出0.2kHz到150kHz的滴答声用于导航和食物狩猎,高频的滴答声可以传递目标的尺寸、形状、速度等信息,低频叫声多用于远距离通信交流。齿鲸可以发出哨叫声与同伴交流,传递猎物和自己的位置信息。海豚发出的哨叫声是每只海豚独有的,与人类的声纹相似,可以作为区分彼此的重要特征。须鲸的叫声频率多数低于5kHz,其低频部分在2-200Hz之间,包括呻吟声、呼噜声、哭声和歌声等。项目主要以须鲸叫声信号为研究目标,对蓝鲸、长须鲸、弓头鲸和座头鲸四类鲸鱼低频叫声数据进行分析。
鲸鱼叫声通常携带了很多信息,需要对鲸鱼叫声进行数学建模。目标信号可以视为一种多项式相位信号,可以表示为式(1)所示:
Figure BDA0002425873740000041
式中,A(t)为随时间变化的幅度,
Figure BDA0002425873740000042
为多项式相位,am为多项式系数,对于二次相位信号(m=2),a0即为起始频率,a1为斜率,a2为曲率。
对于复杂的鲸鱼叫声,例如露脊鲸鲸歌,可以表示为更复杂多项式相位模型,如式(2)所示:
Figure BDA0002425873740000043
式中,
Figure BDA0002425873740000044
为时刻t的第q个谐波信号,si为第i帧信号,大多数的生物信号都可以描述为上述参数模型。
线调频小波变换:
线调频小波变换是一种常见的参数化时频分析方法。它可以在时频面上利用可以任意角度倾斜的直线来拟合任意一条时频曲线,适合分析处理线性调频信号。线调频小波变换的本质是将信号s(t)∈L2(R)投影到一簇线调频小波函数g(t)。在内积空间上可表示为式(3):
CTs(tc,fc,Δt,c)=<z(t),h(t)> (3)
其中tc为时间中心;c为线调频参数;z(t)为信号s(t)的解析信号,h(t)为线调频母小波基函数,定义为,
Figure BDA0002425873740000045
其中gσ(t)是时宽为σ且进行单位L2正则的高斯函数,即
Figure BDA0002425873740000046
Figure BDA0002425873740000047
可得
Figure BDA0002425873740000051
可代入式(3)中得
Figure BDA0002425873740000052
根据鲸鱼叫声参数模型,以蓝鲸D呼叫信号为例,研究线调频小波变换对鲸鱼叫声信号的特征提取问题。D呼叫是蓝鲸的一种典型叫声,可以用二次调频信号进行仿真,表示为
Figure BDA0002425873740000053
采用汉宁窗
Figure BDA0002425873740000054
相乘得仿真鲸鱼信号
Figure BDA0002425873740000055
其中fD表频率;CD表示调频斜率;dD表示叫声的持续时间;τD表示时延。
分数阶傅里叶变换:
分数阶傅里叶变换是一种积分变换,适用于处理具有线性调频特性的非平稳信号。信号x(t)的p阶分数阶傅里叶变换Xp(u)具有如下定义
Figure BDA0002425873740000056
其中
Figure BDA0002425873740000057
是分数阶傅里叶变换核函数,可以表示为:
Figure BDA0002425873740000058
其中
Figure BDA0002425873740000059
是幅度因子,α=pπ/2为变换的旋转角度,p为变换阶次,n为任意整数。分数阶傅里叶变换是一种同一的时频分析方法,能在时域和频域之间的变换域上提供更多的信号特征。从时频平面上看,分数阶傅里叶变换可以看作将时频坐标轴以角度α做逆时针旋转,然后将信号的时频分布向横坐标投影,投影结果即为分数阶傅里叶变换结果。当旋转后的横坐标与信号的时频分布线垂直时,变换结果呈冲激形式,信号能量集中在一个脉冲上。此时相应的阶数称为最优分数阶变换阶数变换的结果为最佳分数阶傅里叶变换域。
在鲸鱼呼叫信号模型具有二次调频的特性,因此该信号在较短的时间窗口内近似呈现出调频的特性。以蓝鲸呼叫信号为例,从时频平面投影的物理意义来看,该呼叫信号具有幅度变化,导致时频平面上信号能量的分布不同于线性调频信号;但分布仍呈现对角线段。蓝鲸呼叫信号仍将在最佳分数阶傅立叶变换域中达到峰值。在非最优分数阶傅里叶变换域中,主峰将加宽,并且根据帕斯瓦尔准则,该值将小于最优分数阶傅里叶变换域中的最大值。附图2显示了分数阶傅里叶变换域中仿真鲸鱼呼叫信号的分布,这与线性调频信号的时频分布相似,但该分布在分数阶傅里叶变换域中有多个峰值。也就是说,对于在参数位置处的鲸鱼呼叫信号,仍可以通过在(p,u)平面上搜索最大值来确定信号的二维特性。
对于具有二次调频的蓝鲸呼叫信号,其分数阶傅里叶变换具有叠加特性。在分数傅里叶变换域中,有两个最大值。根据变换关系,可以确定对应于两个最大值的中心频率和频率调制斜率。因而,在一定情况下,不同鲸鱼叫声在分数阶傅里叶变换分布中具有显着差异。蓝鲸,弓头鲸和座头鲸这三种鲸鱼的叫声在分布形式上是相似的,但是在分数域中能量峰点的位置存在显着差异,可以用作区分三种鲸鱼叫声的训练特征。
卷积神经网络的构建:
卷积神经网络是一种专门具有局部连接、权重共享等特性的深度前馈神经网络。卷积神经网络有别于其他神经网络模型(如递归神经网络、深度神经网络),其最主要的特点是卷积运算操作。由卷积层、激活函数、池化层、全连接层交叉堆叠而成。卷积神经网络有三个结构上的特性:局部连接,权重共享以及降采样。本发明采用的是二维卷积神经网络。
卷积神经网络中通常只涉及离散卷积情况,以图像处理中常用的二维卷积为例,给定图像
Figure BDA0002425873740000061
和滤波器
Figure BDA0002425873740000062
一般m<<M,n<<N,其卷积为
Figure BDA0002425873740000063
式中w为滤波器或者卷积核,x为信号序列,m为滤波器长度,n为信号序列长度。卷积层由多个特征面组成,每个特征面有多个神经元,神经元通过卷积核与上一层特征面的局部区域连接。对于二维图像经过卷积操作后得到的结果成为特征映射。
池化层根据人的视觉系统对输入进行降采样与抽象处理。在卷积层中减少了网络中的连接数量,然而特征映射组中的神经元个数没有减少,通过在卷积层之后加上一个池化层可以降低维数,避免过拟合。池化层的主要功能可归纳为:特征不变性、降维和防止过拟合。假设池化层的输入特征映射组为
Figure BDA0002425873740000064
对于其中每一个特征映射Xd,划分为多个区域
Figure BDA0002425873740000065
1≤m≤M′,1≤n≤N′,区域可以重叠。池化层对每个区域进行下采样得到的一个值,作为这个区域的概括。本发明中应用的卷积神经网络采用的汇聚函数是最大值池化。
在卷积神经网络结构中,经过若干个卷积层和池化层后,连接着一个或一个以上的全连接层。全连接层中的神经元连接方式是将每一个神经元与前一层的所有神经元进行全连接。卷积层和池化层的操作是将原始数据映射到隐含的特征空间,全连接层的每个神经元通常采用线性整流函数作为非线性激活函数。本发明中采用AlexNet网络,网络的各层分别为:输入层、卷积层、归一化层、最大池化层、卷积层、归一化层、最大池化层、卷积层、卷积层、卷积层、最大池化层、全连接层、随机失活层、全连接层、随机失活层、全连接层、随机失活层、全连接层。残差网络中引入了残差结构,网络由含有残差模块的结构顺序组成。
将采用分数阶傅里叶变换方法和线性调频小波变换方法提取得到的鲸鱼叫声数据时频图像保存为带有标签的数据集,作为卷积神经网络的输入,由网络模型对数据集进行读取,执行训练过程。
在网络模型的集合学习过程中,通过将多个学习器进行结合,获得比单一学习器更优越的泛化性能。采用投票法,若有超过半数的基分类器正确,则集成分类正确。假设分类器错误率相互独立,集成的错误率可以表示为
Figure BDA0002425873740000071
即随着集成中个体分类器数目的T的增加,集成的错误率将指数级下降。根据个体学习器生成方式,个体学习器间不存在强依赖关系,可同时生成的并行化方法,可以采用Bagging或随机森林方法。给定包含m个随机样本的数据集,随机抽取样本放入采样集中,再把该样本放回初始数据集,使得下次采样时该样本仍有被选中的机会,经过m次随机采样操作,得到含有m个样本的采样集,初始训练集中有的样本在采样集中多次出现,有的则未出项在采样集中。可采样出T个含m个训练样本的采样集,基于每个采样集训练出一个基学习器,将这些基学习器进行集成,可以得到性能更优的学习器。采用的结合策略是投票法,将hi在样本x上的预测输出表示为一个N维向量
Figure BDA0002425873740000072
其中
Figure BDA0002425873740000073
为hi在类别标记cj上的输出。绝对多数投票法表示为若某标记的票数超过半数,则预测为该标记;否则拒绝预测。对一些能在预测出类别标记的同时产生分类置信度的学习器,其分类置信度可转化为类概率使用。若学习器的类型不同,则其类概率值不能直接进行比较,此时可将类概率输出转化为类标记输出,然后进行投票。
本发明是一种基于卷积神经网络的鲸鱼叫声分类方法,采用分数阶傅里叶变换和线性调频小波变换方法,提取鲸鱼叫声信号的时频分布特征,将获取的特征图像作为二维卷积神经网络的输入进行分类和识别;提出了步骤1到步骤12的处理过程,可以实现鲸鱼叫声的分类。
步骤1:对采集数据进行预处理:采用DCLDE2015和Mobysound的公开数据集,对采集数据进行剪切和提取,使得每段信号的时间长度在3-5秒。
步骤2:使用采样率变换的方法,对提取到的鲸鱼叫声信号进行采样率的统一。此处将采样频率统一变换为2000Hz。
步骤3:采用分数阶傅里叶变换方法进行特征提取:对信号做分数阶傅里叶变换,得到鲸鱼叫声信号在分数阶傅里叶变换域的时频分布特性图,将其保存为224*224的图片文件,并将此特征命名为H1,H1中包含有标签的四类鲸鱼叫声数据。
步骤4:采用线性调频小波变换方法进行特征提取:对信号做线性调频小波变换,得到鲸鱼叫声信号在时间-频率平面的分布特性图,将其保存为224*224的图片文件,将此特征命名为H2,H2中包含有标签的四类鲸鱼叫声数据。
步骤5:令i=0。对提取到的鲸鱼叫声信号数据集H1、H2进行划分。随机抽取70%的原始数据集,将其划分为训练集和验证集,其中训练集数据占抽取数据总数的80%,验证集数据占抽取总数据的20%。四类含标签的数据均按照上述比例分配,将得到的数据集命名为H1-i和H2-i。
步骤6:令i←i+1,判断i<10是否成立.若成立,则执行步骤5,否则执行步骤7。
步骤7:采用AlexNet网络结构对得到的所有数据集分别进行训练,训练回合数为100。训练得到的模型分别记为A1-1、A1-2、…、A1-10、A2-1、A2-2、…、A2-10,共得到20个训练模型。记录每个模型的性能,包括训练集准确率、测试集准确率、召回率、F1值和受试者工作特性曲线下的面积。
步骤8:采用残差网络结构对上述数据集分别进行训练,训练回合数为100。得到的模型分别为R1-1、R1-2、…、R1-10、R2-1、R2-2、…、R2-10,得到20个训练模型,记录模型性能参数。
步骤9:对训练得到的40个网络模型,模型采用相同的权重,通过投票方式进行模型集成学习。
步骤10:得到最终的网络模型M,训练过程结束。
步骤11:此时可以使用训练完成的网络模型,用于实测数据的分类。
步骤12:结束。
综上,本发明提出了一种基于卷积神经网络的鲸鱼叫声信号分类方法,实现了对水下鲸鱼叫声信号的分类与识别。本发明利用分数阶傅里叶变换和线性调频小波变换提取鲸鱼叫声信号的时频特征,将其作为卷积神经网络的输入,进行网络模型的训练。通过对数据集进行有放回的抽取,得到多组数据集的子集,分别采用不同的网络结构对得到的数据集进行训练,得到不同的基模型。采用集成学习方式对得到的基模型进行结合,获得比单学习器更优越的性能,提高了目标的识别率。

Claims (6)

1.基于卷积神经网络的鲸鱼叫声分类方法,其特征在于:步骤如下:
步骤1:对采集数据进行预处理:采用DCLDE2015和Mobysound的公开数据集,对采集数据进行剪切和提取,使得每段信号的时间长度在3-5秒;
步骤2:使用采样率变换的方法,对提取到的鲸鱼叫声信号进行采样率的统一;
步骤3:采用分数阶傅里叶变换方法进行特征提取;
步骤4:采用线性调频小波变换方法进行特征提取;
步骤5:令i=0,对提取到的鲸鱼叫声信号数据集H1、H2进行划分;随机抽取70%的原始数据集,将其划分为训练集和验证集,其中训练集数据占抽取数据总数的80%,验证集数据占抽取总数据的20%;四类含标签的数据均按照上述比例分配,将得到的数据集命名为H1-i和H2-i。
步骤6:令i←i+1,判断i<10是否成立:若成立,则执行步骤5;否则执行步骤7;
步骤7:采用AlexNet网络结构对得到的所有数据集分别进行训练,训练回合数为100;
步骤8:采用残差网络结构对上述数据集分别进行训练,训练回合数为100;
步骤9:对训练得到的40个网络模型,模型采用相同的权重,通过投票方式进行模型集成学习;
步骤10:得到最终的网络模型M,用于实测数据的分类。
2.根据权利要求1所述的基于卷积神经网络的鲸鱼叫声分类方法,其特征在于:步骤2将采样频率统一变换为2000Hz。
3.根据权利要求1或2所述的基于卷积神经网络的鲸鱼叫声分类方法,其特征在于:步骤3具体为:对信号做分数阶傅里叶变换,得到鲸鱼叫声信号在分数阶傅里叶变换域的时频分布特性图,将其保存为224*224的图片文件,并将此特征命名为H1,H1中包含有标签的四类鲸鱼叫声数据。
4.根据权利要求3所述的基于卷积神经网络的鲸鱼叫声分类方法,其特征在于:步骤4具体为:对信号做线性调频小波变换,得到鲸鱼叫声信号在时间-频率平面的分布特性图,将其保存为224*224的图片文件,将此特征命名为H2,H2中包含有标签的四类鲸鱼叫声数据。
5.根据权利要求4所述的基于卷积神经网络的鲸鱼叫声分类方法,其特征在于:步骤7中训练得到的模型分别记为A1-1、A1-2、…、A1-10、A2-1、A2-2、…、A2-10,共得到20个训练模型,记录每个模型的性能,包括训练集准确率、测试集准确率、召回率、F1值和受试者工作特性曲线下的面积。
6.根据权利要求5所述的基于卷积神经网络的鲸鱼叫声分类方法,其特征在于:步骤8得到的模型分别为R1-1、R1-2、…、R1-10、R2-1、R2-2、…、R2-10,得到20个训练模型,记录模型性能参数。
CN202010220423.XA 2020-03-25 2020-03-25 基于卷积神经网络的鲸鱼叫声分类方法 Pending CN111444832A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010220423.XA CN111444832A (zh) 2020-03-25 2020-03-25 基于卷积神经网络的鲸鱼叫声分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010220423.XA CN111444832A (zh) 2020-03-25 2020-03-25 基于卷积神经网络的鲸鱼叫声分类方法

Publications (1)

Publication Number Publication Date
CN111444832A true CN111444832A (zh) 2020-07-24

Family

ID=71650764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010220423.XA Pending CN111444832A (zh) 2020-03-25 2020-03-25 基于卷积神经网络的鲸鱼叫声分类方法

Country Status (1)

Country Link
CN (1) CN111444832A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111986668A (zh) * 2020-08-20 2020-11-24 深圳市一本电子有限公司 使用车载充电器的ai语音智能控制物联网方法
CN112147601A (zh) * 2020-09-03 2020-12-29 南京信息工程大学 一种基于随机森林的海面小目标检测方法
CN113643722A (zh) * 2021-08-27 2021-11-12 杭州电子科技大学 一种基于多层矩阵随机神经网络的城市噪声识别方法
CN113870870A (zh) * 2021-12-02 2021-12-31 自然资源部第一海洋研究所 一种基于卷积神经网络的海洋哺乳动物发声实时识别方法
CN115935172A (zh) * 2023-01-06 2023-04-07 湖南董因信息技术有限公司 一种基于集成深度学习的信号识别方法
CN116660876A (zh) * 2023-05-26 2023-08-29 吉林大学 一种中华白海豚回声定位信号自动检测和定位方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102788969A (zh) * 2012-07-04 2012-11-21 中国人民解放军海军航空工程学院 基于短时分数阶傅里叶变换的海面微动目标检测和特征提取方法
CN108523873A (zh) * 2018-01-31 2018-09-14 北京理工大学 基于分数阶傅里叶变换和信息熵的心电信号特征提取方法
CN108714026A (zh) * 2018-03-27 2018-10-30 杭州电子科技大学 基于深度卷积神经网络和在线决策融合的细粒度心电信号分类方法
CN109063559A (zh) * 2018-06-28 2018-12-21 东南大学 一种基于改良区域回归的行人检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102788969A (zh) * 2012-07-04 2012-11-21 中国人民解放军海军航空工程学院 基于短时分数阶傅里叶变换的海面微动目标检测和特征提取方法
CN108523873A (zh) * 2018-01-31 2018-09-14 北京理工大学 基于分数阶傅里叶变换和信息熵的心电信号特征提取方法
CN108714026A (zh) * 2018-03-27 2018-10-30 杭州电子科技大学 基于深度卷积神经网络和在线决策融合的细粒度心电信号分类方法
CN109063559A (zh) * 2018-06-28 2018-12-21 东南大学 一种基于改良区域回归的行人检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张冠华: "基于卷积神经网络的鲸鱼叫声分类研究", 《中国优秀硕士学位论文全文数据库 基础科学辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111986668A (zh) * 2020-08-20 2020-11-24 深圳市一本电子有限公司 使用车载充电器的ai语音智能控制物联网方法
CN112147601A (zh) * 2020-09-03 2020-12-29 南京信息工程大学 一种基于随机森林的海面小目标检测方法
CN112147601B (zh) * 2020-09-03 2023-05-26 南京信息工程大学 一种基于随机森林的海面小目标检测方法
CN113643722A (zh) * 2021-08-27 2021-11-12 杭州电子科技大学 一种基于多层矩阵随机神经网络的城市噪声识别方法
CN113643722B (zh) * 2021-08-27 2024-04-19 杭州电子科技大学 一种基于多层矩阵随机神经网络的城市噪声识别方法
CN113870870A (zh) * 2021-12-02 2021-12-31 自然资源部第一海洋研究所 一种基于卷积神经网络的海洋哺乳动物发声实时识别方法
JP7180838B1 (ja) * 2021-12-02 2022-11-30 自然資源部第一海洋研究所 畳み込みニューラルネットワークに基づく海洋哺乳類鳴音のリアルタイム識別方法
CN115935172A (zh) * 2023-01-06 2023-04-07 湖南董因信息技术有限公司 一种基于集成深度学习的信号识别方法
CN116660876A (zh) * 2023-05-26 2023-08-29 吉林大学 一种中华白海豚回声定位信号自动检测和定位方法

Similar Documents

Publication Publication Date Title
CN111444832A (zh) 基于卷积神经网络的鲸鱼叫声分类方法
Liu et al. Underwater target recognition using convolutional recurrent neural networks with 3-D Mel-spectrogram and data augmentation
Kong et al. Weakly labelled audioset tagging with attention neural networks
Ghosh et al. A neural network based hybrid system for detection, characterization, and classification of short-duration oceanic signals
CN110307982B (zh) 基于CNN和Adaboost的轴承故障分类方法
Shabri et al. Daily crude oil price forecasting using hybridizing wavelet and artificial neural network model
CN112364779A (zh) 信号处理与深-浅网络多模型融合的水声目标识别方法
Le et al. Deep gabor neural network for automatic detection of mine-like objects in sonar imagery
Zhou et al. Deep learning based on striation images for underwater and surface target classification
Wei et al. A method of underwater acoustic signal classification based on deep neural network
Miao et al. Underwater acoustic signal classification based on sparse time–frequency representation and deep learning
Luo et al. An underwater acoustic target recognition method based on combined feature with automatic coding and reconstruction
CN107729926A (zh) 一种基于高维空间变换的数据扩增方法、机器识别系统
Tian et al. Joint learning model for underwater acoustic target recognition
Li et al. Data augmentation method for underwater acoustic target recognition based on underwater acoustic channel modeling and transfer learning
Mohankumar et al. Implementation of an underwater target classifier using higher order spectral features
Wang et al. Ship radiated noise recognition technology based on ML-DS decision fusion
WO2021237958A1 (zh) 基于特征提取和神经网络的水声目标测距方法
CN113640768A (zh) 一种基于小波变换的低分辨雷达目标识别方法
Liu et al. Design and performance evaluation of a deep neural network for spectrum recognition of underwater targets
Chinmayi et al. Emotion Classification Using Deep Learning
Farrokhrooz et al. Marine vessels acoustic radiated noise classification in passive sonar using probabilistic neural network and spectral features
Ju et al. A new low SNR underwater acoustic signal classification method based on intrinsic modal features maintaining dimensionality reduction
CN111401263B (zh) 一种融合专家知识的优效组合式调制识别方法
Liang et al. Automatic evaluation of internal combustion engine noise based on an auditory model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200724