CN108427958B - 基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法 - Google Patents

基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法 Download PDF

Info

Publication number
CN108427958B
CN108427958B CN201810104948.XA CN201810104948A CN108427958B CN 108427958 B CN108427958 B CN 108427958B CN 201810104948 A CN201810104948 A CN 201810104948A CN 108427958 B CN108427958 B CN 108427958B
Authority
CN
China
Prior art keywords
layer
underwater sonar
cnn
dbn
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810104948.XA
Other languages
English (en)
Other versions
CN108427958A (zh
Inventor
王兴梅
焦佳
孙博轩
王国强
刘安华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201810104948.XA priority Critical patent/CN108427958B/zh
Publication of CN108427958A publication Critical patent/CN108427958A/zh
Application granted granted Critical
Publication of CN108427958B publication Critical patent/CN108427958B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供的是一种基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法。(1)根据数据集中水下声纳图像的特点,生成深度信念网络DBN二维参数矩阵;(2)自适应调整卷积神经网络CNN滤波器权值矩阵的分布;(3)实现基于深度学习的自适应权值卷积神经网络水下声纳图像分类。本发明提出的基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法,可以解决CNN中滤波器权值初始化的随机问题,避免陷入局部最优,能更好的提高分类正确率,有一定的有效性。

Description

基于深度学习的自适应权值卷积神经网络水下声纳图像分类 方法
技术领域
本发明涉及的是一种水下目标分类方法,具体地说是一种水下声纳图像(underwater sonar image)的分类方法。
背景技术
近年来基于声纳图像的水下目标分类技术得到了极大地发展,其应用范围也越来越广泛。由于水下声纳图像对比度低、边缘模糊、弱纹理,图像质量不理想,这将严重影响水下声纳图像的分类,使其成为一个难题。国内外学者对水下声纳图像目标分类进行了深入研究,并取得了重要的成果。其中在已有的文献中最著名和效果最好的分类方法主要包括:1.基于图像分割和纹理特征的水下声纳图像分类:2012年Khidkikar Mahesh,Balasubramanian Ramprasad.Segmentation and classification of side-scan sonardata.Lecture Notes in Computer Science,2012,22(7):841-849.提出将水下声纳图像分割,在分割区域计算其纹理特征,最后分别将水下声纳图像分为岩石,残骸,沉积物和海床四大类,分类效果较好。2.基于SVM的水下声纳图像分类:2013年Li Ke,Li Chonglun,Zhang Wei.Research of Diver Sonar Image Recognition Based on Support VectorMachine.Advanced Materials Research,Guangzhou,China.2013,785:1437-1440.提出采用SVM方法作为分类器,根据潜水者的特点将平均尺度、速度、形状、方向、夹角作为五维特征向量输入到分类器中进行分类,实验结果较好。3.基于图像特征的水下声纳图像分类:2014年Zhu Zhaotong,Xu Xiaomei,Yang Liangliang,et al.A model-based Sonar imageATR method based on SIFT features.OCEANS 2014,Taiwan.2014:1-4.提出根据缩放不变特征变换,提取图像特征进行单类匹配图像,得到了较高分类正确率。4.结合核函数提取特征和SVM分类器的水下声纳图像分类方法:2016年Rhinelander Jason.Featureextraction and target classification of side-scan sonar images.2016IEEESymposium Series on Computational Intelligence,Greece,2016:1-6.提出采用核函数提取特征,SVM对水下声纳图像进行分类,获得了很好的分类性能。5.结合核的极限学习机和PCA原理的水下声纳图像分类方法:2017年Zhu Mingcui,Song Yan,Guo Jia.PCA andKernel-based Extreme Learning Machine for Side-Scan Sonar ImageClassification.2017IEEE OES International Symposium on Underwater Technology,Korea,2017:1-4.提出基于核的极限学习机和PCA原理提出了一种新型分类系统用于水下声纳图像分类,实验结果表明,所提出的方法稳定性好,分类正确率高。
传统水下声纳图像分类方法是采取不同的提取特征方法来完成的分类,但特定的某种特征提取方法不能考虑到水下声纳图像所有的有用信息,造成水下声纳图像分类的瓶颈。另外,由于水下声纳图像的成像原因,使水下声纳图像的目标难以从阴影部分和海底混响区域中分割出来,再加上海底情况复杂,噪声多,这就使海底目标的分类变得困难。目前对水下声纳图像分类这部分的工作还处于初级阶段,海底情况复杂,每次声纳在海底拍摄到的图像都不一样,即使一类的图像也是各种角度,这就进一步增加了水下声纳图像分类的难度。而深度学习模型是通过内部网络结构自动提取图像特征,根据深度学习模型自动提取图像特征进行大量数据训练的这一优势,结合水下声纳图像自身特点,采用深度学习模型来完成水下声纳图像的分类,在水下声纳图像分类上将是一场具有里程碑意义的突破。
目前针对水下声纳图像,NATO STO Centre for Maritime Research andExperimentation首次提出将CNN用于水下声纳图像分类:1.2016年Williams David P,Dugelay Samantha.Multi-view SAS image classification using deeplearning.OCEANS 2016MTS/IEEE Monterey,United states,2016:1-6.2.2017年WilliamsDavid P.Underwater target classification in synthetic aperture sonar imageryusing deep convolutional neural networks.International Conference on PatternRecognition,Mexico,2017:2497-2502.提出将不同结构CNN用于其实验室采集到的水下声纳图像数据集,得到的实验结果和自身对比,获得分类正确率。
发明内容
本发明的目的在于提供一种在保证收敛速度的基础上能提高分类精度的基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法。
本发明的目的是这样实现的:
(1)DBN生成二维参数矩阵
①将数据集中的水下声纳图像裁剪中心区域作为DBN输入,设置相关参数;②进行吉布斯采样,迭代计算与重构层的差异得到隐含层;③用Sigmoid激活函数来处理重构后所得结果;④用逐层贪心算法进行训练,并用BP算法微调整个DBN的参数,生成二维参数矩阵;
(2)自适应调整CNN滤波器权值矩阵的分布
①采用增维函数实现DBN向量与CNN张量之间的维数转换;②初始化滤波器权值矩阵的替换;③为了限定输入向量的最大值和最小值不超过激活函数和输出层函数的限定范围,采用LRN归一化函数对参数矩阵做归一化处理;
(3)实现基于深度学习的自适应权值卷积神经网络的水下声纳图像分类
①根据自适应调整CNN滤波器权值矩阵的分布,完成输入的水下声纳图像与滤波器的卷积操作,得到卷积层的特征映射图;②对卷积后所得特征映射图做池化操作;③用ReLU激活函数和LRN归一化函数来处理池化后的特征映射图;④使用全连接层将所有特征映射图进行连接;⑤利用softmax函数判断数据集所属类别,实现水下声纳图像分类。
本发明还可以包括:
1、在步骤(1)中将裁剪后的水下声纳图像输入到DBN模型中,设置相关参数具体包括:可见层和每层隐含层上神经元的个数N、学习率的大小ε和训练最大周期T,将可见层和每层隐含层的权重ω和偏置b初始化。
2、步骤(1)中用吉布斯采样对每层的神经元进行采样具体包括:通过可见层重构出隐含层,再由重构的隐含层对下一个隐含层进行重构。
3、步骤(1)中隐含层神经元和上一层可见层神经元由sigmoid激活函数
Figure BDA0001567533880000031
进行激活。
4、步骤(2)中所述采用增维函数实现DBN向量与CNN张量之间的维数转换具体包括:DBN生成的二维参数矩阵通过增维函数被增加为三维参数矩阵,前两维是滤波器的大小,后一维是颜色通道数,继续用增维函数对三维参数矩阵进行增维,将四维参数矩阵的第一维设置为1,不断增加第一维的值,直至与滤波器个数相等,最后用reshape方法将四维参数矩阵的第一维与第四维进行交换,实现DBN向量与CNN张量之间的维数转换。
5、步骤(2)中所述的初始化滤波器权值矩阵的替换具体包括:将维数转换后的DBN参数矩阵替换CNN初始化滤波器权值矩阵,完成初始化滤波器权值矩阵的替换。
6、步骤(2)中所述的采用LRN归一化函数对参数矩阵做归一化处理具体包括:采用LRN归一化函数
Figure BDA0001567533880000032
对参数矩阵做归一化处理,a的上标g表示滤波器序号即features maps序号,a的下标q和s表示滤波器矩阵中位置,M是滤波器的总数量,完成滤波器的替换。
7、在步骤(3)中根据水下声纳图像的特点,自适应权值卷积神经网络模型为1层输入层、4层卷积层,每1层卷积层后面是1层池化层、2层全连接层、1层输出层。
8、步骤(3)中,根据DBN生成的二维参数矩阵自适应调整CNN滤波器权值矩阵的分布,采用卷积
Figure BDA0001567533880000033
对水下声纳图像与滤波器进行卷积操作,得到特征映射图,x(t)和h(t)函数是卷积的变量,卷积层提取特征的过程为
Figure BDA0001567533880000034
f(·)是激活函数,m表示层数,ki,j是滤波器,bj是偏置,*表示卷积操作,Qj表示所输入特征映射图的集合。
9、步骤(3)中采用最大池化
Figure BDA0001567533880000041
对卷积后的特征映射图继续提取特征并降维,ci为池化区域的像素点,Rj为池化区域像素点的集合。
10、步骤(3)中ReLU激活函数为
Figure BDA0001567533880000042
ReLU激活函数的映射范围为0~∞,即输出的值都是非负数。
11、步骤(3)中采用softmax函数
Figure BDA0001567533880000043
进行分类。如果其中一幅图像的xi的值大过其他的x,那这个映射的分量就逼近于1,其他就逼近于0;采用softmax回归算法作为损失函数
Figure BDA0001567533880000044
1{·}表示的是标示函数,当y(i)=d为真时,返回1,否则返回0。
本发明与现有技术相比的优点在于:a.传统水下声纳图像分类方法是采取不同的提取特征方法来完成的分类,但特定的某种特征提取方法不能考虑到水下声纳图像所有的有用信息,影响分类的有效性。而深度学习模型是通过内部网络结构自动提取图像特征,根据深度学习模型自动提取图像特征进行大量数据训练的这一优势,结合水下声纳图像自身特点,本发明提出基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法。b.在深度学习模型中,CNN内部网络结构更适合水下声纳图像的分类,但CNN中的卷积操作主要由滤波器矩阵决定,卷积操作的结果是CNN正确率的保证,因此,滤波器权值矩阵就是CNN的关键。但其滤波器权值矩阵初始化具有随机性,容易陷入局部最优,影响最终的分类正确率。而DBN是利用BP算法来微调DBN中每层的权重,微调的过程等同于将整个深层次的网络进行权值矩阵初始化。因此,本发明提出利用DBN微调的优势来自适应调整CNN滤波器权值矩阵的分布,即将DBN训练学习得到的权值矩阵来代替CNN中随机生成的滤波器权值矩阵。c.本发明提出的基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法,即将数据集中的水下声纳图像裁剪中心区域作为DBN输入,经过吉布斯采样,重构隐含层,利用sigmoid函数处理重构结果,逐层贪心算法训练DBN模型后,用反向传播算法BP微调整个DBN的参数,生成DBN二维参数矩阵;在此基础上,采用增维函数实现DBN向量和CNN张量之间的维数转换,进行初始化滤波器权值矩阵替换,并对参数矩阵归一化处理,自适应调整CNN滤波器权值矩阵的分布;用ReLU激活函数和LRN归一化函数来处理池化后的特征映射图,最后将所有特征映射图连接,利用softmax函数完成水下声纳图像的分类。本发明可以解决CNN中滤波器权值初始化的随机问题,避免陷入局部最优,能更好的提高水下声纳图像分类正确率,有一定的有效性。
附图说明
图1是本发明方法的流程图;
图2(a)是水下沙纹类中一幅原始图像(100×100);
图2(b)是图2(a)的H通道图像;
图2(c)是图2(a)的hv通道图像;
图2(d)是图2(a)的S通道图像;
图2(e)是图2(a)的V通道图像;
图2(f)是图2(a)的R通道图像;
图2(g)是图2(a)的G通道图像;
图2(h)是图2(a)的B通道图像;
图2(i)是图2(a)旋转90°的图像;
图2(j)是图2(a)旋转180°的图像;
图2(k)是图2(a)添加高斯噪声后的图像;
图2(l)是图2(a)进行图像增强后的图像;
图3(a)是水下沉船类中一幅原始图像(100×100);
图3(b)是图3(a)的H通道图像;
图3(c)是图3(a)的hv通道图像;
图3(d)是图3(a)的S通道图像;
图3(e)是图3(a)的V通道图像;
图3(f)是图3(a)的R通道图像;
图3(g)是图3(a)的G通道图像;
图3(h)是图3(a)的B通道图像;
图3(i)是图3(a)旋转90°的图像;
图3(j)是图3(a)旋转180°的图像;
图3(k)是图3(a)添加高斯噪声后的图像;
图3(l)是图3(a)进行图像增强后的图像;
图4(a)是水下沉机类中一幅原始图像(100×100);
图4(b)是4(a)的H通道图像;
图4(c)是4(a)的hv通道图像;
图4(d)是4(a)的S通道图像;
图4(e)是4(a)的V通道图像;
图4(f)是4(a)的R通道图像;
图4(g)是4(a)的G通道图像;
图4(h)是4(a)的B通道图像;
图4(i)是4(a)旋转90°的图像;
图4(j)是4(a)旋转180°的图像;
图4(k)是4(a)添加高斯噪声后的图像;
图4(l)是4(a)进行图像增强后的图像;
图5是DBN模型结构图;
图6是Sigmoid激活函数图;
图7是自适应权值卷积神经网络模型结构图;
图8是ReLU激活函数图;
图9是本发明AW-CNN与CNN和DBN的分类正确率对比图;
图10是本发明AW-CNN和CNN的损失精度变化图;
图11是本发明AW-CNN第一个卷积层的可视化图;
图12是CNN第一个卷积层的可视化图;
图13(a)是水下沙纹类中一幅原始图2(a);
图13(b)是图2(a)经过分割预处理后的图像;
图13(c)是图2(a)经过提取特征预处理后的图像;
图14(a)是水下沉船类中一幅原始图3(a);
图14(b)是3(a)经过分割预处理后的图像;
图14(c)是3(a)经过提取特征预处理后的图像;
图15(a)是水下沉机类一幅原始图4(a);
图15(b)是图4(a)经过分割预处理后的图像;
图15(c)是图4(a)经过提取特征预处理后的图像;
图16是本发明提出AW-CNN的原始数据集和预处理后数据集的对比分类正确率结果图。
具体实施方式
下面结合附图举例对本发明做更详细地描述:
结合图1,本发明的具体步骤如下:
(1)生成DBN二维参数矩阵
水下声纳图像属于小样本不公开数据集,本发明的实验数据集来源于实验室采集和历年搜集,数据集分为六类,包括水下沙纹,沉船,沉机,石块,轮胎和鱼群。由于深度学习在大数据上优势明显,本发明考虑了水下声纳图像的各种情况,如图像角度倾斜,噪声等情况,对数据集进行了扩充。其中包括H、hv、S、V通道变换,R、G、B单通道变换,图像翻转操作,为了模拟海底复杂环境,对图像增加了高斯噪声,并利用均值滤波对图像进行增强,达到去除噪声的目的。图2、图3和图4分别是水下沙纹,沉船,沉机三类水下声纳图像数据集中一幅原始图像各种变换后的图像样本。
①裁剪图像
将水下声纳图像的中心区域进行裁剪,裁剪后的水下声纳图像输入到DBN模型中,DBN模型结构如图5所示。可见层和每层隐含层上神经元的个数N、学习率的大小ε和训练最大周期T,将可见层和每层隐含层的权重ω和偏置b初始化。
②吉布斯采样
用吉布斯采样对DBN中每层的神经元进行采样,通过可见层重构出隐含层,再由重构的隐含层对下一个隐含层进行重构。x=(x1,x2,…xk)是一个k维的随机向量,其联合概率分布为p(x)。当x的其它分量已给出时,x的第k个分量的条件概率分布为P(xk|xk-),xk-=(x1,x2,…,xk-1,xk+1,…xk)。当采样次数接近无穷大时,随机向量的概率分布最终将会收敛于x的联合概率分布p(x)。由于给定的所有可见单元都是条件独立的,所以DBN中每个隐含单元都可以同时被采样。同理,由于所有隐含单元也都是条件独立的,因此,所有可见单元也可以同时被采样。
③Sigmoid激活函数处理重构后所得结果
Sigmoid激活函数如图6所示,它的映射范围是0~1,即将输入的任一像素点映射到0~1的范围。输入的像素点中较大的负数被映射为0,较大的正数被映射为1。DBN中隐含层神经元和上一层可见层神经元由sigmoid激活函数
Figure BDA0001567533880000071
进行激活。
④训练及微调
用逐层贪心算法进行训练,并用BP算法微调整个DBN的参数。最后生成DBN二维参数矩阵。
(2)自适应调整CNN滤波器权值矩阵的分布
在提出的基于深度学习的自适应权值卷积神经网络的水下声纳图像分类方法中,由于CNN是张量,而DBN是向量。因此,输入上需要进行维数统一,实现将DBN训练学习得到的权值矩阵来代替CNN中随机生成的滤波器权值矩阵,提高分类正确率。
①维数转换
利用增维函数完成CNN张量与DBN向量之间的维数转换问题,实现两种深度学习模型维数不同的输入。因为在CNN中用滤波器提取的特征矩阵会比原始图像小,再加上组成卷积神经网络中的池化层除了起到提取特征的目的,一个重要的作用就是降维,而DBN在每层用RBM提取特征时并未改变图像大小。DBN是向量,产生的特征矩阵为二维矩阵,CNN是张量,其滤波器为四维矩阵。实现基于深度学习的自适应权值卷积神经网络时要考虑维数不同的问题,使用维数转换使维数达到一致。将第一层卷积后的特征矩阵输入到DBN模型中,水下声纳图像的大小随机裁剪为滤波器大小,进行训练。维数转换过程为:DBN生成的二维参数矩阵通过增维函数被增加为三维参数矩阵,前两维是滤波器的大小,后一维是颜色通道数,继续用增维函数对三维参数矩阵进行增维,将四维参数矩阵的第一维设置为1,不断增加第一维的值,直至与滤波器个数相等,最后用reshape方法将四维参数矩阵的第一维与第四维进行交换,实现DBN向量与CNN张量之间的维数转换。
②初始化滤波器权值矩阵替换
将维数转换后的DBN参数矩阵替换CNN初始化滤波器权值矩阵,完成初始化滤波器权值矩阵的替换,将权值矩阵的数据类型改为浮点型传到CNN中。
③参数矩阵归一化处理
DBN生成的特征矩阵经过维数转换后,不能够保证数据归一化,影响CNN的拟合情况,且代入之后会使CNN模型不收敛,正确率极低。为了限定输入向量的最大值和最小值不超过激活函数和输出层函数的限定范围,采用LRN归一化函数对维数变换后的参数矩阵做归一化处理,以提高分类正确率。CNN一般使用的随机正态截断矩阵方差为0.01,均值为0的滤波器,收敛性较好。考虑水下声纳图像数据集的特点,结合训练后的CNN权值,采用LRN归一化函数
Figure BDA0001567533880000081
对参数矩阵做归一化处理,a的上标g表示滤波器序号即features maps序号,a的下标q和s表示滤波器矩阵中位置,M是滤波器的总数量。
(3)实现基于深度学习的自适应权值卷积神经网络的水下声纳图像分类
根据水下声纳图像特点,通过调整不同网络结构最终得出自适应权值卷积神经网络模型网络结构为1层输入层,4层卷积层,每1层卷积层后面跟着1层池化层,2层全连接层,1层输出层。具体自适应权值卷积神经网络模型结构如图7所示。
①卷积操作
卷积层是对输入水下声纳图像中的局部感受野进行训练,将前一层输出的图像与卷积层上的滤波器做卷积
Figure BDA0001567533880000091
x(t)和h(t)函数是卷积的变量,通过激活函数,来得到本层的特征,进而逐层提取出水下声纳图像的特征。卷积层提取特征的过程为:
Figure BDA0001567533880000092
式中,f(·)是激活函数,本发明选用ReLU激活函数如图8所示,
Figure BDA0001567533880000093
m表示层数,ki,j是滤波器,bj是偏置,*表示卷积操作,
Figure BDA0001567533880000094
是卷积操作,Qj表示所输入特征映射图的集合。
②池化操作
卷积层后面是池化层。池化层的作用是对水下声纳图像进行降维操作并对水下声纳图像继续提取特征。对水下声纳图像进行降维后不仅加快了运行速度,同时解决了过拟合现象,提升了网络结构的稳定性和鲁棒性。池化操作的具体过程为:
Figure BDA0001567533880000095
式中,ω是权重,down(·)是池化函数,本发明选用的池化函数为最大池化
Figure BDA0001567533880000096
对卷积后的特征映射图继续提取特征并降维,ci为池化区域的像素点,Rj为池化区域像素点的集合。
③特征映射图的处理和连接
用ReLU激活函数和LRN归一化函数处理池化后的特征映射图,将池化后所有特征映射图连接到全连接层。全连接层是在卷积层和池化层的基础上一个更抽象的层次学习,从整个图像整合全局信息。因此,全连接层上的参数是最多的。
④利用softmax函数判断数据集所属类别,实现水下声纳图像分类
本发明利用softmax函数将水下声纳图像分为6类,softmax函数如下所示:
Figure BDA0001567533880000097
如果其中一幅图像的xi的值大过其他的x,那这个映射的分量就逼近于1,其他就逼近于0。同时,采用softmax回归算法作为损失函数,具体如下所示。
Figure BDA0001567533880000101
式中,
Figure BDA0001567533880000102
为softmax函数的对数值,1{·}表示的是标示函数,当y(i)=d为真时,返回1,否则返回0。
为验证本发明的分类正确率,将迭代次数设置为600次,对本发明提出的基于深度学习的自适应权值卷积神经网络(Adaptive Weights Convolutional Neural Network,AW-CNN)和CNN、DBN模型分别对水下声纳图像数据集做30次分类实验,分类正确率如图9所示。从图9中可以得出,提出的AW-CNN分类正确率高于CNN和DBN,这是由于AW-CNN解决了CNN滤波器权值矩阵初始化的随机问题,充分利用了滤波器提取的特征,避免陷入局部最优,提高分类正确率。CNN的分类准确率高于DBN,这是由于CNN是通过滤波器与水下声纳图像之间做卷积操作获得特征映射图,相比较于DBN更适合于水下声纳图像分类。
同时,为进一步验证本发明提出AW-CNN的分类有效性,表1和表2分别给出了三种深度学习模型在极大迭代次数和不同固定迭代次数情况下的分类正确率。表1给出在极大迭代次数是1500次时,AW-CNN、CNN、DBN的分类正确率。表2给出固定迭代次数分别为600、700、800和1000次时,AW-CNN和CNN的分类正确率。
表1极大迭代次数的分类正确率
模型 AW-CNN CNN DBN
分类正确率(%) 85.5 81.1 56
从表1可以看出,在极大迭代次数为1500次时,AW-CNN、CNN和DBN的分类正确率分别是85.5%,81.1%和56%。在极大迭代次数的条件下,本发明提出的AW-CNN获得的水下声纳图像分类正确率高于CNN和DBN,而DBN的分类正确率远远低于AW-CNN和CNN。因此,DBN不适合于水下声纳图像的分类。
表2不同固定迭代次数的最高分类正确率
迭代次数 AW-CNN(%) CNN(%)
600 82.4 79.6
700 83 79.3
800 84.3 79.6
1000 84.5 80.2
从表2可以看出,当迭代次数为600、700、800和1000次时,AW-CNN的分类正确率均高于CNN的分类正确率。通过对表1和表2的分析,验证本发明提出的AW-CNN在分类效率上明显优于CNN和DBN,有一定的有效性。
为验证本发明提出AW-CNN的收敛性,图10是在迭代次数为600次的情况下,AW-CNN和CNN的损失精度变化情况。从实验结果中可以看出,当迭代次数为300次时,AW-CNN和CNN的损失值都趋于稳定,接近收敛,收敛速度基本相同。结合图9,表1和表2的分类正确率,说明在保证收敛速度的基础上,本发明提出的AW-CNN的水下声纳图像分类准确率更高。
为验证本发明提出的AW-CNN可以更好的提取水下声纳图像特征,图11和图12分别给出AW-CNN和CNN的第一个卷积层的可视化。从可视化结果中可以看出,图11比图12纹理结构更加的清晰明显。这是由于AW-CNN能够解决CNN中滤波器权值矩阵初始化的随机问题,充分利用了滤波器提取的特征。说明提出的AW-CNN能更好的提取特征进而提高分类正确率。
在验证AW-CNN模型有效性的基础上,为了进一步提高水下声纳图像数据集的分类正确率,采用阶梯初始化水平集轮廓检测和灰度共生矩阵提取特征的预处理方法,分别对水下声纳图像进行分割和特征提取。将预处理后的水下声纳图像代替原始图像,形成预处理后的数据集。有效的将非深度学习提取特征与自动提取特征结合起来,更进一步提高分类的正确率。图13(a)-图13(c),图14(a)-图14(c)和图15(a)-图15(c)分别是图2(a)、图3(a)和图4(a)的预处理结果图。
图16给出基于AW-CNN的原始数据集和预处理后数据集(AW-CNN withpreprocessed dataset)对比分类结果。从图16可以得出,预处理后的数据集分类正确率基本要高于原始声纳数据集。针对水下声纳图像噪声多、分辨率低等特点,预处理后的水下声纳图像使目标特征更加突出,更加有利于分类。同时,为了比较本专利提出的AW-CNN和深度学习模型CNN、DBN以及典型非深度学习模型SVM在水下声纳图像数据集上的分类性能,表3给出30次实验分类结果。
表3 30次实验各种模型的分类正确率
Figure BDA0001567533880000111
Figure BDA0001567533880000121
从表3中可以看到,在30次实验中各种模型用于水下声纳图像数据集的分类均趋于稳定。总体来说,深度学习模型的分类正确率均高于非深度学习模型SVM,其中AW-CNNwith preprocessed dataset分类正确率是最高的,说明对水下声纳图像进行预处理有利于分类。
通过对本发明提出AW-CNN的验证和实验分析可以得出,AW-CNN可以解决CNN中滤波器权值初始化的随机问题,避免陷入局部最优,能更好的提高分类正确率,有一定的有效性。

Claims (8)

1.一种基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法,其特征是包括如下步骤:
(1)DBN生成二维参数矩阵
①将数据集中的水下声纳图像裁剪中心区域作为DBN输入,设置相关参数;②进行吉布斯采样,迭代计算与重构层的差异得到隐含层;③用Sigmoid激活函数来处理重构后所得结果;④用逐层贪心算法进行训练,并用BP算法微调整个DBN的参数,生成二维参数矩阵;
(2)自适应调整CNN滤波器权值矩阵的分布
①采用增维函数实现DBN向量与CNN张量之间的维数转换;②初始化滤波器权值矩阵的替换;③采用LRN归一化函数对参数矩阵做归一化处理;
所述采用增维函数实现DBN向量与CNN张量之间的维数转换体包括:DBN生成的二维参数矩阵通过增维函数被增加为三维参数矩阵,前两维是滤波器的大小,后一维是颜色通道数,继续用增维函数对三维参数矩阵进行增维,将四维参数矩阵的第一维设置为1,不断增加第一维的值,直至与滤波器个数相等,最后用reshape方法将四维参数矩阵的第一维与第四维进行交换,实现DBN向量与CNN张量之间的维数转换;
所述的初始化滤波器权值矩阵的替换具体包括:将维数转换后的DBN参数矩阵替换CNN初始化滤波器权值矩阵,完成初始化滤波器权值矩阵的替换;
(3)实现基于深度学习的自适应权值卷积神经网络的水下声纳图像分类
①根据自适应调整CNN滤波器权值矩阵的分布,完成输入的水下声纳图像与滤波器的卷积操作,得到卷积层的特征映射图;②对卷积后所得特征映射图做池化操作;③用ReLU激活函数和LRN归一化函数来处理池化后的特征映射图;④使用全连接层将所有特征映射图进行连接;⑤利用softmax函数判断数据集所属类别,实现水下声纳图像分类。
2.根据权利要求1所述的基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法,其特征是在步骤(1)中将裁剪后的水下声纳图像输入到DBN模型中,设置相关参数具体包括:可见层和每层隐含层上神经元的个数N、学习率的大小ε和训练最大周期T,将可见层和每层隐含层的权重ω和偏置b初始化;用吉布斯采样对每层的神经元进行采样具体包括:通过可见层重构出隐含层,再由重构的隐含层对下一个隐含层进行重构;隐含层神经元和上一层可见层神经元由sigmoid激活函数
Figure FDA0002998819620000011
进行激活。
3.根据权利要求2所述的基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法,其特征是步骤(2)中所述的采用LRN归一化函数对参数矩阵做归一化处理具体包括:采用LRN归一化函数
Figure FDA0002998819620000012
对参数矩阵做归一化处理,a的上标g表示滤波器序号即features maps序号,a的下标q和s表示滤波器矩阵中位置,M是滤波器的总数量,完成滤波器的替换。
4.根据权利要求3所述的基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法,其特征是在步骤(3)中根据水下声纳图像的特点,自适应权值卷积神经网络模型为1层输入层、4层卷积层,每1层卷积层后面是1层池化层、2层全连接层、1层输出层。
5.根据权利要求4所述的基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法,其特征是步骤(3)中,根据DBN生成的二维参数矩阵自适应调整CNN滤波器权值矩阵的分布,采用卷积
Figure FDA0002998819620000021
对水下声纳图像与滤波器进行卷积操作,得到特征映射图,x(t)和h(t)函数是卷积的变量,卷积层提取特征的过程为
Figure FDA0002998819620000022
f(·)是激活函数,m表示层数,ki,j是滤波器,bj是偏置,*表示卷积操作,Qj表示所输入特征映射图的集合。
6.根据权利要求5所述的基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法,其特征是步骤(3)中采用最大池化
Figure FDA0002998819620000023
对卷积后的特征映射图继续提取特征并降维,ci为池化区域的像素点,Rj为池化区域像素点的集合。
7.根据权利要求6所述的基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法,其特征是步骤(3)中ReLU激活函数为
Figure FDA0002998819620000024
ReLU激活函数的映射范围为0~∞,即输出的值都是非负数。
8.根据权利要求7所述的基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法,其特征是步骤(3)中采用softmax函数
Figure FDA0002998819620000025
进行分类,如果其中一幅图像的xi的值大过其他的x,那这个映射的分量就逼近于1,其他就逼近于0;采用softmax回归算法作为损失函数
Figure FDA0002998819620000026
1{·}表示的是标示函数,当y(i)=d为真时,返回1,否则返回0。
CN201810104948.XA 2018-02-02 2018-02-02 基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法 Active CN108427958B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810104948.XA CN108427958B (zh) 2018-02-02 2018-02-02 基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810104948.XA CN108427958B (zh) 2018-02-02 2018-02-02 基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法

Publications (2)

Publication Number Publication Date
CN108427958A CN108427958A (zh) 2018-08-21
CN108427958B true CN108427958B (zh) 2021-06-01

Family

ID=63156389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810104948.XA Active CN108427958B (zh) 2018-02-02 2018-02-02 基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法

Country Status (1)

Country Link
CN (1) CN108427958B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109239527A (zh) * 2018-09-07 2019-01-18 福州大学 基于深度置信网络的配电网故障识别方法
CN109447238B (zh) * 2018-09-21 2021-07-20 广东石油化工学院 多输出回归深度网络构建方法、结构、设备及存储介质
CN109272500B (zh) * 2018-09-27 2021-11-09 西安电子科技大学 基于自适应卷积神经网络的织物分类方法
CN109508651A (zh) * 2018-10-24 2019-03-22 辽宁师范大学 基于卷积神经网络的脑电情感分类方法
CN109492651B (zh) * 2018-11-01 2020-05-15 国网山东省电力公司青岛供电公司 一种设备信号灯的智能识别方法
CN109948412B (zh) * 2018-12-27 2022-09-16 中南大学 基于深度卷积神经网络的违禁物品标识方法
CN109886357B (zh) * 2019-03-13 2022-12-13 哈尔滨工程大学 一种基于特征融合的自适应权重深度学习目标分类方法
CN109932708B (zh) * 2019-03-25 2022-09-23 西北工业大学 一种基于干涉条纹和深度学习的水面水下分类目标的方法
CN110827238B (zh) * 2019-09-29 2023-07-21 哈尔滨工程大学 一种改进的全卷积神经网络的侧扫声纳图像特征提取方法
DE102019130930A1 (de) * 2019-11-15 2021-05-20 Carl Zeiss Microscopy Gmbh Mikroskop und Verfahren mit Ausführen eines faltenden neuronalen Netzes
CN111539462B (zh) * 2020-04-15 2023-09-19 苏州万高电脑科技有限公司 模仿生物视觉神经元的图像分类方法、系统、装置及介质
CN111476739B (zh) * 2020-04-17 2023-04-18 宁波大学科学技术学院 水下图像增强方法、系统及存储介质
CN111553297B (zh) * 2020-05-06 2022-03-15 东华大学 一种基于2d-cnn和dbn的涤纶长丝生产故障诊断方法和系统
CN111652149A (zh) * 2020-06-04 2020-09-11 青岛理工大学 基于深度卷积神经网络的沉底油声呐探测图像识别方法
CN112149755B (zh) * 2020-10-12 2022-07-05 自然资源部第二海洋研究所 基于深度学习的小样本海底水声图像底质分类方法
CN112882042B (zh) * 2021-01-14 2022-06-21 天津市水产研究所 一种基于声学数据的海洋牧场海床遥测与识别方法
CN113378911B (zh) * 2021-06-08 2022-08-26 北京百度网讯科技有限公司 图像分类模型训练、图像分类方法及相关装置
CN113775942B (zh) * 2021-08-28 2022-07-29 特斯联科技集团有限公司 用于管道状态监控的人工智能数据采集系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286229A (zh) * 2008-05-05 2008-10-15 哈尔滨工程大学 基于分层mrf的声呐图像自适应分割方法
CN107316013A (zh) * 2017-06-14 2017-11-03 西安电子科技大学 基于nsct变换和dcnn的高光谱图像分类方法
CN107563422A (zh) * 2017-08-23 2018-01-09 西安电子科技大学 一种基于半监督卷积神经网络的极化sar分类方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10650508B2 (en) * 2014-12-03 2020-05-12 Kla-Tencor Corporation Automatic defect classification without sampling and feature selection
CN105894018B (zh) * 2016-03-29 2019-04-23 西安电子科技大学 基于深度多示例学习的极化sar图像分类方法
CN106960185B (zh) * 2017-03-10 2019-10-25 陕西师范大学 线性判别深度信念网络的多姿态人脸识别方法
CN107092859A (zh) * 2017-03-14 2017-08-25 佛山科学技术学院 一种三维模型的深度特征提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286229A (zh) * 2008-05-05 2008-10-15 哈尔滨工程大学 基于分层mrf的声呐图像自适应分割方法
CN107316013A (zh) * 2017-06-14 2017-11-03 西安电子科技大学 基于nsct变换和dcnn的高光谱图像分类方法
CN107563422A (zh) * 2017-08-23 2018-01-09 西安电子科技大学 一种基于半监督卷积神经网络的极化sar分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Object recognition using cellular simultaneous recurrent networks and convolutional neural network;Md Zahangir Alom et al.;《2017 International Joint Conference on Neural Networks (IJCNN)》;20170703;2873-2880 *
SFLA with PSO Local Search for detection sonar image;Xingmei Wang et al.;《2016 35th Chinese Control Conference (CCC)》;20160829;3852-3857 *
Underwater target classification in synthetic aperture sonar imagery using deep convolutional neural networks;David P Williams;《2016 23rd International Conference on Pattern Recognition (ICPR)》;20170424;2497-2502 *
基于深度协同稀疏编码网络的海洋浮筏SAR图像目标识别;耿杰 等;《自动化学报》;20160430;第42卷(第4期);593-604 *

Also Published As

Publication number Publication date
CN108427958A (zh) 2018-08-21

Similar Documents

Publication Publication Date Title
CN108427958B (zh) 基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法
CN110335290B (zh) 基于注意力机制的孪生候选区域生成网络目标跟踪方法
Wang et al. Underwater sonar image classification using adaptive weights convolutional neural network
CN109828251B (zh) 基于特征金字塔轻量卷积神经网络的雷达目标识别方法
CN108122008B (zh) 基于稀疏表示和多特征决策级融合的sar图像识别方法
CN107103338B (zh) 融合卷积特征和集成超限学习机的sar目标识别方法
Bai et al. Hilbert-based generative defense for adversarial examples
CN113408605B (zh) 基于小样本学习的高光谱图像半监督分类方法
CN112288011B (zh) 一种基于自注意力深度神经网络的图像匹配方法
CN110136075B (zh) 一种基于边缘锐化循环生成对抗网络的遥感影像去雾方法
Alenezi et al. Geometric regularized hopfield neural network for medical image enhancement
CN116468995A (zh) 一种联合slic超像素和图注意力网络的声呐图像分类方法
CN109872331A (zh) 一种基于深度学习的遥感图像数据自动识别分类方法
Long et al. Underwater forward-looking sonar images target detection via speckle reduction and scene prior
Zhu et al. Underwater object images classification based on convolutional neural network
Xu et al. An SVM-based AdaBoost cascade classifier for sonar image
CN115170943A (zh) 一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法
CN109658340B (zh) 基于rsvd与直方图保存的sar图像快速去噪方法
Yang et al. UGC-YOLO: Underwater environment object detection based on YOLO with a global context block
CN112508106B (zh) 一种基于卷积神经网络的水下图像分类方法
CN116977694A (zh) 一种基于不变特征提取的高光谱对抗样本防御方法
Chen et al. Feature fusion based on convolutional neural network for SAR ATR
CN114066816B (zh) 基于静态小波变换提取的sar图像无监督变化检测方法
Fonseka et al. Data augmentation to improve the performance of a convolutional neural network on image classification
Zhao et al. Seabed sediments classification based on side-scan sonar images using dimension-invariant residual network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant