CN112926619B - 一种高精度水下激光目标识别系统 - Google Patents

一种高精度水下激光目标识别系统 Download PDF

Info

Publication number
CN112926619B
CN112926619B CN202110023549.2A CN202110023549A CN112926619B CN 112926619 B CN112926619 B CN 112926619B CN 202110023549 A CN202110023549 A CN 202110023549A CN 112926619 B CN112926619 B CN 112926619B
Authority
CN
China
Prior art keywords
convolution
multiplied
data
training
residual error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110023549.2A
Other languages
English (en)
Other versions
CN112926619A (zh
Inventor
刘兴高
万子宁
王文海
张志猛
张泽银
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202110023549.2A priority Critical patent/CN112926619B/zh
Publication of CN112926619A publication Critical patent/CN112926619A/zh
Application granted granted Critical
Publication of CN112926619B publication Critical patent/CN112926619B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种高精度水下激光目标识别系统,包括水下激光探测器、数据库及上位机;水下激光探测器、数据库和上位机依次相连,所述的水下激光探测器对待检测的水域进行探测,并将得到的图像存储到所述的数据库,所述的上位机包含数据生成模块、数据预处理模块、目标分类模块和结果显示模块。本发明提供一种实现水下环境数据生成和高准确度识别水下目标的水下激光目标识别系统及方法。

Description

一种高精度水下激光目标识别系统
技术领域
本发明涉及水下目标检测领域、深度学习算法领域,尤其涉及一种高精度水下激光目标识别系统。
背景技术
水下目标识别在许多领域都有重要的应用,具有重要的研究价值,越来越多的研究者开始关注并推动相关领域的发展。传统的水下探测技术主要采用的是声呐探测器和光学相机,利用采集到的声呐信号或者光学图像进行相应的变换以提取特征,从而进行对特征的识别和分类。
在水下目标识别中,通过声呐探测器和光学相机进行采集数据,但是水下声学和光学环境复杂,声呐探测器和光学相机的信号传送与获取的过程容易受到噪声的干扰,采集到的高质量图像较少。在可以使用的图像数目较小的情况下,无论是传统机器学习的方法还是深度学习方法都容易出现过拟合的问题,无法提取到泛化能力强的特征,这严重限制了水下目标识别的准确率。因此,对于水下目标识别,探究数据生成和增强方法有着重要的实际价值以及理论意义,也是国内外水下目检识别的难点和热点。
发明内容
为了克服传统的水下目检识别中数据量少导致的精度差以及识别准确度低的问题,本发明的目的在于提供一种实现水下环境数据生成和高准确度识别水下目标的高精度的水下激光目标识别系统及方法。
本发明解决其技术问题所采用的技术方案是:一种高精度水下激光目标识别系统,其特征在于:包括依次相连的水下激光探测器、数据库及上位机,所述上位机包括依次相连的数据生成模块、数据预处理模块、目标分类模块和结果显示模块。所述激光探测器对所检测水域进行探测,并将得到的图像存储到所述的数据库,数据生成模块对激光探测器采集到的图像进行生成,以扩展可用图像数量;数据预处理模块将水下激光探测器采集的图像数据和新生成的图像数据进行预处理,目标分类模块使用残差卷积神经网络训练目标分类器,使用该搭建好的残差卷积神经网络进行目标分类的训练,对预处理后的图像数据进行识别,结果显示模块将目标分类的结果展示在上位机中。
进一步地:所述数据生成模块对激光探测器采集到的图像进行生成,以扩展可用图像数量,采用如下过程完成:
(1)从数据库中采集K个图像作为训练样本集,记为
Figure BDA0002889573930000021
其中
Figure BDA0002889573930000022
代表第i个训练样本;
(2)从噪声数据先验分布P(z)中采集K个噪声作为噪声样本集,记为
Figure BDA0002889573930000023
其中
Figure BDA00028895739300000221
代表第i个噪声样本;
(3)采用卷积神经网络作为生成器G,从噪声数据中生成新的数据,
Figure BDA0002889573930000024
其中
Figure BDA0002889573930000025
Figure BDA00028895739300000222
代表第i个新生成的样本;
(4)采用卷积神经网络作为判别器D,并更新判别器的参数θd,具体公式如下:
Figure BDA0002889573930000026
Figure BDA0002889573930000027
其中,VD为判别器D关于θd的损失函数,
Figure BDA0002889573930000028
为第(1)步中采集的训练样本,
Figure BDA0002889573930000029
为第(3)步中生成的新样本,i为样本索引,m为训练批次大小,η为学习率,
Figure BDA00028895739300000210
为关于θd的梯度。
(5)更新生成器G的参数θg,具体公式如下:
Figure BDA00028895739300000211
Figure BDA00028895739300000212
其中,VG为判别器G关于θG的损失函数,
Figure BDA00028895739300000213
为第(2)步中采集的噪声样本,i为样本索引,m为训练批次大小,η为学习率,
Figure BDA00028895739300000214
为关于θg的梯度。
(6)重复上述(1)~(5)步骤,直到VD和VG收敛;
(7)设定想要生成的图片数目M,从噪声数据先验分布P(z)中采集M个噪声
Figure BDA00028895739300000215
作为噪声样本,采用训练好的生成器G,从噪声数据中生成新的数据
Figure BDA00028895739300000216
其中
Figure BDA00028895739300000217
将新生成的图片数据加入数据库。
进一步地:所述数据预处理模块将水下激光探测器采集的图像数据和新生成的图像数据进行预处理,采用如下过程完成:将数据库中所有样本图像
Figure BDA00028895739300000218
其中
Figure BDA00028895739300000219
代表第i个样本图像,总数为N;对训练样本的灰度直方图进行均衡化处理,公式如下:
Figure BDA00028895739300000220
其中,i=1,2,...,N,j=0,1,2,...,L-1,uij第i个样本的第j个灰度级均衡化后的结果,RN表示图像像素的行数,CN表示图像像素的列数,L表示图像的灰度级数量,ne表示当前图像中灰度为re的像素的个数,pr(re)表示概率分布,T(rj)表示当前图像中第j个灰度级的直方图均衡化变换。灰度直方图进行均衡化处理后的图像为U={u1,u2,...,uN}。
进一步地:所述目标分类模块使用残差卷积神经网络训练目标分类器。残差卷积神经网络在深度学习框架下构建,构建的的残差卷积网络具体结构为:
(1)卷积池化层:首先对128×128×3的输入图像作卷积,卷积核个数为64、大小为7×7、移动步数为2,对卷积层的输出进行ReLU非线性变换后作最大值池化,池化窗口大小为2×2、移动步数为2,最后输出的特征图维数为32×32×64;
(2)残差结构块一:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为64、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为128、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为128、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为128、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为16×16×128。
(3)残差结构块二:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为128、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为256、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为256、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为256、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为8×8×256。
(4)残差结构块三:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为256、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为512、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为512、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为512、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为4×4×512。
(5)分类器:对残差结构块三的输出作全局平均池化,得到512维的特征向量,再用全连接层对该向量进行降维,全连接层神经元数与目标类别数相等,采用softmax激活函数作分类,输出结果为的预测目标为各类别的概率。
使用该搭建好的残差卷积神经网络进行目标分类的训练:
(A)将预处理后的样本集划分为训练集和测试集;
(B)使用训练集中的样本对残差卷积神经网络模型进行训练,在测试集上进行识别。
本发明的有益效果主要表现在:使用激光检测技术比传统的声呐技术的精确度更高;使用卷积神经网络进行数据生成扩展可使用图片数量,相较于传统的数据增强方法生成的图片更加的真实,最终使得目标识别的准确率更高,并且卷积神经网络生成后的数据也可以用于其他模型进行识别;基于残差卷积神经网络进行目标识别,相比传统神经网络,残差卷积神经网络可以搭建得更深,可以处理更加复杂的水下光学场景。
附图说明
图1是本发明所提出的系统的硬件结构图;
图2是本发明所提出的上位机的功能模块图。
具体实施方式
下面结合附图对本发明做进一步描述。本发明实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。
参照图1、图2,一种高精度水下激光目标识别系统,包括水下激光探测器1、数据库2、及上位机3,水下激光探测器1、数据库2和上位机3依次相连,所述的水下激光探测器1对所检测的水域进行探测,并将激光成像的数据存储到所述的数据库2,所述的上位机包含数据生成模块4、数据预处理模块5、目标分类模块6和结果显示模块7。
所述数据生成模块4,用以对激光探测器采集到的图像进行生成,以扩展可用图像数量,采用如下过程完成:
(1)从数据库中采集K个图像作为训练样本集,记为
Figure BDA0002889573930000041
其中
Figure BDA0002889573930000042
代表第i个训练样本;
(2)从噪声数据先验分布P(z)中采集K个噪声作为噪声样本集,记为
Figure BDA0002889573930000043
其中
Figure BDA0002889573930000046
代表第i个噪声样本;
(3)采用卷积神经网络作为生成器G,从噪声数据中生成新的数据,
Figure BDA0002889573930000044
其中
Figure BDA0002889573930000045
Figure BDA0002889573930000047
代表第i个新生成的样本;
生成器G的具体结构为:
(3.1)全连接层:神经元个数为8192,用于提取一维噪声样本信息;
(3.2)上采样层:先将全连接层输出的一维特征向量转化成重排列为4×4×512大小的特征图,再用反卷积操作将特征图上采样成形状为7×7,×256的特征图,并采用斜率参数为0.2的LeakyReLU激活函数进行非线性变换;
(3.3)上采样层:用反卷积操作将特征图从7×7×256上采样至14×14×128;,并采用斜率参数为0.2的LeakyReLU激活函数进行非线性变换;
(3.4)全连接层:先将特征图展平为一维特征向量,再利用神经元个数为49125、激活函数为tanh的全连接层处理得到新的特征向量,将该特征向量重排列为形为128×128×3的图像数据。
(4)采用卷积神经网络作为判别器D,通过以下公式更新判别器的参数θd,具体公式如下:
Figure BDA0002889573930000051
Figure BDA0002889573930000052
其中,VD为判别器D关于θd的损失函数,
Figure BDA0002889573930000053
为第(1)步中采集的训练样本,
Figure BDA0002889573930000054
为第(3)步中生成的新样本,i为样本索引,m为训练批次大小,η为学习率,
Figure BDA0002889573930000055
为关于θd的梯度。
判别器D的具体结构为:
(4.1)卷积层:卷积核个数为64,卷积核大小为3×3,步长为2,处理128×128×3的输入图像得到64×64×64的特征图,并采用斜率参数为0.2的LeakyReLU激活函数进行非线性变换;;
(4.2)池化层:采用步长为2的最大值池化操作将特征图化为32×32×64;
(4.3)卷积层:卷积核个数为128,卷积核大小为3×3,步长为2,处理32×32×64的输入图像得到16×16×128的特征图,并采用斜率参数为0.2的LeakyReLU激活函数进行非线性变换;
(4.4)卷积层:卷积核个数为256,卷积核大小为3×3,步长为2,处理16×16×128的输入图像得到8×8×256的特征图,并采用斜率参数为0.2的LeakyReLU激活函数进行非线性变换;(4.5)全连接层:先将特征图展平为一维特征向量,再利用神经元个数为2、激活函数为softmax的全连接层处理得到新的特征向量,这里输出的结果为预测样本是真实样本还是伪样本的概率。
(5)更新生成器G的参数θg,具体公式如下:
Figure BDA0002889573930000056
Figure BDA0002889573930000057
其中,VG为判别器G关于θG的损失函数,
Figure BDA0002889573930000058
为第(2)步中采集的噪声样本,i为样本索引,m为训练批次大小,η为学习率,
Figure BDA0002889573930000059
为关于θg的梯度。
(6)重复上述(1)~(5)步骤,直到VD和VG收敛;
(7)设定想要生成的图片数目M,从噪声数据先验分布P(z)中采集M个噪声
Figure BDA0002889573930000061
作为噪声样本,采用训练好的生成器G,从噪声数据中生成新的数据
Figure BDA0002889573930000062
其中
Figure BDA0002889573930000063
将新生成的图片数据加入数据库。
数据预处理模块,用以进行将水下激光探测器采集的图像数据和新生成的图像数据进行预处理,采用如下过程完成:
(1)将数据库中所有样本图像
Figure BDA0002889573930000064
其中
Figure BDA0002889573930000065
代表第i个样本图像,总数为N;
(2)对训练样本的灰度直方图进行均衡化处理,公式如下:
Figure BDA0002889573930000066
其中,i=1,2,...,N,j=0,1,2,...,L-1,uij第i个样本的第j个灰度级均衡化后的结果,RN表示图像像素的行数,CN表示图像像素的列数,L表示图像的灰度级数量,ne表示当前图像中灰度为re的像素的个数,pr(re)表示概率分布,T(rj)表示当前图像中第j个灰度级的直方图均衡化变换。灰度直方图进行均衡化处理后的图像为U={u1,u2,...,uN}。
目标分类模块,使用残差卷积神经网络构建目标识别模型。残差卷积神经网络可以在深度学习框架下构建,残差卷积网络包含的结构有:
(1)卷积层:卷积核在输入的特征图上滑动,卷积核参数与特征图数据作卷积操作,卷积操作公式如下,其中*代表卷积操作,ink为输入到第k层的特征图,outk为第k层输出的特征图,Wk和bk为第k层的卷积参数和偏置参数,f()代表ReLU激活函数,并令z代表激活函数的输入,计算公式如下:
f(z)=max(z,0) (6)
outk=f(ink*Wk+bk) (7)
(2)全连接层:用于将输入的特征图降维提纯为维数与类别数相等的特征向量;
(3)池化层:用到了最大值池化和全局平均池化两种池化方式,全局平均池化用在最后一个卷积层之后,其他地方都采用最大值池化;
(4)残差结构:残差结构由两个卷积层组成,在两卷积层前后有一个捷径连接,捷径连接又有两种,一种是恒等映射,将输入特征图直接与经过两个卷积层后的输出相加,另一种的捷径连接含有一个卷积层,以配合主路径上特征图维度的变化。
本发明构造的残差卷积网络具体结构为:
(1)卷积池化层:首先对128×128×3的输入图像作卷积,卷积核个数为64、大小为7×7、移动步数为2,对卷积层的输出进行ReLU非线性变换后作最大值池化,池化窗口大小为2×2、移动步数为2,最后输出的特征图维数为32×32×64;
(2)残差结构块一:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为64、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为128、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为128、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为128、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为16×16×128。
(3)残差结构块二:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为128、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为256、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为256、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为256、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为8×8×256。
(4)残差结构块三:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为256、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为512、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为512、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为512、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为4×4×512。
(5)分类器:对残差结构块三的输出作全局平均池化,得到512维的特征向量,再用全连接层对该向量进行降维,全连接层神经元数与目标类别数相等,采用softmax激活函数作分类,输出结果为的预测目标为各类别的概率。
使用该搭建好的残差卷积神经网络进行目标分类的训练:
(1)将第二步中得到的预处理后的样本集划分为训练集和测试集
(2)使用训练集中的样本对残差卷积神经网络模型进行训练,在测试集上进行识别。
结果显示模块将目标分类的结果展示在上位机中。

Claims (2)

1.一种高精度水下激光目标识别系统,其特征在于:包括依次相连的水下激光探测器、数据库及上位机,所述上位机包括依次相连的数据生成模块、数据预处理模块、目标分类模块和结果显示模块;所述激光探测器对所检测水域进行探测,并将得到的图像存储到所述的数据库,数据生成模块对激光探测器采集到的图像进行生成,以扩展可用图像数量;数据预处理模块将水下激光探测器采集的图像数据和新生成的图像数据进行预处理,目标分类模块使用残差卷积神经网络训练目标分类器,使用该搭建好的残差卷积神经网络进行目标分类的训练,对预处理后的图像数据进行识别,结果显示模块将目标分类的结果展示在上位机中;
所述数据生成模块对激光探测器采集到的图像进行生成,以扩展可用图像数量,采用如下过程完成:
(1)从数据库中采集K个图像作为训练样本集,记为
Figure FDA0003571124260000011
其中
Figure FDA0003571124260000012
代表第i个训练样本;
(2)从噪声数据先验分布P(z)中采集K个噪声作为噪声样本集,记为
Figure FDA0003571124260000013
其中
Figure FDA0003571124260000014
代表第i个噪声样本;
(3)采用卷积神经网络作为生成器G,从噪声数据中生成新的数据,
Figure FDA0003571124260000015
其中
Figure FDA0003571124260000016
Figure FDA0003571124260000017
代表第i个新生成的样本;
(4)采用卷积神经网络作为判别器D,并更新判别器的参数θd,具体公式如下:
Figure FDA0003571124260000018
Figure FDA0003571124260000019
其中,VD为判别器D关于θd的损失函数,
Figure FDA00035711242600000110
为第(1)步中采集的训练样本,
Figure FDA00035711242600000111
为第(3)步中生成的新样本,i为样本索引,m为训练批次大小,η为学习率,
Figure FDA00035711242600000112
为关于θd的梯度;
(5)更新生成器G的参数θg,具体公式如下:
Figure FDA00035711242600000113
Figure FDA00035711242600000114
其中,VG为判别器G关于θG的损失函数,
Figure FDA00035711242600000115
为第(2)步中采集的噪声样本,i为样本索引,m为训练批次大小,η为学习率,
Figure FDA00035711242600000116
为关于θg的梯度;
(6)重复上述(1)~(5)步骤,直到VD和VG收敛;
(7)设定想要生成的图片数目M,从噪声数据先验分布P(z)中采集M个噪声
Figure FDA0003571124260000021
作为噪声样本,采用训练好的生成器G,从噪声数据中生成新的数据
Figure FDA0003571124260000022
其中
Figure FDA0003571124260000023
将新生成的图片数据加入数据库;
所述数据预处理模块将水下激光探测器采集的图像数据和新生成的图像数据进行预处理,采用如下过程完成:将数据库中所有样本图像
Figure FDA0003571124260000024
其中
Figure FDA0003571124260000025
代表第i个样本图像,总数为N;对训练样本的灰度直方图进行均衡化处理,公式如下:
Figure FDA0003571124260000026
其中,i=1,2,...,N,j=0,1,2,...,L-1,uij第i个样本的第j个灰度级均衡化后的结果,RN表示图像像素的行数,CN表示图像像素的列数,L表示图像的灰度级数量,ne表示当前图像中灰度为re的像素的个数,pr(re)表示概率分布,T(rj)表示当前图像中第j个灰度级的直方图均衡化变换;灰度直方图进行均衡化处理后的图像为U={u1,u2,...,uN}。
2.根据权利要求1所述一种高精度水下激光目标识别系统,其特征在于:所述目标分类模块使用残差卷积神经网络训练目标分类器;残差卷积神经网络在深度学习框架下构建,构建的残差卷积网络具体结构为:
(1)卷积池化层:首先对128×128×3的输入图像作卷积,卷积核个数为64、大小为7×7、移动步数为2,对卷积层的输出进行ReLU非线性变换后作最大值池化,池化窗口大小为2×2、移动步数为2,最后输出的特征图维数为32×32×64;
(2)残差结构块一:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为64、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为128、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为128、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为128、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为16×16×128;
(3)残差结构块二:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为128、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为256、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为256、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为256、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为8×8×256;
(4)残差结构块三:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为256、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为512、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为512、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为512、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为4×4×512;
(5)分类器:对残差结构块三的输出作全局平均池化,得到512维的特征向量,再用全连接层对该向量进行降维,全连接层神经元数与目标类别数相等,采用softmax激活函数作分类,输出结果为的预测目标为各类别的概率;
使用该搭建好的残差卷积神经网络进行目标分类的训练:
(A)将预处理后的样本集划分为训练集和测试集;
(B)使用训练集中的样本对残差卷积神经网络模型进行训练,在测试集上进行识别。
CN202110023549.2A 2021-01-08 2021-01-08 一种高精度水下激光目标识别系统 Active CN112926619B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110023549.2A CN112926619B (zh) 2021-01-08 2021-01-08 一种高精度水下激光目标识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110023549.2A CN112926619B (zh) 2021-01-08 2021-01-08 一种高精度水下激光目标识别系统

Publications (2)

Publication Number Publication Date
CN112926619A CN112926619A (zh) 2021-06-08
CN112926619B true CN112926619B (zh) 2022-06-24

Family

ID=76163708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110023549.2A Active CN112926619B (zh) 2021-01-08 2021-01-08 一种高精度水下激光目标识别系统

Country Status (1)

Country Link
CN (1) CN112926619B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104680500A (zh) * 2015-02-07 2015-06-03 江西科技学院 一种基于直方图均衡化的图像增强算法
CN105005979A (zh) * 2015-08-04 2015-10-28 李舒曼 基于图像滤波的检测平台
CN108444447A (zh) * 2018-02-28 2018-08-24 哈尔滨工程大学 一种用于水下避障系统中的渔网实时自主检测方法
CN108921029A (zh) * 2018-06-04 2018-11-30 浙江大学 一种融合残差卷积神经网络和pca降维的sar自动目标识别方法
WO2019180442A1 (en) * 2018-03-21 2019-09-26 Headlight AI Limited Object detection system and method
CN110543859A (zh) * 2019-09-05 2019-12-06 大连海事大学 一种基于深度学习和双目定位的海参自主识别和抓取方法
CN110596774A (zh) * 2019-09-09 2019-12-20 中国电子科技集团公司第十一研究所 红外探测潜艇的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8204328B2 (en) * 2008-04-08 2012-06-19 The United States Of America, As Represented By The Secretary Of The Navy Automated underwater image restoration via denoised deconvolution

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104680500A (zh) * 2015-02-07 2015-06-03 江西科技学院 一种基于直方图均衡化的图像增强算法
CN105005979A (zh) * 2015-08-04 2015-10-28 李舒曼 基于图像滤波的检测平台
CN108444447A (zh) * 2018-02-28 2018-08-24 哈尔滨工程大学 一种用于水下避障系统中的渔网实时自主检测方法
WO2019180442A1 (en) * 2018-03-21 2019-09-26 Headlight AI Limited Object detection system and method
CN108921029A (zh) * 2018-06-04 2018-11-30 浙江大学 一种融合残差卷积神经网络和pca降维的sar自动目标识别方法
CN110543859A (zh) * 2019-09-05 2019-12-06 大连海事大学 一种基于深度学习和双目定位的海参自主识别和抓取方法
CN110596774A (zh) * 2019-09-09 2019-12-20 中国电子科技集团公司第十一研究所 红外探测潜艇的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Underwater Pipe and Valve 3D Recognition Using Deep Learning Segmentation";Miguel Martin-Abadal.et al;《Marine Science and Engineering》;20201223;全文 *
"一种基于形态学强光束下的水下激光目标检测算法";谢志远等;《襄樊学院学报》;20020930;第23卷(第5期);全文 *

Also Published As

Publication number Publication date
CN112926619A (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN106683048B (zh) 一种图像超分辨率方法及设备
CN107239751B (zh) 基于非下采样轮廓波全卷积网络的高分辨sar图像分类方法
CN112488210A (zh) 一种基于图卷积神经网络的三维点云自动分类方法
CN112818969B (zh) 一种基于知识蒸馏的人脸姿态估计方法及系统
CN109871875B (zh) 一种基于深度学习的建筑物变化检测方法
CN111738363B (zh) 基于改进的3d cnn网络的阿尔茨海默病分类方法
CN110930378B (zh) 基于低数据需求的肺气肿影像处理方法及系统
CN112990334A (zh) 基于改进原型网络的小样本sar图像目标识别方法
CN109635726B (zh) 一种基于对称式深度网络结合多尺度池化的滑坡识别方法
CN112766283B (zh) 一种基于多尺度卷积网络的两相流流型识别方法
CN111639697B (zh) 基于非重复采样与原型网络的高光谱图像分类方法
CN115311502A (zh) 基于多尺度双流架构的遥感图像小样本场景分类方法
CN112785636A (zh) 一种多尺度增强式的单目深度估计方法
CN111967361A (zh) 一种基于婴儿表情识别与哭声的情绪检测方法
CN111242028A (zh) 基于U-Net的遥感图像地物分割方法
CN114511785A (zh) 基于瓶颈注意力模块的遥感图像云检测方法及系统
CN112926619B (zh) 一种高精度水下激光目标识别系统
CN116343016A (zh) 一种基于轻量型卷积网络的多角度声呐图像目标分类方法
Zhao et al. Recognition and Classification of Concrete Cracks under Strong Interference Based on Convolutional Neural Network.
CN115223033A (zh) 一种合成孔径声呐图像目标分类方法及系统
CN115239967A (zh) 一种基于Trans-CSN生成对抗网络的图像生成方法及装置
CN113344110A (zh) 一种基于超分辨率重建的模糊图像分类方法
CN113222206A (zh) 一种基于ResLS-C深度学习组合的交通状态预测方法
CN112946682B (zh) 一种高准确率高敏捷性的水下激光目标识别仪
CN117808650B (zh) 一种基于Transform-Flownet和R-FPN的降水预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant