CN109101897A

CN109101897A - 水下机器人的目标检测方法、系统及相关设备

Info

Publication number: CN109101897A
Application number: CN201810806439.1A
Authority: CN
Inventors: 刘智勇; 张璐; 杨旭; 乔红
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2018-07-20
Filing date: 2018-07-20
Publication date: 2018-12-28

Abstract

本发明涉及机器人视觉、模式识别与机器学习领域，具体涉及一种水下机器人的目标检测方法、系统及相关设备。旨在提升目标检测技术对水下目标遮挡、变形、光照变化的鲁棒性。本发明的目标检测方法包括：获取原始的待检测图像；对原始的待检测图像进行像素值归一化，得到预处理后的待检图像；将预处理后的待检测图像输入目标检测网络进行检测，得到感兴趣区域的包围框和属于各目标类别的概率；根据感兴趣区域的包围框和属于各目标类别的概率，采用改进的非极大值抑制算法得到目标物体的包围框和所属类别。其中，目标检测网络中采用可变形卷积神经网络提取特征图，基于候选区域法进行目标检测。本发明的检测方法在保证速度的情况下提升了检测的精度。

Description

水下机器人的目标检测方法、系统及相关设备

技术领域

本发明涉及机器人视觉、模式识别与机器学习领域，具体涉及一种水下机器人的目标检测方法、系统及相关设备。

背景技术

目标检测是一种从包含目标的序列图像中检测、识别目标的技术。机器人的场景目标检测是实现机器人与环境交互以及在未知环境中完成复杂智能任务的关键环节。实际应用中，由于目标所处场景的复杂性，遮挡、变形、光照以及尺度的变化等等都提升了检测任务的难度。目标检测在机器人视觉的许多领域都有应用，包括机器人在特定环境下的抓取任务、装配任务、探测任务等，一种鲁棒的机器人特定场景目标检测技术对该类任务有着重要的实际意义。

传统的目标检测方法的一般流程为：

(1)扫描图像。使用滑窗法，在待检测的窗口中不断移位滑动。这是一种穷举的策略，计算量巨大，而且在目标多尺度、多长宽比的情况下得到的效果较差。

(2)特征提取。如Haar特征、局部二值模式(Local Binary Pattern，LBP)特征、方向梯度直方图(Histogram of Oriented Gradient，HOG)特征和SIFT特征等。每种特征的适用情况各有不同，特征的选取要视检测的目标而定。

(3)使用分类器进行分类。一般使用支持向量机或AdaBoost算法对目标的特征进行分类。

近年来，深度学习方法兴起，基于卷积神经网络的方法在简单视觉问题如分类问题上取得了优异的表现。由图像分类等问题中取得的大幅进展可知，卷积神经网络具有很强的图像特征提取能力，其内在的层次结构在一定程度上模仿了人类的视觉认知机制，体现了变量间的组合关系。2014年，Ross Girshick等人首次将卷积神经网络引入目标检测任务，得到的结果效果较传统的目标检测方法得到了很大提升。

目前，基于卷积神经网络的目标检测流程大致分为两类：

(1)基于候选区域的方法，如Faster RCNN，一般流程为：a)计算候选区域。候选区域(region proposal)是利用图像的特征，预先计算出最有可能出现目标的位置，提高了召回率，大大降低了后续计算的复杂度。b)分类网络为每个候选区域计算出分类和回归值。这一步一般使用卷积神经网络，并共享图像特征以提高处理速度。c)进行后处理，过滤包围框。这一步通常使用非极大值抑制(NMS)算法进行处理，目前最广泛使用的方法为Greedy-NMS。目前常用的候选区域的计算策略主要分为：Selective Search、Edge Boxes、RPN等。其中，候选区域网络(RPN)技术，可以提高候选区域的计算速度，并将多步骤处理任务融合到一个网络中，使网络可以端到端训练。

(2)基于回归的方法，如YOLO、SSD，一般流程为：a)卷积神经网络提取特征和预测；b)过滤包围框。

基于回归的方法速度较快，但检测精度较低，并且对某些小物体的检测效果不好。基于候选区域的方法检测精度较高，但由于候选区域所需计算较多，速度较慢。

发明内容

为了解决现有技术中的上述问题，即为了解决现有的检测系统不够高效精准、在海洋环境中适应性不强的问题，本发明提出了一种水下机器人的目标检测方法、系统及相关设备，提高了检测结果的精度，并明显提升了训练和检测过程的速度。

本发明的一方面，提出一种水下机器人的目标检测方法，包括以下步骤：

步骤A1，获取原始的待检测图像；

步骤A2，对所述原始的待检测图像进行像素值归一化，得到预处理后的待检图像；

步骤A3，将所述预处理后的待检测图像输入目标检测网络进行检测，得到感兴趣区域的包围框和属于各目标类别的概率；

步骤A4，根据所述感兴趣区域的包围框和属于各目标类别的概率，采用改进的非极大值抑制算法得到目标物体的包围框和所属类别；

其中，所述改进的非极大值抑制算法包括：

步骤A41，根据所有所述感兴趣区域属于各目标类别的概率，选择其中最大概率值对应的包围框，作为评分最高的包围框M；

步骤A42，根据下式的方法，对除包围框M以外的其他包围框进行重新评分：

其中，s_i代表第i个包围框的评分值，初值为该包围框属于各目标类别的概率中最大概率值；b_i代表第i个包围框，且不等于M；iou(M,b_i)代表包围框M与b_i的重叠度；N₁代表第一重叠度阈值；

步骤A43，遍历其他包围框，对所有与M的重叠度大于第二重叠度阈值N₂的包围框进行删除操作；将包围框M作为一个目标物体的包围框，将该包围框的属于各目标类别的概率中最大概率值对应的目标类别作为该目标物体的类别；

步骤A44，从余下的包围框中选择评分最高的包围框M，并转至步骤A42，直到处理完所有的包围框。

优选地，所述目标检测网络的构建与训练方法包括：

步骤S10，构建检测器网络，所述检测器网络包括：可变形卷积神经网络、区域候选网络、池化层、第一全连接层、第二全连接层、第三全连接层、第四全连接层、softmax层；

步骤S20，输入一帧训练样本图像；

步骤S30，基于可变形卷积神经网络对所述训练样本图像进行特征图提取；

步骤S40，根据提取的所述特征图，基于候选区域法进行目标检测；

步骤S50，计算多任务损失函数；若所述多任务损失函数未收敛，则修改所述检测器网络的参数并转至步骤S20，否则转至步骤S60；

步骤S60，使用剪枝方法对所述检测器网络进行稀疏化处理，得到所述目标检测网络。

优选地，在“输入一帧训练样本图像”之前，所述方法还包括：

获取训练用的原始图像样本集；

对所述样本集进行数据增广与像素值归一化，得到所述训练样本图像的集合。

优选地，步骤S40中“根据提取的所述特征图，基于候选区域法进行目标检测”具体包括：

步骤S41，根据提取的所述特征图，通过区域候选网络计算感兴趣区域；

步骤S42，根据提取的所述特征图，通过池化层对所述感兴趣区域进行池化操作，得到固定大小的特征图；根据所述固定大小的特征图，通过所述第一全连接层和所述第二全连接层提取所述感兴趣区域特征表示；

步骤S43，根据所述感兴趣区域的特征表示，通过第三全连接层对感兴趣区域进行分类处理；根据所述分类处理的结果，通过softmax层计算每个感兴趣区域属于各目标类别的概率；

步骤S44，根据所述感兴趣区域的特征表示，通过第四全连接层对包围框的位置偏差进行回归得到偏差值；

其中，

回归得到的偏差值为：

x、y分别表示包围框的横、纵坐标值；w、h分别表示包围框的宽和高；k表示目标类别的序号，分别表示类别为k的包围框的x、y、w、h值偏差；

所述感兴趣区域属于各目标类别的概率为：

c＝(c₀,...,c_K)

K表示待检测目标的类别总数，c₀表示感兴趣区域属于背景类别的概率值，c₁、...、c_K分别表示感兴趣区域属于第1、...、K类目标的概率。

优选地，所述多任务损失函数为：

L(c,u,t^u,v)＝L_cls(c,u)+λ[u≥1]L_loc(t^u,v)

其中，c表示感兴趣区域的离散概率分布；u表示感兴趣区域的真实类别标签；t^u表示回归得到的偏差值，v表示包围框的真实回归值标签，v＝(v_x,v_y,v_w,v_h)；第一项L_cls(c,u)＝-logc_u，为c在真实类别u处的softmax值的负对数；[u≥1]为指示函数，当u＝0时，感兴趣区域属于背景类别，不需要计算第二项λ[u≥1]L_loc(t^u,v)；权重λ为超参数，用于平衡两个任务间的损失值；

本发明的另一方面，提出一种水下机器人的目标检测系统，所述系统包括：图像获取模块、预处理模块、目标检测网络、抑制模块；

所述图像获取模块用于获取原始的待检测图像；

所述预处理模块用于对所述原始的待检测图像进行像素值归一化，得到预处理后的待检图像；

所述目标检测网络用于根据所述预处理后的待检测图像检测目标物体；

所述抑制模块配置为：根据所述感兴趣区域的包围框和属于各目标类别的概率，采用改进的非极大值抑制算法得到目标物体的包围框和所属类别；

所述抑制模块包括：选择单元、再评分单元、非极大值抑制单元、循环控制单元；

所述选择单元配置为：根据所有所述感兴趣区域属于各目标类别的概率，选择其中最大概率值对应的包围框，作为评分最高的包围框M；

所述再评分单元配置为：根据下式的方法，对除包围框M以外的其他包围框进行重新评分：

其中，s_i代表第i个包围框的评分值，初值为该包围框属于各目标类别的概率中的最大概率值；b_i代表第i个包围框，且不等于M；iou(M,b_i)代表包围框M与b_i的重叠度；N₁代表第一重叠度阈值；

所述非极大值抑制单元配置为：遍历其他包围框，对所有与M的重叠度大于第二重叠度阈值N₂的包围框进行删除操作；将包围框M作为一个目标物体的包围框，将该包围框属于各目标类别的概率中最大概率值对应的目标类别作为该目标物体的类别；

所述循环控制单元配置为：调用所述选择单元从余下的包围框中选择评分最高的包围框M，并依次调用所述再评分单元、所述非极大值抑制单元，直到处理完所有的包围框。

优选地，所述系统还包括：目标检测网络构建模块；

所述目标检测网络构建模块用于构建和训练所述目标检测网络；

所述目标检测网络构建模块包括：构建单元、输入单元、特征图提取单元、目标检测单元、损失函数计算单元、控制单元、稀疏化处理单元；

所述构建单元用于构建检测器网络，所述检测器网络包括：可变形卷积神经网络、区域候选网络、池化层、第一全连接层、第二全连接层、第三全连接层、第四全连接层、softmax层；

所述输入单元用于输入一帧训练样本图像到所述特征图提取单元；

所述特征图提取单元配置为：基于可变形卷积神经网络对所述训练样本图像进行特征图提取；

所述目标检测单元配置为：根据提取的所述特征图，基于候选区域法进行目标检测；

所述损失函数计算单元用于计算多任务损失函数；

所述控制单元配置为：判断所述多任务损失函数的收敛情况；若所述多任务损失函数未收敛，则修改所述检测器网络的参数，并顺次调用所述输入单元、所述特征图提取单元、所述目标检测单元和所述损失函数计算单元继续训练；否则，调用所述稀疏化处理单元；

所述稀疏化处理单元配置为：使用剪枝方法对所述检测器网络进行稀疏化处理，得到所述目标检测网络。

优选地，所述目标检测网络构建模块还包括：训练样本生成单元；

所述训练样本生成单元配置为：获取训练用的原始图像样本集；对所述样本集进行数据增广与像素值归一化，得到所述训练样本图像的集合。

本发明的第三方面，提出一种存储设备，其中存储有程序，其特征在于，所述程序适于由处理器加载并执行，以实现上面所述的水下机器人的目标检测方法。

本发明的第四方面，提出一种处理设备，包括处理器和存储器；所述处理器适于执行程序；所述存储器适于存储该程序；所述程序适于由所述处理器加载并执行，以实现上面所述的水下机器人的目标检测方法。

与最接近的现有技术相比，本发明具有如下有益效果：

本发明采用基于可变形卷积网络的方法，在特征图中引入偏移变量进行学习，提高对目标形变的建模能力，并采用基于区域的全连接卷积神经网络对后续特征图进行处理，明显提升了训练和测试过程的速度。在特征提取阶段，为解决识别目标的复杂形变问题，本发明采用可变形卷积神经网络进行特征的学习。在分类和回归值计算阶段，为共享计算量、提升算法速度，本发明采用基于区域的全连接卷积神经网络对可变形卷积神经网络提取到的特征进行关于位置信息的显式编码，得到反映位置信息的特征图，然后直接进行无需参数学习的池化步骤得到候选区域的特征表示，明显提高了算法的运行速度。在目标检测任务中，为了保持较高的召回率，本发明采用一种改进的非极大值抑制技术，对重叠度(Intersection over Union，IoU)较高的候选框进行平滑抑制，抑制过程采用重新排序的方法而非直接舍弃，提高了目标检测的效果。

因此，本发明的检测方法在保证速度的情况下提升了检测的精度。

附图说明

图1是本发明实施例中构建与训练目标检测网络的主要步骤示意图；

图2是本发明实施例中检测器网络的信号流向示意图；

图3是本发明实施例中特征图的偏移量计算示意图；

图4是本发明实施例中池化操作的原理示意图；

图5是本发明实施例中一种水下机器人的目标检测方法的主要步骤示意图；

图6是本发明实施例中一种水下机器人的目标检测系统的构成示意图。

具体实施方式

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。

由于对精度要求较高，本发明采用基于候选区域的目标检测算法。目前的卷积神经网络由于使用固定的方形滤波器几何结构，所以对图像中几何形变的建模能力较差。海洋生物所处环境特殊，海水折射和拍摄角度会导致目标有较大形变，已有的基于卷积神经网络的目标检测方法不能很好的辨别出这种形变。且后续分类网络在对感兴趣区域池化层的特征图进行分类时，存在着重复计算的问题，影响了检测的速度。针对上述问题，本发明采用了一种基于可变形卷积网络的方法，在特征图中引入偏移变量进行学习，提高对目标形变的建模能力，并采用基于区域的全连接卷积神经网络对后续特征图进行处理，明显提升了训练和测试过程的速度。

目标检测的流程一般为：首先，计算候选区域，利用卷积神经网络提取出的特征预先计算出最有可能出现目标的位置；然后，分类网络为每个候选区域计算出分类和回归值；最后进行后处理，采用非极大值抑制技术得到准确的包围框。在特征提取阶段，为解决识别目标的复杂形变问题，本发明采用可变形卷积神经网络进行特征的学习。在分类和回归值计算阶段，为共享计算量、提升算法速度，本发明采用基于区域的全连接卷积神经网络对可变形卷积神经网络提取到的特征进行关于位置信息的显式编码，得到反映位置信息的特征图，然后直接进行无需参数学习的池化步骤得到候选区域的特征表示，明显提高了算法的运行速度。在目标检测任务中，为了保持较高的召回率，算法前期通常会提出较多的候选区域，因此后续网络的输出中会包含许多假阳性检测结果，对于这一问题，许多算法在后处理时直接使用贪心的非极大值抑制，这种算法使用硬性标准对重复的候选框进行贪心抑制，被抑制的候选框将被直接舍弃，本发明采用一种改进的非极大值抑制技术，对重叠度较高的候选框进行平滑抑制，抑制过程采用重新排序的方法而非直接舍弃，提高了目标检测的效果。

图1是本发明中构建与训练目标检测网络的实施例的主要步骤示意图。图2是本发明实施例中检测器网络的信号流向示意图。

如图1所示，本实施例中，目标检测网络的构建与训练方法包括步骤S10-S60：

在步骤S10中，构建检测器网络。如图2所示，本实施例中构建的检测器网络包括：可变形卷积神经网络、区域候选网络、池化层、第一全连接层、第二全连接层、第三全连接层、第四全连接层、softmax层。

在步骤S15中，生成训练样本图像的集合。

首先，获取训练用的原始图像样本集。

然后，采用数据增广的方式扩充样本数据集。由于样本图片是在自然场景下拍摄，图片信息大多不对称，本发明在训练时以0.5的概率将图片进行水平翻转、随机裁剪和光照对比度干扰，图片对应的标签信息也相应进行调整。同时，使用PCA Jittering方法，对每一张训练图片，在图像矩阵[I^R,I^G,I^B]的基础上，我们计算出PCA(PrincipalComponentAnalysis)得到的主成份，并乘以其对应特征值和0均值0.1标准差的高斯噪声，即对每个图像矩阵，我们添加如公式(1)所示的值：

[v₁,v₂,v₃][α₁λ₁,α₂λ₂,α₃λ₃]^T (1)

其中，λ_i、v_i是图像RGB像素值的3×3协方差矩阵的第i个特征值和特征向量，α_i是高斯噪声，对每个图像，本发明都随机采样一个新的高斯噪声值。随机图像增广可以增强模型的鲁棒性，提高其泛化能力。

最后，为了防止输入网络的数据表现出较大差异的分布，对所有的图像数据进行归一化操作，使得归一化后的数据均值为0，方差为1。至此，我们得到了训练样本图像的集合。

在步骤S20中，输入一帧训练样本图像。

在步骤S30中，基于可变形卷积神经网络对训练样本图像进行特征图提取。

本发明使用VGG16作为基础特征提取网络，只保留conv5及之前的网络，即第五个max pooling层之前的网络结构。我们使用在ImageNet数据集上预训练模型的参数对基础的卷积神经网络模型参数进行初始化。我们在保留VGG16的基础卷积神经网络的同时，加入卷积层对偏移进行学习，并以0权重将其初始化。图3是本实施例中特征图的偏移量计算示意图。图3右侧3×3方框中的箭头为偏移量示意图，箭头所指方向代表向量的方向。卷积核映射到其相对特征图上的偏移可以在反向传播的过程中进行学习。

以3×3卷积核为例，本发明使用R＝{(-1,-1),(-1,0),...,(0,1),(1,1)}定义感受野的大小和膨胀情况，该例为标准情况。计算输出特征图y中的p₀位置输出的如公式(2)所示，w代表累加时的权重：

p_n代表了R中的任意一种情况，为了实现可变形卷积，引入偏移变量{△p_n|n＝1,...,N}，该偏移变量与上式中的p₀变量相加。由于偏移变量为小数，而图像像素均为整数，于是采用双线性插值法进行值的表示，如公式(3)所示：

其中，G(q,p)代表双线性插值核函数，p、q均代表特征图上任意像素点的位置，p＝p₀+p_n+△p_n，Ω代表特征图上所有像素点的集合。

采用这种方式，由于插值运算只用到邻近的四个像素，所以总体来讲涉及的参数较少，可以较快的进行反向传播。

在步骤S40中，根据提取的特征图，基于候选区域法进行目标检测；该步骤具体包括步骤S41-S44：

在步骤S41中，根据提取的特征图，通过区域候选网络(Region ProposalNetwork，RPN)计算感兴趣区域。

经过步骤S30的特征提取后，我们在conv5层特征图上进行滑窗卷积，conv5层特征图上每一个卷积位置表示一组锚点，每组锚点有9个，包括了3种不同的尺度和长宽比。每个锚点的卷积结果为一组256维的向量表示，之后通过两个并行的双层全连接层(后面的步骤S43、S44中分别提到的第三全连接层、第四全连接层)同时预测出包围框的回归值和是否为目标的得分值。在这一步中，除了预训练初始化涉及的层外，其他新层均使用均值为0、标准差为0.01的高斯分布进行初始化。

在步骤S42中，根据提取的特征图，通过池化层对感兴趣区域进行池化操作，得到固定大小的特征图；图4是本实施例中池化操作的原理示意图。如图4所示，将RPN网络输出的原图像包围框像素坐标值结果以一定的缩放比例映射到卷积神经网络的conv5层特征图上，并将映射后的区域进行池化得到固定大小的特征图，再经过两层全连接网络(第一全连接层和第二全连接层)得到特定感兴趣区域的特征表示。这一步网络只进行池化处理，不需要额外的参数学习。

在步骤S43中，根据感兴趣区域的特征表示，通过第三全连接层对感兴趣区域进行分类处理；根据分类处理的结果，每个感兴趣区域都会通过softmax层输出K+1类离散概率分布，即感兴趣区域属于各目标类别的概率，如公式(4)所示：

c＝(c₀,...,c_K) (4)

在步骤S44中，根据感兴趣区域的特征表示，通过第四全连接层对包围框的位置偏差进行回归得到偏差值。

其中，回归得到的偏差值包括位置偏差(包围框的坐标值)和对数尺度偏差(包围框的宽和高值)，如公式(5)所示：

在步骤S50中，计算多任务损失函数；若多任务损失函数未收敛，则修改检测器网络的参数并转至步骤S20，否则转至步骤S60。

本实施例中多任务损失函数，如公式(6)所示：

L(c,u,t^u,v)＝L_cls(c,u)+λ[u≥1]L_loc(t^u,v) (6)

其中，c表示感兴趣区域的离散概率分布；u表示感兴趣区域的真实类别标签；t^u表示回归得到的偏差值，v表示包围框的真实回归值标签，v＝(v_x,v_y,v_w,v_h)；第一项L_cls(c,u)＝-logc_u，为c在真实类别u处的softmax值的负对数；[u≥1]为指示函数，当u＝0时，感兴趣区域属于背景类别，不关心包围框的回归值，不需要计算第二项λ[u≥1]L_loc(t^u,v)；权重λ为超参数，用于平衡两个任务间的损失值，本实施例中设定λ＝1；对于包围框回归，使用对外点相对不敏感的Smooth L1损失函数，如公式(7)-(8)所示：

在步骤S60中，使用剪枝方法对检测器网络进行稀疏化处理，得到目标检测网络。

图5是一种水下机器人的目标检测方法实施例的主要步骤示意图。如图5所示，本实施例的目标检测方法包括以下步骤A1-A4：

步骤A1，获取原始的待检测图像；

步骤A2，对原始的待检测图像进行像素值归一化，得到预处理后的待检图像；

步骤A3，将预处理后的待检测图像输入目标检测网络进行检测，得到感兴趣区域的包围框和属于各目标类别的概率；

步骤A4，根据感兴趣区域的包围框和属于各目标类别的概率，采用改进的非极大值抑制算法得到目标物体的包围框和所属类别；该步骤具体包括步骤A41-A44：

步骤A41，根据所有感兴趣区域属于各目标类别的概率，选择其中最大概率值对应的包围框，作为评分最高的包围框M；

步骤A42，根据公式(9)-(10)所示的方法，对除包围框M以外的其他包围框进行重新评分：

其中，s_i代表第i个包围框的评分值，初值为该包围框属于各目标类别的概率中最大概率值；b_i代表第i个包围框，且不等于M；iou(M,b_i)代表包围框M与b_i的重叠度；N₁代表第一重叠度阈值。通过上述公式(9)-(10)，我们对与M的重叠度较高的包围框进行了一定程度上的抑制。

步骤A44，从余下的包围框中选择评分最高的包围框M，并转至步骤A42，直到处理完所有的包围框(即每个包围框要么被确定为目标物体，要么被删除)。

本实施例中，进行非极大值抑制时，不再简单丢弃被抑制的包围框，而是将非极大值抑制视为一个再次评分、再次排序的过程。

上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述，但是本领域技术人员可以理解，为了实现本实施例的效果，不同的步骤之间不必按照这样的次序执行，其可以同时(并行)执行或以颠倒的次序执行，这些简单的变化都在本发明的保护范围之内。

我们在国家自然基金委发布的公开比赛数据集上，将本发明的方法与其他三种方法进行了对比测试。检测结果使用各类目标的AP(Average Precision)与三类目标的mAP(mean Average Precision)进行评估，其综合反映了检测的精度，包括分类精度与定位准确度等。检测结果如表1所示：

表1.检测结果对比

方法	海参(％)	海胆(％)	扇贝(％)	mAP(％)
					Faster RCNN	47.0	56.8	66.4	56.7
R-FCN	46.9	56.1	61.0	54.7
					YOLOv2	43.2	46.6	56.2	48.7
本发明	53.1	62.7	69.8	61.9

从表1可以看出，对于三类目标(海参、海胆、海贝)的AP值，本发明的检测精度明显高于另外三种方法(Faster RCNN、R-FCN、YOLOv2)，而且三类目标的mAP值也是优于另外三种方法。

基于与上面的目标检测方法相同的技术构思，本发明提出一种目标检测系统。图6是一种水下机器人的目标检测系统实施例的构成示意图。如图6所示，本实施例的目标检测系统100包括：图像获取模块110、预处理模块120、目标检测网络130、抑制模块140、目标检测网络构建模块150。

其中，图像获取模块110用于获取原始的待检测图像；预处理模块120用于对原始的待检测图像进行像素值归一化，得到预处理后的待检图像；目标检测网络130用于根据预处理后的待检测图像检测目标物体；抑制模块140配置为：根据感兴趣区域的包围框和该感兴趣区域属于各目标类别的概率，采用改进的非极大值抑制算法得到目标物体的包围框和所属类别；目标检测网络构建模块150用于构建和训练目标检测网络130。

具体地，抑制模块140包括：选择单元141、再评分单元142、非极大值抑制单元143、循环控制单元144。

选择单元141配置为：根据所有感兴趣区域属于各目标类别的概率，选择其中最大概率值对应的包围框，作为评分最高的包围框M；再评分单元142配置为：根据公式(9)-(10)所示的方法，对除包围框M以外的其他包围框进行重新评分；非极大值抑制单元143配置为：遍历其他包围框，对所有与M的重叠度大于第二重叠度阈值N₂的包围框进行删除操作；将包围框M作为一个目标物体的包围框，将该包围框属于各目标类别的概率中最大概率值对应的目标类别作为该目标物体的类别；循环控制单元144配置为：调用选择单元141从余下的包围框中选择评分最高的包围框M，并依次调用再评分单元142、非极大值抑制单元143，直到处理完所有的包围框。

本实施例中的目标检测网络构建模块150具体包括：构建单元151、训练样本生成单元152、输入单元153、特征图提取单元154、目标检测单元155、损失函数计算单元156、控制单元157、稀疏化处理单元158。

其中，构建单元151用于构建检测器网络，所述检测器网络包括：可变形卷积神经网络、区域候选网络、池化层、第一全连接层、第二全连接层、第三全连接层、第四全连接层、softmax层；训练样本生成单元152配置为：获取训练用的原始图像样本集；对样本集进行数据增广与像素值归一化，得到训练样本图像的集合；输入单元153用于输入一帧训练样本图像到特征图提取单元；特征图提取单元154配置为：基于可变形卷积神经网络对训练样本图像进行特征图提取；目标检测单元155配置为：根据提取的特征图，基于候选区域法进行目标检测；损失函数计算单元156用于计算多任务损失函数；控制单元157配置为：判断多任务损失函数的收敛情况；若多任务损失函数未收敛，则修改检测器网络的参数，并顺次调用输入单元153、特征图提取单元154、目标检测单元155和损失函数计算单元156继续训练；否则，调用稀疏化处理单元158；稀疏化处理单元158配置为：使用剪枝方法对检测器网络进行稀疏化处理，得到目标检测网络130。

基于上面的目标检测方法，本发明还提出一种存储设备的实施例，其中存储有程序，所述程序适于由处理器加载并执行，以实现上面所述的水下机器人的目标检测方法。

进一步地，基于上面的目标检测方法，本发明还提出一种处理设备，包括处理器和存储器；其中，处理器适于执行程序，存储器适于存储该程序；该程序适于由该处理器加载并执行，以实现上面所述的水下机器人的目标检测方法。

本申请中对水下机器人目标检测系统进行模块、单元划分，仅仅是为了更好地理解本发明的技术方案所涉及的功能，在实践中，这些模块所对应的功能可以由单个硬件加载程序并执行。

本领域技术人员应该能够意识到，结合本文中所公开的实施例描述的各示例的方法步骤、模块、单元，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明电子硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种水下机器人的目标检测方法，其特征在于，包括以下步骤：

步骤A1，获取原始的待检测图像；

其中，

所述改进的非极大值抑制算法包括：

2.根据权利要求1所述的目标检测方法，其特征在于，所述目标检测网络的构建与训练方法包括：

步骤S20，输入一帧训练样本图像；

3.根据权利要求1所述的目标检测方法，其特征在于，在“输入一帧训练样本图像”之前，所述方法还包括：

获取训练用的原始图像样本集；

4.根据权利要求2所述的目标检测方法，其特征在于，步骤S40中“根据提取的所述特征图，基于候选区域法进行目标检测”具体包括：

其中，

回归得到的偏差值为：

x、y分别表示包围框的横、纵坐标值；w、h分别表示包围框的宽和高；k表示目标类别的序号，k＝1,2,...,K；分别表示类别为k的包围框的x、y、w、h值偏差；

所述感兴趣区域属于各目标类别的概率为：

c＝(c₀,...,c_K)

5.根据权利要求4所述的目标检测方法，其特征在于，所述多任务损失函数为：

L(c,u,t^u,v)＝L_cls(c,u)+λ[u≥1]L_loc(t^u,v)

其中，

c表示感兴趣区域的离散概率分布；u表示感兴趣区域的真实类别标签；t^u表示回归得到的偏差值，v表示包围框的真实回归值标签，v＝(v_x,v_y,v_w,v_h)；第一项L_cls(c,u)＝-logc_u，为c在真实类别u处的softmax值的负对数；[u≥1]为指示函数，当u＝0时，感兴趣区域属于背景类别，不需要计算第二项λ[u≥1]L_loc(t^u,v)；权重λ为超参数，用于平衡两个任务间的损失值；

6.一种水下机器人的目标检测系统，其特征在于，所述系统包括：图像获取模块、预处理模块、目标检测网络、抑制模块；

所述图像获取模块用于获取原始的待检测图像；

7.根据权利要求6所述的目标检测系统，其特征在于，所述系统还包括：目标检测网络构建模块；

所述损失函数计算单元用于计算多任务损失函数；

8.根据权利要求6所述的目标检测系统，其特征在于，所述目标检测网络构建模块还包括：训练样本生成单元；

9.一种存储设备，其中存储有程序，其特征在于，所述程序适于由处理器加载并执行，以实现权利要求1-5中任一项所述的水下机器人的目标检测方法。

10.一种处理设备，包括处理器和存储器；

所述处理器适于执行程序；

所述存储器适于存储该程序；

其特征在于，所述程序适于由所述处理器加载并执行，以实现权利要求1-5中任一项所述的水下机器人的目标检测方法。