CN115311255A

CN115311255A - 一种基于全卷积神经网络的伪装物体分割方法

Info

Publication number: CN115311255A
Application number: CN202211116270.XA
Authority: CN
Inventors: 宋霄罡; 张鹏飞; 宁靖宇; 唐俊杰; 庞欣超; 崔永新; 张冬冬; 黑新宏
Original assignee: Xian University of Technology
Current assignee: Xian University of Technology
Priority date: 2022-09-14
Filing date: 2022-09-14
Publication date: 2022-11-08

Abstract

本发明公开了一种基于全卷积神经网络的伪装物体分割算法，具体包括如下步骤：步骤1，图像特征提取模块；步骤2，构建图像分类模块；步骤3，构建基于全卷积神经网络的目标分割模块；步骤4，融合分类模块与目标分割模块的输出结果。采用本发明，通过实验结果表明，可以有效的识别并分割图像中的伪装物体，丰富了人工智能和计算机视觉的方法体系，为伪装物体分割领域提升分割效果提供了一种选择。

Description

一种基于全卷积神经网络的伪装物体分割方法

技术领域

本发明涉及计算机视觉及人工智能技术领域，具体涉及一种基于全卷积神经网络的伪装物体分割方法。

背景技术

伪装物体分割，主要目的是检测出图像中那些视觉上与周围环境高度相似的目标，伪装是指通过材料、颜色或照明的任何组合来隐藏目标，以使目标物体难以被看到(伪装)或将其伪装成其他物体(模仿)，伪装物体分割本质上是一种目标分割任务。

由于能够找到隐藏在周围环境中的伪装对象，所以伪装物体分割在医疗领域(息肉分割)、工业领域(产品检测)、军事领域(卫星侦察)等不同领域都有着巨大的应用前景。所以最近几年，伪装物体分割也受到越来越多的关注。

然而，伪装物体分割任务是一项具有挑战性的分割任务，与普通的分割任务不同，“伪装物体”利用自身与背景的高度相似性来欺骗观察者从而达到隐藏自己的目的，因此对此类任务，我们需要有更多的视觉感知知识来将物体从相似背景中分割出来。我们使用CNN网络特征提取，将特征图分别做两路处理，一路选择全卷积神经网络结构来实现对目标的像素级分割，一路使用卷积神经网络结构实现对目标的分类(是否为伪装物体)，将两路处理结果融合，最终得到伪装物体的分割结果。

发明内容

本发明的目的是提供一种基于全卷积神经网络的伪装物体分割算法，实现针对自然图像中与背景相似或相近的伪装物体的识别与分割。

本发明所采用的技术方案是，一种基于全卷积神经网络的伪装物体分割方法，具体按以下步骤实施：

步骤1，图像特征提取；

步骤2，构建图像分类模块；

步骤3，构建基于全卷积神经网络的目标分割模块；

步骤4，融合分类模块与目标分割模块的输出结果。

本发明的特点还在于：

其中步骤1中图像特征提取模块采用ResNet-50网络结构对输入图像进行特征提取，具体按以下步骤实施：

步骤1.1，第一卷积模块，对待检测图像进行卷积处理，输出第一特征图；

步骤1.2，第二卷积模块，对第一特征图进行卷积处理，输出第二特征图；

步骤1.3，第三卷积模块，对第二特征图进行卷积处理，输出第三特征图；

步骤1.4，第四卷积模块，，对第三特征图进行卷积处理，输出第四特征图；

步骤1.5，第五卷积模块，对第四特征图进行卷积处理，输出第五特征图；

其中步骤2中构建图像分类模块按照以下步骤实施：

步骤2.1，使用两个全连接层，输出尺寸均为2048，每个全连接层后均使用一个ReLU激活函数，将特征图处理后得到一个一维向量；

步骤2.2，图像分类模块采用交叉熵损失作为损失函数；

其中步骤3构建基于全卷积神经网络的目标分割模块按照以下步骤实施：

步骤3.1，将特征图输入区域建议网络RPN以得到图像中伪装物体的可能定位；

步骤3.2，将得到的候选框做分类和回归计算；

步骤3.3，通过全卷积神经网络将伪装物体像素级分割；

其中步骤3.1将特征图输入区域建议网络具体按以下步骤实施：

步骤3.1.1，将步骤2得到的特征图经过一个3x3的卷积，设经过特征提取后得到的特征图大小为N×H×W，经过卷积将得到一个256×H×W的特征图；

步骤3.1.2，将特征图分别经过两次1x1的卷积操作，分别得到2×H×W和4×H×W，即两个分数和四个坐标；两个分数代表是目标物体还是背景的得分，四个坐标代表针对原图坐标的偏移；

步骤3.1.3，将得到的坐标映射到原图中的一个区域，将此区域左上角作为基准锚点，设每个锚点最多可以预测k个候选框，锚点在最后输出的卷积特征图每个像素点上按照从上到下，从左到右的规则进行滑动窗口，且其位于滑动窗口的中央，并根据预先设定好的不同尺度和长宽比来生成相应的锚框；

步骤3.1.4，RPN网络使用3种尺度(128²，256²，512²)和3种长宽比(1∶1，1∶2，2∶1)来生成锚框，因此在每个滑动窗口上最大可以生成k＝9个锚框；假定最后输出的卷积特征图大小为H×W，则根据上述规则共可以生成H×W×k个锚框，每个像素点最后共有(4+2)×9向量输出，总共(4+2)×9×H×W个预测结果；

其中步骤3.2将得到的候选框做分类和回归计算具体按以下步骤实施：

步骤3.2.1，RPN网络还为每个锚框设定了相应的二进制标签，当某个锚框与真实标注框具有最高的重叠率IOU或该锚框与真实标注框的IOU大于0.7则将其标注为目标；当某个锚框与所有真实标注框的重叠率小于0.3时，将其标注为背景；重叠率介于0.3与0.7之间的锚框舍弃；

步骤3.2.2，生成锚框后，使用softmax对锚框进行分类，分类前和分类后分别使用Reshape对图像大小进行操作；

步骤3.2.3，分类结束后，采用线性回归函数对锚框坐标进行修正，最终生成候选框；

步骤3.2.4，RPN损失函数定义如公式(1)所示：

式中，i表示某一锚框所对应的索引值，p表示网络预测第i个锚框是目标物体还是背景的概率；若锚框为目标物体，则对应的真实标注框标签

值为1，否则为0；t表示锚框的4个参数化坐标，分别是锚框的中心点坐标和锚框的宽高，

表示对应的真实标注框的坐标；L_cls表示对数分类损失，L_reg表示边框回归损失，其关系如公式(2)所示：

其中步骤3.3通过全卷积神经网络将伪装物体像素级分割具体实施步骤如下：

步骤3.3.1，通过卷积神经网络对特征图下采样，此处仍然采用ResNet网络结果来进行卷积，但是去掉了ResNet的全连接层和池化层；

步骤3.3.2，经过特征提取后的特征图，再进行上采样，恢复图片大小，然后对每一个像素softmax，得到对每一个像素的预测值，实现像素级分割；

其中步骤4融合分类模块与目标分割模块的输出结果按照以下步骤实施：

步骤4.1，将分类模块得到的标量与目标分割模块得到的向量相乘，得到最终的结果；

步骤4.2，使用F-measure来评估结果，如公式(3)所示：

式中，β是参数，Precision是精确率，Recall是召回率。

本发明的有益效果是

采用本发明的一种基于全卷积神经网络的伪装物体分割算法，通过实验结果表明，可以有效的识别并分割图像中的伪装物体，丰富了人工智能和计算机视觉的方法体系，为伪装物体分割领域提升分割效果提供了一种选择。

附图说明

图1是本发明的一种基于全卷积神经网络的伪装物体分割方法中实施例的步骤2中使用的分类模块网络结构图；

图2是本发明的一种基于全卷积神经网络的伪装物体分割方法中实施例的步骤3.1中使用的分割模块中RPN网络处理流程图；

图3是本发明的一种基于全卷积神经网络的伪装物体分割方法中实施例的步骤3.1中使用的区域建议RPN网络结构图；

图4是本发明的一种基于全卷积神经网络的伪装物体分割方法中实施例的步骤3.2中使用的全卷积神经网络结构图；

图5是本发明的一种基于全卷积神经网络的伪装物体分割方法的整体模型框架图；

图6是本发明的一种基于全卷积神经网络的伪装物体分割方法对一张图像中伪装目标的处理结果。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明提供了一种基于全卷积神经网络的伪装物体分割方法，如图6所示，具体按以下步骤实施：

步骤1，图像特征提取：

图像特征提取模块采用ResNet-50网络结构对输入图像进行特征提取，具体按以下步骤实施：

步骤1.4，第四卷积模块，对第三特征图进行卷积处理，输出第四特征图；

本技术方案采用ResNet-50模型进行特征提取，ResNet-50模型结构如表1所示：

表1：ResNet-50结构表

步骤2，如图1所示，构建图像分类模块：

步骤2.2，图像分类模块采用交叉熵损失作为损失函数；

步骤3，如图2所示，构建基于全卷积神经网络的目标分割模块：

步骤3.1，将特征图输入区域建议网络(RPN)以得到图像中伪装物体的可能定位，RPN网络的网络结构图如图3所示：

步骤3.2，将得到的候选框做分类和回归计算：

步骤3.2.1，RPN网络还为每个锚框设定了相应的二进制标签，当某个锚框与真实标注框具有最高的重叠率(IOU)或该锚框与真实标注框的IOU大于0.7则将其标注为目标；当某个锚框与所有真实标注框的重叠率小于0.3时，将其标注为背景；重叠率介于0.3与0.7之间的锚框舍弃。

步骤3.2.2，生成锚框后，使用softmax对锚框进行分类，分类前和分类后分别使用Reshape对图像大小进行操作。

步骤3.2.3，分类结束后，采用线性回归函数对锚框坐标进行修正，最终生成候选框；步骤3.2.4，RPN损失函数定义如公式(1)所示：

步骤3.3，通过全卷积神经网络将伪装物体像素级分割：

步骤3.3.1，通过卷积神经网络对特征图下采样，此处仍然采用ResNet网络结果来进行卷积，但是去掉了ResNet的全连接层和池化层。

步骤4，融合分类模块与目标分割模块的输出结果：

步骤4.1，将分类模块得到的标量(概率)与目标分割模块得到的向量相乘，得到最终的结果，如图5所示，图5显示了本网络对图像的处理结果，图左侧是原始图像，经过网络处理，得到图右的处理结果，可以看到，精确的将图中的伪装目标识别并分割了出来；

步骤4.2，我们使用F-measure来评估我们的结果；如公式(3)所示：

式中，β是参数，Precision是精确率，Recall是召回率。

Claims

1.一种基于全卷积神经网络的伪装物体分割方法，其特征在于，具体按以下步骤实施：

步骤1，图像特征提取；

步骤2，构建图像分类模块；

步骤3，构建基于全卷积神经网络的目标分割模块；

步骤4，融合分类模块与目标分割模块的输出结果。

2.根据权利要求1所述的一种基于全卷积神经网络的伪装物体分割方法，其特征在于，所述步骤1中图像特征提取模块采用ResNet-50网络结构对输入图像进行特征提取，具体按以下步骤实施：

步骤1.5，第五卷积模块，对第四特征图进行卷积处理，输出第五特征图。

3.根据权利要求1所述的一种基于全卷积神经网络的伪装物体分割方法，其特征在于，所述步骤2中构建图像分类模块按照以下步骤实施：

步骤2.2，图像分类模块采用交叉熵损失作为损失函数。

4.根据权利要求1所述的一种基于全卷积神经网络的伪装物体分割方法，其特征在于，所述步骤3构建基于全卷积神经网络的目标分割模块按照以下步骤实施：

步骤3.2，将得到的候选框做分类和回归计算；

步骤3.3，通过全卷积神经网络将伪装物体像素级分割。

5.根据权利要求4所述的一种基于全卷积神经网络的伪装物体分割方法，其特征在于，所述步骤3.1将特征图输入区域建议网络具体按以下步骤实施：

步骤3.1.4，RPN网络使用3种尺度(1282，2562，5122)和3种长宽比(1：1，1：2，2：1)来生成锚框，因此在每个滑动窗口上最大可以生成k＝9个锚框；假定最后输出的卷积特征图大小为H×W，则根据上述规则共可以生成H×W×k个锚框，每个像素点最后共有(4+2)×9向量输出，总共(4+2)×9×H×W个预测结果。

6.根据权利要求4所述的一种基于全卷积神经网络的伪装物体分割方法，其特征在于，所述步骤3.2将得到的候选框做分类和回归计算具体按以下步骤实施：

步骤3.2.4，RPN损失函数定义如公式(1)所示：

7.根据权利要求4所述的一种基于全卷积神经网络的伪装物体分割方法，其特征在于，所述步骤3.3通过全卷积神经网络将伪装物体像素级分割具体实施步骤如下：

步骤3.3.2，经过特征提取后的特征图，再进行上采样，恢复图片大小，然后对每一个像素softmax，得到对每一个像素的预测值，实现像素级分割。

8.根据权利要求1所述的一种基于全卷积神经网络的伪装物体分割方法，其特征在于，所述步骤4融合分类模块与目标分割模块的输出结果按照以下步骤实施：

步骤4.2，使用F-measure来评估结果，如公式(3)所示：

式中，β是参数，Precision是精确率，Recall是召回率。