CN112802039A

CN112802039A - 一种基于全局边缘注意力的全景分割方法

Info

Publication number: CN112802039A
Application number: CN202110100682.3A
Authority: CN
Inventors: 雷晓春; 汪小龙; 江泽涛; 卢畅; 陈俊彦; 翟丰硕; 伍旭; 谢浚霖; 梁观平
Original assignee: Guilin University of Electronic Technology
Current assignee: Guilin University of Electronic Technology
Priority date: 2021-01-26
Filing date: 2021-01-26
Publication date: 2021-05-14
Anticipated expiration: 2041-01-26
Also published as: CN112802039B

Abstract

本发明公开一种基于全局边缘注意力的全景分割方法，在原全景分割网络结构的基础上添加了一个全局边缘注意力模块，利用当前模型的全景分割网络对原始训练图像进行全景分割得到当前模型的全景分割掩码；利用当前模型的全局边缘注意力模块对全景分割掩码进行全局边缘注意力检测，得到当前模型的全景分割掩码边缘矩阵；利用当前模型的全局边缘注意力模块对原始训练图像进行全局边缘注意力检测，得到当前模型的边缘矩阵因子；利用边缘矩阵因子去引导全景分割网络的实例和语义的全景分割，有利于区分细节和边缘，增强分割效果，提高分割效率。

Description

一种基于全局边缘注意力的全景分割方法

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于全局边缘注意力的全景分割方法。

背景技术

全景分割是2018年何恺明团队提出的概念，综合了语义分割和实例分割效果。在计算机视觉领域中，图像分割指的是是根据某些规则把图片中的像素分成不同的部分(加不同的标签)。其中语义分割旨在为图像中每个像素赋予一个类别标签，但是语义分割所做的仅仅是判断类别，无法实现区分个体的功能。而实例分割任务不需要对每个像素进行标记，它只需要找到感兴趣物体的边缘轮廓，可以在实现判断个体类别的基础上，同时实现个体的区分。全景分割是语义分割和实例分割的结合，每个像素都被分为一类，如果一种类别里有多个实例，会用不同的颜色进行区分，从而实现了对图像中的物体和背景的分割。

全景分割适用于目标识别与检测、物体跟踪、自动驾驶、医学影像处理等各领域。通过深度学习的方法对图像进行全景分割，分割结果的边缘的精确度是需要考虑的重要问题。何恺明研究团队提出过类似图形学渲染的方式，在边缘部分的不确定区域增加判定步骤，使得图像不会因为尺度缩小、图像模糊，导致边缘被平滑掉而影响图像的分割效果。但是该方法采用传统图形学算法，网络缺乏一定的学习能力。采用边缘检测结果去辅助超分辨率重建也有相关应用，比如拉普拉斯金字塔在超分辨率重建方面的应用，但是由于超分辨率重建注重重建的是细节，用于辅助的边缘没有语义信息，即无法确定是边缘还是细节，所以这些边缘是没有权重概念的，而这会导致图像局部的过度分割。

发明内容

本发明所要解决的是现有全景分割方法由于边缘限制所导致的局部过度分割问题，提供一种基于全局边缘注意力的全景分割方法。

为解决上述问题，本发明是通过以下技术方案实现的：

一种基于全局边缘注意力的全景分割方法，包括步骤如下：

步骤1、在全景分割网络的基础上添加全局边缘注意力模块构造出基于全局边缘注意力的全景分割模型；

步骤2、将原始训练图像送入到步骤1所构建的基于全局边缘注意力的全景分割模型中对模型进行训练，得到训练好的最终基于全局边缘注意力的全景分割模型；其中基于全局边缘注意力的全景分割模型的每一次的迭代训练的过程如下：

步骤2.1、将上一次迭代训练所得到的基于全局边缘注意力的全景分割模型视为当前模型；

步骤2.2、利用当前模型的全景分割网络对原始训练图像进行全景分割得到当前模型的全景分割掩码；

步骤2.3、利用当前模型的全局边缘注意力模块对全景分割掩码进行全局边缘注意力检测，在进行全局边缘注意力检测的过程中，直接对全景分割掩码进行二值化，得到当前模型的全景分割掩码边缘矩阵；

步骤2.4、利用当前模型的全局边缘注意力模块对原始训练图像进行全局边缘注意力检测，在进行全局边缘注意力检测的过程中，先对原图像进行三通道分离，得到三个颜色通道矩阵；再使用当前边缘注意力权重矩阵群分别与三个颜色通道矩阵相乘，得到三个边缘矩阵；后将三个边缘矩阵相乘，得到当前模型的边缘矩阵因子；

步骤2.5、将基于步骤2.2所得的当前模型的全景分割掩码所计算的全景分割网络的损失函数L作为基础项，并将基于2.3所得的当前模型的全景分割掩码边缘矩阵和步骤2.4所得的当前模型的边缘矩阵因子所计算的全局边缘注意力模块的损失函数L_edge作为新增项，得到当前模型的损失函数L^*：

式中：L表示全景分割网络的损失函数，L_edge表示全局边缘注意力模块的损失函数，F_edge[i,j]表示全景分割掩码边缘矩阵的第i行、第j列的像素值，E[i,j]表示边缘矩阵因子的第i行、第j列的数值，i＝0,1,2,...,H-1，j＝0,1,2,...,W-1，H和W分别表示原始训练图像的高和宽向下取整的整数值；

步骤2.6、判断损失函数是否收敛或迭代训练次数是否达到迭代阈值：如果是，则当前模型即为最终基于全局边缘注意力的全景分割模型；否则，先通过极小化损失函数对当前模型的优化参数进行优化，再返回步骤2.1；

步骤3、将待分割的图像送入到步骤2所得的最终基于全局边缘注意力的全景分割模型中，完成待分割的图像基于全局边缘注意力的全景分割。

上述步骤2.2的具体过程如下：

首先，将输入的原始训练图像送入ResNet-FPN特征提取网络得到图像的多维度共享特征融合图；

接着，将多维度共享特征融合图分别送入实例分割分支和语义分割分支中；在实例分割分支中，先找出多维度共享特征融合图的感兴趣区域，再对感兴趣区域进行像素校正，后对像素校正的感兴趣区域使用特征金字塔框架进行预测不同的实例所属分类，得到实例分割掩码；在语义分割分支中，通过对多维度共享特征融合图的每个像素进行细粒度的推理，得到语义掩码；

最后，将实例分割掩码和语义掩码进行融合后得到全景分割掩码。

上述步骤2.5中，全景分割网络的损失函数L为：

L＝L_cls+L_box+L_mask

式中：L_cls表示预测框的分类损失项，L_box表示预测框的回归损失项，L_mask表示掩码部分的损失项。

上述步骤2.6中，当前模型的优化参数包括全景分割网络的网络权重系数和全局边缘注意力模块的边缘注意力权重矩阵群。

与现有技术相比，本发明在原全景分割网络结构的基础上添加了一个全局边缘注意力模块，利用当前模型的全景分割网络对原始训练图像进行全景分割得到当前模型的全景分割掩码；利用当前模型的全局边缘注意力模块对全景分割掩码进行全局边缘注意力检测，得到当前模型的全景分割掩码边缘矩阵；利用当前模型的全局边缘注意力模块对原始训练图像进行全局边缘注意力检测，得到当前模型的边缘矩阵因子；利用边缘矩阵因子去引导全景分割网络的实例和语义的全景分割，有利于区分细节和边缘，增强分割效果，提高分割效率。

附图说明

图1为一种基于全局边缘注意力的全景分割方法的流程图。

图2为边缘注意力模块对原始训练图像处理的工作流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实例，对本发明进一步详细说明。

一种基于全局边缘注意力的全景分割方法，如图1所示，其包括步骤如下：

步骤1、在全景分割网络的基础上添加全局边缘注意力模块构造出基于全局边缘注意力的全景分割模型。

步骤2、将原始训练图像送入到步骤1所构建的基于全局边缘注意力的全景分割模型中对模型进行训练，得到训练好的最终基于全局边缘注意力的全景分割模型。

参见图2，基于全局边缘注意力的全景分割模型的每一次的迭代训练的过程如下：

步骤2.1、将上一次迭代训练所得到的基于全局边缘注意力的全景分割模型视为当前模型。

初始时，给定初始的模型优化参数，其中模型优化参数包括全景分割网络的网络权重系数和全局边缘注意力模块的边缘注意力权重矩阵群。全景分割网络的网络权重系数与传统全景分割网络的权重系数的设定相同。边缘注意力权重矩阵群设定为

并初始化矩阵中各元素的值为

i表示第i个边缘注意力权重矩阵。并基于给定的初始的模型优化参数得到基于全局边缘注意力的全景分割模型，即作为第1次迭代训练的当前模型。

从第二次迭代开始，每一次迭代利用上一次迭代训练所得到的基于更新后的模型优化参数的基于全局边缘注意力的全景分割模型，作为下一次迭代训练的当前模型。

步骤2.2、利用当前模型的全景分割网络对原始训练图像进行全景分割得到当前模型的全景分割掩码。

首先，将输入的原始训练图像送入ResNet-FPN特征提取网络得到图像的多维度共享特征融合图。接着，将多维度共享特征融合图分别送入实例分割分支和语义分割分支中。在实例分割分支中，先找出输入图像中对象的可能位置的边界框列表，即感兴趣区域，再对感兴趣区域使用双线性插值法得到固定大小的输出特征图，取ROI分类器选择的正区域为输入，将预测的掩码放大为ROI边框的尺寸以给出最终的掩码结果。在语义分割分支中，通过对多维度共享特征融合图的每个像素进行细粒度的推理，得到语义掩码。最后，将实例分割掩码和语义掩码进行融合后得到全景分割结果。

步骤2.3、利用当前模型的全局边缘注意力模块对全景分割掩码进行全局边缘注意力检测，在进行全局边缘注意力检测的过程中，直接对全景分割掩码进行二值化，得到全景分割掩码边缘矩阵。

步骤2.4、利用当前模型的全局边缘注意力模块对原始训练图像进行全局边缘注意力检测，在进行全局边缘注意力检测的过程中，先对原图像进行R、G、B三通道分离，得到三个颜色通道矩阵；再使用当前边缘注意力权重矩阵群分别与三个颜色通道矩阵相乘，得到三个边缘矩阵E_R,E_G,E_B；后将三个边缘矩阵相乘得到边缘矩阵因子E＝E_R×E_G×E_B。

边缘矩阵因子(即全局边缘注意力轮廓)与全景分割掩码边缘矩阵有同样的大小，将两个矩阵的各个元素相对应，边缘矩阵因子是一个0和1组成的矩阵，沿着所有值为1的像素坐标遍历掩码矩阵，分析以遍历路径中每一个掩码矩阵的像素点为中心的九宫格像素特征：将像素值相近的像素点归为同一个标签，9个像素点中与大部分像素值差值较大的像素点归为另外一个标签，从而达到修正的目的。

步骤2.5、将基于步骤2.2所得的当前模型的全景分割掩码所计算的全景分割网络的损失函数L作为基础项，并将基于2.3所得的当前模型的全景分割掩码边缘矩阵和步骤2.4所得的当前模型的边缘矩阵因子所计算的全局边缘注意力模块的损失函数L_edge作为新增项，得到当前模型的损失函数L^*。

全景分割网络的损失函数L为：

L＝L_cls+L_box+L_mask

全局边缘注意力模块的损失函数L_edge为：

式中：F_edge[i,j]表示全景分割掩码边缘矩阵的第i行、第j列的像素值，E[i,j]表示边缘矩阵因子的第i行、第j列的数值，i＝0,1,2,...,H-1，j＝0,1,2,...,W-1，H和W分别表示原始训练图像的高和宽向下取整的整数值；

当前模型的损失函数L^*为：

L^*＝L+L_edge

步骤2.6、判断损失函数是否收敛或迭代训练次数是否达到迭代阈值：如果是，则当前模型即为最终基于全局边缘注意力的全景分割模型；否则，先通过极小化损失函数对当前模型的优化参数进行优化，再返回步骤2.1。

在通过极小化损失函数对当前模型的优化参数进行优化时，通过反向传播，并利用梯度下降方法调整全景分割网络的网络权重系数和全局边缘注意力模块的边缘注意力权重矩阵群达到极小化损失函数的目的，从而完成对当前模型的训练。

步骤3、将待分割的图像送入到步骤2所最终基于全局边缘注意力的全景分割模型中，完成待分割的图像基于全局边缘注意力的全景分割。

需要说明的是，尽管以上本发明所述的实施例是说明性的，但这并非是对本发明的限制，因此本发明并不局限于上述具体实施方式中。在不脱离本发明原理的情况下，凡是本领域技术人员在本发明的启示下获得的其它实施方式，均视为在本发明的保护之内。

Claims

1.一种基于全局边缘注意力的全景分割方法，其特征是，包括步骤如下：

2.根据权利要求1所述的一种基于全局边缘注意力的全景分割方法，其特征是，步骤2.2的具体过程如下：

3.根据权利要求1所述的一种基于全局边缘注意力的全景分割方法，其特征是，步骤2.5中，全景分割网络的损失函数L为：

L＝L_cls+L_box+L_mask

4.根据权利要求1所述的一种基于全局边缘注意力的全景分割方法，其特征是，步骤2.6中，当前模型的优化参数包括全景分割网络的网络权重系数和全局边缘注意力模块的边缘注意力权重矩阵群。