CN110648332B

CN110648332B - 基于多分支卷积神经网络特征正交的图像可判别区域提取方法

Info

Publication number: CN110648332B
Application number: CN201910866119.XA
Authority: CN
Inventors: 孟凡满; 黄开旭; 鲍俊玲; 李宏亮; 吴庆波
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2019-09-12
Filing date: 2019-09-12
Publication date: 2022-03-15
Anticipated expiration: 2039-09-12
Also published as: CN110648332A

Abstract

本发明提供的一种基于多分支卷积神经网络特征正交的图像可判别区域提取方法，包括步骤：1)构建N个结构相同卷积神经网络作为多分支卷积神经网络的N个分支，N个卷积神经网络相互不共享参数；任意两个不同分支输出的特征之间作哈达玛积，将哈达玛积的矩阵中所有元素相加得到两两分支的特征正交损失；多分支卷积神经网络的总损失函数为所有分支的分类损失加上超参数乘两两分支的特征正交损失之和；2)得到训练集；3)训练多分支卷积神经网络；4)利用经过训练的多分支卷积神经网络进行图像可判别区域提取。本发明使用了多分支卷积神经网络，利用特征正交，使不同分支的卷积神经网络之间彼此不同，从而可以获得不同的可判别区域信息。

Description

基于多分支卷积神经网络特征正交的图像可判别区域提取方法

技术领域

本发明涉及图像处理的卷积神经网络技术，特别涉及图像可判别区域提取技术。

背景技术

图像可判别区域显示了图像中属于特定类别的区域。它可以从具有图像级标签的图像中获取指定类别的像素级对象区域，并且最近已被广泛应用于许多计算机视觉弱监督分析任务中，例如图像分割，对象检测和和识别等任务。提取更高质量的图像可判别区域对于计算机视觉任务非常重要。

目前基于卷积神经网络进行图像可判别区域提取的算法，是基于单一卷积神经网络来提取图像可判别区域的。由于图像可判别区域提取算法的限制，单一卷积神经网络可以提取到的信息有限，即提取到的可判别区域比较小，无法提取到完整的可判别区域。

发明内容

本发明所要解决的技术问题是，提供的一种应用在图像可判别区域提取上的基于多分支卷积神经网络的特征正交模块。

本发明为解决上述技术问题所采用的技术方案是，基于多分支卷积神经网络特征正交的图像可判别区域提取方法，包括以下步骤：

1)基于特征正交模块构建多分支卷积神经网络作为分类网络；

构建N个结构相同卷积神经网络作为多分支卷积神经网络的N个分支，N个卷积神经网络相互不共享参数；N为大于2的整数；

将每个分支卷积神经网络最后一层卷积层输出的特征提取出来，任意两个不同分支输出的特征之间作哈达玛积，将哈达玛积的矩阵中所有元素相加得到两两分支的特征正交损失；N分支卷积神经网络的总损失函数L_all为：

其中L_ci为第i个分支的分类损失，L_o为两两分支的特征正交损失之和，λ为超参数；

2)对准备好的数据库进行预处理得到训练集；

3)使用训练数据训练多分支卷积神经网络；

4)利用经过训练的多分支卷积神经网络进行图像可判别区域提取：

将测试图片输入其分支卷积神经网络中，对于每个分支获取测试图像可判别区域；将从N个分支网络获取到的测试图像的可判别区域进行融合，从而得到图像的可判别区域谱M，融合计算如下：

其中,M_i表示第i个分支提取到的可判别区域，M表示融合后最终的可判别区域。

本发明的有益效果是，针对目前图像可判别区域提取方法多基于单一卷积神经网络，这些方法提取到的可判别区域不够全面，本发明使用了多分支卷积神经网络，利用特征正交，使不同分支的卷积神经网络之间彼此不同，从而可以获得不同的可判别区域信息。融合从不同分支提取到的可判别区域，可以提取出图像更加完整可判别区域。

附图说明

图1为是实施例三分支卷积神经网络示意图；

图2为实施例的图像可判别区域提取过程示意图。

具体实施方式

步骤一，构建基于特征正交模块的卷积神经网络：

1.1构建多分支卷积神经网络。这里我们构建三分支卷积神经网络，即使用三个ResNet-50网络构建卷积神经网络。这三个ResNet-50网络作为我们卷积神经网络的三个分支，它们之间不共享参数。

1.2构建特征正交模块。我们将卷积神经网络的每个分支最后一层卷积层layer4输出的特征提取出来，然后任意两个不同分支输出的特征之间作哈达玛积，最后将得到的所有哈达玛积矩阵中所有元素相加构建特征正交损失。具体公式如下：

其中，i与j均表示分支序号变量，||x||_sum表示求x矩阵中所有元素的和，

表示特征f_i和特征f_j之间作哈达玛积。

1.3构建卷积神经网络的总损失函数。对于卷积神经网络中的每一个分支网络，单独计算它的分类损失，这里我们使用的是二元交叉熵损失。总损失函数由所有分支的分类损失和1.2中构建的特征正交损失组成。具体公式如下：

其中，L_ci表示第i个分支网络的分类损失，L_o表示1.2中的特征正交损失,λ为超参数，我们将它设定为0.00001.

步骤二、对分类数据库进行预处理得到训练集和测试集：

2.1我们选择Pascal VOC 2012数据集作为数据集。Pascal VOC 2012数据集包含了飞机、自行车、人、猫等20个类别的图片。选取Pascal VOC 2012数据集公布的训练集作为本发明的训练集，包含10582张图片；Pascal VOC 2012数据集公布的验证集作为本发明的测试集，包含1449张图片。

2.2我们将所有图片归一化为长256宽256,以适应分类网络的输入大小。

2.3我们将所有图片R、G、B三个通道分别减去整个数据集所有图片分别在R、G、B三个通道上的均值，以减少图像中光照，阴影等对分类网络的影响。

步骤三、训练基于特征正交模块的分类网络：

使用步骤一中设计好的多分支卷积神经网络模型作为分类网络对步骤二中准备好的训练数据进行分类训练，训练完成后保存分类网络。

步骤四、利用经过训练的卷积神经网络进行图像可判别区域提取：

4.1将测试图片输入其训练好的分类网络中，对于分类网络中每个分支网络，都通过grad-cam获取图像可判别区域。

4.2将各分支得到的图像可判别区域进行双线性上采样操作，使其大小和原图相等。

4.3将从3个分支网络获取到的图像的3个可判别区域进行融合，从而得到图像的可判别区域谱。融合计算公式如下：

其中M_i表示第i个分支提取到的进行双线性上采样操作后的可判别区域，M表示融合后最终的可判别区域。最终结果效果如图2所示。

Claims

1.基于多分支卷积神经网络特征正交的图像可判别区域提取方法，其特征在于，包括以下步骤：

1)网络构建：

2)构建训练集；

3)使用训练数据训练所述多分支卷积神经网络；

4)使用训练完成的所述多分支卷积神经网络进行图像可判别区域提取：

4-1)将测试图片输入其分支卷积神经网络中，对于每个分支获取测试图像可判别区域；

4-2)将各分支的测试图像的可判别区域进行双线性上采样，使其大小和原测试图片相等；

4-3)将从N个分支网络获取到的测试图像的可判别区域进行融合，从而得到图像的可判别区域谱M，融合计算如下：

2.如权利要求1所述方法，其特征在于，各分支的分类损失的计算使用二元交叉熵损失。

3.如权利要求1所述方法，其特征在于，结构相同卷积神经网络为残差网络。

4.如权利要求3所述方法，其特征在于，残差网络为ResNet-50网络。

5.如权利要求1所述方法，其特征在于，超参数λ设定为0.00001。

6.如权利要求1所述方法，其特征在于，构建训练集时，先将数据集中所有图片进行尺寸归一化，再将所有图片R、G、B三个通道分别减去整个数据集所有图片分别在R、G、B三个通道上的均值。

7.如权利要求6所述方法，其特征在于，尺寸归一化大小为256*256。