CN107247952B

CN107247952B - 基于深层监督的循环卷积神经网络的视觉显著性检测方法

Info

Publication number: CN107247952B
Application number: CN201610604722.7A
Authority: CN
Inventors: 邬向前; 卜巍; 唐有宝
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2016-07-28
Filing date: 2016-07-28
Publication date: 2020-11-10
Anticipated expiration: 2036-07-28
Also published as: CN107247952A

Abstract

本发明公开了一种基于深层监督的循环卷积神经网络的显著性检测方法，其包括如下步骤：一、初级深层网络结构的设计；二、循环卷积神经网络的设计；三、深层监督的循环卷积神经网络的设计；四、模型的训练与测试。本发明提出了一种新的网络结构，在不增加模型参数的同时增加了网络结构的深度，并采用多层监督信息来对模型进行有效地训练。本发明提出的深层监督的循环卷积神经网络除了在显著性检测领域能取得很好的效果外，还可以用于所有的基于像素分类的图像处理和计算机视觉领域的应用中。

Description

基于深层监督的循环卷积神经网络的视觉显著性检测方法

技术领域

本发明涉及一种基于深度学习的图像处理方法，具体涉及一种基于深层监督的循环卷积神经网络的视觉显著性检测方法。

背景技术

随着深度学习的发展和兴起，基于深度学习的显著性检测技术也不断发展。显著性检测可分为自底向上的数据驱动模型和自顶向下的任务驱动模型两大类。自底向上的显著性检测是指对于给定的任意一幅图像，找出图中引人注意的目标，该目标可为任何类别的事物。而自顶向下的显著性检测方法通常从给定图片中找出给定类别的目标，并赋予不同的显著性值。目前，对自底向上的显著性检测方法的研究最多。

现在已有的自底向上的显著性检测方法可分为两类，分别为基于手工设计特征的方法和基于卷积神经网络的方法。由于基于手工设计特征的方法通常利用图像中的表面信息（比如颜色、纹理等）来进行特征提取，而提取的这些手工特征不能捕捉显著性目标的深层特性和多尺度信息，从而不能取得很好的性能。最近随着深度学习的兴起，有部分研究者开始使用卷积神经网络来进行显著性目标检测。目前已有的大部分基于卷积神经网络（CNN）的显著性目标检测方法首先将图像分割成多个区域，然后对每个区域用训练好的CNN模型来预测其显著性值。由于图像分割本身是一个复杂的问题，且每个区域都需使用模型进行预测，从而使得这些方法变得复杂且不能得到精确的像素级的显著性预测结果。

发明内容

为了克服上述问题，本发明提出一种新的基于CNN的显著性检测方法，即基于深层监督的循环卷积神经网络的显著性检测方法，其可直接使用模型对原始图像进行预测，得到精确的像素级的显著性图，从而能更有效地推动基于显著性的相关应用的发展。

本发明的目的是通过以下技术方案实现的：

本发明提供了一种基于深层监督的循环卷积神经网络的显著性检测方法，该方法研究的对象是静态图像，其中图像的内容可以是任意的，研究的目标是从图像中找出吸引人眼注意力的目标，并为其赋予不同的显著性值。本发明主要设计了一种新的网络结构，叫做深层监督的循环卷积神经网络。该网络模型以图像作为输入，以图像的真实结果作为监督信号用于网络模型的训练，并最终输出与输入图像大小一致的显著性图。该网络结构是在VGGNet-16的基础上进行改进得到，即将VGGNet-16中的卷积层替换成循环卷积层，从而在不增加网络参数的同时增加了网络结构的深度。同时还在网络结构中的多层加入监督信息，以便能更有效地训练网络模型。具体实施步骤如下：

一、初级深层网络结构的设计

以VGGNet-16为基础，将其前5个模块作为初级网络模型；

二、循环卷积神经网络的设计

在初级网络模型的基础上，在初级网络结构中的每个卷积层上引入循环链接，即将所有卷积层替换为循环卷积层；

三、深层监督的循环卷积神经网络的设计

在每个模块最后的循环卷积层后增加一个额外的模块，将五个增加的额外的模块的输出拼接成一个多通道图，然后使用一个卷积层对该多通道图进行卷积操作，得到最终的显著性图；

四、模型的训练与测试

在模型训练的过程中，首先计算每个额外增加的模块的输出与监督信号之间的误差；其次对所有额外模块计算得到的误差求和得到总误差，然后将误差回传来更新模型的参数直到满足终止条件；

在模型测试的过程中，对于给定的图像，将其作为训练好的模型的输入，通过计算后，直接输出最终的显著性图。

本发明具有如下优点：

1、本发明提出了一种新的网络结构，在不增加模型参数的同时增加了网络结构的深度，并采用多层监督信息来对模型进行有效地训练。

2、本发明提出的深层监督的循环卷积神经网络除了在显著性检测领域能取得很好的效果外，还可以用于所有的基于像素分类的图像处理和计算机视觉领域的应用中，比如图像分割。

附图说明

图1为深层监督的循环卷积神经网络结构；

图2为卷积层和循环卷积层，a-卷积层，b-循环卷积层，c-循环卷积层展开后的网络结构；

图3为本发明进行显著性检测的结果，a-原始图像，b-真实结果，c-检测结果。

具体实施方式

下面结合附图对本发明的技术方案作进一步的说明，但并不局限于此，凡是对本发明技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，均应涵盖在本发明的保护范围中。

本发明提供了一种基于深层监督的循环卷积神经网络的显著性检测方法，具体实施步骤如下：

一、初级深层网络结构的设计

为了获得像素级显著性预测结果，本发明首先设计一个初级的网路结构，以原始图像作为输入，以与原始图像大小一致的显著性图作为输出。为了得到精确的显著性图，该网络模型应该具有深层的结构和不同步幅的多尺度结构，以至于学习到区分能力强的多尺度特征。当样本数量不够时，重新训练这样一个网络模型是很困难的，因此本发明使用在大量样本的数据库上训练好的VGGNet-16模型作为预训练模型，并用其在显著性检测的数据集上进行微调。由于VGGNet-16网络模型包含了6个模块，前5个模块由卷积层（记为conv）和池化层（记为pooling）组成，最后一个模块由池化层和全连接层组成。由于最后一个模块中的池化层使得输出的特征图的大小太小，从而不利于显著性图的预测，且全连接层增加了模型的复杂性，因此本发明将使用VGGNet-16中的前5个模块作为初级网络模型。

二、循环卷积神经网络的设计

为了使模型能够学习到更加丰富的上下文信息，在初级网络模型的基础上，本发明在初级网络结构中的每个卷积层上引入循环链接，即将所有卷积层（convolutionallayer，如图2(a)所示）替换为循环卷积层（recurrent convolutional layer，记为RCL，如图2(b)所示）。本发明中的循环卷积层进行2次循环过程，即在原有卷积层的基础上，使用相同的卷积核对生成特征图再进行卷积操作得到的结果与该卷积核同最底层特征图进行卷积操作得到的结果之和作为该层的结果，重复该过程2次。将该循环卷积层展开后可得到一个深度为3的网络结构（如图2(c)所示）。由此可见，随着循环次数的增加，循环卷积层的有效感受野相比前一层也是逐渐扩大的，从而使得循环卷积层相比卷积层在不增加参数的同时能学习到包含更加丰富的上下文信息的特征，最终达到提高显著性图预测的性能。

三、深层监督的循环卷积神经网络的设计

为了学习到更具区分能力的局部和全局特征，本发明为以上网络结构中的每一个模块使用监督信息来对模型进行深层监督学习。通过在每个模块最后的循环卷积层后增加一个额外的模块，该模块由一个卷积层和一个去卷积层（deconvolutional layer，记为deconv）组成（如图1所示）。这些额外增加的卷积层只有一个卷积核且该核的大小为1*1，因此这样的一个卷积操作是将多个特征图转化为一个显著性图。而额外增加的去卷积层的目的是为了使得输出的显著性图的大小和原始图像一致。最终为了使最终的显著性图考虑到显著性目标的局部和全局信息，本发明将五个增加的额外的模块的输出进行融合，即将它们的输出拼接（记为concat）成一个多通道图，然后使用一个卷积核大小为1*1的卷积层对该多通道图进行卷积操作，得到最终的显著性图。实际上，最后的卷积操作是一个加权融合的过程。到此为止，本发明提出的整个深层监督的循环卷积神经网络结构已经全部给出，如图1所示。

四、模型的训练与测试

在模型训练的过程中，首先计算每个额外增加的模块（包括最后的融合模块）的输出与监督信号之间的误差。由于监督信号中的正负两类像素点的个数相差太大，为了平衡两个之间的差距，本发明使用叉熵损失函数来计算误差。其次，对所有额外模块计算得到的误差求和得到总误差，然后将误差回传来更新模型的参数直到满足终止条件。在模型测试的过程中，对于给定的图像，本发明可将其作为训练好的模型的输入，通过计算后，直接输出最终的显著性图。图3给出了三个本发明进行显著性检测的结果，由图3可知，本发明检测的结果与真实结果很接近，由此说明了本发明的有效性。

Claims

1.一种基于深层监督的循环卷积神经网络的显著性检测方法，其特征在于所述方法步骤如下：

步骤一、初级深层网络结构的设计

以VGGNet-16为基础，将其前5个模块作为初级网络模型；

步骤二、循环卷积神经网络的设计

步骤三、深层监督的循环卷积神经网络的设计

在每个模块最后的循环卷积层后增加一个额外的模块，所述额外增加的模块由一个卷积层和一个去卷积层组成，额外增加的卷积层只有一个卷积核且该核的大小为1*1；将五个增加的额外的模块的输出拼接成一个多通道图，然后使用一个卷积层对该多通道图进行卷积操作，得到最终的显著性图；

步骤四、模型的训练与测试

2.根据权利要求1所述的基于深层监督的循环卷积神经网络的显著性检测方法，其特征在于所述步骤二中，循环卷积层进行2次循环过程，即：

（1）在原有卷积层的基础上，使用相同的卷积核对生成特征图再进行卷积操作得到的结果与该卷积核同最底层特征图进行卷积操作得到的结果之和作为循环卷积层的结果；

（2）重复过程（1）2次。