CN110866565B

CN110866565B - 一种基于卷积神经网络的多分支图像分类方法

Info

Publication number: CN110866565B
Application number: CN201911176738.2A
Authority: CN
Inventors: 栾晓; 赵园园; 刘玲慧
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Guo Weiwang
Priority date: 2019-11-26
Filing date: 2019-11-26
Publication date: 2022-06-24
Anticipated expiration: 2039-11-26
Also published as: CN110866565A

Abstract

本发明涉及一种基于卷积神经网络的多分支图像分类方法，属于图像处理领域，该方法包含如下步骤：S1：提取主干神经网络中的各个尺度的特征图；S2：对相邻的特征图相加形成多个分支并且每个分支设置单独的一个输出；S3：结合主干网络的输出，通过投票各个输出的结果得到一个辅助输出，最后选取所有输出中准确率最高的。最后，本发明方法能够准确的对图像分类，在各个数据库上都有较高的识别效果。

Description

一种基于卷积神经网络的多分支图像分类方法

技术领域

本发明涉及一种基于卷积神经网络的多分支图像分类方法，属于图像处理领域。

背景技术

深度神经网络在图像分类任务中取得了巨大的成功。研究表明，越深的网络层数越能够提取到图像高级的特征。因此，研究者们着力于解决如何加深网络结构以提升分类准确率。1998年至今，网络层数从一开始的5层到19层，甚至达到了惊人的1202层。随着网络层数的加深，图像识别竞赛ILSVRC的准确率也逐渐被提高。除了加深网络层数外，另一批学者尝试从其他的方向来改进网络结构，如加宽网络,分组卷积网络，分形网络等。

虽然随着层数的增加，网络性能变得更好，但是网络优化问题变得愈加的困难。残差结构能很好的优化网络，但是更深层的网络仍然出。现了过拟合的问题。此外，池化会导致信息的损失，影响网络的分类准确率。网络在前向传播的过程中，会不断的对原始输入图像进行降维，每一次的降维都会造成不同程度的信息丢失。而丢失的信息对于网络性能的提升也有着不可忽视的作用。总的来说，现有的网络依然会面临着优化问题和特征复用问题。

发明内容

有鉴于此，本发明的目的在于提供一种基于卷积神经网络的多分支图像分类方法，能解决现有深度卷积神经网中的优化和过拟合问题。

为达到上述目的，本发明提供如下技术方案：

一种基于卷积神经网络的多分支图像分类方法，该方法包含如下步骤：

S1：提取主干神经网络中的各个尺度的特征图；

S2：对相邻的特征图相加形成多个分支并且每个分支设置单独的一个输出，每一个分支称为一个branch单元；

S3：结合主干网络的输出，通过投票各个输出的结果得到一个辅助输出，最后选取所有输出中准确率最高的。

可选的，所述步骤S2中，一个branch单元包含如下步骤：

S31：先对低维度的特征图进行上采样

S32：减少其通道数

S33：和另一个特征图相加

上述步骤满足如下公式：

y＝x+W_s(Up(G(x)))

式中，x表示branch单元的输入，G表示一个下采样函数，Up表示上采样函数，W_s映射函数，功能为改变其输入的通道数。

可选的，所述投票遵从对每个输出类别取众数的规则，满足如下公式：

式中，y表示投票后的类别，y_i表示第i个分支所属的类别，c_j表示总分类数中的第j个类别，I为指示函数，当y_i＝c_j时为1，否则为0。

本发明的有益效果在于：本发明方法能够缓解现有卷积神经网络中的过拟合问题，能够更好地优化网络信息的传递。

附图说明

为了使本发明的目的、技术方案和有益效果更加清楚，本发明提供如下附图进行说明：

图1为本发明的网络结构图；

图2为本发明的branch单元结构图；

图3为本发明的具有3个branch单元的结构图。

具体实施方式

下面将结合附图，对本发明的优选实施例进行详细的描述。

本发明为一种基于卷积神经网络的多分支图像分类方法，该方法包含如下步骤：

1、提取主干神经网络中的各个尺度的特征图；

2、对相邻的特征图相加形成多个分支并切每个分支设置单独的一个输出，每一个分支称为一个branch单元；

3、结合主干网络的输出，通过投票各个输出的结果得到一个辅助输出，最后选取所有输出中准确率最高的。

由于现有网络结构中，为了减少参数和计算量都会在网络中对输入图像多次降维，因此本文提出的BranchNet可以直接扩展在主干网络中，提取网络中输入图像每一个维度的输出，把相邻两个维度的输出相加形成一个branch单元，如图2所示，然后作为主干网络的辅助输出，得到多个结果。为了进一步利用多尺度信息，我们还对输出结果进行投票，在原输出的数量上增加一个输出，最后选取准确率最大的输出作为最终结果。

图1到图3为本发明方法的结构示意图。具体包括以下几个部分：

图1为本发明方法的网络结构图，有主干网络和branch单元构成。图中每有一条支路就有一个branch单元，以及对应于一个结果。最后对所有的结果投票取最大值。

图2为本发明所述branch单元结构图。包括以下步骤：

1、先对低维度的特征图进行上采样

2、减少其通道数

3、和另一个特征图相加

上述步骤满足如下公式：

y＝x+W_s(Up(G(x)))

图3为本发明方法中有四个branch单元的网络结构图。

最后说明的是，以上优选实施例仅用以说明发明的技术方案而非限制，尽管通过上述优选实施例已经对本发明进行了详细的描述，但本领域技术人员应当理解，可以在形式上和细节上对其作出各种各样的改变，而不偏离本发明权利要求书所限定的范围。

Claims

1.一种基于卷积神经网络的多分支图像分类方法，其特征在于：该方法包含如下步骤：

S1：提取主干神经网络中的各个尺度的特征图；

2.根据权利要求1所述的一种基于卷积神经网络的多分支图像分类方法，其特征在于：所述步骤S2中，一个branch单元包含如下步骤：

S31：先对低维度的特征图进行上采样

S32：减少其通道数

S33：和另一个特征图相加

上述步骤满足如下公式：

y＝x+W_s(Up(G(x)))

3.根据权利要求2所述的一种基于卷积神经网络的多分支图像分类方法，其特征在于：所述投票遵从对每个输出类别取众数的规则，满足如下公式：