WO2022095584A1

WO2022095584A1 - 一种基于流卷积的图像识别方法

Info

Publication number: WO2022095584A1
Application number: PCT/CN2021/117028
Authority: WO
Inventors: 陈英鹏; 许野平; 井焜; 刘辰飞; 席道亮; 高朋; 张朝瑞
Original assignee: 神思电子技术股份有限公司
Priority date: 2020-11-06
Filing date: 2021-09-07
Publication date: 2022-05-12
Also published as: CN112288028A

Abstract

一种基于流卷积的图像识别方法，所述流卷积在分组卷积的基础上，利用通道路径聚合操作，即连接当前子分组输入特征与上一层子分组输出特征去得到当前层子分组输出特征，去加强各子分组之间的特征信息流通。基于流卷积的目标预防不仅有效减少了网络参数与计算成本，而且使得图像识别精度得到进一步提升。

Description

一种基于流卷积的图像识别方法

技术领域

本发明涉及人工智能领域，具体地说，是一种基于流卷积的图像识别方法，属于卷积神经网络的特征提取网络。

背景技术

近年来，卷积神经网络在各类计算视觉任务中取得重大突破。卷积神经网络的设计变得越来越复杂。然而，在现实的应用场景中，受限于有限设备计算资源，分组卷积的方式越来越受到大家的关注。尽管这种分组卷积的方式可以有效的减少网络参数量以及计算成本，但是这种分离通道特征的方式会导致组通道特征信息无法有效的流通起来，从而导致网络性能下降明显。

论文《MobileDets:Searching for Object Detection Architectures for Mobile Accelerators》中利用深度分离卷积来减少网络参数以及计算成本，但是该方法整体性能下降也很明显。

论文《CSPNet:A New Backbone that can Enhance Learning Capability of CNN》中提出了跨阶段局部网络(CSPNet)，以缓解以往的工作需要从网络架构的角度进行大量推理计算的问题。但是该方法仍然基于传统的卷积操作进行网络设计，很难进一步减少模型参数与计算成本。

发明内容

本发明要解决的技术问题是提供一种基于流卷积的图像识别方法，在减少参数以及计算成本的前提下，利用通道路径聚合的方式，使得子组通道特征信息能够很好地相互流通起来，从而提高图像识别的速度、减低计算成本。

为了解决所述技术问题，本发明采用的技术方案是：一种基于流卷积的图像识别方法，包括以下步骤：

S01)、输入特征进入图像识别网络，输入特征为X ^(h,w,c)，其中h表示输入特征的高度，w表示输入特征的宽度，c表示输入特征的通道数；

S02)、图像识别网络中步长为1的卷积层的卷积操作替换成流卷积操作，流卷积操作为：

S21)、将执行流卷积操作的卷积层拆分为g个子分组，每个子分组对应的输入特征为

各子分组的宽高与输入特征宽高保持一致，各子分组通道数与输入特征通道数的关系为：

c ₁+c ₂+...+c _g＝c；

S22)、各子分组执行卷积操作映射，用公式表示为：

其中，F _i表示正常的卷积操作映射，i∈[1,2,...,g]；

S23)、流卷积最后的输出特征为各子分组输出特征的连接，即Y＝[Y ₁,Y ₂,...Y _g]；

S03)、图像识别网络输出图像识别结果。

进一步的，流卷积的两两连接方式为：第一个流卷积的通道特征信息流通方式为自顶向下，第二个流卷积的通道特征信息流通方式为自底向上。

进一步的，流卷积的两两连接方式为：第一个流卷积的通道特征信息流通方式为自底向上，第二个流卷积的通道特征信息流通方式为自顶向下。

进一步的，流卷积的两两连接方式为：两个流卷积的通道特征信息流通方式均为自顶向下。

进一步的，流卷积的两两连接方式为：两个流卷积的通道特征信息流通方式均为自底向上。

进一步的，

本发明的有益效果：本发明公开一种基于流卷积的图像识别方法，所述流卷积在分组卷积的基础上，利用通道路径聚合操作，即连接当前子分组输入特征与上一层子分组输出特征去得到当前层子分组输出特征，去加强各子分组之间的特征信息流通。基于流卷积的目标预防不仅有效减少了网络参数与计算成本，而且使得图像识别精度得到进一步提升。

附图说明

图1为流卷积连接方式示意图；

图2为图像识别网络结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的说明。

实施例1

本实施例公开一种基于流卷积的图像识别方法，包括以下步骤：

本实施例中，所述图像识别网络为经典网络残差网络(ResNet50)，图2为ResNet50网络的结构示意图。

c ₁+c ₂+...+c _g＝c；

流卷积的分组方式有多种，可以使得每个子分组的通道数相等或者不相等均可。为了便于计算，本方法中选取各子分组通道均相等的方式，即：

S22)、各子分组执行卷积操作映射，用公式表示为：

其中，F _i表示正常的卷积操作映射，i∈[1,2,...,g]；

S03)、图像识别网络输出图像识别结果。

本实施例所述方法主要对ResNet50步长为1的卷积层全部替换为流卷积，下采样层(步长为2的卷积层)、池化层、平均池化、全连接层以及最后的输出层均保持不变，因此本实施例对这些操作详述。流卷积的两两连接方式采用图2中的任意一种即可。

本实施例中，流卷积的两两连接方式有4种，如图1所示，分别为：

Flow Type A：第一个流卷积的通道特征信息流通方式为自顶向下，第二个流卷积的通道特征信息流通方式为自底向上。

Flow Type B：第一个流卷积的通道特征信息流通方式为自底向上，第二个流卷积的通道特征信息流通方式为自顶向下。

Flow Type C：第一个流卷积的通道特征信息流通方式为自底向上，第二个流卷积的通道特征信息流通方式为自顶向下。

Flow Type D：两个流卷积的通道特征信息流通方式均为自底向上。

本实施例所述目标预测方法在分组卷积的基础上，利用通道路径聚合操作，即连接当前子分组输入特征与上一层子分组输出特征去得到当前层子分组输出特征，去加强各子分组之间的特征信息流通。基于流卷积的目标预防不仅有效减少了网络参数与计算成本，而且使得图像识别精度得到进一步提升。

以上描述的仅是本发明的基本原理和优选实施例，本领域技术人员根据本发明作出的改进或替换，属于本发明的保护范围。

Claims

一种基于流卷积的图像识别方法，其特征在于：包括以下步骤：

S01)、输入特征进入图像识别网络，输入特征为X ^(h,w,c)，其中h表示输入特征的高度，w表示输入特征的宽度，c表示输入特征的通道数；

S02)、图像识别网络中步长为1的卷积层的卷积操作替换成流卷积操作，流卷积操作为：

S21)、将执行流卷积操作的输入特征拆分为g个子分组，每个子分组对应的输入特征为
各子分组的宽高与输入特征宽高保持一致，各子分组通道数与输入特征通道数的关系为：

c ₁+c ₂+...+c _g＝c；

S22)、各子分组执行卷积操作映射，用公式表示为：

其中，F _i表示正常的卷积操作映射，i∈[1,2,...,g]；

S23)、流卷积最后的输出特征为各子分组输出特征的连接，即Y＝[Y ₁,Y ₂,...Y _g]；

S03)、图像识别网络输出图像识别结果。
根据权利要求1所述的基于流卷积的图像识别方法，其特征在于：流卷积的两两连接方式为：第一个流卷积的通道特征信息流通方式为自顶向下，第二个流卷积的通道特征信息流通方式为自底向上。
根据权利要求1所述的基于流卷积的图像识别方法，其特征在于：流卷积的两两连接方式为：第一个流卷积的通道特征信息流通方式为自底向上，第二个流卷积的通道特征信息流通方式为自顶向下。
根据权利要求1所述的基于流卷积的图像识别方法，其特征在于：流卷积的两两连接方式为：两个流卷积的通道特征信息流通方式均为自顶向下。
根据权利要求1所述的基于流卷积的图像识别方法，其特征在于：流卷积的两两连接方式为：两个流卷积的通道特征信息流通方式均为自底向上。
根据权利要求1所述的基于流卷积的图像识别方法，其特征在于：