CN108846475B

CN108846475B - 一种分段密集连接型深度网络构建方法

Info

Publication number: CN108846475B
Application number: CN201810542036.0A
Authority: CN
Inventors: 朱建清; 曾焕强; 陈婧; 蔡灿辉; 杜永兆; 傅玉青; 林露馨
Original assignee: Huaqiao University
Current assignee: Huaqiao University
Priority date: 2018-05-30
Filing date: 2018-05-30
Publication date: 2021-10-26
Anticipated expiration: 2038-05-30
Also published as: CN108846475A

Abstract

本发明涉及一种应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法，首先把深度网络中各串连续连接的卷积层划分为多个小段；其次，对每个小段内的卷积层进行密集连接，即段内密集连接；然后，对每个小段进行密集连接，即段间密集连接，从而实现了对连续连接的卷积层的分段密集连接。最后，在各串连续连接的卷积层之间配合上最大池化层，并在最后的最大池化层之后配上全连接层，就完成了分段密集连接型深度网络的构建。借助分段密集连接的机制，一方面有利于训练更深的深度网络，进而有利提升深度网络的特征学习能力；另一方面，由于分段划分，各个小段内只包含少数卷积层，能够有效地避免因密集连接所带来的庞大计算量。

Description

一种分段密集连接型深度网络构建方法

技术领域

本发明涉及机器视觉和人工智能领域，特别涉及一种分段密集连接型深度网络构建方法，可应用于目标检测、目标分类和目标识别系统。

背景技术

卷积神经网络是目前最流行的一种深度学习算法。近年来涌现出大量基于卷积神经网络的目标检测、目标分类和目标识别算法，这些算法的准确性很大程度上依赖于卷积神经网络特征学习能力。

密集连接网络DenseNet(Huang G,Liu Z,Maaten L V D,et al.DenselyConnected Convolutional Networks[C].IEEE Conference on Computer Vision andPattern Recognition,2016.)是目前特征学习能力最强的深度网络之一。DenseNet的直接密集连接机制是指在一连串的卷积层中，对于每一个卷积层皆把其之前所有卷积层在通道(Channel)方向进行连接后作为其输入。显然，随着网络深度的增加，越排在后方的卷积层会累积到越多的输入，引起计算量的急剧增长。为了避免这种情况，DenseNet不得不对那些连接后过于庞大的输入数据，利用1×1卷积核进行特征压缩。然而，引入这种压缩机制后，网络设计的复杂度增加，且这种压缩本身亦可能损害深度网络的特征学习能力。

发明内容

本发明的目的在于提出一种应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法，该方法计算量适中，可提升卷积神经网络的特征学习能力。

为实现上述目的，本发明采用如下技术方案：

一种分段密集连接型深度网络构建方法，应用于目标检测、目标分类或目标识别系统，包括以下步骤：

步骤1、连续卷积层的分段，把深度网络中各串连续连接的卷积层划分为多个小段；

步骤2、段内密集连接，即对每个小段内的卷积层进行密集连接；

步骤3、段间密集连接，即对不同小段再次进行密集连接；

步骤4、在各串连续连接的卷积层之间配合上最大池化层，并在最后的最大池化层之后配上全连接层，就构成了分段密集型深度网络。

所述步骤1中，C＝{C₁,C₂,C₃,…,C_K}为K个连续连接的卷积层，对其进行划分，得到M个小段S＝{S₁,S₂,…,S_i,…,S_M}，每个小段上有N个卷积层，第i个小段S_i＝{C_(i-1)×N+1,C_(i-1)×N+2,…,C_(i-1)×N+j,…,C_i×N}；

所述步骤2中，所述段内密集连接是指把第i个小段S_i的第j个卷积层C_(i-1)×N+j之前且属于同一段的所有卷积层{C_(i-1)×N+1,C_(i-1)×N+2,…,C_(i-1)×N+j-1}在通道方向上进行连接，并将连接后的结果作为C_(i-1)×N+j的输入；

所述步骤3中，所述段间密集连接是指把第i个小段S_i之前的所有小段的输出，即{C_N,C_2×N,…,C_(i-1)×N}在通道方向上进行连接，并将连接后的结果作为S_i首个卷积层C_(i-1)×N+1的输入。

采用上述方案后，本发明的应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法，一方面有利于训练更深的深度网络，进而有利提升深度网络的特征学习能力；另一方面，由于分段划分，各个小段内只包含少数卷积层，无需进行特征压缩，网络的设计简单，能够有效地避免密集连接带来的庞大计算量。

附图说明

图1为本发明中CBR单元的结构示意图；

图2为本发明的分段密集连接型深度网络构建方法的原理示意图。

具体实施方式

本发明揭示了一种应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法，该方法降低深度网络的设计复杂度，计算量适中，可提升深度网络的特征学习能力。

本发明的一种分段密集连接型深度网络构建方法，应用于目标检测、目标分类或目标识别系统，具体步骤如下：

步骤1、连续卷积层的分段，即把深度网络中各串连续连接的卷积层划分为多个小段；

假设C＝{C₁,C₂,C₃,…,C_K}为K个连续连接的卷积层，对其进行划分，得到M个小段S＝{S₁,S₂,…,S_i,…,S_M}，每个小段上有N个卷积层，第i个小段S_i＝{C_(i-1)×N+1,C_(i-1)×N+2,…,C_(i-1)×N+j,…,C_i×N}；

本发明采用了目前常用的批归一化层(Batch Normalization,BN)来配合卷积层，以加快网络的收敛速度。为了便于描述，如图1所示，本发明中卷积层(Conv)、批归一化层(Batch Normalization,BN)和ReLU激活函数整合为CBR单元。基于CBR单元，如图2所示，本发明所提出的分段密集连接型深度网络，包括64个CBR单元、4个最大池化层MP1-MP4和一个全连接(Fully Connection,FC)层。每个最大池化层前连续放置16个CBR单元，并划分为四段，每段包含4个CBR单元。

步骤2、段内密集连接，即对每个小段内卷积层进行密集连接；

把第i个小段S_i的第j个卷积层C_(i-1)×N+j之前且属于同一段的所有卷积层{C_(i-1)×N+1,C_(i-1)×N+2,…,C_(i-1)×N+j-1}在通道方向上进行连接，并将连接后的结果作为C_(i-1)×N+j的输入；

具体地，以第1个小段S₁为例，进行段内密集连接的具体说明。如图2所示，第1个小段S₁包括4个CBR单元{CBR₁,CBR₂,CBR₃,CBR₄}。CBR₁作为第一个CBR单元，其输入为图像数据；CBR₂作为第二个CBR单元，其输入为CBR₁单元的输出；对于CBR₃单元，先用连接层CCAT₁把CBR₁和CBR₂按通道(Channel)方向进行连接，然后将连接结果作为CBR₃单元的输入；对于CBR₄单元，把CBR₁、CBR₂和CBR₃按照通道(Channel)方向进行连接，然后将连接结果作为CBR₄单元的输入。实际中为了简化设计，直接用连接层CCAT₂把连接层CCAT₁的输出和CBR₃单元的输出进行连接，送入CBR₄单元。

步骤3、段间密集连接，即对不同小段再次进行密集连接；

把第i个小段S_i之前的所有小段的输出，即{C_N,C_2×N,…,C_(i-1)×N}在通道方向上进行连接，并将连接后的结果作为S_i首个卷积层C_(i-1)×N+1的输入。

以第1个小段S₁至第4个小段S₄为例，进行段间密集连接的具体说明。如图2所示，S₁作为第一个小段，其输入为图像数据；S₂作为第二个小段，其输入为S₁的输出(即CBR₄单元的输出)；对于S₃，先用连接层SCAT₁把S₁的输出(即CBR₄单元的输出)和S₂的输出(即CBR₈单元的输出)按通道(Channel)方向进行连接，然后将连接结果作为S₃的输入；对于S₄，把S₁、S₂和S₃按照通道(Channel)方向进行连接，然后将连接结果作为S₄的输入。实际中为了简化设计，直接用连接层SCAT₂把连接层SCAT₁的输出和S₃的输出(即CBR₁₂单元的输出)进行连接，送入S₄。

步骤4、在各串连续连接的卷积层之间配合上最大池化层，并在最后的最大池化层之后配上全连接(Fully Connection,FC)层，就构成了分段密集型深度网络。

如图2所示，本实施例中分段密集连接型深度网络包括4个最大池化层MP₁-MP₄，每个最大池化层前连续放置的16个CBR单元，并把相应的16个CBR单元划分为四段，每段包含4个卷积层，此外在MP₄之后还连接了1个全连接层(Full Connection,FC)，因此所设计的分段密集连接型深度网络一共经历了64个CBR单元和4个最大池化层(MP₁-MP₄)和1个全连接层(Full Connection,FC)，最后送入常用的Softmax损失函数。本实施例中所有CBR单元中统一采用3×3大小的滤波器，并采用1像素补零操作。所有的池化层(MP₁-MP₄)，采用池化窗口皆为3×3，采用步长为2像素，并采用1像素补零操作。

MP₁前的16个CBR单元划分为S₁至S₄，且其中各个CBR单元输出的特征映射为64通道；MP₂前的16个CBR单元为S₅至S₈，且其中各个CBR单元输出的特征映射为128通道；MP₃前的16个CBR单元为S₉至S₁₂，且其中各个CBR单元输出的特征映射为256通道；MP₄前的16个CBR单元划分为S₁₃至S₁₆，且其中各个CBR单元输出的特征映射为512通道；FC全连接层输出的特征映射为1024通道。

以上所述，仅是本发明的一个实施例而已，并非对本发明的技术范围作任何限制，故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种分段密集连接型深度网络构建方法，应用于目标检测、目标分类或目标识别系统，其特征在于，包括以下步骤：

步骤3、段间密集连接，即对不同小段再次进行密集连接；

步骤4、在各串连续连接的卷积层之间配合上最大池化层，并在最后的最大池化层之后配上全连接层，就构成了分段密集型深度网络；

所述步骤1中，C＝{C₁,C₂,C₃,…,C_K}为K个连续连接的卷积层，对其进行划分，得到M个小段S＝{S₁,S₂,…,S_i,…,S_M}，每个小段上有N个卷积层，第i个小段S_i＝{C_(i-1)×N+1,C_(i-1)×N+2,…,C_(i-1)×N+j,…,C_i×N}；采用批归一化层来配合卷积层，将卷积层、批归一化层和ReLU激活函数整合为CBR单元，所有CBR单元采用1像素补零操作；

所述步骤2中，所述段内密集连接是指把第i个小段S_i的第j个卷积层C_(i-1)×N+j之前且属于同一段的所有卷积层{C_(i-1)×N+1,C_(i-1)×N+2,…,C_(i-1)×N+j-1}在通道方向上进行连接，并将连接后的结果作为C_(i-1)×N+j的输入；其中，各个小段的第一个CBR单元的输入为图像数据；

所述步骤3中，所述段间密集连接是指把第i个小段S_i之前的所有小段的输出，即{C_N,C_2×N,…,C_(i-1)×N}在通道方向上进行连接，并将连接后的结果作为S_i首个卷积层C_(i-1)×N+1的输入；其中，第1个小段S1的输入为图像数据。