CN108846475B - 一种分段密集连接型深度网络构建方法 - Google Patents

一种分段密集连接型深度网络构建方法 Download PDF

Info

Publication number
CN108846475B
CN108846475B CN201810542036.0A CN201810542036A CN108846475B CN 108846475 B CN108846475 B CN 108846475B CN 201810542036 A CN201810542036 A CN 201810542036A CN 108846475 B CN108846475 B CN 108846475B
Authority
CN
China
Prior art keywords
dense connection
layer
deep network
segment
cbr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810542036.0A
Other languages
English (en)
Other versions
CN108846475A (zh
Inventor
朱建清
曾焕强
陈婧
蔡灿辉
杜永兆
傅玉青
林露馨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaqiao University
Original Assignee
Huaqiao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaqiao University filed Critical Huaqiao University
Priority to CN201810542036.0A priority Critical patent/CN108846475B/zh
Publication of CN108846475A publication Critical patent/CN108846475A/zh
Application granted granted Critical
Publication of CN108846475B publication Critical patent/CN108846475B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法,首先把深度网络中各串连续连接的卷积层划分为多个小段;其次,对每个小段内的卷积层进行密集连接,即段内密集连接;然后,对每个小段进行密集连接,即段间密集连接,从而实现了对连续连接的卷积层的分段密集连接。最后,在各串连续连接的卷积层之间配合上最大池化层,并在最后的最大池化层之后配上全连接层,就完成了分段密集连接型深度网络的构建。借助分段密集连接的机制,一方面有利于训练更深的深度网络,进而有利提升深度网络的特征学习能力;另一方面,由于分段划分,各个小段内只包含少数卷积层,能够有效地避免因密集连接所带来的庞大计算量。

Description

一种分段密集连接型深度网络构建方法
技术领域
本发明涉及机器视觉和人工智能领域,特别涉及一种分段密集连接型深度网络构建方法,可应用于目标检测、目标分类和目标识别系统。
背景技术
卷积神经网络是目前最流行的一种深度学习算法。近年来涌现出大量基于卷积神经网络的目标检测、目标分类和目标识别算法,这些算法的准确性很大程度上依赖于卷积神经网络特征学习能力。
密集连接网络DenseNet(Huang G,Liu Z,Maaten L V D,et al.DenselyConnected Convolutional Networks[C].IEEE Conference on Computer Vision andPattern Recognition,2016.)是目前特征学习能力最强的深度网络之一。DenseNet的直接密集连接机制是指在一连串的卷积层中,对于每一个卷积层皆把其之前所有卷积层在通道(Channel)方向进行连接后作为其输入。显然,随着网络深度的增加,越排在后方的卷积层会累积到越多的输入,引起计算量的急剧增长。为了避免这种情况,DenseNet不得不对那些连接后过于庞大的输入数据,利用1×1卷积核进行特征压缩。然而,引入这种压缩机制后,网络设计的复杂度增加,且这种压缩本身亦可能损害深度网络的特征学习能力。
发明内容
本发明的目的在于提出一种应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法,该方法计算量适中,可提升卷积神经网络的特征学习能力。
为实现上述目的,本发明采用如下技术方案:
一种分段密集连接型深度网络构建方法,应用于目标检测、目标分类或目标识别系统,包括以下步骤:
步骤1、连续卷积层的分段,把深度网络中各串连续连接的卷积层划分为多个小段;
步骤2、段内密集连接,即对每个小段内的卷积层进行密集连接;
步骤3、段间密集连接,即对不同小段再次进行密集连接;
步骤4、在各串连续连接的卷积层之间配合上最大池化层,并在最后的最大池化层之后配上全连接层,就构成了分段密集型深度网络。
所述步骤1中,C={C1,C2,C3,…,CK}为K个连续连接的卷积层,对其进行划分,得到M个小段S={S1,S2,…,Si,…,SM},每个小段上有N个卷积层,第i个小段Si={C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j,…,Ci×N};
所述步骤2中,所述段内密集连接是指把第i个小段Si的第j个卷积层C(i-1)×N+j之前且属于同一段的所有卷积层{C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j-1}在通道方向上进行连接,并将连接后的结果作为C(i-1)×N+j的输入;
所述步骤3中,所述段间密集连接是指把第i个小段Si之前的所有小段的输出,即{CN,C2×N,…,C(i-1)×N}在通道方向上进行连接,并将连接后的结果作为Si首个卷积层C(i-1)×N+1的输入。
采用上述方案后,本发明的应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法,一方面有利于训练更深的深度网络,进而有利提升深度网络的特征学习能力;另一方面,由于分段划分,各个小段内只包含少数卷积层,无需进行特征压缩,网络的设计简单,能够有效地避免密集连接带来的庞大计算量。
附图说明
图1为本发明中CBR单元的结构示意图;
图2为本发明的分段密集连接型深度网络构建方法的原理示意图。
具体实施方式
本发明揭示了一种应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法,该方法降低深度网络的设计复杂度,计算量适中,可提升深度网络的特征学习能力。
本发明的一种分段密集连接型深度网络构建方法,应用于目标检测、目标分类或目标识别系统,具体步骤如下:
步骤1、连续卷积层的分段,即把深度网络中各串连续连接的卷积层划分为多个小段;
假设C={C1,C2,C3,…,CK}为K个连续连接的卷积层,对其进行划分,得到M个小段S={S1,S2,…,Si,…,SM},每个小段上有N个卷积层,第i个小段Si={C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j,…,Ci×N};
本发明采用了目前常用的批归一化层(Batch Normalization,BN)来配合卷积层,以加快网络的收敛速度。为了便于描述,如图1所示,本发明中卷积层(Conv)、批归一化层(Batch Normalization,BN)和ReLU激活函数整合为CBR单元。基于CBR单元,如图2所示,本发明所提出的分段密集连接型深度网络,包括64个CBR单元、4个最大池化层MP1-MP4和一个全连接(Fully Connection,FC)层。每个最大池化层前连续放置16个CBR单元,并划分为四段,每段包含4个CBR单元。
步骤2、段内密集连接,即对每个小段内卷积层进行密集连接;
把第i个小段Si的第j个卷积层C(i-1)×N+j之前且属于同一段的所有卷积层{C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j-1}在通道方向上进行连接,并将连接后的结果作为C(i-1)×N+j的输入;
具体地,以第1个小段S1为例,进行段内密集连接的具体说明。如图2所示,第1个小段S1包括4个CBR单元{CBR1,CBR2,CBR3,CBR4}。CBR1作为第一个CBR单元,其输入为图像数据;CBR2作为第二个CBR单元,其输入为CBR1单元的输出;对于CBR3单元,先用连接层CCAT1把CBR1和CBR2按通道(Channel)方向进行连接,然后将连接结果作为CBR3单元的输入;对于CBR4单元,把CBR1、CBR2和CBR3按照通道(Channel)方向进行连接,然后将连接结果作为CBR4单元的输入。实际中为了简化设计,直接用连接层CCAT2把连接层CCAT1的输出和CBR3单元的输出进行连接,送入CBR4单元。
步骤3、段间密集连接,即对不同小段再次进行密集连接;
把第i个小段Si之前的所有小段的输出,即{CN,C2×N,…,C(i-1)×N}在通道方向上进行连接,并将连接后的结果作为Si首个卷积层C(i-1)×N+1的输入。
以第1个小段S1至第4个小段S4为例,进行段间密集连接的具体说明。如图2所示,S1作为第一个小段,其输入为图像数据;S2作为第二个小段,其输入为S1的输出(即CBR4单元的输出);对于S3,先用连接层SCAT1把S1的输出(即CBR4单元的输出)和S2的输出(即CBR8单元的输出)按通道(Channel)方向进行连接,然后将连接结果作为S3的输入;对于S4,把S1、S2和S3按照通道(Channel)方向进行连接,然后将连接结果作为S4的输入。实际中为了简化设计,直接用连接层SCAT2把连接层SCAT1的输出和S3的输出(即CBR12单元的输出)进行连接,送入S4
步骤4、在各串连续连接的卷积层之间配合上最大池化层,并在最后的最大池化层之后配上全连接(Fully Connection,FC)层,就构成了分段密集型深度网络。
如图2所示,本实施例中分段密集连接型深度网络包括4个最大池化层MP1-MP4,每个最大池化层前连续放置的16个CBR单元,并把相应的16个CBR单元划分为四段,每段包含4个卷积层,此外在MP4之后还连接了1个全连接层(Full Connection,FC),因此所设计的分段密集连接型深度网络一共经历了64个CBR单元和4个最大池化层(MP1-MP4)和1个全连接层(Full Connection,FC),最后送入常用的Softmax损失函数。本实施例中所有CBR单元中统一采用3×3大小的滤波器,并采用1像素补零操作。所有的池化层(MP1-MP4),采用池化窗口皆为3×3,采用步长为2像素,并采用1像素补零操作。
MP1前的16个CBR单元划分为S1至S4,且其中各个CBR单元输出的特征映射为64通道;MP2前的16个CBR单元为S5至S8,且其中各个CBR单元输出的特征映射为128通道;MP3前的16个CBR单元为S9至S12,且其中各个CBR单元输出的特征映射为256通道;MP4前的16个CBR单元划分为S13至S16,且其中各个CBR单元输出的特征映射为512通道;FC全连接层输出的特征映射为1024通道。
以上所述,仅是本发明的一个实施例而已,并非对本发明的技术范围作任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (1)

1.一种分段密集连接型深度网络构建方法,应用于目标检测、目标分类或目标识别系统,其特征在于,包括以下步骤:
步骤1、连续卷积层的分段,把深度网络中各串连续连接的卷积层划分为多个小段;
步骤2、段内密集连接,即对每个小段内的卷积层进行密集连接;
步骤3、段间密集连接,即对不同小段再次进行密集连接;
步骤4、在各串连续连接的卷积层之间配合上最大池化层,并在最后的最大池化层之后配上全连接层,就构成了分段密集型深度网络;
所述步骤1中,C={C1,C2,C3,…,CK}为K个连续连接的卷积层,对其进行划分,得到M个小段S={S1,S2,…,Si,…,SM},每个小段上有N个卷积层,第i个小段Si={C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j,…,Ci×N};采用批归一化层来配合卷积层,将卷积层、批归一化层和ReLU激活函数整合为CBR单元,所有CBR单元采用1像素补零操作;
所述步骤2中,所述段内密集连接是指把第i个小段Si的第j个卷积层C(i-1)×N+j之前且属于同一段的所有卷积层{C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j-1}在通道方向上进行连接,并将连接后的结果作为C(i-1)×N+j的输入;其中,各个小段的第一个CBR单元的输入为图像数据;
所述步骤3中,所述段间密集连接是指把第i个小段Si之前的所有小段的输出,即{CN,C2×N,…,C(i-1)×N}在通道方向上进行连接,并将连接后的结果作为Si首个卷积层C(i-1)×N+1的输入;其中,第1个小段S1的输入为图像数据。
CN201810542036.0A 2018-05-30 2018-05-30 一种分段密集连接型深度网络构建方法 Active CN108846475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810542036.0A CN108846475B (zh) 2018-05-30 2018-05-30 一种分段密集连接型深度网络构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810542036.0A CN108846475B (zh) 2018-05-30 2018-05-30 一种分段密集连接型深度网络构建方法

Publications (2)

Publication Number Publication Date
CN108846475A CN108846475A (zh) 2018-11-20
CN108846475B true CN108846475B (zh) 2021-10-26

Family

ID=64211334

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810542036.0A Active CN108846475B (zh) 2018-05-30 2018-05-30 一种分段密集连接型深度网络构建方法

Country Status (1)

Country Link
CN (1) CN108846475B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001344590A (ja) * 2000-05-31 2001-12-14 Fuji Electric Co Ltd ニューラルネットワーク及びその学習方法、解析方法並びに異常判定方法
CN106372577A (zh) * 2016-08-23 2017-02-01 北京航空航天大学 一种基于深度学习的交通标志自动识别与标注方法
CN107844743A (zh) * 2017-09-28 2018-03-27 浙江工商大学 一种基于多尺度分层残差网络的图像多字幕自动生成方法
CN108090836A (zh) * 2018-01-30 2018-05-29 南京信息工程大学 基于加权密集连接卷积神经网络深度学习的股票投资方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001344590A (ja) * 2000-05-31 2001-12-14 Fuji Electric Co Ltd ニューラルネットワーク及びその学習方法、解析方法並びに異常判定方法
CN106372577A (zh) * 2016-08-23 2017-02-01 北京航空航天大学 一种基于深度学习的交通标志自动识别与标注方法
CN107844743A (zh) * 2017-09-28 2018-03-27 浙江工商大学 一种基于多尺度分层残差网络的图像多字幕自动生成方法
CN108090836A (zh) * 2018-01-30 2018-05-29 南京信息工程大学 基于加权密集连接卷积神经网络深度学习的股票投资方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Seismic-Net: A Deep Densely Connected Neural Network to Detect Seismic Events;Wu Y 等;《arXiv》;20180131;第1-6页 *

Also Published As

Publication number Publication date
CN108846475A (zh) 2018-11-20

Similar Documents

Publication Publication Date Title
CN111340814B (zh) 一种基于多模态自适应卷积的rgb-d图像语义分割方法
CN107609641B (zh) 稀疏神经网络架构及其实现方法
CN108288035A (zh) 基于深度学习的多通道图像特征融合的人体动作识别方法
US20190303731A1 (en) Target detection method and device, computing device and readable storage medium
CN109886391B (zh) 一种基于空间正反对角卷积的神经网络压缩方法
CN110889416B (zh) 一种基于级联改良网络的显著性物体检测方法
CN112016450B (zh) 机器学习模型的训练方法、装置和电子设备
CN111401373B (zh) 基于分组非对称卷积的高效语义分割方法
CN110659565A (zh) 一种基于带孔卷积的3d多人人体姿态估计方法
CN107274378A (zh) 一种融合记忆cnn的图像模糊类型识别及参数整定方法
Cai et al. Softer pruning, incremental regularization
CN110852295A (zh) 一种基于多任务监督学习的视频行为识别方法
CN111882053B (zh) 一种基于拼接卷积的神经网络模型压缩方法
CN109711269A (zh) 一种基于3d卷积谱空特征融合的高光谱图像分类算法
CN110324613B (zh) 一种面向视频传输质量的深度学习图像评价方法
CN111881743A (zh) 一种基于语义分割的人脸特征点定位方法
CN108846475B (zh) 一种分段密集连接型深度网络构建方法
CN110110775A (zh) 一种基于超连接网络的匹配代价计算方法
CN108846420B (zh) 网络结构以及客户端
CN117475134A (zh) 基于多尺度跨层特征融合网络的伪装目标检测算法
CN111882028A (zh) 用于卷积神经网络的卷积运算装置
CN106897770A (zh) 一种建立车牌识别模型的方法及装置
CN113486718B (zh) 一种基于深度多任务学习的指尖检测方法
CN111832336A (zh) 一种基于改进的c3d视频行为检测方法
CN112613405B (zh) 任意视角动作识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant