CN108846475B - 一种分段密集连接型深度网络构建方法 - Google Patents
一种分段密集连接型深度网络构建方法 Download PDFInfo
- Publication number
- CN108846475B CN108846475B CN201810542036.0A CN201810542036A CN108846475B CN 108846475 B CN108846475 B CN 108846475B CN 201810542036 A CN201810542036 A CN 201810542036A CN 108846475 B CN108846475 B CN 108846475B
- Authority
- CN
- China
- Prior art keywords
- dense connection
- layer
- deep network
- segment
- cbr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法,首先把深度网络中各串连续连接的卷积层划分为多个小段;其次,对每个小段内的卷积层进行密集连接,即段内密集连接;然后,对每个小段进行密集连接,即段间密集连接,从而实现了对连续连接的卷积层的分段密集连接。最后,在各串连续连接的卷积层之间配合上最大池化层,并在最后的最大池化层之后配上全连接层,就完成了分段密集连接型深度网络的构建。借助分段密集连接的机制,一方面有利于训练更深的深度网络,进而有利提升深度网络的特征学习能力;另一方面,由于分段划分,各个小段内只包含少数卷积层,能够有效地避免因密集连接所带来的庞大计算量。
Description
技术领域
本发明涉及机器视觉和人工智能领域,特别涉及一种分段密集连接型深度网络构建方法,可应用于目标检测、目标分类和目标识别系统。
背景技术
卷积神经网络是目前最流行的一种深度学习算法。近年来涌现出大量基于卷积神经网络的目标检测、目标分类和目标识别算法,这些算法的准确性很大程度上依赖于卷积神经网络特征学习能力。
密集连接网络DenseNet(Huang G,Liu Z,Maaten L V D,et al.DenselyConnected Convolutional Networks[C].IEEE Conference on Computer Vision andPattern Recognition,2016.)是目前特征学习能力最强的深度网络之一。DenseNet的直接密集连接机制是指在一连串的卷积层中,对于每一个卷积层皆把其之前所有卷积层在通道(Channel)方向进行连接后作为其输入。显然,随着网络深度的增加,越排在后方的卷积层会累积到越多的输入,引起计算量的急剧增长。为了避免这种情况,DenseNet不得不对那些连接后过于庞大的输入数据,利用1×1卷积核进行特征压缩。然而,引入这种压缩机制后,网络设计的复杂度增加,且这种压缩本身亦可能损害深度网络的特征学习能力。
发明内容
本发明的目的在于提出一种应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法,该方法计算量适中,可提升卷积神经网络的特征学习能力。
为实现上述目的,本发明采用如下技术方案:
一种分段密集连接型深度网络构建方法,应用于目标检测、目标分类或目标识别系统,包括以下步骤:
步骤1、连续卷积层的分段,把深度网络中各串连续连接的卷积层划分为多个小段;
步骤2、段内密集连接,即对每个小段内的卷积层进行密集连接;
步骤3、段间密集连接,即对不同小段再次进行密集连接;
步骤4、在各串连续连接的卷积层之间配合上最大池化层,并在最后的最大池化层之后配上全连接层,就构成了分段密集型深度网络。
所述步骤1中,C={C1,C2,C3,…,CK}为K个连续连接的卷积层,对其进行划分,得到M个小段S={S1,S2,…,Si,…,SM},每个小段上有N个卷积层,第i个小段Si={C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j,…,Ci×N};
所述步骤2中,所述段内密集连接是指把第i个小段Si的第j个卷积层C(i-1)×N+j之前且属于同一段的所有卷积层{C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j-1}在通道方向上进行连接,并将连接后的结果作为C(i-1)×N+j的输入;
所述步骤3中,所述段间密集连接是指把第i个小段Si之前的所有小段的输出,即{CN,C2×N,…,C(i-1)×N}在通道方向上进行连接,并将连接后的结果作为Si首个卷积层C(i-1)×N+1的输入。
采用上述方案后,本发明的应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法,一方面有利于训练更深的深度网络,进而有利提升深度网络的特征学习能力;另一方面,由于分段划分,各个小段内只包含少数卷积层,无需进行特征压缩,网络的设计简单,能够有效地避免密集连接带来的庞大计算量。
附图说明
图1为本发明中CBR单元的结构示意图;
图2为本发明的分段密集连接型深度网络构建方法的原理示意图。
具体实施方式
本发明揭示了一种应用于目标检测、目标分类或目标识别系统的分段密集连接型深度网络构建方法,该方法降低深度网络的设计复杂度,计算量适中,可提升深度网络的特征学习能力。
本发明的一种分段密集连接型深度网络构建方法,应用于目标检测、目标分类或目标识别系统,具体步骤如下:
步骤1、连续卷积层的分段,即把深度网络中各串连续连接的卷积层划分为多个小段;
假设C={C1,C2,C3,…,CK}为K个连续连接的卷积层,对其进行划分,得到M个小段S={S1,S2,…,Si,…,SM},每个小段上有N个卷积层,第i个小段Si={C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j,…,Ci×N};
本发明采用了目前常用的批归一化层(Batch Normalization,BN)来配合卷积层,以加快网络的收敛速度。为了便于描述,如图1所示,本发明中卷积层(Conv)、批归一化层(Batch Normalization,BN)和ReLU激活函数整合为CBR单元。基于CBR单元,如图2所示,本发明所提出的分段密集连接型深度网络,包括64个CBR单元、4个最大池化层MP1-MP4和一个全连接(Fully Connection,FC)层。每个最大池化层前连续放置16个CBR单元,并划分为四段,每段包含4个CBR单元。
步骤2、段内密集连接,即对每个小段内卷积层进行密集连接;
把第i个小段Si的第j个卷积层C(i-1)×N+j之前且属于同一段的所有卷积层{C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j-1}在通道方向上进行连接,并将连接后的结果作为C(i-1)×N+j的输入;
具体地,以第1个小段S1为例,进行段内密集连接的具体说明。如图2所示,第1个小段S1包括4个CBR单元{CBR1,CBR2,CBR3,CBR4}。CBR1作为第一个CBR单元,其输入为图像数据;CBR2作为第二个CBR单元,其输入为CBR1单元的输出;对于CBR3单元,先用连接层CCAT1把CBR1和CBR2按通道(Channel)方向进行连接,然后将连接结果作为CBR3单元的输入;对于CBR4单元,把CBR1、CBR2和CBR3按照通道(Channel)方向进行连接,然后将连接结果作为CBR4单元的输入。实际中为了简化设计,直接用连接层CCAT2把连接层CCAT1的输出和CBR3单元的输出进行连接,送入CBR4单元。
步骤3、段间密集连接,即对不同小段再次进行密集连接;
把第i个小段Si之前的所有小段的输出,即{CN,C2×N,…,C(i-1)×N}在通道方向上进行连接,并将连接后的结果作为Si首个卷积层C(i-1)×N+1的输入。
以第1个小段S1至第4个小段S4为例,进行段间密集连接的具体说明。如图2所示,S1作为第一个小段,其输入为图像数据;S2作为第二个小段,其输入为S1的输出(即CBR4单元的输出);对于S3,先用连接层SCAT1把S1的输出(即CBR4单元的输出)和S2的输出(即CBR8单元的输出)按通道(Channel)方向进行连接,然后将连接结果作为S3的输入;对于S4,把S1、S2和S3按照通道(Channel)方向进行连接,然后将连接结果作为S4的输入。实际中为了简化设计,直接用连接层SCAT2把连接层SCAT1的输出和S3的输出(即CBR12单元的输出)进行连接,送入S4。
步骤4、在各串连续连接的卷积层之间配合上最大池化层,并在最后的最大池化层之后配上全连接(Fully Connection,FC)层,就构成了分段密集型深度网络。
如图2所示,本实施例中分段密集连接型深度网络包括4个最大池化层MP1-MP4,每个最大池化层前连续放置的16个CBR单元,并把相应的16个CBR单元划分为四段,每段包含4个卷积层,此外在MP4之后还连接了1个全连接层(Full Connection,FC),因此所设计的分段密集连接型深度网络一共经历了64个CBR单元和4个最大池化层(MP1-MP4)和1个全连接层(Full Connection,FC),最后送入常用的Softmax损失函数。本实施例中所有CBR单元中统一采用3×3大小的滤波器,并采用1像素补零操作。所有的池化层(MP1-MP4),采用池化窗口皆为3×3,采用步长为2像素,并采用1像素补零操作。
MP1前的16个CBR单元划分为S1至S4,且其中各个CBR单元输出的特征映射为64通道;MP2前的16个CBR单元为S5至S8,且其中各个CBR单元输出的特征映射为128通道;MP3前的16个CBR单元为S9至S12,且其中各个CBR单元输出的特征映射为256通道;MP4前的16个CBR单元划分为S13至S16,且其中各个CBR单元输出的特征映射为512通道;FC全连接层输出的特征映射为1024通道。
以上所述,仅是本发明的一个实施例而已,并非对本发明的技术范围作任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (1)
1.一种分段密集连接型深度网络构建方法,应用于目标检测、目标分类或目标识别系统,其特征在于,包括以下步骤:
步骤1、连续卷积层的分段,把深度网络中各串连续连接的卷积层划分为多个小段;
步骤2、段内密集连接,即对每个小段内的卷积层进行密集连接;
步骤3、段间密集连接,即对不同小段再次进行密集连接;
步骤4、在各串连续连接的卷积层之间配合上最大池化层,并在最后的最大池化层之后配上全连接层,就构成了分段密集型深度网络;
所述步骤1中,C={C1,C2,C3,…,CK}为K个连续连接的卷积层,对其进行划分,得到M个小段S={S1,S2,…,Si,…,SM},每个小段上有N个卷积层,第i个小段Si={C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j,…,Ci×N};采用批归一化层来配合卷积层,将卷积层、批归一化层和ReLU激活函数整合为CBR单元,所有CBR单元采用1像素补零操作;
所述步骤2中,所述段内密集连接是指把第i个小段Si的第j个卷积层C(i-1)×N+j之前且属于同一段的所有卷积层{C(i-1)×N+1,C(i-1)×N+2,…,C(i-1)×N+j-1}在通道方向上进行连接,并将连接后的结果作为C(i-1)×N+j的输入;其中,各个小段的第一个CBR单元的输入为图像数据;
所述步骤3中,所述段间密集连接是指把第i个小段Si之前的所有小段的输出,即{CN,C2×N,…,C(i-1)×N}在通道方向上进行连接,并将连接后的结果作为Si首个卷积层C(i-1)×N+1的输入;其中,第1个小段S1的输入为图像数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810542036.0A CN108846475B (zh) | 2018-05-30 | 2018-05-30 | 一种分段密集连接型深度网络构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810542036.0A CN108846475B (zh) | 2018-05-30 | 2018-05-30 | 一种分段密集连接型深度网络构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108846475A CN108846475A (zh) | 2018-11-20 |
CN108846475B true CN108846475B (zh) | 2021-10-26 |
Family
ID=64211334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810542036.0A Active CN108846475B (zh) | 2018-05-30 | 2018-05-30 | 一种分段密集连接型深度网络构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108846475B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001344590A (ja) * | 2000-05-31 | 2001-12-14 | Fuji Electric Co Ltd | ニューラルネットワーク及びその学習方法、解析方法並びに異常判定方法 |
CN106372577A (zh) * | 2016-08-23 | 2017-02-01 | 北京航空航天大学 | 一种基于深度学习的交通标志自动识别与标注方法 |
CN107844743A (zh) * | 2017-09-28 | 2018-03-27 | 浙江工商大学 | 一种基于多尺度分层残差网络的图像多字幕自动生成方法 |
CN108090836A (zh) * | 2018-01-30 | 2018-05-29 | 南京信息工程大学 | 基于加权密集连接卷积神经网络深度学习的股票投资方法 |
-
2018
- 2018-05-30 CN CN201810542036.0A patent/CN108846475B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001344590A (ja) * | 2000-05-31 | 2001-12-14 | Fuji Electric Co Ltd | ニューラルネットワーク及びその学習方法、解析方法並びに異常判定方法 |
CN106372577A (zh) * | 2016-08-23 | 2017-02-01 | 北京航空航天大学 | 一种基于深度学习的交通标志自动识别与标注方法 |
CN107844743A (zh) * | 2017-09-28 | 2018-03-27 | 浙江工商大学 | 一种基于多尺度分层残差网络的图像多字幕自动生成方法 |
CN108090836A (zh) * | 2018-01-30 | 2018-05-29 | 南京信息工程大学 | 基于加权密集连接卷积神经网络深度学习的股票投资方法 |
Non-Patent Citations (1)
Title |
---|
Seismic-Net: A Deep Densely Connected Neural Network to Detect Seismic Events;Wu Y 等;《arXiv》;20180131;第1-6页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108846475A (zh) | 2018-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111340814B (zh) | 一种基于多模态自适应卷积的rgb-d图像语义分割方法 | |
CN107609641B (zh) | 稀疏神经网络架构及其实现方法 | |
CN108288035A (zh) | 基于深度学习的多通道图像特征融合的人体动作识别方法 | |
US20190303731A1 (en) | Target detection method and device, computing device and readable storage medium | |
CN109886391B (zh) | 一种基于空间正反对角卷积的神经网络压缩方法 | |
CN110889416B (zh) | 一种基于级联改良网络的显著性物体检测方法 | |
CN112016450B (zh) | 机器学习模型的训练方法、装置和电子设备 | |
CN111401373B (zh) | 基于分组非对称卷积的高效语义分割方法 | |
CN110659565A (zh) | 一种基于带孔卷积的3d多人人体姿态估计方法 | |
CN107274378A (zh) | 一种融合记忆cnn的图像模糊类型识别及参数整定方法 | |
Cai et al. | Softer pruning, incremental regularization | |
CN110852295A (zh) | 一种基于多任务监督学习的视频行为识别方法 | |
CN111882053B (zh) | 一种基于拼接卷积的神经网络模型压缩方法 | |
CN109711269A (zh) | 一种基于3d卷积谱空特征融合的高光谱图像分类算法 | |
CN110324613B (zh) | 一种面向视频传输质量的深度学习图像评价方法 | |
CN111881743A (zh) | 一种基于语义分割的人脸特征点定位方法 | |
CN108846475B (zh) | 一种分段密集连接型深度网络构建方法 | |
CN110110775A (zh) | 一种基于超连接网络的匹配代价计算方法 | |
CN108846420B (zh) | 网络结构以及客户端 | |
CN117475134A (zh) | 基于多尺度跨层特征融合网络的伪装目标检测算法 | |
CN111882028A (zh) | 用于卷积神经网络的卷积运算装置 | |
CN106897770A (zh) | 一种建立车牌识别模型的方法及装置 | |
CN113486718B (zh) | 一种基于深度多任务学习的指尖检测方法 | |
CN111832336A (zh) | 一种基于改进的c3d视频行为检测方法 | |
CN112613405B (zh) | 任意视角动作识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |