CN111178510A - 基于卷积神经网络的自适应分组卷积模块设计方法 - Google Patents

基于卷积神经网络的自适应分组卷积模块设计方法 Download PDF

Info

Publication number
CN111178510A
CN111178510A CN201911400731.4A CN201911400731A CN111178510A CN 111178510 A CN111178510 A CN 111178510A CN 201911400731 A CN201911400731 A CN 201911400731A CN 111178510 A CN111178510 A CN 111178510A
Authority
CN
China
Prior art keywords
features
convolution
neural network
input features
channels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911400731.4A
Other languages
English (en)
Inventor
颜成钢
王廷宇
孙垚棋
张继勇
张勇东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201911400731.4A priority Critical patent/CN111178510A/zh
Publication of CN111178510A publication Critical patent/CN111178510A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于卷积神经网络的自适应分组卷积模块设计方法。本发明步骤如下:1:对全局特征进行加和求平均处理;2:通过全卷积操作将输入特征的通道数转换为指定大小的通道数,输出特征Ⅰ;同时通过全卷积操作将输入特征通道数不变,但大小改变的特征Ⅱ;3:将步骤2的特征Ⅰ作为softmax函数输入,得到一组概率分布;并按照此概率分布将原始输入特征和得到的卷积核进行分组;4:将分组后的原始输入特征通过分组后的卷积核进行特征提取;对完成特征提取的各个分组得到的特征通过通道拼接进行融合,且融合后的通道数与原始输入特征的通道数一致。本发明设计的模块在卷积神经网络对特征进行提取的过程中,能够自适应的将输入特征进行分组提取。

Description

基于卷积神经网络的自适应分组卷积模块设计方法
技术领域
本发明涉及计算机视觉与人工智能领域,尤其涉及在卷积神经网络中自适应分组卷积的设计方法。
背景技术
卷积神经网络作为人工神经网络的一种,被广泛应用于深度学习中的多种领域,比如自动驾驶、地理信息系统、医疗影像分析、机器人等领域。卷积神经网络通过局部感知和权值共享等方式,自适应提取特征。相比早期采用人为设计的人工算子提取特征的方式,卷积神经网络自适应提取的特征具有更强的表达能力。
在卷积神经网络被广泛应用之前,提取特征通常是使用SIFT,HOG和GIST特征,这些特征有一个共性,都具有按组表示的特征,每一个组由相同种类直方图构建而成,这些特征通常是对在每个直方图或每个方向上进行组归一化而得到。从卷积神经网络角度来说,每一层有很多的卷积核,这些核学习到的特征并不完全是独立的,某些特征具有相同的分布,可以被分为一组。因此,设计一个自适应分组卷积模块,使得卷积神经网络提取更加有效的特征,显得尤为重要。
发明内容
本发明提出一种基于卷积神经网络的自适应卷积模块,该模块会在卷积神经网络对特征进行提取的过程中,自适应的将输入特征进行分组提取。
基于卷积神经网络的自适应分组卷积模块设计方法,该方法设计的模块在卷积神经网络对特征进行提取的过程中,能够自适应的将输入特征进行分组提取,具体实现如下:
步骤1:通过自适应全局平均池化操作,将原始输入特征大小变为1*1的输入特征,即对全局特征进行加和求平均处理;
步骤2:通过全卷积操作将大小为1*1的输入特征的通道数转换为指定大小的通道数,输出特征Ⅰ;
同时通过全卷积操作将大小为1*1的输入特征转换为通道数不变,但大小为3*3的特征Ⅱ,作为分组卷积的卷积核;
步骤3:将步骤2的输出特征Ⅰ作为softmax函数的输入,得到一组概率分布;并按照此概率分布将原始输入特征和得到的卷积核进行分组;
步骤4:将分组后的原始输入特征通过分组后的卷积核进行特征提取;对完成特征提取的各个分组得到的特征通过通道拼接进行融合,使得融合后的通道数与原始输入特征的通道数一致。
所述的指定大小的通道数为数据集中的类别数。
所述的softmax函数的具体实现如下:
将一组输入的K维向量z压缩到另外K维实向量σ(z)中,使得每一个元素的范围都在(0,1)之间,并且所有元素的和为1;其公式如下所示:
Figure BDA0002347409120000021
所述的将原始输入特征和得到的卷积核进行分组,具体实现如下:
Figure BDA0002347409120000022
其中,concat是拼接函数,dim是concat拼接函数过程的一个维度参数,dim=0,指拼接过程中按照第一维度进行拼接。
本发明的有益效果是:
针对卷积神经网络中,每一层的卷积核学习到的特征并不完全是独立的,某些特征具有相同的分布,可以被分为一组的特点,设计自适应分组卷积模块,使分组提取的特征具有更强的表达能力。
附图说明
图1是自适应分组卷积模块运行流程图。
图2是分组卷积具体实施流程图。
具体实施方式
本发明提出了一种基于卷积神经网络的自适应分组卷积模块设计方法,如图1和2所示,本发明在卷积神经网络训练过程中,具体实施方式,如下所示:
步骤1:通过自适应全局平均池化操作,将原始输入特征大小变为1*1的输入特征,即对全局特征进行加和求平均处理。
步骤2:通过全卷积操作将大小为1*1的输入特征的通道数转换为指定大小的通道数,输出特征Ⅰ;所述的指定大小的通道数为数据集中的类别数。例如,将512*1*1的输入特征转换为21*1*1特征。
同时通过全卷积操作将大小为1*1的输入特征转换为通道数不变,但大小为3*3的特征Ⅱ,作为分组卷积的卷积核。例如,将512*1*1的特征转换为512*3*3。
步骤3:将步骤2的输出特征Ⅰ(21*1*1的特征)作为softmax函数的输入,得到一组概率分布;并按照此概率分布将原始输入特征和得到的卷积核进行分组。例如,分别将通道数为512的输入特征和卷积核分为21组。
所述的利用softmax函数将一组输入的K维向量z压缩到另外K维实向量σ(z)中,使得每一个元素的范围都在(0,1)之间,并且所有元素的和为1。其公式如下所示:
Figure BDA0002347409120000031
如图2所示,所述的将原始输入特征和得到的卷积核进行分组,具体实现如下:
Figure BDA0002347409120000032
步骤5:将分组后的原始输入特征通过分组后的卷积核进行特征提取;对完成特征提取的各个分组得到的特征通过通道拼接进行融合,使得融合后的通道数与原始输入特征的通道数一致。即得到的特征仍为512个通道,但具有相似分布的特征已经被分组提取。

Claims (4)

1.基于卷积神经网络的自适应分组卷积模块设计方法,其特征在于该方法设计的模块在卷积神经网络对特征进行提取的过程中,能够自适应的将输入特征进行分组提取,具体实现如下:
步骤1:通过自适应全局平均池化操作,将原始输入特征大小变为1*1的输入特征,即对全局特征进行加和求平均处理;
步骤2:通过全卷积操作将大小为1*1的输入特征的通道数转换为指定大小的通道数,输出特征I;
同时通过全卷积操作将大小为1*1的输入特征转换为通道数不变,但大小为3*3的特征II,作为分组卷积的卷积核;
步骤3:将步骤2的输出特征I作为softmax函数的输入,得到一组概率分布;并按照此概率分布将原始输入特征和得到的卷积核进行分组;
步骤4:将分组后的原始输入特征通过分组后的卷积核进行特征提取;对完成特征提取的各个分组得到的特征通过通道拼接进行融合,使得融合后的通道数与原始输入特征的通道数一致。
2.根据权利要求1所述的基于卷积神经网络的自适应分组卷积模块设计方法,其特征在于所述的指定大小的通道数为数据集中的类别数。
3.根据权利要求1或2所述的基于卷积神经网络的自适应分组卷积模块设计方法,其特征在于所述的softmax函数的具体实现如下:
将一组输入的K维向量z压缩到另外K维实向量σ(z)中,使得每一个元素的范围都在(0,1)之间,并且所有元素的和为1;其公式如下所示:
Figure FDA0002347409110000011
4.根据权利要求3所述的基于卷积神经网络的自适应分组卷积模块设计方法,其特征在于所述的将原始输入特征和得到的卷积核进行分组,具体实现如下:
Input:原始特征F(c*w*h),卷积核K(c*3*3),概率分布P(p1,p2,…,pn)
for each pi∈P do
Figure FDA0002347409110000012
end for
Output:Fout=concat([out1,out2,…,outn],dim=0);
其中,concat是拼接函数,dim是concat拼接函数过程的一个维度参数,dim=0,指拼接过程中按照第一维度进行拼接。
CN201911400731.4A 2019-12-30 2019-12-30 基于卷积神经网络的自适应分组卷积模块设计方法 Pending CN111178510A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911400731.4A CN111178510A (zh) 2019-12-30 2019-12-30 基于卷积神经网络的自适应分组卷积模块设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911400731.4A CN111178510A (zh) 2019-12-30 2019-12-30 基于卷积神经网络的自适应分组卷积模块设计方法

Publications (1)

Publication Number Publication Date
CN111178510A true CN111178510A (zh) 2020-05-19

Family

ID=70646400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911400731.4A Pending CN111178510A (zh) 2019-12-30 2019-12-30 基于卷积神经网络的自适应分组卷积模块设计方法

Country Status (1)

Country Link
CN (1) CN111178510A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898608A (zh) * 2020-07-04 2020-11-06 西北工业大学 一种基于边界预测的自然场景多语言文字检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898608A (zh) * 2020-07-04 2020-11-06 西北工业大学 一种基于边界预测的自然场景多语言文字检测方法

Similar Documents

Publication Publication Date Title
CN110188795B (zh) 图像分类方法、数据处理方法和装置
CN108960141B (zh) 基于增强型深度卷积神经网络的行人再识别方法
CN112446476A (zh) 神经网络模型压缩的方法、装置、存储介质和芯片
CN109754017B (zh) 基于可分离的三维残差网络和迁移学习高光谱图像分类方法
CN112132004B (zh) 一种基于多视角特征融合的细粒度图像识别方法
CN107529650B (zh) 闭环检测方法、装置及计算机设备
CN107516103B (zh) 一种影像分类方法和系统
CN111242157A (zh) 联合深度注意力特征和条件对抗的无监督域自适应方法
CN107944483B (zh) 基于双通道dcgan和特征融合的多光谱图像分类方法
CN109840560A (zh) 基于胶囊网络中融入聚类的图像分类方法
CN113705641B (zh) 基于富上下文网络的高光谱图像分类方法
CN114549913B (zh) 一种语义分割方法、装置、计算机设备和存储介质
CN111931686B (zh) 一种基于背景知识增强的视频卫星目标跟踪方法
CN110136162B (zh) 无人机视角遥感目标跟踪方法及装置
CN111768415A (zh) 一种无量化池化的图像实例分割方法
CN114092793B (zh) 适用于复杂水下环境的端到端生物目标检测方法
CN112257738A (zh) 机器学习模型的训练方法、装置和图像的分类方法、装置
CN111626357B (zh) 一种基于神经网络模型的图像识别方法
CN112699941A (zh) 植物病害严重程度图像分类方法、装置、计算机设备和存储介质
CN111340019A (zh) 基于Faster R-CNN的粮仓害虫检测方法
CN114626476A (zh) 基于Transformer与部件特征融合的鸟类细粒度图像识别方法及装置
CN112149526A (zh) 一种基于长距离信息融合的车道线检测方法及系统
CN115761888A (zh) 基于nl-c3d模型的塔吊操作人员异常行为检测方法
CN113066528B (zh) 基于主动半监督图神经网络的蛋白质分类方法
CN113743443B (zh) 一种图像证据分类和识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200519

RJ01 Rejection of invention patent application after publication