CN110866565B - 一种基于卷积神经网络的多分支图像分类方法 - Google Patents
一种基于卷积神经网络的多分支图像分类方法 Download PDFInfo
- Publication number
- CN110866565B CN110866565B CN201911176738.2A CN201911176738A CN110866565B CN 110866565 B CN110866565 B CN 110866565B CN 201911176738 A CN201911176738 A CN 201911176738A CN 110866565 B CN110866565 B CN 110866565B
- Authority
- CN
- China
- Prior art keywords
- branch
- output
- neural network
- convolutional neural
- method based
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 11
- 238000013528 artificial neural network Methods 0.000 claims abstract description 5
- 238000005070 sampling Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/259—Fusion by voting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于卷积神经网络的多分支图像分类方法,属于图像处理领域,该方法包含如下步骤:S1:提取主干神经网络中的各个尺度的特征图;S2:对相邻的特征图相加形成多个分支并且每个分支设置单独的一个输出;S3:结合主干网络的输出,通过投票各个输出的结果得到一个辅助输出,最后选取所有输出中准确率最高的。最后,本发明方法能够准确的对图像分类,在各个数据库上都有较高的识别效果。
Description
技术领域
本发明涉及一种基于卷积神经网络的多分支图像分类方法,属于图像处理领域。
背景技术
深度神经网络在图像分类任务中取得了巨大的成功。研究表明,越深的网络层数越能够提取到图像高级的特征。因此,研究者们着力于解决如何加深网络结构以提升分类准确率。1998年至今,网络层数从一开始的5层到19层,甚至达到了惊人的1202层。随着网络层数的加深,图像识别竞赛ILSVRC的准确率也逐渐被提高。除了加深网络层数外,另一批学者尝试从其他的方向来改进网络结构,如加宽网络,分组卷积网络,分形网络等。
虽然随着层数的增加,网络性能变得更好,但是网络优化问题变得愈加的困难。残差结构能很好的优化网络,但是更深层的网络仍然出。现了过拟合的问题。此外,池化会导致信息的损失,影响网络的分类准确率。网络在前向传播的过程中,会不断的对原始输入图像进行降维,每一次的降维都会造成不同程度的信息丢失。而丢失的信息对于网络性能的提升也有着不可忽视的作用。总的来说,现有的网络依然会面临着优化问题和特征复用问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于卷积神经网络的多分支图像分类方法,能解决现有深度卷积神经网中的优化和过拟合问题。
为达到上述目的,本发明提供如下技术方案:
一种基于卷积神经网络的多分支图像分类方法,该方法包含如下步骤:
S1:提取主干神经网络中的各个尺度的特征图;
S2:对相邻的特征图相加形成多个分支并且每个分支设置单独的一个输出,每一个分支称为一个branch单元;
S3:结合主干网络的输出,通过投票各个输出的结果得到一个辅助输出,最后选取所有输出中准确率最高的。
可选的,所述步骤S2中,一个branch单元包含如下步骤:
S31:先对低维度的特征图进行上采样
S32:减少其通道数
S33:和另一个特征图相加
上述步骤满足如下公式:
y=x+Ws(Up(G(x)))
式中,x表示branch单元的输入,G表示一个下采样函数,Up表示上采样函数,Ws映射函数,功能为改变其输入的通道数。
可选的,所述投票遵从对每个输出类别取众数的规则,满足如下公式:
式中,y表示投票后的类别,yi表示第i个分支所属的类别,cj表示总分类数中的第j个类别,I为指示函数,当yi=cj时为1,否则为0。
本发明的有益效果在于:本发明方法能够缓解现有卷积神经网络中的过拟合问题,能够更好地优化网络信息的传递。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为本发明的网络结构图;
图2为本发明的branch单元结构图;
图3为本发明的具有3个branch单元的结构图。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
本发明为一种基于卷积神经网络的多分支图像分类方法,该方法包含如下步骤:
1、提取主干神经网络中的各个尺度的特征图;
2、对相邻的特征图相加形成多个分支并切每个分支设置单独的一个输出,每一个分支称为一个branch单元;
3、结合主干网络的输出,通过投票各个输出的结果得到一个辅助输出,最后选取所有输出中准确率最高的。
由于现有网络结构中,为了减少参数和计算量都会在网络中对输入图像多次降维,因此本文提出的BranchNet可以直接扩展在主干网络中,提取网络中输入图像每一个维度的输出,把相邻两个维度的输出相加形成一个branch单元,如图2所示,然后作为主干网络的辅助输出,得到多个结果。为了进一步利用多尺度信息,我们还对输出结果进行投票,在原输出的数量上增加一个输出,最后选取准确率最大的输出作为最终结果。
图1到图3为本发明方法的结构示意图。具体包括以下几个部分:
图1为本发明方法的网络结构图,有主干网络和branch单元构成。图中每有一条支路就有一个branch单元,以及对应于一个结果。最后对所有的结果投票取最大值。
图2为本发明所述branch单元结构图。包括以下步骤:
1、先对低维度的特征图进行上采样
2、减少其通道数
3、和另一个特征图相加
上述步骤满足如下公式:
y=x+Ws(Up(G(x)))
式中,x表示branch单元的输入,G表示一个下采样函数,Up表示上采样函数,Ws映射函数,功能为改变其输入的通道数。
图3为本发明方法中有四个branch单元的网络结构图。
最后说明的是,以上优选实施例仅用以说明发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
Claims (3)
1.一种基于卷积神经网络的多分支图像分类方法,其特征在于:该方法包含如下步骤:
S1:提取主干神经网络中的各个尺度的特征图;
S2:对相邻的特征图相加形成多个分支并且每个分支设置单独的一个输出,每一个分支称为一个branch单元;
S3:结合主干网络的输出,通过投票各个输出的结果得到一个辅助输出,最后选取所有输出中准确率最高的。
2.根据权利要求1所述的一种基于卷积神经网络的多分支图像分类方法,其特征在于:所述步骤S2中,一个branch单元包含如下步骤:
S31:先对低维度的特征图进行上采样
S32:减少其通道数
S33:和另一个特征图相加
上述步骤满足如下公式:
y=x+Ws(Up(G(x)))
式中,x表示branch单元的输入,G表示一个下采样函数,Up表示上采样函数,Ws映射函数,功能为改变其输入的通道数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911176738.2A CN110866565B (zh) | 2019-11-26 | 2019-11-26 | 一种基于卷积神经网络的多分支图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911176738.2A CN110866565B (zh) | 2019-11-26 | 2019-11-26 | 一种基于卷积神经网络的多分支图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110866565A CN110866565A (zh) | 2020-03-06 |
CN110866565B true CN110866565B (zh) | 2022-06-24 |
Family
ID=69656929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911176738.2A Active CN110866565B (zh) | 2019-11-26 | 2019-11-26 | 一种基于卷积神经网络的多分支图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110866565B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112633402B (zh) * | 2020-12-30 | 2024-05-03 | 南京大学 | 一种实现动态计算的高精度高比例的分类模型及分类方法 |
CN113283514B (zh) * | 2021-05-31 | 2024-05-21 | 高新兴科技集团股份有限公司 | 一种基于深度学习的未知类别分类方法、装置及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0574937A2 (en) * | 1992-06-19 | 1993-12-22 | United Parcel Service Of America, Inc. | Method and apparatus for input classification using a neural network |
CN107679552A (zh) * | 2017-09-11 | 2018-02-09 | 北京飞搜科技有限公司 | 一种基于多分支训练的场景分类方法以及系统 |
CN108875826A (zh) * | 2018-06-15 | 2018-11-23 | 武汉大学 | 一种基于粗细粒度复合卷积的多分支对象检测方法 |
CN109886986A (zh) * | 2019-01-23 | 2019-06-14 | 北京航空航天大学 | 一种基于多分支卷积神经网络的皮肤镜图像分割方法 |
CN110443286A (zh) * | 2019-07-18 | 2019-11-12 | 广州华多网络科技有限公司 | 神经网络模型的训练方法、图像识别方法以及装置 |
CN110443143A (zh) * | 2019-07-09 | 2019-11-12 | 武汉科技大学 | 多分支卷积神经网络融合的遥感图像场景分类方法 |
-
2019
- 2019-11-26 CN CN201911176738.2A patent/CN110866565B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0574937A2 (en) * | 1992-06-19 | 1993-12-22 | United Parcel Service Of America, Inc. | Method and apparatus for input classification using a neural network |
CN107679552A (zh) * | 2017-09-11 | 2018-02-09 | 北京飞搜科技有限公司 | 一种基于多分支训练的场景分类方法以及系统 |
CN108875826A (zh) * | 2018-06-15 | 2018-11-23 | 武汉大学 | 一种基于粗细粒度复合卷积的多分支对象检测方法 |
CN109886986A (zh) * | 2019-01-23 | 2019-06-14 | 北京航空航天大学 | 一种基于多分支卷积神经网络的皮肤镜图像分割方法 |
CN110443143A (zh) * | 2019-07-09 | 2019-11-12 | 武汉科技大学 | 多分支卷积神经网络融合的遥感图像场景分类方法 |
CN110443286A (zh) * | 2019-07-18 | 2019-11-12 | 广州华多网络科技有限公司 | 神经网络模型的训练方法、图像识别方法以及装置 |
Non-Patent Citations (3)
Title |
---|
"Collaborative Learning With a Multi-Branch Framework for Feature Enhancement";Xiao Luan等;《IEEE Transactions on Multimedia》;20210224;第24卷;929-941 * |
"Multi-branch fusion network for hyperspectral image classification";Hongmin Gao等;《Knowledge-Based Systems》;20190331;第167卷;11-25 * |
"基于多分支卷积神经网络的车辆图像对比方法";蔡晓东等;《电视技术》;20161212;第40卷(第11期);116-120 * |
Also Published As
Publication number | Publication date |
---|---|
CN110866565A (zh) | 2020-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113850825B (zh) | 基于上下文信息和多尺度特征融合的遥感图像道路分割方法 | |
CN111368825B (zh) | 一种基于语义分割的指针定位方法 | |
CN112085741B (zh) | 一种基于深度学习的胃癌病理切片分割算法 | |
CN109740686A (zh) | 一种基于区域池化和特征融合的深度学习图像多标记分类方法 | |
CN111709903A (zh) | 一种红外与可见光图像融合方法 | |
CN113239954A (zh) | 基于注意力机制的图像语义分割特征融合方法 | |
CN113192076B (zh) | 联合分类预测和多尺度特征提取的mri脑肿瘤图像分割方法 | |
CN109102498B (zh) | 一种宫颈涂片图像中簇型细胞核分割的方法 | |
CN107833224B (zh) | 一种基于多层次区域合成的图像分割方法 | |
CN110866565B (zh) | 一种基于卷积神经网络的多分支图像分类方法 | |
CN110866938B (zh) | 一种全自动视频运动目标分割方法 | |
Li et al. | A deep learning method for material performance recognition in laser additive manufacturing | |
WO2025020619A1 (zh) | 一种量化神经网络表征间语义差异的方法及系统 | |
CN113436198A (zh) | 一种协同图像超分辨率重建的遥感图像语义分割方法 | |
CN110136113B (zh) | 一种基于卷积神经网络的阴道病理图像分类方法 | |
CN109741358A (zh) | 基于自适应超图学习的超像素分割方法 | |
CN113989671B (zh) | 基于语义感知与动态图卷积的遥感场景分类方法及系统 | |
CN115775226A (zh) | 基于Transformer的医学图像分类方法 | |
CN113269734B (zh) | 一种基于元学习特征融合策略的肿瘤图像检测方法及装置 | |
CN112990336B (zh) | 基于竞争注意力融合的深度三维点云分类网络构建方法 | |
CN114022494A (zh) | 一种基于轻型卷积神经网络和知识蒸馏的中医舌图像自动分割方法 | |
CN117911394A (zh) | 基于改进YOLOv5的钢材表面缺陷检测方法及系统 | |
CN115410083B (zh) | 一种基于对抗域适应的小样本sar目标分类方法及装置 | |
CN110992320A (zh) | 一种基于双重交错的医学图像分割网络 | |
CN111696117B (zh) | 一种基于骨架感知的损失函数加权方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |