CN110866565B - 一种基于卷积神经网络的多分支图像分类方法 - Google Patents
一种基于卷积神经网络的多分支图像分类方法 Download PDFInfo
- Publication number
- CN110866565B CN110866565B CN201911176738.2A CN201911176738A CN110866565B CN 110866565 B CN110866565 B CN 110866565B CN 201911176738 A CN201911176738 A CN 201911176738A CN 110866565 B CN110866565 B CN 110866565B
- Authority
- CN
- China
- Prior art keywords
- branch
- output
- neural network
- convolutional neural
- method based
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/259—Fusion by voting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于卷积神经网络的多分支图像分类方法,属于图像处理领域,该方法包含如下步骤:S1:提取主干神经网络中的各个尺度的特征图;S2:对相邻的特征图相加形成多个分支并且每个分支设置单独的一个输出;S3:结合主干网络的输出,通过投票各个输出的结果得到一个辅助输出,最后选取所有输出中准确率最高的。最后,本发明方法能够准确的对图像分类,在各个数据库上都有较高的识别效果。
Description
技术领域
本发明涉及一种基于卷积神经网络的多分支图像分类方法,属于图像处理领域。
背景技术
深度神经网络在图像分类任务中取得了巨大的成功。研究表明,越深的网络层数越能够提取到图像高级的特征。因此,研究者们着力于解决如何加深网络结构以提升分类准确率。1998年至今,网络层数从一开始的5层到19层,甚至达到了惊人的1202层。随着网络层数的加深,图像识别竞赛ILSVRC的准确率也逐渐被提高。除了加深网络层数外,另一批学者尝试从其他的方向来改进网络结构,如加宽网络,分组卷积网络,分形网络等。
虽然随着层数的增加,网络性能变得更好,但是网络优化问题变得愈加的困难。残差结构能很好的优化网络,但是更深层的网络仍然出。现了过拟合的问题。此外,池化会导致信息的损失,影响网络的分类准确率。网络在前向传播的过程中,会不断的对原始输入图像进行降维,每一次的降维都会造成不同程度的信息丢失。而丢失的信息对于网络性能的提升也有着不可忽视的作用。总的来说,现有的网络依然会面临着优化问题和特征复用问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于卷积神经网络的多分支图像分类方法,能解决现有深度卷积神经网中的优化和过拟合问题。
为达到上述目的,本发明提供如下技术方案:
一种基于卷积神经网络的多分支图像分类方法,该方法包含如下步骤:
S1:提取主干神经网络中的各个尺度的特征图;
S2:对相邻的特征图相加形成多个分支并且每个分支设置单独的一个输出,每一个分支称为一个branch单元;
S3:结合主干网络的输出,通过投票各个输出的结果得到一个辅助输出,最后选取所有输出中准确率最高的。
可选的,所述步骤S2中,一个branch单元包含如下步骤:
S31:先对低维度的特征图进行上采样
S32:减少其通道数
S33:和另一个特征图相加
上述步骤满足如下公式:
y=x+Ws(Up(G(x)))
式中,x表示branch单元的输入,G表示一个下采样函数,Up表示上采样函数,Ws映射函数,功能为改变其输入的通道数。
可选的,所述投票遵从对每个输出类别取众数的规则,满足如下公式:
式中,y表示投票后的类别,yi表示第i个分支所属的类别,cj表示总分类数中的第j个类别,I为指示函数,当yi=cj时为1,否则为0。
本发明的有益效果在于:本发明方法能够缓解现有卷积神经网络中的过拟合问题,能够更好地优化网络信息的传递。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为本发明的网络结构图;
图2为本发明的branch单元结构图;
图3为本发明的具有3个branch单元的结构图。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
本发明为一种基于卷积神经网络的多分支图像分类方法,该方法包含如下步骤:
1、提取主干神经网络中的各个尺度的特征图;
2、对相邻的特征图相加形成多个分支并切每个分支设置单独的一个输出,每一个分支称为一个branch单元;
3、结合主干网络的输出,通过投票各个输出的结果得到一个辅助输出,最后选取所有输出中准确率最高的。
由于现有网络结构中,为了减少参数和计算量都会在网络中对输入图像多次降维,因此本文提出的BranchNet可以直接扩展在主干网络中,提取网络中输入图像每一个维度的输出,把相邻两个维度的输出相加形成一个branch单元,如图2所示,然后作为主干网络的辅助输出,得到多个结果。为了进一步利用多尺度信息,我们还对输出结果进行投票,在原输出的数量上增加一个输出,最后选取准确率最大的输出作为最终结果。
图1到图3为本发明方法的结构示意图。具体包括以下几个部分:
图1为本发明方法的网络结构图,有主干网络和branch单元构成。图中每有一条支路就有一个branch单元,以及对应于一个结果。最后对所有的结果投票取最大值。
图2为本发明所述branch单元结构图。包括以下步骤:
1、先对低维度的特征图进行上采样
2、减少其通道数
3、和另一个特征图相加
上述步骤满足如下公式:
y=x+Ws(Up(G(x)))
式中,x表示branch单元的输入,G表示一个下采样函数,Up表示上采样函数,Ws映射函数,功能为改变其输入的通道数。
图3为本发明方法中有四个branch单元的网络结构图。
最后说明的是,以上优选实施例仅用以说明发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
Claims (3)
1.一种基于卷积神经网络的多分支图像分类方法,其特征在于:该方法包含如下步骤:
S1:提取主干神经网络中的各个尺度的特征图;
S2:对相邻的特征图相加形成多个分支并且每个分支设置单独的一个输出,每一个分支称为一个branch单元;
S3:结合主干网络的输出,通过投票各个输出的结果得到一个辅助输出,最后选取所有输出中准确率最高的。
2.根据权利要求1所述的一种基于卷积神经网络的多分支图像分类方法,其特征在于:所述步骤S2中,一个branch单元包含如下步骤:
S31:先对低维度的特征图进行上采样
S32:减少其通道数
S33:和另一个特征图相加
上述步骤满足如下公式:
y=x+Ws(Up(G(x)))
式中,x表示branch单元的输入,G表示一个下采样函数,Up表示上采样函数,Ws映射函数,功能为改变其输入的通道数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911176738.2A CN110866565B (zh) | 2019-11-26 | 2019-11-26 | 一种基于卷积神经网络的多分支图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911176738.2A CN110866565B (zh) | 2019-11-26 | 2019-11-26 | 一种基于卷积神经网络的多分支图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110866565A CN110866565A (zh) | 2020-03-06 |
CN110866565B true CN110866565B (zh) | 2022-06-24 |
Family
ID=69656929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911176738.2A Active CN110866565B (zh) | 2019-11-26 | 2019-11-26 | 一种基于卷积神经网络的多分支图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110866565B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112633402B (zh) * | 2020-12-30 | 2024-05-03 | 南京大学 | 一种实现动态计算的高精度高比例的分类模型及分类方法 |
CN113283514B (zh) * | 2021-05-31 | 2024-05-21 | 高新兴科技集团股份有限公司 | 一种基于深度学习的未知类别分类方法、装置及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0574937A2 (en) * | 1992-06-19 | 1993-12-22 | United Parcel Service Of America, Inc. | Method and apparatus for input classification using a neural network |
CN107679552A (zh) * | 2017-09-11 | 2018-02-09 | 北京飞搜科技有限公司 | 一种基于多分支训练的场景分类方法以及系统 |
CN108875826A (zh) * | 2018-06-15 | 2018-11-23 | 武汉大学 | 一种基于粗细粒度复合卷积的多分支对象检测方法 |
CN109886986A (zh) * | 2019-01-23 | 2019-06-14 | 北京航空航天大学 | 一种基于多分支卷积神经网络的皮肤镜图像分割方法 |
CN110443143A (zh) * | 2019-07-09 | 2019-11-12 | 武汉科技大学 | 多分支卷积神经网络融合的遥感图像场景分类方法 |
CN110443286A (zh) * | 2019-07-18 | 2019-11-12 | 广州华多网络科技有限公司 | 神经网络模型的训练方法、图像识别方法以及装置 |
-
2019
- 2019-11-26 CN CN201911176738.2A patent/CN110866565B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0574937A2 (en) * | 1992-06-19 | 1993-12-22 | United Parcel Service Of America, Inc. | Method and apparatus for input classification using a neural network |
CN107679552A (zh) * | 2017-09-11 | 2018-02-09 | 北京飞搜科技有限公司 | 一种基于多分支训练的场景分类方法以及系统 |
CN108875826A (zh) * | 2018-06-15 | 2018-11-23 | 武汉大学 | 一种基于粗细粒度复合卷积的多分支对象检测方法 |
CN109886986A (zh) * | 2019-01-23 | 2019-06-14 | 北京航空航天大学 | 一种基于多分支卷积神经网络的皮肤镜图像分割方法 |
CN110443143A (zh) * | 2019-07-09 | 2019-11-12 | 武汉科技大学 | 多分支卷积神经网络融合的遥感图像场景分类方法 |
CN110443286A (zh) * | 2019-07-18 | 2019-11-12 | 广州华多网络科技有限公司 | 神经网络模型的训练方法、图像识别方法以及装置 |
Non-Patent Citations (3)
Title |
---|
"Collaborative Learning With a Multi-Branch Framework for Feature Enhancement";Xiao Luan等;《IEEE Transactions on Multimedia》;20210224;第24卷;929-941 * |
"Multi-branch fusion network for hyperspectral image classification";Hongmin Gao等;《Knowledge-Based Systems》;20190331;第167卷;11-25 * |
"基于多分支卷积神经网络的车辆图像对比方法";蔡晓东等;《电视技术》;20161212;第40卷(第11期);116-120 * |
Also Published As
Publication number | Publication date |
---|---|
CN110866565A (zh) | 2020-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112257794B (zh) | 一种基于yolo的轻量级的目标检测方法 | |
CN108764317A (zh) | 一种基于多路特征加权的残差卷积神经网络图像分类方法 | |
CN113160062B (zh) | 一种红外图像目标检测方法、装置、设备及存储介质 | |
CN106845381A (zh) | 基于双通道卷积神经网络的空谱联合的高光谱图像分类方法 | |
CN111696101A (zh) | 一种基于SE-Inception的轻量级茄科病害识别方法 | |
CN112085741B (zh) | 一种基于深度学习的胃癌病理切片分割算法 | |
CN109784283A (zh) | 基于场景识别任务下的遥感图像目标提取方法 | |
CN110866565B (zh) | 一种基于卷积神经网络的多分支图像分类方法 | |
CN113192076B (zh) | 联合分类预测和多尺度特征提取的mri脑肿瘤图像分割方法 | |
CN113361466B (zh) | 一种基于多模态交叉指导学习的多光谱目标检测方法 | |
CN111462090A (zh) | 一种多尺度图像目标检测方法 | |
CN111695513A (zh) | 一种基于深度残差网络的人脸表情识别方法 | |
CN113344077A (zh) | 一种基于卷积胶囊网络结构的抗噪茄科病害识别方法 | |
CN113344110A (zh) | 一种基于超分辨率重建的模糊图像分类方法 | |
CN115239613B (zh) | 基于集成深度学习的全视野数字切片图像分类建模方法及装置 | |
CN115775226A (zh) | 基于Transformer的医学图像分类方法 | |
CN114972753A (zh) | 基于上下文信息聚合和辅助学习的轻量级语义分割方法及系统 | |
CN115082806A (zh) | 一种面向中高分辨率卫星遥感影像的地面物体提取方法 | |
CN118212417A (zh) | 基于轻量化注意力模块的医学图像分割模型及模型的训练方法 | |
CN113592885B (zh) | 基于SegNet-RS网络的大障碍物轮廓分割方法 | |
CN118154986A (zh) | 基于多尺度稀疏交叉融合和语义增强的遥感图像分类方法 | |
CN113780550A (zh) | 一种量化特征图相似度的卷积神经网络剪枝方法及装置 | |
CN116030095B (zh) | 一种基于双分支孪生网络结构的视觉目标跟踪方法 | |
CN110992320B (zh) | 一种基于双重交错的医学图像分割网络 | |
CN117635989A (zh) | 基于改进CFNet的双目立体匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |