CN108491856A - 一种基于多尺度特征卷积神经网络的图像场景分类方法 - Google Patents

一种基于多尺度特征卷积神经网络的图像场景分类方法 Download PDF

Info

Publication number
CN108491856A
CN108491856A CN201810129756.4A CN201810129756A CN108491856A CN 108491856 A CN108491856 A CN 108491856A CN 201810129756 A CN201810129756 A CN 201810129756A CN 108491856 A CN108491856 A CN 108491856A
Authority
CN
China
Prior art keywords
extraction module
convolutional neural
analysis
neural networks
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810129756.4A
Other languages
English (en)
Other versions
CN108491856B (zh
Inventor
赖睿
徐昆然
官俊涛
王松松
莫过
莫一过
李永薛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201810129756.4A priority Critical patent/CN108491856B/zh
Publication of CN108491856A publication Critical patent/CN108491856A/zh
Application granted granted Critical
Publication of CN108491856B publication Critical patent/CN108491856B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多尺度特征卷积神经网络的图像场景分类方法,包括:S1、构建原始多尺度特征卷积神经网络;S2、训练所述原始多尺度特征卷积神经网络,得到训练的多尺度特征卷积神经网络;S3、获取M个图像数据;S4、将所述M个图像数据输入到所述训练的多尺度特征卷积神经网络,得到M个分类向量;S5、根据所述M个分类向量计算对应的特征向量的期望;S6、根据所述特征向量的期望,得到特征向量期望的概率最大值,将所述概率最大值对应的分类向量作为图像场景预处理的分类结果,其中M为正整数。本发明提出的基于多尺度特征卷积神经网络的场景分类方法更好,具有更高的特征提取能力,具有更高的场景分类正确率。

Description

一种基于多尺度特征卷积神经网络的图像场景分类方法
技术领域
本发明属于图像处理技术领域,具体涉及一种基于多尺度特征卷积神经网络的图像场景分类方法。
背景技术
信息技术的发展使得图像数据迅速增多,如何使用计算机对这些图像进行分类管理成了人们研究的目标,图像场景分类技术就是一种对图像数据进行有效的组织和管理的手段。最终目标是将图像转化成计算机可以理解和处理的数据,最终实现自动分类和管理图像数据。因此图像场景分类对后续的支持基于图像语义的图像检索和图像浏览等功能提供了重要的基础。
现存的图像场景分类方法主要有两大类,一是通过计算条件分布概率进行分类的,如:神经网络算法,逻辑回归方法,支持向量机等;二是通过寻找数据的联合分布概率进行分类的,如:贝叶斯网络层级模型,高斯模型,隐马尔科夫模型等。
然而,现有的这些方法对图像中的细节以及颜色信息都不敏感,因此无法实现一个较为准确的分类结果。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于多尺度特征卷积神经网络的图像场景分类方法。本发明要解决的技术问题通过以下技术方案实现:
本发明实施例提供了一种基于多尺度特征卷积神经网络的图像场景分类方法,包括:
S1、构建原始多尺度特征卷积神经网络;
S2、训练所述原始多尺度特征卷积神经网络,得到训练的多尺度特征卷积神经网络;
S3、获取M个图像数据;
S4、将所述M个图像数据输入到所述训练的多尺度特征卷积神经网络,得到M个分类向量;
S5、根据所述M个分类向量计算对应的特征向量的期望;
S6、根据所述特征向量的期望,得到特征向量期望的概率最大值,将所述概率最大值对应的分类向量作为图像场景预处理的分类结果,其中M为正整数。
在一个具体实施例中,所述S1包括:
S11、构建标准卷积模块、特征融合模块;
S12、根据所述标准卷积模块构造特征压缩模块;
S13、根据所述标准卷积模块和所述特征融合模块构造基本特征提取模块;
S14、根据所述基本特征提取模块、所述特征压缩模块构建原始多尺度特征卷积神经网络。
在一个具体实施例中,所述S12包括:
将一个卷积核大小为1×1,卷积核数量为32的标准卷积模块与一个大小为Wpool×Hpool的平均池化层连接,构造特征压缩模块,其中Wpool表示平均池化层卷积核的宽度,Hpool表示平均池化层卷积核的高度。
在一个具体实施例中,所述S13包括:
通过一个卷积核大小为W×H、卷积核数量为O的标准卷积模块级连一个特征融合模块构造基本特征提取模块,其中W为卷积核的宽度,H为卷积核的高度,O为卷积核的数量。
在一个具体实施例中,所述S14包括:
S141、根据所述基本特征提取模块构建i个多尺度特征提取模块;
S142、构建所述原始多尺度特征卷积神经网络,所述原始多尺度特征卷积神经网络的连接顺序依次为:
卷积核大小W×H=7×7,卷积核数量O=32,步进值为2的标准卷积模块层、池化大小为Wpool×Hpool=2×2的最大池化层、多尺度特征提取系统、池化大小为Wpool×Hpool=2×2的平均池化层、全连接层、Softmax分类层;
其中,所述多尺度特征提取系统包括依次交替连接的多尺度特征提取模块和特征压缩模块,且所述多尺度特征提取系统中的多尺度特征提取模块为i个,i≥4。
在一个具体实施例中,根据所述基本特征提取模块构建i个多尺度特征提取模块为:
采用j个所述基本特征提取模块构建所述多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤j。
在一个具体实施例中,i个多尺度特征提取模块中,所述基本特征提取模块的总个数为50-200。
在一个具体实施例中,第一个所述多尺度特征提取模块的基本特征提取模块数量小于或等于第一个所述多尺度特征提取模块的基本特征提取模块数量,且第i个所述多尺度特征提取模块的基本特征提取模块数量大于或等于第i-1个所述多尺度特征提取模块的基本特征提取模块数量。
在一个具体实施例中,所述S3包括:
S31、获取输入图像;
S32、根据所述输入图像获取M个预定大小的图像块;
S33、获取所述图像块对应的图像数据。
在一个具体实施例中,所述预定大小为512×512个像素点。
与现有技术相比,本发明的有益效果:
本发明的基于多尺度特征卷积神经网络的图像场景分类方法在卷积神经网络的基础上通过构建特定的特征模块并进行组合,与现有的分类方法相比具有更好的场景分类能力。
附图说明
图1为本发明实施例提供的一种基于多尺度特征卷积神经网络的图像场景分类方法流程图;
图2为本发明一个具体实施例的多尺度特征提取模块叠加结构图;
图3为本发明一个具体实施例的多尺度特征卷积神经网络的结构图。
具体实施方式
下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
实施例一
请参见图1,图1为本发明实施例提供的一种基于多尺度特征卷积神经网络的图像场景分类方法流程图,本实施例的分类方法应用于对图像的预处理,包括:
S1、构建原始多尺度特征卷积神经网络;
S2、训练所述原始多尺度特征卷积神经网络,得到训练的多尺度特征卷积神经网络;
S3、获取M个图像数据;
S4、将所述M个图像数据输入到所述训练的多尺度特征卷积神经网络,得到M个分类向量;
S5、根据所述M个分类向量计算对应的特征向量的期望;
S6、根据所述特征向量的期望,得到特征向量期望的概率最大值,将所述概率最大值对应的分类向量作为图像场景预处理的分类结果,其中M为正整数。
原始多尺度特征卷积神经网络为未经过训练的神经网络,因此需要对应进行训练,本发明在训练时使用AI Challenger数据集训练网络。
为了更好的说明本实施例的训练过程,举例进行说明。
首先,对于AI Challenger数据集中的每张场景照片随机截取10张512×512大小的图像区域,并对其进行对比度和亮度的调节,减少噪声对场景分类的影响。
其次,采用Nesterov技术的Mini-batch Stochastic Gradient Descent优化器训练基于多尺度特征的卷积神经网络,mini-batch的大小设置为64,权重衰减率设置为0.000005,动量设置为0.9;训练的前10个回合采用0.1的学习率,然后每隔30个回合降低10倍的学习率,最终使学习率降低至0.0000007或者网络已经收敛,停止训练,得到完成训练的基于多尺度特征的卷积神经网络。
本发明的基于多尺度特征卷积神经网络的图像场景分类方法在卷积神经网络的基础上通过构建特定的特征模块并进行组合,与现有的分类方法相比具有更好的场景分类能力。
在一个具体实施例中,所述S1包括:
S11、构建标准卷积模块、特征融合模块;
S12、根据所述标准卷积模块构造特征压缩模块;
S13、根据所述标准卷积模块和所述特征融合模块构造基本特征提取模块;
S14、根据所述基本特征提取模块、所述特征压缩模块构建原始多尺度特征卷积神经网络。
在一个具体实施例中,所述S12包括:
将一个卷积核大小为1×1,卷积核数量为32的标准卷积模块与一个大小为Wpool×Hpool的平均池化层连接,构造特征压缩模块,其中Wpool表示平均池化层卷积核的宽度,Hpool表示平均池化层卷积核的高度。
在一个具体实施例中,所述S13包括:
通过一个卷积核大小为W×H、卷积核数量为O的标准卷积模块级连一个特征融合模块构造基本特征提取模块,其中W为卷积核的宽度,H为卷积核的高度,O为卷积核的数量。
在一个具体实施例中,请参见图2和图3,图2所示为本发明一个具体实施例的多尺度特征提取模块叠加结构图,图3为本发明一个具体实施例的多尺度特征的卷积神经网络的结构图,所述S14包括:
S141、根据所述基本特征提取模块构建i个多尺度特征提取模块;
S142、构建所述原始多尺度特征卷积神经网络,所述原始多尺度特征卷积神经网络的连接顺序依次为:
卷积核大小W×H=7×7,卷积核数量O=32,步进值为2的标准卷积模块层、池化大小为Wpool×Hpool=2×2的最大池化层、多尺度特征提取系统、池化大小为Wpool×Hpool=2×2的平均池化层、全连接层、Softmax分类层;
其中,所述多尺度特征提取系统包括依次交替连接的多尺度特征提取模块和特征压缩模块,且所述多尺度特征提取系统中的多尺度特征提取模块为i个,i≥4。
优选的,将多尺度特征提取模块的输出端两两连接,形成若干个特征旁路。由于构建的每个多尺度特征提取模块对应提取的特征不同,单独依次提取的话可能会丢失部分特征,通过输出端两两连接能够保证多尺度特征提取模块之间形成连接从而提高分类的精确度。
根据所述基本特征提取模块构建i个多尺度特征提取模块为:
采用j个所述基本特征提取模块构建所述多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤j。
优选的,i个多尺度特征提取模块中,所述基本特征提取模块的总个数为50-200。从而能够在保证精度较高的前提下,使得运算效率不至于下降。
优选的,第一个所述多尺度特征提取模块的基本特征提取模块数量小于或等于第一个所述多尺度特征提取模块的基本特征提取模块数量,且第i个所述多尺度特征提取模块的基本特征提取模块数量大于或等于第i-1个所述多尺度特征提取模块的基本特征提取模块数量。即保证多尺度特征提取模块中基本特征提取模块数量具有由少变多、由多变少的趋势,这样设计能够有效的降低运行负荷,提高运行效率,例如如果i=5,那对应的多尺度特征提取模块的基本特征提取模块数量依次可以是6、12、24、12、6。
为了更好的说明上述实施过程,本发明以i=4为例进行说明,4个多尺度特征提取模块对应的基本特征提取模块分别为j=6、12、24、16。
具体如下:根据所述基本特征提取模块构建第一多尺度特征提取模块为:
采用6个所述基本特征提取模块构建所述第一多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤6。
在一个具体实施例中,根据所述基本特征提取模块构建第二多尺度特征提取模块为:
采用12个所述基本特征提取模块构建所述第一多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤12。
在一个具体实施例中,根据所述基本特征提取模块构建第三多尺度特征提取模块为:
采用24个所述基本特征提取模块构建所述第一多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤24。
在一个具体实施例中,根据所述基本特征提取模块构建第四多尺度特征提取模块为:
采用16个所述基本特征提取模块构建所述第一多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤16。
对于上述方案,其中原始多尺度特征卷积神经网络的连接顺序依次为:卷积核大小W×H=7×7,卷积核数量O=32,步进值为2的标准卷积模块层、池化大小为Wpool×Hpool=2×2的最大池化层、第一多尺度特征提取模块、特征压缩模块、第二多尺度特征提取模块、特征压缩模块、第三多尺度特征提取模块、特征压缩模块、第四多尺度特征提取模块、池化大小为Wpool×Hpool=2×2的平均池化层、全连接层、Softmax分类层;
其中,所述多尺度特征提取系统包括依次交替连接的多尺度特征提取模块和特征压缩模块,且所述多尺度特征提取系统中的多尺度特征提取模块为4个。
其中4个多尺度特征提取模块中,所述基本特征提取模块的总个数为6+12+24+16=58。
优选的,将第一多尺度特征提取模块的输出与第三多尺度特征提取模块的输出连接,形成一条特征旁路,从而提高特征提取的精确度。
在一个具体实施例中,所述S3包括:
S31、获取输入图像;
S32、根据所述输入图像获取M个预定大小的图像块;
S33、获取所述图像块对应的图像数据。
本发明图像块的大小取值为512×512个像素点。获得截取的每张图片的分类向量Yk,按如下步骤计算分类特征向量的期望
其中,M为随机截取的图像的数量,Yk表示第k张图片的场景分类向量;选取分类特征向量的期望中,计算特征向量期望的概率最大值,将所述概率最大值对应的分类向量作为图像场景预处理的分类结果。
分别采用现有的VggNet、DenseNet方法和本发明方法对AI Challenger数据集的测试集进行场景分类,实验结果见表1。
表1 场景分类正确率对比表
由表1可知,本发明提出的多尺度特征场景分类网络的场景分类正确率明显高于采用VggNet(Visual Geometry Group Networks)和DenseNet(Densely ConnectedConvolutional Networks)进行场景分类的正确率,说明经本发明方法具有更强的特征提取及场景鉴别能力。
综上,本发明提出的基于多尺度特征场卷积神经网络的场景分类方法更好,具有更高的特征提取能力,具有更高的场景分类正确率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,包括:
S1、构建原始多尺度特征卷积神经网络;
S2、训练所述原始多尺度特征卷积神经网络,得到训练的多尺度特征卷积神经网络;
S3、获取M个图像数据;
S4、将所述M个图像数据输入到所述训练的多尺度特征卷积神经网络,得到M个分类向量;
S5、根据所述M个分类向量计算对应的特征向量的期望;
S6、根据所述特征向量的期望,得到特征向量期望的概率最大值,将所述概率最大值对应的分类向量作为图像场景预处理的分类结果,其中M为正整数。
2.根据权利要求1所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,所述S1包括:
S11、构建标准卷积模块、特征融合模块;
S12、根据所述标准卷积模块构造特征压缩模块;
S13、根据所述标准卷积模块和所述特征融合模块构造基本特征提取模块;
S14、根据所述基本特征提取模块、所述特征压缩模块构建原始多尺度特征卷积神经网络。
3.根据权利要求2所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,所述S12包括:
将一个卷积核大小为1×1,卷积核数量为32的标准卷积模块与一个大小为Wpool×Hpool的平均池化层连接,构造特征压缩模块,其中Wpool表示平均池化层卷积核的宽度,Hpool表示平均池化层卷积核的高度。
4.根据权利要求2所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,所述S13包括:
通过一个卷积核大小为W×H、卷积核数量为O的标准卷积模块级连一个特征融合模块构造基本特征提取模块,其中W为卷积核的宽度,H为卷积核的高度,O为卷积核的数量。
5.根据权利要求2所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,所述S14包括:
S141、根据所述基本特征提取模块构建i个多尺度特征提取模块;
S142、构建所述原始多尺度特征卷积神经网络,所述原始多尺度特征卷积神经网络的连接顺序依次为:
卷积核大小W×H=7×7,卷积核数量O=32,步进值为2的标准卷积模块层、池化大小为Wpool×Hpool=2×2的最大池化层、多尺度特征提取系统、池化大小为Wpool×Hpool=2×2的平均池化层、全连接层、Softmax分类层;
其中,所述多尺度特征提取系统包括依次交替连接的多尺度特征提取模块和特征压缩模块,且所述多尺度特征提取系统中的多尺度特征提取模块为i个,i≥4。
6.根据权利要求5所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,根据所述基本特征提取模块构建i个多尺度特征提取模块为:
采用j个所述基本特征提取模块构建所述多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤j。
7.根据权利要求6所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,i个多尺度特征提取模块中,所述基本特征提取模块的总个数为50-200。
8.根据权利要求6所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,第一个所述多尺度特征提取模块的基本特征提取模块数量小于或等于第一个所述多尺度特征提取模块的基本特征提取模块数量,且第i个所述多尺度特征提取模块的基本特征提取模块数量大于或等于第i-1个所述多尺度特征提取模块的基本特征提取模块数量。
9.根据权利要求1所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,所述S3包括:
S31、获取输入图像;
S32、根据所述输入图像获取M个预定大小的图像块;
S33、获取所述图像块对应的图像数据。
10.根据权利要求9所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,所述预定大小为512×512个像素点。
CN201810129756.4A 2018-02-08 2018-02-08 一种基于多尺度特征卷积神经网络的图像场景分类方法 Active CN108491856B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810129756.4A CN108491856B (zh) 2018-02-08 2018-02-08 一种基于多尺度特征卷积神经网络的图像场景分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810129756.4A CN108491856B (zh) 2018-02-08 2018-02-08 一种基于多尺度特征卷积神经网络的图像场景分类方法

Publications (2)

Publication Number Publication Date
CN108491856A true CN108491856A (zh) 2018-09-04
CN108491856B CN108491856B (zh) 2022-02-18

Family

ID=63340154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810129756.4A Active CN108491856B (zh) 2018-02-08 2018-02-08 一种基于多尺度特征卷积神经网络的图像场景分类方法

Country Status (1)

Country Link
CN (1) CN108491856B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046572A (zh) * 2019-04-15 2019-07-23 重庆邮电大学 一种基于深度学习的地标建筑物识别与检测方法
CN110705431A (zh) * 2019-09-26 2020-01-17 中国人民解放军陆军炮兵防空兵学院 基于深度c3d特征的视频显著性区域检测方法及系统
CN110751957A (zh) * 2019-09-25 2020-02-04 电子科技大学 一种使用堆叠多尺度模块的语音增强方法
CN111091178A (zh) * 2019-11-22 2020-05-01 国网山西省电力公司大同供电公司 一种基于卷积神经网络的瓷瓶裂缝识别方法
CN111382685A (zh) * 2020-03-04 2020-07-07 电子科技大学 一种基于深度学习的场景识别方法和系统
CN113033507A (zh) * 2021-05-20 2021-06-25 腾讯科技(深圳)有限公司 场景识别方法、装置、计算机设备和存储介质
CN113390806A (zh) * 2021-06-15 2021-09-14 崔薇 基于多尺度图像的生菜重金属含量检测方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408705A (zh) * 2014-09-23 2015-03-11 西安电子科技大学 一种高光谱图像的异常检测方法
CN105956532A (zh) * 2016-04-25 2016-09-21 大连理工大学 一种基于多尺度卷积神经网络的交通场景分类方法
CN106250856A (zh) * 2016-08-03 2016-12-21 武汉大学 一种基于非监督特征学习的高分辨率图像场景分类方法
CN106599907A (zh) * 2016-11-29 2017-04-26 北京航空航天大学 多特征融合的动态场景分类方法与装置
CN107133590A (zh) * 2017-05-04 2017-09-05 上海博历机械科技有限公司 一种基于人脸图像的身份识别系统
US20170262733A1 (en) * 2016-03-10 2017-09-14 Siemens Healthcare Gmbh Method and System for Machine Learning Based Classification of Vascular Branches
CN107220657A (zh) * 2017-05-10 2017-09-29 中国地质大学(武汉) 一种面向小数据集的高分辨率遥感影像场景分类的方法
CN107316066A (zh) * 2017-07-28 2017-11-03 北京工商大学 基于多通路卷积神经网络的图像分类方法及系统
CN107358260A (zh) * 2017-07-13 2017-11-17 西安电子科技大学 一种基于表面波cnn的多光谱图像分类方法
CN107403201A (zh) * 2017-08-11 2017-11-28 强深智能医疗科技(昆山)有限公司 肿瘤放射治疗靶区和危及器官智能化、自动化勾画方法
US20170344808A1 (en) * 2016-05-28 2017-11-30 Samsung Electronics Co., Ltd. System and method for a unified architecture multi-task deep learning machine for object recognition
CN107578060A (zh) * 2017-08-14 2018-01-12 电子科技大学 一种基于可判别区域的深度神经网络用于菜品图像分类的方法
US20180032846A1 (en) * 2016-08-01 2018-02-01 Nvidia Corporation Fusing multilayer and multimodal deep neural networks for video classification

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408705A (zh) * 2014-09-23 2015-03-11 西安电子科技大学 一种高光谱图像的异常检测方法
US20170262733A1 (en) * 2016-03-10 2017-09-14 Siemens Healthcare Gmbh Method and System for Machine Learning Based Classification of Vascular Branches
CN105956532A (zh) * 2016-04-25 2016-09-21 大连理工大学 一种基于多尺度卷积神经网络的交通场景分类方法
US20170344808A1 (en) * 2016-05-28 2017-11-30 Samsung Electronics Co., Ltd. System and method for a unified architecture multi-task deep learning machine for object recognition
US20180032846A1 (en) * 2016-08-01 2018-02-01 Nvidia Corporation Fusing multilayer and multimodal deep neural networks for video classification
CN106250856A (zh) * 2016-08-03 2016-12-21 武汉大学 一种基于非监督特征学习的高分辨率图像场景分类方法
CN106599907A (zh) * 2016-11-29 2017-04-26 北京航空航天大学 多特征融合的动态场景分类方法与装置
CN107133590A (zh) * 2017-05-04 2017-09-05 上海博历机械科技有限公司 一种基于人脸图像的身份识别系统
CN107220657A (zh) * 2017-05-10 2017-09-29 中国地质大学(武汉) 一种面向小数据集的高分辨率遥感影像场景分类的方法
CN107358260A (zh) * 2017-07-13 2017-11-17 西安电子科技大学 一种基于表面波cnn的多光谱图像分类方法
CN107316066A (zh) * 2017-07-28 2017-11-03 北京工商大学 基于多通路卷积神经网络的图像分类方法及系统
CN107403201A (zh) * 2017-08-11 2017-11-28 强深智能医疗科技(昆山)有限公司 肿瘤放射治疗靶区和危及器官智能化、自动化勾画方法
CN107578060A (zh) * 2017-08-14 2018-01-12 电子科技大学 一种基于可判别区域的深度神经网络用于菜品图像分类的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
WEI SHEN等: "Multi-scale Convolutional Neural Networks for Lung Nodule Classification", 《IPMI2015:INFORMATION PROCESSING IN MEDICAL IMAGEING》 *
刘盛清等: "基于多尺度特征融合Hessian稀疏编码的图像分类算法", 《计算机应用》 *
姚柯柯等: "基于多尺度分解的超光谱图像异常检测", 《强激光与粒子束》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046572A (zh) * 2019-04-15 2019-07-23 重庆邮电大学 一种基于深度学习的地标建筑物识别与检测方法
CN110751957A (zh) * 2019-09-25 2020-02-04 电子科技大学 一种使用堆叠多尺度模块的语音增强方法
CN110705431A (zh) * 2019-09-26 2020-01-17 中国人民解放军陆军炮兵防空兵学院 基于深度c3d特征的视频显著性区域检测方法及系统
CN110705431B (zh) * 2019-09-26 2022-03-15 中国人民解放军陆军炮兵防空兵学院 基于深度c3d特征的视频显著性区域检测方法及系统
CN111091178A (zh) * 2019-11-22 2020-05-01 国网山西省电力公司大同供电公司 一种基于卷积神经网络的瓷瓶裂缝识别方法
CN111382685A (zh) * 2020-03-04 2020-07-07 电子科技大学 一种基于深度学习的场景识别方法和系统
CN113033507A (zh) * 2021-05-20 2021-06-25 腾讯科技(深圳)有限公司 场景识别方法、装置、计算机设备和存储介质
CN113390806A (zh) * 2021-06-15 2021-09-14 崔薇 基于多尺度图像的生菜重金属含量检测方法
CN113390806B (zh) * 2021-06-15 2023-11-10 崔薇 基于多尺度图像的生菜重金属含量检测方法

Also Published As

Publication number Publication date
CN108491856B (zh) 2022-02-18

Similar Documents

Publication Publication Date Title
CN108491856A (zh) 一种基于多尺度特征卷积神经网络的图像场景分类方法
CN110414670B (zh) 一种基于全卷积神经网络的图像拼接篡改定位方法
Xie et al. Pyramid grafting network for one-stage high resolution saliency detection
CN109492026B (zh) 一种基于改进的主动学习技术的电信欺诈分类检测方法
CN111340123A (zh) 一种基于深度卷积神经网络的图像分数标签预测方法
CN109509149A (zh) 一种基于双通道卷积网络特征融合的超分辨率重建方法
CN105678292A (zh) 基于卷积及递归神经网络的复杂光学文字序列识别系统
CN105654135A (zh) 一种基于递归神经网络的图像文字序列识别系统
CN111737551A (zh) 一种基于异构图注意力神经网络的暗网线索检测方法
CN105654127A (zh) 基于端到端的图片文字序列连续识别方法
CN107491729B (zh) 基于余弦相似度激活的卷积神经网络的手写数字识别方法
CN111680705B (zh) 适于目标检测的mb-ssd方法和mb-ssd特征提取网络
CN115049534A (zh) 基于知识蒸馏的鱼眼图像实时语义分割方法
CN108416270A (zh) 一种基于多属性联合特征的交通标志识别方法
Wang et al. DECA: a novel multi-scale efficient channel attention module for object detection in real-life fire images
CN109345684A (zh) 一种基于gmdh-svm的多国纸币冠字号识别方法
Petrova et al. Methods of weighted combination for text field recognition in a video stream
CN109165675A (zh) 基于周期性局部连接卷积神经网络的图像分类方法
JP2019197445A (ja) 画像認識装置、画像認識方法、およびプログラム
CN111813893A (zh) 基于深度迁移学习的房地产市场分析方法、装置及设备
CN104657130A (zh) 一种对业务支撑系统进行分层分级的方法
CN115294381B (zh) 基于特征迁移和正交先验的小样本图像分类方法及装置
CN111126173A (zh) 一种高精度人脸检测方法
Wang et al. Deep learning for optical character recognition and its application to VAT invoice recognition
CN107122472A (zh) 大规模非结构化数据提取方法、其系统、分布式数据管理平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant