CN108491856B - 一种基于多尺度特征卷积神经网络的图像场景分类方法 - Google Patents

一种基于多尺度特征卷积神经网络的图像场景分类方法 Download PDF

Info

Publication number
CN108491856B
CN108491856B CN201810129756.4A CN201810129756A CN108491856B CN 108491856 B CN108491856 B CN 108491856B CN 201810129756 A CN201810129756 A CN 201810129756A CN 108491856 B CN108491856 B CN 108491856B
Authority
CN
China
Prior art keywords
feature extraction
module
scale feature
neural network
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810129756.4A
Other languages
English (en)
Other versions
CN108491856A (zh
Inventor
赖睿
徐昆然
官俊涛
王松松
莫一过
李永薛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201810129756.4A priority Critical patent/CN108491856B/zh
Publication of CN108491856A publication Critical patent/CN108491856A/zh
Application granted granted Critical
Publication of CN108491856B publication Critical patent/CN108491856B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多尺度特征卷积神经网络的图像场景分类方法,包括:S1、构建原始多尺度特征卷积神经网络;S2、训练所述原始多尺度特征卷积神经网络,得到训练的多尺度特征卷积神经网络;S3、获取M个图像数据;S4、将所述M个图像数据输入到所述训练的多尺度特征卷积神经网络,得到M个分类向量;S5、根据所述M个分类向量计算对应的特征向量的期望;S6、根据所述特征向量的期望,得到特征向量期望的概率最大值,将所述概率最大值对应的分类向量作为图像场景预处理的分类结果,其中M为正整数。本发明提出的基于多尺度特征卷积神经网络的场景分类方法更好,具有更高的特征提取能力,具有更高的场景分类正确率。

Description

一种基于多尺度特征卷积神经网络的图像场景分类方法
技术领域
本发明属于图像处理技术领域,具体涉及一种基于多尺度特征卷积神经网络的图像场景分类方法。
背景技术
信息技术的发展使得图像数据迅速增多,如何使用计算机对这些图像进行分类管理成了人们研究的目标,图像场景分类技术就是一种对图像数据进行有效的组织和管理的手段。最终目标是将图像转化成计算机可以理解和处理的数据,最终实现自动分类和管理图像数据。因此图像场景分类对后续的支持基于图像语义的图像检索和图像浏览等功能提供了重要的基础。
现存的图像场景分类方法主要有两大类,一是通过计算条件分布概率进行分类的,如:神经网络算法,逻辑回归方法,支持向量机等;二是通过寻找数据的联合分布概率进行分类的,如:贝叶斯网络层级模型,高斯模型,隐马尔科夫模型等。
然而,现有的这些方法对图像中的细节以及颜色信息都不敏感,因此无法实现一个较为准确的分类结果。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于多尺度特征卷积神经网络的图像场景分类方法。本发明要解决的技术问题通过以下技术方案实现:
本发明实施例提供了一种基于多尺度特征卷积神经网络的图像场景分类方法,包括:
S1、构建原始多尺度特征卷积神经网络;
S2、训练所述原始多尺度特征卷积神经网络,得到训练的多尺度特征卷积神经网络;
S3、获取M个图像数据;
S4、将所述M个图像数据输入到所述训练的多尺度特征卷积神经网络,得到M个分类向量;
S5、根据所述M个分类向量计算对应的特征向量的期望;
S6、根据所述特征向量的期望,得到特征向量期望的概率最大值,将所述概率最大值对应的分类向量作为图像场景预处理的分类结果,其中M为正整数。
在一个具体实施例中,所述S1包括:
S11、构建标准卷积模块、特征融合模块;
S12、根据所述标准卷积模块构造特征压缩模块;
S13、根据所述标准卷积模块和所述特征融合模块构造基本特征提取模块;
S14、根据所述基本特征提取模块、所述特征压缩模块构建原始多尺度特征卷积神经网络。
在一个具体实施例中,所述S12包括:
将一个卷积核大小为1×1,卷积核数量为32的标准卷积模块与一个大小为Wpool×Hpool的平均池化层连接,构造特征压缩模块,其中Wpool表示平均池化层卷积核的宽度,Hpool表示平均池化层卷积核的高度。
在一个具体实施例中,所述S13包括:
通过一个卷积核大小为W×H、卷积核数量为O的标准卷积模块级连一个特征融合模块构造基本特征提取模块,其中W为卷积核的宽度,H为卷积核的高度,O为卷积核的数量。
在一个具体实施例中,所述S14包括:
S141、根据所述基本特征提取模块构建i个多尺度特征提取模块;
S142、构建所述原始多尺度特征卷积神经网络,所述原始多尺度特征卷积神经网络的连接顺序依次为:
卷积核大小W×H=7×7,卷积核数量O=32,步进值为2的标准卷积模块层、池化大小为Wpool×Hpool=2×2的最大池化层、多尺度特征提取系统、池化大小为Wpool×Hpool=2×2的平均池化层、全连接层、Softmax分类层;
其中,所述多尺度特征提取系统包括依次交替连接的多尺度特征提取模块和特征压缩模块,且所述多尺度特征提取系统中的多尺度特征提取模块为i个,i≥4。
在一个具体实施例中,根据所述基本特征提取模块构建i个多尺度特征提取模块为:
采用j个所述基本特征提取模块构建所述多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤j。
在一个具体实施例中,i个多尺度特征提取模块中,所述基本特征提取模块的总个数为50-200。
在一个具体实施例中,第一个所述多尺度特征提取模块的基本特征提取模块数量小于或等于第一个所述多尺度特征提取模块的基本特征提取模块数量,且第i个所述多尺度特征提取模块的基本特征提取模块数量大于或等于第i-1个所述多尺度特征提取模块的基本特征提取模块数量。
在一个具体实施例中,所述S3包括:
S31、获取输入图像;
S32、根据所述输入图像获取M个预定大小的图像块;
S33、获取所述图像块对应的图像数据。
在一个具体实施例中,所述预定大小为512×512个像素点。
与现有技术相比,本发明的有益效果:
本发明的基于多尺度特征卷积神经网络的图像场景分类方法在卷积神经网络的基础上通过构建特定的特征模块并进行组合,与现有的分类方法相比具有更好的场景分类能力。
附图说明
图1为本发明实施例提供的一种基于多尺度特征卷积神经网络的图像场景分类方法流程图;
图2为本发明一个具体实施例的多尺度特征提取模块叠加结构图;
图3为本发明一个具体实施例的多尺度特征卷积神经网络的结构图。
具体实施方式
下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
实施例一
请参见图1,图1为本发明实施例提供的一种基于多尺度特征卷积神经网络的图像场景分类方法流程图,本实施例的分类方法应用于对图像的预处理,包括:
S1、构建原始多尺度特征卷积神经网络;
S2、训练所述原始多尺度特征卷积神经网络,得到训练的多尺度特征卷积神经网络;
S3、获取M个图像数据;
S4、将所述M个图像数据输入到所述训练的多尺度特征卷积神经网络,得到M个分类向量;
S5、根据所述M个分类向量计算对应的特征向量的期望;
S6、根据所述特征向量的期望,得到特征向量期望的概率最大值,将所述概率最大值对应的分类向量作为图像场景预处理的分类结果,其中M为正整数。
原始多尺度特征卷积神经网络为未经过训练的神经网络,因此需要对应进行训练,本发明在训练时使用AI Challenger数据集训练网络。
为了更好的说明本实施例的训练过程,举例进行说明。
首先,对于AI Challenger数据集中的每张场景照片随机截取10张512×512大小的图像区域,并对其进行对比度和亮度的调节,减少噪声对场景分类的影响。
其次,采用Nesterov技术的Mini-batch Stochastic Gradient Descent优化器训练基于多尺度特征的卷积神经网络,mini-batch的大小设置为64,权重衰减率设置为0.000005,动量设置为0.9;训练的前10个回合采用0.1的学习率,然后每隔30个回合降低10倍的学习率,最终使学习率降低至0.0000007或者网络已经收敛,停止训练,得到完成训练的基于多尺度特征的卷积神经网络。
本发明的基于多尺度特征卷积神经网络的图像场景分类方法在卷积神经网络的基础上通过构建特定的特征模块并进行组合,与现有的分类方法相比具有更好的场景分类能力。
在一个具体实施例中,所述S1包括:
S11、构建标准卷积模块、特征融合模块;
S12、根据所述标准卷积模块构造特征压缩模块;
S13、根据所述标准卷积模块和所述特征融合模块构造基本特征提取模块;
S14、根据所述基本特征提取模块、所述特征压缩模块构建原始多尺度特征卷积神经网络。
在一个具体实施例中,所述S12包括:
将一个卷积核大小为1×1,卷积核数量为32的标准卷积模块与一个大小为Wpool×Hpool的平均池化层连接,构造特征压缩模块,其中Wpool表示平均池化层卷积核的宽度,Hpool表示平均池化层卷积核的高度。
在一个具体实施例中,所述S13包括:
通过一个卷积核大小为W×H、卷积核数量为O的标准卷积模块级连一个特征融合模块构造基本特征提取模块,其中W为卷积核的宽度,H为卷积核的高度,O为卷积核的数量。
在一个具体实施例中,请参见图2和图3,图2所示为本发明一个具体实施例的多尺度特征提取模块叠加结构图,图3为本发明一个具体实施例的多尺度特征的卷积神经网络的结构图,所述S14包括:
S141、根据所述基本特征提取模块构建i个多尺度特征提取模块;
S142、构建所述原始多尺度特征卷积神经网络,所述原始多尺度特征卷积神经网络的连接顺序依次为:
卷积核大小W×H=7×7,卷积核数量O=32,步进值为2的标准卷积模块层、池化大小为Wpool×Hpool=2×2的最大池化层、多尺度特征提取系统、池化大小为Wpool×Hpool=2×2的平均池化层、全连接层、Softmax分类层;
其中,所述多尺度特征提取系统包括依次交替连接的多尺度特征提取模块和特征压缩模块,且所述多尺度特征提取系统中的多尺度特征提取模块为i个,i≥4。
优选的,将多尺度特征提取模块的输出端两两连接,形成若干个特征旁路。由于构建的每个多尺度特征提取模块对应提取的特征不同,单独依次提取的话可能会丢失部分特征,通过输出端两两连接能够保证多尺度特征提取模块之间形成连接从而提高分类的精确度。
根据所述基本特征提取模块构建i个多尺度特征提取模块为:
采用j个所述基本特征提取模块构建所述多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤j。
优选的,i个多尺度特征提取模块中,所述基本特征提取模块的总个数为50-200。从而能够在保证精度较高的前提下,使得运算效率不至于下降。
优选的,第一个所述多尺度特征提取模块的基本特征提取模块数量小于或等于第一个所述多尺度特征提取模块的基本特征提取模块数量,且第i个所述多尺度特征提取模块的基本特征提取模块数量大于或等于第i-1个所述多尺度特征提取模块的基本特征提取模块数量。即保证多尺度特征提取模块中基本特征提取模块数量具有由少变多、由多变少的趋势,这样设计能够有效的降低运行负荷,提高运行效率,例如如果i=5,那对应的多尺度特征提取模块的基本特征提取模块数量依次可以是6、12、24、12、6。
为了更好的说明上述实施过程,本发明以i=4为例进行说明,4个多尺度特征提取模块对应的基本特征提取模块分别为j=6、12、24、16。
具体如下:根据所述基本特征提取模块构建第一多尺度特征提取模块为:
采用6个所述基本特征提取模块构建所述第一多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤6。
在一个具体实施例中,根据所述基本特征提取模块构建第二多尺度特征提取模块为:
采用12个所述基本特征提取模块构建所述第一多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤12。
在一个具体实施例中,根据所述基本特征提取模块构建第三多尺度特征提取模块为:
采用24个所述基本特征提取模块构建所述第一多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤24。
在一个具体实施例中,根据所述基本特征提取模块构建第四多尺度特征提取模块为:
采用16个所述基本特征提取模块构建所述第一多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤16。
对于上述方案,其中原始多尺度特征卷积神经网络的连接顺序依次为:卷积核大小W×H=7×7,卷积核数量O=32,步进值为2的标准卷积模块层、池化大小为Wpool×Hpool=2×2的最大池化层、第一多尺度特征提取模块、特征压缩模块、第二多尺度特征提取模块、特征压缩模块、第三多尺度特征提取模块、特征压缩模块、第四多尺度特征提取模块、池化大小为Wpool×Hpool=2×2的平均池化层、全连接层、Softmax分类层;
其中,所述多尺度特征提取系统包括依次交替连接的多尺度特征提取模块和特征压缩模块,且所述多尺度特征提取系统中的多尺度特征提取模块为4个。
其中4个多尺度特征提取模块中,所述基本特征提取模块的总个数为6+12+24+16=58。
优选的,将第一多尺度特征提取模块的输出与第三多尺度特征提取模块的输出连接,形成一条特征旁路,从而提高特征提取的精确度。
在一个具体实施例中,所述S3包括:
S31、获取输入图像;
S32、根据所述输入图像获取M个预定大小的图像块;
S33、获取所述图像块对应的图像数据。
本发明图像块的大小取值为512×512个像素点。获得截取的每张图片的分类向量Yk,按如下步骤计算分类特征向量的期望
Figure BDA0001574533370000101
Figure BDA0001574533370000102
其中,M为随机截取的图像的数量,Yk表示第k张图片的场景分类向量;选取分类特征向量的期望
Figure BDA0001574533370000103
中,计算特征向量期望的概率最大值,将所述概率最大值对应的分类向量作为图像场景预处理的分类结果。
分别采用现有的VggNet、DenseNet方法和本发明方法对AI Challenger数据集的测试集进行场景分类,实验结果见表1。
表1 场景分类正确率对比表
Figure BDA0001574533370000111
由表1可知,本发明提出的多尺度特征场景分类网络的场景分类正确率明显高于采用VggNet(Visual Geometry Group Networks)和DenseNet(Densely ConnectedConvolutional Networks)进行场景分类的正确率,说明经本发明方法具有更强的特征提取及场景鉴别能力。
综上,本发明提出的基于多尺度特征场卷积神经网络的场景分类方法更好,具有更高的特征提取能力,具有更高的场景分类正确率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (7)

1.一种基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,包括:
S1、构建原始多尺度特征卷积神经网络;
S2、训练所述原始多尺度特征卷积神经网络,得到训练的多尺度特征卷积神经网络;
S3、获取M个图像数据;
S4、将所述M个图像数据输入到所述训练的多尺度特征卷积神经网络,得到M个分类向量;
S5、根据所述M个分类向量计算对应的特征向量的期望;
S6、根据所述特征向量的期望,得到特征向量期望的概率最大值,将所述概率最大值对应的分类向量作为图像场景预处理的分类结果,其中M为正整数;
所述S1包括:
S11、构建标准卷积模块、特征融合模块;
S12、根据所述标准卷积模块构造特征压缩模块;
S13、根据所述标准卷积模块和所述特征融合模块构造基本特征提取模块;
S14、根据所述基本特征提取模块、所述特征压缩模块构建原始多尺度特征卷积神经网络;
所述S14包括:
S141、根据所述基本特征提取模块构建i个多尺度特征提取模块;
S142、构建所述原始多尺度特征卷积神经网络,所述原始多尺度特征卷积神经网络的连接顺序依次为:
卷积核大小W×H=7×7,卷积核数量O=32,步进值为2的标准卷积模块层、池化大小为Wpool×Hpool=2×2的最大池化层、多尺度特征提取系统、池化大小为Wpool×Hpool=2×2的平均池化层、全连接层、Softmax分类层;
其中,所述多尺度特征提取系统包括依次交替连接的多尺度特征提取模块和特征压缩模块,且所述多尺度特征提取系统中的多尺度特征提取模块为i个,i≥4;
所述根据所述基本特征提取模块构建i个多尺度特征提取模块为:
采用j个所述基本特征提取模块构建所述多尺度特征提取模块,所述基本特征提取模块卷积核的大小为W×H=3×3,卷积核的数量O=32,每个所述基本特征提取模块的连接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk为第k个基本特征提取模块的输出,Fk为第k个基本特征提取模块的非线性变换函数,[x1,x2,…,xk-1]由k-1个基本特征提取模块的输出按通道方向拼接而成,其中0<k≤j。
2.根据权利要求1所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,所述S12包括:
将一个卷积核大小为1×1,卷积核数量为32的标准卷积模块与一个大小为Wpool×Hpool的平均池化层连接,构造特征压缩模块,其中Wpool表示平均池化层卷积核的宽度,Hpool表示平均池化层卷积核的高度。
3.根据权利要求1所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,所述S13包括:
通过一个卷积核大小为W×H、卷积核数量为O的标准卷积模块级连一个特征融合模块构造基本特征提取模块,其中W为卷积核的宽度,H为卷积核的高度,O为卷积核的数量。
4.根据权利要求1所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,i个多尺度特征提取模块中,所述基本特征提取模块的总个数为50-200。
5.根据权利要求1所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,第一个所述多尺度特征提取模块的基本特征提取模块数量小于或等于第一个所述多尺度特征提取模块的基本特征提取模块数量,且第i个所述多尺度特征提取模块的基本特征提取模块数量大于或等于第i-1个所述多尺度特征提取模块的基本特征提取模块数量。
6.根据权利要求1所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,所述S3包括:
S31、获取输入图像;
S32、根据所述输入图像获取M个预定大小的图像块;
S33、获取所述图像块对应的图像数据。
7.根据权利要求6所述的基于多尺度特征卷积神经网络的图像场景分类方法,其特征在于,所述预定大小为512×512个像素点。
CN201810129756.4A 2018-02-08 2018-02-08 一种基于多尺度特征卷积神经网络的图像场景分类方法 Active CN108491856B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810129756.4A CN108491856B (zh) 2018-02-08 2018-02-08 一种基于多尺度特征卷积神经网络的图像场景分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810129756.4A CN108491856B (zh) 2018-02-08 2018-02-08 一种基于多尺度特征卷积神经网络的图像场景分类方法

Publications (2)

Publication Number Publication Date
CN108491856A CN108491856A (zh) 2018-09-04
CN108491856B true CN108491856B (zh) 2022-02-18

Family

ID=63340154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810129756.4A Active CN108491856B (zh) 2018-02-08 2018-02-08 一种基于多尺度特征卷积神经网络的图像场景分类方法

Country Status (1)

Country Link
CN (1) CN108491856B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046572A (zh) * 2019-04-15 2019-07-23 重庆邮电大学 一种基于深度学习的地标建筑物识别与检测方法
CN110751957B (zh) * 2019-09-25 2020-10-27 电子科技大学 一种使用堆叠多尺度模块的语音增强方法
CN110705431B (zh) * 2019-09-26 2022-03-15 中国人民解放军陆军炮兵防空兵学院 基于深度c3d特征的视频显著性区域检测方法及系统
CN111091178A (zh) * 2019-11-22 2020-05-01 国网山西省电力公司大同供电公司 一种基于卷积神经网络的瓷瓶裂缝识别方法
CN111382685B (zh) * 2020-03-04 2023-03-28 电子科技大学 一种基于深度学习的场景识别方法和系统
CN113033507B (zh) * 2021-05-20 2021-08-10 腾讯科技(深圳)有限公司 场景识别方法、装置、计算机设备和存储介质
CN113390806B (zh) * 2021-06-15 2023-11-10 崔薇 基于多尺度图像的生菜重金属含量检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408705A (zh) * 2014-09-23 2015-03-11 西安电子科技大学 一种高光谱图像的异常检测方法
CN105956532A (zh) * 2016-04-25 2016-09-21 大连理工大学 一种基于多尺度卷积神经网络的交通场景分类方法
CN107133590A (zh) * 2017-05-04 2017-09-05 上海博历机械科技有限公司 一种基于人脸图像的身份识别系统
CN107316066A (zh) * 2017-07-28 2017-11-03 北京工商大学 基于多通路卷积神经网络的图像分类方法及系统
CN107358260A (zh) * 2017-07-13 2017-11-17 西安电子科技大学 一种基于表面波cnn的多光谱图像分类方法
CN107403201A (zh) * 2017-08-11 2017-11-28 强深智能医疗科技(昆山)有限公司 肿瘤放射治疗靶区和危及器官智能化、自动化勾画方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10115039B2 (en) * 2016-03-10 2018-10-30 Siemens Healthcare Gmbh Method and system for machine learning based classification of vascular branches
US10032067B2 (en) * 2016-05-28 2018-07-24 Samsung Electronics Co., Ltd. System and method for a unified architecture multi-task deep learning machine for object recognition
US10402697B2 (en) * 2016-08-01 2019-09-03 Nvidia Corporation Fusing multilayer and multimodal deep neural networks for video classification
CN106250856A (zh) * 2016-08-03 2016-12-21 武汉大学 一种基于非监督特征学习的高分辨率图像场景分类方法
CN106599907B (zh) * 2016-11-29 2019-11-29 北京航空航天大学 多特征融合的动态场景分类方法与装置
CN107220657B (zh) * 2017-05-10 2018-05-18 中国地质大学(武汉) 一种面向小数据集的高分辨率遥感影像场景分类的方法
CN107578060B (zh) * 2017-08-14 2020-12-29 电子科技大学 一种基于可判别区域的深度神经网络用于菜品图像分类的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408705A (zh) * 2014-09-23 2015-03-11 西安电子科技大学 一种高光谱图像的异常检测方法
CN105956532A (zh) * 2016-04-25 2016-09-21 大连理工大学 一种基于多尺度卷积神经网络的交通场景分类方法
CN107133590A (zh) * 2017-05-04 2017-09-05 上海博历机械科技有限公司 一种基于人脸图像的身份识别系统
CN107358260A (zh) * 2017-07-13 2017-11-17 西安电子科技大学 一种基于表面波cnn的多光谱图像分类方法
CN107316066A (zh) * 2017-07-28 2017-11-03 北京工商大学 基于多通路卷积神经网络的图像分类方法及系统
CN107403201A (zh) * 2017-08-11 2017-11-28 强深智能医疗科技(昆山)有限公司 肿瘤放射治疗靶区和危及器官智能化、自动化勾画方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Multi-scale Convolutional Neural Networks for Lung Nodule Classification;Wei Shen等;《IPMI2015:Information Processing in Medical Imageing》;20150623;第588-599页 *
基于多尺度分解的超光谱图像异常检测;姚柯柯等;《强激光与粒子束》;20120215;第24卷(第2期);第327-330页 *
基于多尺度特征融合Hessian稀疏编码的图像分类算法;刘盛清等;《计算机应用》;20171210;第37卷(第12期);第3517-3522页 *

Also Published As

Publication number Publication date
CN108491856A (zh) 2018-09-04

Similar Documents

Publication Publication Date Title
CN108491856B (zh) 一种基于多尺度特征卷积神经网络的图像场景分类方法
CN111767882B (zh) 一种基于改进yolo模型的多模态行人检测方法
CN110223292B (zh) 图像评估方法、装置及计算机可读存储介质
CN111639692A (zh) 一种基于注意力机制的阴影检测方法
CN110569814B (zh) 视频类别识别方法、装置、计算机设备及计算机存储介质
CN111506773B (zh) 一种基于无监督深度孪生网络的视频去重方法
CN111639564B (zh) 一种基于多注意力异构网络的视频行人重识别方法
CN112966646A (zh) 基于双路模型融合的视频分割方法、装置、设备及介质
CN111339818B (zh) 一种人脸多属性识别系统
CN114973317A (zh) 一种基于多尺度邻接交互特征的行人重识别方法
CN111680705B (zh) 适于目标检测的mb-ssd方法和mb-ssd特征提取网络
CN110009003A (zh) 图像处理与图像比对模型的训练方法、装置和系统
CN109919084B (zh) 一种基于深度多索引哈希的行人重识别方法
CN110414586B (zh) 基于深度学习的防伪标签验伪方法、装置、设备及介质
CN111400572A (zh) 一种基于卷积神经网络实现图像特征识别的内容安全监测系统及其方法
CN116798070A (zh) 一种基于光谱感知和注意力机制的跨模态行人重识别方法
CN112580480A (zh) 一种高光谱遥感影像分类方法及装置
CN112507853A (zh) 一种基于互注意力机制的跨模态行人重识别方法
CN112132279A (zh) 卷积神经网络模型压缩方法、装置、设备及存储介质
CN116052218B (zh) 一种行人重识别方法
CN111125397A (zh) 一种基于卷积神经网络的布料图像检索方法
CN112633417A (zh) 一种用于行人重识别的将神经网络模块化的行人深度特征融合方法
US20230072445A1 (en) Self-supervised video representation learning by exploring spatiotemporal continuity
CN106845555A (zh) 基于Bayer格式的图像匹配方法及图像匹配装置
CN113469238A (zh) 一种基于crnn解决拼图任务的自监督学习方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant