CN108052981A - 基于非下采样Contourlet变换和卷积神经网络的图像分类方法 - Google Patents
基于非下采样Contourlet变换和卷积神经网络的图像分类方法 Download PDFInfo
- Publication number
- CN108052981A CN108052981A CN201711404570.7A CN201711404570A CN108052981A CN 108052981 A CN108052981 A CN 108052981A CN 201711404570 A CN201711404570 A CN 201711404570A CN 108052981 A CN108052981 A CN 108052981A
- Authority
- CN
- China
- Prior art keywords
- neural networks
- convolutional neural
- image
- pond
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Abstract
本发明公开了一种基于非下采样Contourlet变换的卷积神经网络图像分类方法。首先利用非下采样Contourlet变换进行RGB三通道图像的特征统计,捕捉到图像在变换域上较好的不变性和区分性描述;然后在此基础上构建卷积神经网络的深度学习方法,从而达到RGB图像分类的目的。本发明分别通过非下采样Contourlet变换和卷积神经网络进行已知和未知特征的学习,不仅避免了大量参数的学习,还可以简化后续的网络模型。
Description
技术领域
本发明涉及图像分类领域,具体地说是一种基于非下采样Contourlet变换和卷积神经网络的图像分类方法。
背景技术
图像分类是根据图像目标或者场景,在图像反映出来的不同特征对图像进行识别和分类,其目的是使得计算机能识别已知一副图像的所属分类,从而进一步对图像进行理解。基于卷积神经网络的图像分类技术由于其较高的识别效果,受到研究者的高度重视。
卷积神经网络的主要目标是学习分级的图像特征,所谓分级,指的是特征从底层的像素输入到高层的复杂函数映射。通常情况下,为了得到充分的分级特征,需要通过增加隐层数和神经元个数来增加卷积神经网络模型的学习能力,这就导致神经网络要学习的参数非常多,较多的参数会导致整个网络的训练时间变得很长,严重影响参数的调节。另外,过多的训练样本亦会导致模型的过拟合现象。因此,在进行网络学习前,如何提取图像特征是制约和提高分类系统性能的关键点。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种基于非下采样Contourlet变换和卷积神经网络的图像分类方法。
本发明的技术解决方案是:一种基于非下采样Contourlet变换和卷积神经网络的图像分类方法,其特征在于按照如下步骤进行:
步骤1:将自然图像分解为RGB三种不同的通道,分别对每个通道中的图像进行非下采样Contourlet变换:
(1)
其中,表示近似的RGB通道图像;为每个通道的Contourlet系数;为对应的变换矩阵;和分别为Contourlet变换的分解层数和方向子带的个数。
步骤2:利用类似于卷积神经网络中均值-最大池化方法计算基于非下采样Contourlet变换中每个系数的特征描述子,其中均值池化过程如下:
(2)
其中,表示某个RGB通道;为每个RGB通道中待池化区域的索引项;和分别表示源图像和池化区域的大小;采用最大池化方法对上述系数进行处理:
(3)
得到最终的特征描述子,形成卷积神经网络中待输入的维映射图。
步骤3:利用卷积神经网络对上述特征描述子进行学习,其中每一层的具体描述如下:
步骤3.1:卷积层:采用大小为、步长为、特征图为的卷积核,对应的输出结果为:
(4)
其中,为多维的滤波器组,对应的核权值和偏差分别为和;
步骤3.2:池化层:采用均值-最大池化相混合的方法对上述卷积结果进行下采样:
(5)
(6)
步骤3.3:正则化:进一步地,采用如下修正线性单元激活函和局部响应正则化以增加网络模型的非线性:
(7)
(8)
本专利设置、;
步骤3.4:全连接层:将学到的特征映射到样本标记空间,即将前层的结果转化为卷积核为的卷积。
步骤3.5:分类层:利用softmax激活函数进行预测,将图像分为4或者5类。
本发明利用非下采样Contourlet变换对RGB图像进行处理,首先捕捉到图像的平移或旋转等刚性变换,获得RGB图像的变换域特征描述;然后在此基础上构建卷积神经网络的分类模型,对RGB图像进行分类。本发明不仅可以避免大量参数的学习过程,还可以简化后续网络参数的学习。
与现有技术相比,本发明具有以下优点:
第一.结合了RGB通道的非下采样Contourlet变换,由于Contourlet变换的紧凑表达能力,所提模型的分类性能得到提升,同时也大幅度的降低了模型的训练时间。考虑到Contourlet变换的不变和稳定能力,可以消除图像中的平移或者旋转变化,从而简化卷积神经网络的学习。第二.为了获取自然图像中较复杂的未知信息,在变换系数之上构建深度学习网络,可以实现从复杂图像中学习捕捉Contourlet变换无法描述的其它复杂信息。
附图说明
图1 为本发明实施例进行图像分类的结构信息示意图。
图2 为本发明实施例在试验过程中所使用的图像数据库。
图3为本发明实施例在进行FOOD-101数据库试验中的卷积层结果。
图4为本发明实施例在进行FOOD-101和SUN数据库中的Box plot分类结果示意图。
图5为本发明实施例在进行FOOD-101和SUN数据库中的运行时间统计结果示意图。
图6为本发明实施例在进行FOOD-101和SUN数据库中不同的图像数量对分类准确率的统计结果示意图。
具体实施方式
本发明的基于非下采样Contourlet变换和卷积神经网络的图像分类方法,按照如下步骤进行;
步骤1:将自然图像分解为RGB三种不同的通道,分别对每个通道中的图像进行非下采样Contourlet变换:
(1)
其中,表示近似的RGB通道图像;为每个通道的Contourlet系数;为对应的变换矩阵;和分别为Contourlet变换的分解层数和方向子带的个数。
步骤2:利用类似于卷积神经网络中均值-最大池化方法计算基于非下采样Contourlet变换中每个系数的特征描述子,其中均值池化过程如下:
(2)
其中,表示某个RGB通道;为每个RGB通道中待池化区域的索引项;和分别表示源图像和池化区域的大小;采用最大池化方法对上述系数进行处理:
(3)
得到最终的特征描述子,形成卷积神经网络中待输入的维映射图
。
步骤3:利用卷积神经网络对上述特征描述子进行学习,其中每一层的具体描述如下:
步骤3.1:卷积层:采用大小为、步长为、特征图为的卷积核,这也是卷积层中最重要的设计环节,对应的输出结果为:
(4)
其中,为多维的滤波器组,对应的核权值和偏差分别为和;
步骤3.2:池化层:采用均值-最大池化相混合的方法对上述卷积结果进行下采样:
(5)
(6)
步骤3.3:正则化:进一步地,采用如下修正线性单元激活函和局部响应正则化以增加网络模型的非线性:
(7)
(8)
本专利设置、;
步骤3.4:全连接层:将学到的特征映射到样本标记空间,即将前层的结果转化为卷积核为的卷积。
步骤3.5:分类层:利用softmax激活函数进行预测,将图像分为4或者5类。
图1 为本发明实施例进行图像分类的结构信息示意图。
图2 为本发明实施例在试验过程中所使用的图像数据库,(a)是SUN数据库,(b)是FOOD-101数据库。
图3为本发明实施例在进行FOOD-101数据库试验中的卷积层结果,图3
中(a) 原测试图像的卷积层,(b) 基于Contourlet变换后图像的卷积层。
图4为本发明实施例在进行FOOD-101和SUN数据库中的Box plot分类结果示意图,图4中(a) 不同尺度,(b) 不同分解层。
图5为本发明实施例在进行FOOD-101和SUN数据库中的运行时间统计结果示意图,图5中(a)不同分解尺度下的运行时间,(b) 不同方法的运行时间。
图6为本发明实施例在进行FOOD-101和SUN数据库中不同的图像数量对分类准确率的统计结果示意图。
结果表明:本发明不仅可以避免大量参数的学习过程,还可以简化后续网络参数的学习。
Claims (1)
1.一种基于非下采样Contourlet变换和卷积神经网络的图像分类方法,其特征在于按照如下步骤进行:
步骤1:将自然图像分解为RGB三种不同的通道,分别对每个通道中的图像进行非下采样Contourlet变换:
(1)
其中,表示近似的RGB通道图像;为每个通道的Contourlet系数;为对应的变换矩阵;和分别为Contourlet变换的分解层数和方向子带的个数;
步骤2:利用类似于卷积神经网络中均值-最大池化方法计算基于非下采样Contourlet变换中每个系数的特征描述子,其中均值池化过程如下:
(2)
其中,表示某个RGB通道;为每个RGB通道中待池化区域的索引项;和分别表示源图像和池化区域的大小;采用最大池化方法对上述系数进行处理:
(3)
得到最终的特征描述子,形成卷积神经网络中待输入的维映射图
;
步骤3:利用卷积神经网络对上述特征描述子进行学习,其中每一层的具体描述如下:
步骤3.1:卷积层:采用大小为、步长为、特征图为的卷积核,对应的输出结果为:
(4)
其中,为多维的滤波器组,对应的核权值和偏差分别为和;
步骤3.2:池化层:采用均值-最大池化相混合的方法对上述卷积结果进行下采样:
(5)
(6)
步骤3.3:正则化:进一步地,采用如下修正线性单元激活函和局部响应正则化以增加网络模型的非线性:
(7)
(8)
本专利设置、;
步骤3.4:全连接层:将学到的特征映射到样本标记空间,即将前层的结果转化为卷积核为的卷积;
步骤3.5:分类层:利用softmax激活函数进行预测,将图像分为4或者5类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711404570.7A CN108052981B (zh) | 2017-12-22 | 2017-12-22 | 基于非下采样Contourlet变换和卷积神经网络的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711404570.7A CN108052981B (zh) | 2017-12-22 | 2017-12-22 | 基于非下采样Contourlet变换和卷积神经网络的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108052981A true CN108052981A (zh) | 2018-05-18 |
CN108052981B CN108052981B (zh) | 2021-08-17 |
Family
ID=62130332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711404570.7A Expired - Fee Related CN108052981B (zh) | 2017-12-22 | 2017-12-22 | 基于非下采样Contourlet变换和卷积神经网络的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108052981B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109344898A (zh) * | 2018-09-30 | 2019-02-15 | 北京工业大学 | 基于稀疏编码预训练的卷积神经网络图像分类方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101866479A (zh) * | 2010-05-07 | 2010-10-20 | 浙江大学 | 基于非下采样Contourlet变换的边缘自适应图像放大方法 |
CN104680473A (zh) * | 2014-12-20 | 2015-06-03 | 辽宁师范大学 | 基于机器学习的彩色图像水印嵌入及检测方法 |
CN104899280A (zh) * | 2015-05-29 | 2015-09-09 | 山西大学 | 基于彩色直方图和nsct的模糊相关异步图像检索方法 |
-
2017
- 2017-12-22 CN CN201711404570.7A patent/CN108052981B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101866479A (zh) * | 2010-05-07 | 2010-10-20 | 浙江大学 | 基于非下采样Contourlet变换的边缘自适应图像放大方法 |
CN104680473A (zh) * | 2014-12-20 | 2015-06-03 | 辽宁师范大学 | 基于机器学习的彩色图像水印嵌入及检测方法 |
CN104899280A (zh) * | 2015-05-29 | 2015-09-09 | 山西大学 | 基于彩色直方图和nsct的模糊相关异步图像检索方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109344898A (zh) * | 2018-09-30 | 2019-02-15 | 北京工业大学 | 基于稀疏编码预训练的卷积神经网络图像分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108052981B (zh) | 2021-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108537731B (zh) | 基于压缩多尺度特征融合网络的图像超分辨率重建方法 | |
WO2022160771A1 (zh) | 基于自适应多尺度特征提取模型的高光谱图像分类方法 | |
CN104517122A (zh) | 一种基于优化卷积架构的图像目标识别方法 | |
CN107180248A (zh) | 基于联合损失增强网络的高光谱图像分类方法 | |
CN113239954B (zh) | 基于注意力机制的图像语义分割特征融合方法 | |
CN107798381A (zh) | 一种基于卷积神经网络的图像识别方法 | |
CN109064396A (zh) | 一种基于深度成分学习网络的单幅图像超分辨率重建方法 | |
CN107680077A (zh) | 一种基于多阶梯度特征的无参考图像质量评价方法 | |
CN106971160A (zh) | 基于深度卷积神经网络和病害图像的冬枣病害识别方法 | |
CN110399821B (zh) | 基于人脸表情识别的顾客满意度获取方法 | |
CN106682569A (zh) | 一种基于卷积神经网络的快速交通标识牌识别方法 | |
CN111160533A (zh) | 一种基于跨分辨率知识蒸馏的神经网络加速方法 | |
CN109416758A (zh) | 神经网络及神经网络训练的方法 | |
CN109241995B (zh) | 一种基于改进型ArcFace损失函数的图像识别方法 | |
CN108446766A (zh) | 一种快速训练堆栈自编码深度神经网络的方法 | |
CN107516128A (zh) | 一种基于ReLU激活函数的卷积神经网络的花卉识别方法 | |
CN108764298A (zh) | 基于单分类器的电力图像环境影响识别方法 | |
CN107516304A (zh) | 一种图像去噪方法及装置 | |
CN109711461A (zh) | 基于主成分分析的迁移学习图片分类方法及其装置 | |
CN107909112A (zh) | 一种红外光强与偏振图像多类变元组合的融合方法 | |
CN106997463A (zh) | 一种基于压缩感知域和卷积神经网络的路牌识别方法 | |
CN113920043A (zh) | 基于残差通道注意力机制的双流遥感图像融合方法 | |
CN110414578A (zh) | 一种基于动态多批次训练和色域转化的迁移学习方法 | |
CN114898359B (zh) | 一种基于改进EfficientDet的荔枝病虫害检测方法 | |
CN107545281A (zh) | 一种基于深度学习的单一有害气体红外图像分类识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210817 Termination date: 20211222 |
|
CF01 | Termination of patent right due to non-payment of annual fee |