CN107748895A - 基于dct‑cnn模型的无人机着陆地貌图像分类方法 - Google Patents

基于dct‑cnn模型的无人机着陆地貌图像分类方法 Download PDF

Info

Publication number
CN107748895A
CN107748895A CN201711028874.8A CN201711028874A CN107748895A CN 107748895 A CN107748895 A CN 107748895A CN 201711028874 A CN201711028874 A CN 201711028874A CN 107748895 A CN107748895 A CN 107748895A
Authority
CN
China
Prior art keywords
mrow
dct
layer
image
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711028874.8A
Other languages
English (en)
Other versions
CN107748895B (zh
Inventor
刘芳
路丽霞
黄光伟
王洪娟
王鑫
吴志威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201711028874.8A priority Critical patent/CN107748895B/zh
Publication of CN107748895A publication Critical patent/CN107748895A/zh
Application granted granted Critical
Publication of CN107748895B publication Critical patent/CN107748895B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本发明公开了基于DCT‑CNN模型的无人机着陆地貌图像分类方法,包括以下步骤:获取无人机着陆地貌图像的训练图像集和测试图像集;对无人机着陆地貌图像DCT变换,并进行DCT系数的筛选;针对无人机着陆地貌图像场景复杂、信息丰富的特点构建DCT‑CNN网络模型;将训练集的DCT系数输入到改进的DCT‑CNN模型中训练,并对网络进行参数更新,直到损失函数收敛于一个较小的值,训练结束;将训练图像特征集作为训练样本对SVM分类器进行训练;输入测试集,利用训练好的模型对测试图像进行逐层学习,最后将得到的特征向量输入到训练好的SVM分类器中进行分类,得到分类结果。本发明降低了数据冗余,使得训练时间大幅度减少,有效的提高了无人机着陆地貌图像的分类准确率。

Description

基于DCT-CNN模型的无人机着陆地貌图像分类方法
技术领域
本发明涉及一种无人机着陆地貌图像分类方法,属于模式识别与智能计算、图像处理技术领域,特别涉及一种基于DCT-CNN模型的无人机着陆地貌图像分类方法。
背景技术
随着技术的进步,无人机(unmanned aerial vehicle,UAV)被广泛的应用到军事侦察、目标攻击、地质勘探、自然灾害监测、交通监控等领域。无人机飞行环境复杂多样,因此快速有效的着陆地貌自动识别成了无人机实现自主导航和探索环境的先决条件,能为飞行任务提供安全保障。目前无人机图像分类大多是针对自然场景的,很少有针对场景复杂、信息丰富的无人机着陆地貌图像分类的算法,并且传统的图像分类方法分类率较低。通过视觉技术实现无人机着陆地貌的自动识别和分类,降低了无人机对外界信息的依赖性,能提高无人机着陆的自主性。
近年来,深度学习思想的提出,为机器学习的带来了新的研究领域。卷积神经网络(Convolution neural network,CNN)是通过卷积运算由浅层到深层的提取图像不同层次的特征,从低层的模糊、简单的特征到高层逐渐抽象、准确的特征,提取得到高级语义特征,与传统图像分类方法相比在图像分类方面具有较高的准确率。
现有的方法存在的不足:一方面:无人机在未知区域着陆时,地貌上的障碍物与周围环境差异一般不明显,地貌图像大多具有场景复杂、信息丰富的特点,因此需要多层的CNN模型对图像进行逐层特征学习以及较准确的高层语义特征来表达;另一方面:CNN模型层数较多、结构复杂,在CNN模型训练时,将较大维数的图像直接输入会使训练模型的时间大幅度增加,训练参数增加导致调参困难,训练时间过长还会导致深层的特征不容易被学习,丢失大部分深层特征信息。
发明内容
本发明的目的旨在解决上述技术缺陷,提高无人机着陆地貌图像的分类准确率。
为达到上述目的,本发明采用的技术方案为基于DCT-CNN模型的无人机着陆地貌图像分类方法,该方法包括以下步骤:
S1:获取无人机着陆地貌图像,图像分为训练图像集和测试图像集;
S2:对无人机着陆地貌图像DCT变换,并进行DCT系数的筛选,具体如下:
S2.1:首先对无人机着陆地貌图像进行8×8分块,对无人机着陆地貌进行分块后形成子块,对每个子块分别进行DCT变换;
S2.2:DCT变换后得到8×8的系数矩阵,对DCT系数进行选择,按照ZigZag扫描的方式保留矩阵左上角的10个低频系数;
S2.3:对剩余的54个系数采用系数判别法进行系数选择。提出的系数判别法是:首先求每一个子块的平均值,并设定平均值为每块的系数阈值,然后对每个子块中剩余的54个系数进行选择,如果系数小于设定的阈值则该系数置0,大于阈值则保留该系数;
S2.4:把每幅图像筛选的DCT系数进行整合得到DCT系数矩阵;
S3:针对无人机着陆地貌图像场景复杂、信息丰富的特点构建了一个14层用于无人机着陆地貌图像分类的DCT-CNN网络结构,包括一个输入层、五个卷积层、三个池化层,四个ReLU层和一个输出层,具体如下:
S3.1:DCT-CNN模型中的五层卷积层为5-6-9-4-1结构,卷积核大小分别为:第一层卷积层是5×5,第二层是6×6,第三层是9×9,第四层是4×4;
S3.2:DCT-CNN模型中的池化层采用了平均池化和最大值池化两种方法,总共有三层池化层,第一个池化层采用平均池化,后两层池化采用最大值池化;
S3.3:DCT-CNN模型中增加了zero padding,表示对特征图进行0填充操作,当pad=1时,将每张输入特征图向四周扩展1格用0填充,填充后相当于长、宽各加2,之后再进行卷积、池化过程。
S3.4:在该网络结构中,每一层卷积层后面接着一层激活函数层,是为了给网络加入非线性的因素,使得卷积神经网络可以更好地解决较为复杂的问题,该卷积神经网络中采用的是ReLU激活函数,其公式为:
f(x)=max(0,x)
x为ReLU激活函数自变量。
S4:将训练集的DCT系数输入到改进的DCT-CNN模型中训练,并对网络进行参数更新,直到损失函数收敛于一个较小的值,训练结束。
S5:将训练图像特征集作为训练样本对SVM分类器进行训练;
S6:输入测试集,利用训练好的模型对测试图像进行逐层学习,最后将得到的一维特征向量输入到训练好的SVM分类器中进行分类,得到分类结果。
有益效果
根据本发明实施例的基于DCT-CNN模型的无人机着陆地貌图像分类方法,针对无人机着陆地貌图像场景复杂、信息丰富的特点构建了DCT-CNN模型,将基于DCT的能量集中的特点引入到基于CNN的特征学习中,结合两者优点。DCT具有能量集中的特点,且计算简单,耗时较少,图像经过DCT后,少量的低频信息包含了图像的大部分信息,将一幅图像的一小部分DCT系数代表图像输入到深度网络中去学习,去除了冗余信息,可以大大缩短网络的训练时间。根据DCT能量集中的特点提出了系数判别法,在不损失原始输入信息的前提下降低输入数据的冗余信息,保留最能表达图像信息、能量集中的DCT系数。
由于CNN模型层数较多、结构复杂,将较大维数的图像直接输入CNN模型中进行训练,会使模型的训练时间较长,训练参数增加导致调参困难,训练时间过长还会导致深层的特征不容易被学习,丢失大部分深层特征信息。在不损失输入数据信息的前提下,降低输入数据的冗余信息,可以减少参数的数量以及缩短网络的训练时间。
图像经过DCT后少量的低频系数中聚集了图像大部分视觉信息,因此,根据无人机着陆地貌图像的特点将DCT和CNN的优点结合构建了DCT-CNN模型。将DCT作为深度网络结构的第一层,图像经过DCT变换后得到和原图像相同维度的DCT系数,为了降低输入数据的信息冗余,选择少量的DCT系数输入到深度网络中进行网络训练。为了提高场景复杂、内容丰富的无人机地貌图像的分类准确率,对传统CNN结构根据DCT系数的特点以及无人机着陆地貌图像的特点进行改进,然后将得到的系数输入到改进的CNN模型中,通过特征学习得到图像的深层次的特征表达,最后将特征学习得到的深层特征输入到SVM分类器中完成图像分类,提高了无人机着陆地貌图像的分类准确率。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例的基于DCT-CNN模型的无人机着陆地貌图像分类方法的流程图;以及
图2为本发明一个实施例的原图像DCT系数频谱图;以及
图3位本发明一个实施例的图像经过系数选择后的频谱图;以及
图4为本发明一个实施例构建的DCT-CNN模型结构图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
如图1所示,根据本发明基于DCT-CNN模型的无人机着陆地貌图像分类方法,包括以下几个步骤:
步骤S1:获取无人机着陆地貌的训练图像集和测试图像集;
步骤S2:对无人机着陆地貌图像DCT变换,并进行DCT系数的筛选;
一幅图像经过DCT变换,图像的大部分能量聚集在低频DCT系数中,所以低频系数比高频系数更重要,但是完全把高频系数丢弃就会损失太多的图像细节信息。本方法采用保留左上角10个低频系数以及具有较高能量信息的中高频系数,提出了系数判别法对中高频系数进行选择。具体分为以下4个步骤:
S2.1:首先对图像进行8×8分块,对每个子块分别进行DCT变换;
S2.2:DCT变换后得到8×8的系数矩阵,对DCT系数进行选择,按照ZigZag扫描的方式保留矩阵左上角的10个低频系数;
S2.3:对剩余的54个系数采用系数判别法进行系数选择。提出的系数判别法是:首先求每一个子块的平均值,并设定平均值为每块的系数阈值,然后对每个子块中剩余的54个系数进行选择,如果系数小于设定的阈值则该系数置0,大于阈值则保留该系数;
S2.4:把每幅图像筛选的DCT系数进行整合得到DCT系数矩阵;
步骤S3:针对无人机着陆地貌图像场景复杂、信息丰富的特点构建了一个14层用于无人机着陆地貌图像分类的DCT-CNN网络结构,包括一个输入层、五个卷积层、三个池化层,四个ReLU层和一个输出层;
由于CNN模型层数较多、结构复杂,将较大维数的图像直接输入CNN模型中进行训练,会使模型的训练时间较长,导致深层的特征不容易被学习,丢失大部分深层特征信息。本方法根据无人机着陆地貌图像的特点将DCT和CNN的优点结合构建了DCT-CNN模型。将DCT作为深度网络结构的第一层,图像经过DCT变换后得到和原图像相同维度的DCT系数,为了降低输入数据的信息冗余,选择少量的DCT系数输入到深度网络中进行网络训练。具体分为以下4个步骤:
S3.1:DCT-CNN模型中的五层卷积层为5-6-9-4-1结构,具体如下:
第一层卷积层的大小是5×5,卷积核尺寸不是很大,能有效的减少了参数的数目。第二层是6×6,如果卷积核尺寸越大,特征提取的效果越好,但是运算量会加大,因此将第二层卷积核大小设为6×6,既能提取到深层特征表达,又能保证运算量不会大幅度增加。第三层是9×9,虽然该层卷积核尺寸较大会增加网络运算量,但是该层提取的特征效果较好,得到的特征比较完整、准确。第四层是4×4,控制参数数目,降低网络运算的复杂度。最后一层是1×1,相当于一层全连接层,输出一维特征向量。
CNN通过卷积操作对图像进行逐层的特征提取,并且利用权值共享的思想在卷积操作时大大减少了网络的训练参数,降低了网络的复杂度。卷积过程就是用一个可学习的卷积核或滤波器去卷积一个输入的图像,加上偏置然后通过激活函数,得到卷积特征图。公式表示为:
其中,为第l层第j个特征图的输入,为第l-1层第i个特征图的输出,为前一层第i个特征图与当前层第j个特征图之间的卷积核,为第l层第j个特征图的偏置,i∈Mj为前一层中与当前层第j个特征图连接的所有特征图,f(*)表示激活函数。
S3.2:DCT-CNN模型中的池化层采用了平均池化和最大值池化两种方法,具体如下:
本方法中构建的网络总共有三层池化层,第一个池化层采用平均池化,平均池化就是计算图像区域的平均值作为该区域池化后的值,因为往往能保留整体数据的特征,能凸出背景的信息。后两层池化采用最大值池化,最大值池化是选图像区域的最大值作为该区域池化后的值,抛弃其他特征,最大值池化能更好保留纹理上的特征,取最大值是为了提取最重要最突出的特征,舍弃其他弱的某类特征;
卷积后的特征图个数增加,根据图像的局部相关性原理通过池化层对卷积后得到的特征提取图进行下采样,降低了图像的维度,避免了维数灾难。公式表示为:
其中,为第l层第j个特征图的输入,f(*)表示激活函数,是乘性偏置,down(*)是下采样函数。
S3.3:DCT-CNN模型中增加了zero padding,表示对特征图进行0填充操作,当pad=1时,将每张输入特征图向四周扩展1格用0填充,填充后相当于长、宽各加2,之后再进行卷积、池化过程。
S3.4:在该网络结构中,每一层卷积层后面接着一层激活函数层,是为了给网络加入非线性的因素,使得卷积神经网络可以更好地解决较为复杂的问题,该网络中采用的是ReLU激活函数,其公式为:
f(x)=max(0,x)
将采集到的无人机着陆地貌图像大小统一缩放到128×128像素大小,构建的DCT-CNN网络结构参数。
表1DCT-CNN网络结构的各层参数
步骤S4:将训练集的DCT系数输入到改进的DCT-CNN模型中训练,并对网络进行参数更新,直到损失函数收敛于一个较小的值,训练结束。具体如下:
网络训练主要分为两个阶段,第一个阶段是前向传播阶段:
S4.1:将训练样本集的DCT系数输入到CNN网络中;
S4.2:通过网络的逐层学习,计算最终得到的输出值;
第二阶段是后向传播阶段:
S4.3:计算实际的输出值,得到实际的输出值和理想的输出值的差;
S4.4:使用梯度下降法对网络参数进行更新,直到损失函数收敛于一个较小的值,训练结束,参数更新规则如下:
其中,α为学习率,分别是卷积神经网络的损失函数J(W,b)对权重参数W和b的偏导数。
步骤S5:将训练图像特征集作为训练样本对SVM分类器进行训练;
步骤S6:输入测试集,利用训练好的模型对测试图像进行逐层学习,最后将得到的一维特征向量输入到训练好的SVM分类器中进行分类,得到分类结果。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改替换和变形,本发明的范围有所附权利要求及其等同限定。

Claims (2)

1.基于DCT-CNN模型的无人机着陆地貌图像分类方法,其特征在于,该方法包括以下步骤,
S1:获取无人机着陆地貌图像,图像分为训练图像集和测试图像集;
S2:对无人机着陆地貌图像DCT变换,并进行DCT系数的筛选,具体如下:
S2.1:首先对无人机着陆地貌图像进行8×8分块,对无人机着陆地貌进行分块后形成子块,对每个子块分别进行DCT变换;
S2.2:DCT变换后得到8×8的系数矩阵,对DCT系数进行选择,按照ZigZag扫描的方式保留矩阵左上角的10个低频系数;
S2.3:对剩余的54个系数采用系数判别法进行系数选择;提出的系数判别法是:首先求每一个子块的平均值,并设定平均值为每块的系数阈值,然后对每个子块中剩余的54个系数进行选择,如果系数小于设定的阈值则该系数置0,大于阈值则保留该系数;
S2.4:把每幅图像筛选的DCT系数进行整合得到DCT系数矩阵;
S3:针对无人机着陆地貌图像场景复杂、信息丰富的特点构建了一个14层用于无人机着陆地貌图像分类的DCT-CNN网络结构,包括一个输入层、五个卷积层、三个池化层,四个ReLU层和一个输出层,具体如下:
S3.1:DCT-CNN模型中的五层卷积层为5-6-9-4-1结构,卷积核大小分别为:第一层卷积层是5×5,第二层是6×6,第三层是9×9,第四层是4×4;
S3.2:DCT-CNN模型中的池化层采用了平均池化和最大值池化两种方法,总共有三层池化层,第一个池化层采用平均池化,后两层池化采用最大值池化;
S3.3:DCT-CNN模型中增加了zero padding,表示对特征图进行0填充操作,当pad=1时,将每张输入特征图向四周扩展1格用0填充,填充后相当于长、宽各加2,之后再进行卷积、池化过程;
S3.4:在该网络结构中,每一层卷积层后面接着一层激活函数层,是为了给网络加入非线性的因素,使得卷积神经网络可以更好地解决较为复杂的问题,该卷积神经网络中采用的是ReLU激活函数,其公式为:
f(x)=max(0,x)
x为ReLU激活函数自变量;
S4:将训练集的DCT系数输入到改进的DCT-CNN模型中训练,并对网络进行参数更新,直到损失函数收敛于一个较小的值,训练结束;
S5:将训练图像特征集作为训练样本对SVM分类器进行训练;
S6:输入测试集,利用训练好的模型对测试图像进行逐层学习,最后将得到的一维特征向量输入到训练好的SVM分类器中进行分类,得到分类结果。
2.根据权利要求1所述的基于DCT-CNN模型的无人机着陆地貌图像分类方法,其特征在于,包括以下几个步骤:
步骤S1:获取无人机着陆地貌图像,图像分为训练图像集和测试图像集;
步骤S2:对无人机着陆地貌图像DCT变换,并进行DCT系数的筛选;
一幅图像经过DCT变换,图像的大部分能量聚集在低频DCT系数中,所以低频系数比高频系数更重要,但是完全把高频系数丢弃就会损失太多的图像细节信息;本方法采用保留左上角10个低频系数以及具有较高能量信息的中高频系数,提出了系数判别法对中高频系数进行选择;具体分为以下4个步骤:
S2.1:首先对图像进行8×8分块,对每个子块分别进行DCT变换;
S2.2:DCT变换后得到8×8的系数矩阵,对DCT系数进行选择,按照ZigZag扫描的方式保留矩阵左上角的10个低频系数;
S2.3:对剩余的54个系数采用系数判别法进行系数选择;提出的系数判别法是:首先求每一个子块的平均值,并设定平均值为每块的系数阈值,然后对每个子块中剩余的54个系数进行选择,如果系数小于设定的阈值则该系数置0,大于阈值则保留该系数;
S2.4:把每幅图像筛选的DCT系数进行整合得到DCT系数矩阵;
步骤S3:针对无人机着陆地貌图像场景复杂、信息丰富的特点构建了一个14层用于无人机着陆地貌图像分类的DCT-CNN网络结构,包括一个输入层、五个卷积层、三个池化层,四个ReLU层和一个输出层;
由于CNN模型层数较多、结构复杂,将较大维数的图像直接输入CNN模型中进行训练,会使模型的训练时间较长,导致深层的特征不容易被学习,丢失大部分深层特征信息;本方法根据无人机着陆地貌图像的特点将DCT和CNN的优点结合构建了DCT-CNN模型;将DCT作为深度网络结构的第一层,图像经过DCT变换后得到和原图像相同维度的DCT系数,为了降低输入数据的信息冗余,选择少量的DCT系数输入到深度网络中进行网络训练;具体分为以下4个步骤:
S3.1:DCT-CNN模型中的五层卷积层为5-6-9-4-1结构,具体如下:
第一层卷积层的大小是5×5,卷积核尺寸不是很大,能有效的减少了参数的数目;第二层是6×6,如果卷积核尺寸越大,特征提取的效果越好,但是运算量会加大,因此将第二层卷积核大小设为6×6,既能提取到深层特征表达,又能保证运算量不会大幅度增加;第三层是9×9,虽然该层卷积核尺寸较大会增加网络运算量,但是该层提取的特征效果较好,得到的特征比较完整、准确;第四层是4×4,控制参数数目,降低网络运算的复杂度;最后一层是1×1,相当于一层全连接层,输出一维特征向量;
CNN通过卷积操作对图像进行逐层的特征提取,并且利用权值共享的思想在卷积操作时大大减少了网络的训练参数,降低了网络的复杂度;卷积过程就是用一个可学习的卷积核或滤波器去卷积一个输入的图像,加上偏置然后通过激活函数,得到卷积特征图;公式表示为:
<mrow> <msubsup> <mi>x</mi> <mi>j</mi> <mi>l</mi> </msubsup> <mo>=</mo> <mi>f</mi> <mo>(</mo> <mrow> <munder> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>&amp;Element;</mo> <msub> <mi>M</mi> <mi>j</mi> </msub> </mrow> </munder> <msubsup> <mi>y</mi> <mi>i</mi> <mrow> <mi>l</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>&amp;CircleTimes;</mo> <msubsup> <mi>k</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>l</mi> </msubsup> <mo>+</mo> <msubsup> <mi>b</mi> <mi>j</mi> <mi>l</mi> </msubsup> </mrow> <mo>)</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>
其中,为第l层第j个特征图的输入,为第l-1层第i个特征图的输出,为前一层第i个特征图与当前层第j个特征图之间的卷积核,为第l层第j个特征图的偏置,i∈Mj为前一层中与当前层第j个特征图连接的所有特征图,f(*)表示激活函数;
S3.2:DCT-CNN模型中的池化层采用了平均池化和最大值池化两种方法,具体如下:
本方法中构建的网络总共有三层池化层,第一个池化层采用平均池化,平均池化就是计算图像区域的平均值作为该区域池化后的值,因为往往能保留整体数据的特征,能凸出背景的信息;后两层池化采用最大值池化,最大值池化是选图像区域的最大值作为该区域池化后的值,抛弃其他特征,最大值池化能更好保留纹理上的特征,取最大值是为了提取最重要最突出的特征,舍弃其他弱的某类特征;
卷积后的特征图个数增加,根据图像的局部相关性原理通过池化层对卷积后得到的特征提取图进行下采样,降低了图像的维度,避免了维数灾难;公式表示为:
<mrow> <msubsup> <mi>x</mi> <mi>j</mi> <mi>l</mi> </msubsup> <mo>=</mo> <mi>f</mi> <mrow> <mo>(</mo> <msubsup> <mi>&amp;beta;</mi> <mi>j</mi> <mi>l</mi> </msubsup> <mi>d</mi> <mi>o</mi> <mi>w</mi> <mi>n</mi> <mo>(</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mrow> <mi>l</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> <mo>+</mo> <msubsup> <mi>b</mi> <mi>j</mi> <mi>l</mi> </msubsup> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>
其中,为第l层第j个特征图的输入,f(*)表示激活函数,是乘性偏置,down(*)是下采样函数;
S3.3:DCT-CNN模型中增加了zero padding,表示对特征图进行0填充操作,当pad=1时,将每张输入特征图向四周扩展1格用0填充,填充后相当于长、宽各加2,之后再进行卷积、池化过程;
S3.4:在该网络结构中,每一层卷积层后面接着一层激活函数层,是为了给网络加入非线性的因素,使得卷积神经网络可以更好地解决较为复杂的问题,该网络中采用的是ReLU激活函数,其公式为:
f(x)=max(0,x)
将采集到的无人机着陆地貌图像大小统一缩放到128×128像素大小,构建的DCT-CNN网络结构参数;
表1 DCT-CNN网络结构的各层参数
步骤S4:将训练集的DCT系数输入到改进的DCT-CNN模型中训练,并对网络进行参数更新,直到损失函数收敛于一个较小的值,训练结束;具体如下:
网络训练主要分为两个阶段,第一个阶段是前向传播阶段:
S4.1:将训练样本集的DCT系数输入到CNN网络中;
S4.2:通过网络的逐层学习,计算最终得到的输出值;
第二阶段是后向传播阶段:
S4.3:计算实际的输出值,得到实际的输出值和理想的输出值的差;
S4.4:使用梯度下降法对网络参数进行更新,直到损失函数收敛于一个较小的值,训练结束,参数更新规则如下:
<mrow> <msubsup> <mi>W</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>=</mo> <msubsup> <mi>W</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>-</mo> <mi>&amp;alpha;</mi> <mfrac> <mo>&amp;part;</mo> <mrow> <mo>&amp;part;</mo> <msubsup> <mi>W</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> </mrow> </mfrac> <mi>J</mi> <mrow> <mo>(</mo> <mi>W</mi> <mo>,</mo> <mi>b</mi> <mo>)</mo> </mrow> </mrow>
<mrow> <msubsup> <mi>b</mi> <mi>i</mi> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>=</mo> <msubsup> <mi>b</mi> <mi>i</mi> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>-</mo> <mi>&amp;alpha;</mi> <mfrac> <mo>&amp;part;</mo> <mrow> <mo>&amp;part;</mo> <msubsup> <mi>b</mi> <mi>i</mi> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> </mrow> </mfrac> <mi>J</mi> <mrow> <mo>(</mo> <mi>W</mi> <mo>,</mo> <mi>b</mi> <mo>)</mo> </mrow> </mrow>
其中,α为学习率,分别是卷积神经网络的损失函数J(W,b)对权重参数W和b的偏导数;
步骤S5:将训练图像特征集作为训练样本对SVM分类器进行训练;
步骤S6:输入测试集,利用训练好的模型对测试图像进行逐层学习,最后将得到的一维特征向量输入到训练好的SVM分类器中进行分类,得到分类结果。
CN201711028874.8A 2017-10-29 2017-10-29 基于dct-cnn模型的无人机着陆地貌图像分类方法 Active CN107748895B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711028874.8A CN107748895B (zh) 2017-10-29 2017-10-29 基于dct-cnn模型的无人机着陆地貌图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711028874.8A CN107748895B (zh) 2017-10-29 2017-10-29 基于dct-cnn模型的无人机着陆地貌图像分类方法

Publications (2)

Publication Number Publication Date
CN107748895A true CN107748895A (zh) 2018-03-02
CN107748895B CN107748895B (zh) 2021-06-25

Family

ID=61253390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711028874.8A Active CN107748895B (zh) 2017-10-29 2017-10-29 基于dct-cnn模型的无人机着陆地貌图像分类方法

Country Status (1)

Country Link
CN (1) CN107748895B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108469358A (zh) * 2018-05-09 2018-08-31 东莞中国科学院云计算产业技术创新与育成中心 用于不同深度水体采样的无人机系统及其采样方法
CN108805866A (zh) * 2018-05-23 2018-11-13 兰州理工大学 基于四元数小波变换深度视感知的图像注视点检测方法
CN109215123A (zh) * 2018-09-20 2019-01-15 电子科技大学 基于cGAN的无限地形生成方法、系统、存储介质和终端
CN109542649A (zh) * 2018-11-23 2019-03-29 于兴虎 一种在视觉伺服系统下的跨语言快速共享图像内存的方法
CN109685126A (zh) * 2018-12-17 2019-04-26 北斗航天卫星应用科技集团有限公司 基于深度卷积神经网络的图像分类方法及图像分类系统
CN109858609A (zh) * 2018-12-27 2019-06-07 中国电子科技集团公司信息科学研究院 一种分区块池化的方法和系统
CN110543182A (zh) * 2019-09-11 2019-12-06 济宁学院 一种小型无人旋翼机自主着陆控制方法及系统
CN110598584A (zh) * 2019-08-26 2019-12-20 天津大学 一种基于小波变换和dct的卷积神经网络人脸识别算法
WO2020000171A1 (en) * 2018-06-26 2020-01-02 Nokia Technologies Oy Method and apparatus for computer vision
CN110766038A (zh) * 2019-09-02 2020-02-07 深圳中科保泰科技有限公司 无监督式的地貌分类模型训练和地貌图构建方法
CN112198891A (zh) * 2020-04-22 2021-01-08 北京理工大学 多旋翼机自主回收方法
CN112464756A (zh) * 2020-11-13 2021-03-09 上海电力大学 一种面向绝缘子缺陷识别的图像量化方法
CN112668449A (zh) * 2020-12-24 2021-04-16 杭州电子科技大学 一种室外自主移动机器人的低风险地貌识别方法
CN113645468A (zh) * 2021-08-19 2021-11-12 广东博华超高清创新中心有限公司 动态视觉传感器滤波加速控制方法、系统、设备及应用
CN113691818A (zh) * 2021-08-25 2021-11-23 深圳龙岗智能视听研究院 视频目标检测方法、系统、存储介质、计算机视觉终端
CN113810724A (zh) * 2021-09-29 2021-12-17 广东博华超高清创新中心有限公司 一种基于avs帧内压缩编码的视频目标分割方法
CN116385953A (zh) * 2023-01-11 2023-07-04 哈尔滨市科佳通用机电股份有限公司 铁路货车敞车车门折页折断故障图像识别方法
US11741702B2 (en) 2020-10-21 2023-08-29 Honeywell International Inc. Automatic safe-landing-site selection for unmanned aerial systems
CN116958752A (zh) * 2023-09-20 2023-10-27 国网湖北省电力有限公司经济技术研究院 一种基于ipkcnn-svm的电网基建建筑归档方法、装置及设备
WO2024052928A1 (en) * 2022-09-10 2024-03-14 Patil Dipti System for vision-based self-decisive planetary hazard free landing of a space vehicle

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7016885B1 (en) * 2001-08-28 2006-03-21 University Of Central Florida Research Foundation, Inc. Self-designing intelligent signal processing system capable of evolutional learning for classification/recognition of one and multidimensional signals
CN106446777A (zh) * 2016-08-29 2017-02-22 广东工业大学 基于卷积神经网络的无创血糖数据处理方法及系统
CN106529574A (zh) * 2016-10-17 2017-03-22 北京工业大学 基于稀疏自动编码器和支持向量机的图像分类方法
CN106557812A (zh) * 2016-11-21 2017-04-05 北京大学 基于dct变换的深度卷积神经网络压缩与加速方案
CN106845341A (zh) * 2016-12-15 2017-06-13 南京积图网络科技有限公司 一种基于虚拟号牌的无牌车辆识别方法
CN107016371A (zh) * 2017-04-09 2017-08-04 北京工业大学 基于改进的深度置信网络的无人机着陆地貌分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7016885B1 (en) * 2001-08-28 2006-03-21 University Of Central Florida Research Foundation, Inc. Self-designing intelligent signal processing system capable of evolutional learning for classification/recognition of one and multidimensional signals
CN106446777A (zh) * 2016-08-29 2017-02-22 广东工业大学 基于卷积神经网络的无创血糖数据处理方法及系统
CN106529574A (zh) * 2016-10-17 2017-03-22 北京工业大学 基于稀疏自动编码器和支持向量机的图像分类方法
CN106557812A (zh) * 2016-11-21 2017-04-05 北京大学 基于dct变换的深度卷积神经网络压缩与加速方案
CN106845341A (zh) * 2016-12-15 2017-06-13 南京积图网络科技有限公司 一种基于虚拟号牌的无牌车辆识别方法
CN107016371A (zh) * 2017-04-09 2017-08-04 北京工业大学 基于改进的深度置信网络的无人机着陆地貌分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
RONGFANG GAO ET AL.: "Rock Thin Section Image Classification Research from Shallow Network to Deep Neural Network", 《ICEMC 2016》 *
XIAOYI ZOU ET AL.: "HIGH SPEED DEEP NETWORKS BASED ON DISCRETE COSINE TRANSFORMATION", 《ICIP 2014》 *
孙继平 等: "基于离散余弦变换低频分量特征及学习向量量化的煤岩识别方法", 《工矿自动化》 *

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108469358A (zh) * 2018-05-09 2018-08-31 东莞中国科学院云计算产业技术创新与育成中心 用于不同深度水体采样的无人机系统及其采样方法
CN108805866A (zh) * 2018-05-23 2018-11-13 兰州理工大学 基于四元数小波变换深度视感知的图像注视点检测方法
CN108805866B (zh) * 2018-05-23 2022-03-25 兰州理工大学 基于四元数小波变换深度视感知的图像注视点检测方法
WO2020000171A1 (en) * 2018-06-26 2020-01-02 Nokia Technologies Oy Method and apparatus for computer vision
US11386287B2 (en) 2018-06-26 2022-07-12 Nokia Technologies Oy Method and apparatus for computer vision
CN109215123A (zh) * 2018-09-20 2019-01-15 电子科技大学 基于cGAN的无限地形生成方法、系统、存储介质和终端
CN109215123B (zh) * 2018-09-20 2022-07-29 电子科技大学 基于cGAN的无限地形生成方法、系统、存储介质和终端
CN109542649A (zh) * 2018-11-23 2019-03-29 于兴虎 一种在视觉伺服系统下的跨语言快速共享图像内存的方法
CN109685126A (zh) * 2018-12-17 2019-04-26 北斗航天卫星应用科技集团有限公司 基于深度卷积神经网络的图像分类方法及图像分类系统
CN109858609B (zh) * 2018-12-27 2021-09-14 中国电子科技集团公司信息科学研究院 一种分区块池化的方法和系统
CN109858609A (zh) * 2018-12-27 2019-06-07 中国电子科技集团公司信息科学研究院 一种分区块池化的方法和系统
CN110598584A (zh) * 2019-08-26 2019-12-20 天津大学 一种基于小波变换和dct的卷积神经网络人脸识别算法
CN110766038B (zh) * 2019-09-02 2022-08-16 深圳中科保泰空天技术有限公司 无监督式的地貌分类模型训练和地貌图构建方法
CN110766038A (zh) * 2019-09-02 2020-02-07 深圳中科保泰科技有限公司 无监督式的地貌分类模型训练和地貌图构建方法
CN110543182B (zh) * 2019-09-11 2022-03-15 济宁学院 一种小型无人旋翼机自主着陆控制方法及系统
CN110543182A (zh) * 2019-09-11 2019-12-06 济宁学院 一种小型无人旋翼机自主着陆控制方法及系统
CN112198891B (zh) * 2020-04-22 2021-12-07 北京理工大学 多旋翼机自主回收方法
CN112198891A (zh) * 2020-04-22 2021-01-08 北京理工大学 多旋翼机自主回收方法
US11741702B2 (en) 2020-10-21 2023-08-29 Honeywell International Inc. Automatic safe-landing-site selection for unmanned aerial systems
CN112464756B (zh) * 2020-11-13 2023-05-02 上海电力大学 一种面向绝缘子缺陷识别的图像量化方法
CN112464756A (zh) * 2020-11-13 2021-03-09 上海电力大学 一种面向绝缘子缺陷识别的图像量化方法
CN112668449A (zh) * 2020-12-24 2021-04-16 杭州电子科技大学 一种室外自主移动机器人的低风险地貌识别方法
CN113645468A (zh) * 2021-08-19 2021-11-12 广东博华超高清创新中心有限公司 动态视觉传感器滤波加速控制方法、系统、设备及应用
CN113691818A (zh) * 2021-08-25 2021-11-23 深圳龙岗智能视听研究院 视频目标检测方法、系统、存储介质、计算机视觉终端
CN113810724A (zh) * 2021-09-29 2021-12-17 广东博华超高清创新中心有限公司 一种基于avs帧内压缩编码的视频目标分割方法
CN113810724B (zh) * 2021-09-29 2023-12-08 广东博华超高清创新中心有限公司 一种基于avs帧内压缩编码的视频目标分割方法
WO2024052928A1 (en) * 2022-09-10 2024-03-14 Patil Dipti System for vision-based self-decisive planetary hazard free landing of a space vehicle
CN116385953A (zh) * 2023-01-11 2023-07-04 哈尔滨市科佳通用机电股份有限公司 铁路货车敞车车门折页折断故障图像识别方法
CN116385953B (zh) * 2023-01-11 2023-12-15 哈尔滨市科佳通用机电股份有限公司 铁路货车敞车车门折页折断故障图像识别方法
CN116958752A (zh) * 2023-09-20 2023-10-27 国网湖北省电力有限公司经济技术研究院 一种基于ipkcnn-svm的电网基建建筑归档方法、装置及设备
CN116958752B (zh) * 2023-09-20 2023-12-15 国网湖北省电力有限公司经济技术研究院 一种基于ipkcnn-svm的电网基建建筑归档方法、装置及设备

Also Published As

Publication number Publication date
CN107748895B (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
CN107748895A (zh) 基于dct‑cnn模型的无人机着陆地貌图像分类方法
CN104850845B (zh) 一种基于非对称卷积神经网络的交通标志识别方法
CN110428428B (zh) 一种图像语义分割方法、电子设备和可读存储介质
CN106407986B (zh) 一种基于深度模型的合成孔径雷达图像目标识别方法
CN110414377B (zh) 一种基于尺度注意力网络的遥感图像场景分类方法
CN108549893A (zh) 一种任意形状的场景文本端到端识别方法
Wang et al. Training deeper convolutional networks with deep supervision
CN105657402B (zh) 一种深度图恢复方法
CN109389051A (zh) 一种基于卷积神经网络的建筑物遥感图像识别方法
CN104361363B (zh) 深度反卷积特征学习网络、生成方法及图像分类方法
CN108647742A (zh) 基于轻量级神经网络的快速目标检测方法
CN104462494B (zh) 一种基于无监督特征学习的遥感图像检索方法及系统
CN109461157A (zh) 基于多级特征融合及高斯条件随机场的图像语义分割方法
CN106203363A (zh) 人体骨架运动序列行为识别方法
CN111626355A (zh) 一种基于Unet++卷积神经网络的地震数据初至拾取方法
CN108647585A (zh) 一种基于多尺度循环注意力网络的交通标识符检测方法
CN107679462A (zh) 一种基于小波的深度多特征融合分类方法
CN107480726A (zh) 一种基于全卷积和长短期记忆单元的场景语义分割方法
CN107392130A (zh) 基于阈值自适应和卷积神经网络的多光谱图像分类方法
CN107832835A (zh) 一种卷积神经网络的轻量化方法及装置
CN108090447A (zh) 双分支深层结构下的高光谱图像分类方法及装置
CN107392901A (zh) 一种用于输电线路部件智能自动识别的方法
CN106845418A (zh) 一种基于深度学习的高光谱图像分类方法
CN107609525A (zh) 基于剪枝策略构建卷积神经网络的遥感图像目标检测方法
CN107316066A (zh) 基于多通路卷积神经网络的图像分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant