CN111382788A - 基于二值量化网络的高光谱图像分类方法 - Google Patents

基于二值量化网络的高光谱图像分类方法 Download PDF

Info

Publication number
CN111382788A
CN111382788A CN202010151137.2A CN202010151137A CN111382788A CN 111382788 A CN111382788 A CN 111382788A CN 202010151137 A CN202010151137 A CN 202010151137A CN 111382788 A CN111382788 A CN 111382788A
Authority
CN
China
Prior art keywords
convolution
layer
neural network
cloud
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010151137.2A
Other languages
English (en)
Other versions
CN111382788B (zh
Inventor
雷杰
苏展
吴凌云
李云松
谢卫莹
张鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202010151137.2A priority Critical patent/CN111382788B/zh
Publication of CN111382788A publication Critical patent/CN111382788A/zh
Application granted granted Critical
Publication of CN111382788B publication Critical patent/CN111382788B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/194Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出了一种基于二值量化网络的高光谱图像分类方法,主要解决高光谱图像的边缘模糊、模型复杂和提取云的空间特征信息不足的技术问题。实现步骤为:生成训练集;构建全精度卷积神经网络;训练全精度卷积神经网络;构建二值量化卷积神经网络;初始化二值量化卷积神经网络的;训练二值量化卷积神经网络;对高光谱图像进行分类。本发明利用了七个量化模块,简化了传统的卷积神经网络结构,充分提取高光谱图像云层的空间特征信息,在节省计算资源的同时提高了高光谱图像云分类的精度。

Description

基于二值量化网络的高光谱图像分类方法
技术领域
本发明属于图像处理技术领域,更进一步涉及图像分类技术领域中的一种基于二值量化网络的高光谱图像分类方法。本发明可用于从高光谱图像中分类出有云图像和无云图像。
背景技术
高光谱成像仪可以在数百个狭窄波段内对物体进行成像,其波段范围从可见光覆盖到红外波段,“图谱合一”的特点使其能获得更多的信息。目前高光谱数据处理已成为了国内外的一个重要研究领域。其中,高光谱图像云分类在航空飞行保障和天气预报等方面都具有重要的理论价值和应用前景。根据云的占比,高光谱图像可以分为少云和多云两大类别。然而,高光谱图像千变万化,无论云的高度、厚度、种类以及太阳高度角等因素,还是高光谱图像中个别通道中的噪声以及部分云层在红外和水汽上的特征与晴空的特征近似等都会干扰到高光谱图像的分类结果。基于深度学习的神经网络技术通过特有的非线性映射、自学习、自组织的信息处理能力可以深度挖掘图像特征信息。
西北工业大学在其申请的专利文献“基于三维轻量化深度网络的高光谱图像分类方法”(专利申请号:201811542534.1,申请公开号:109753996A)中提出了一种高光谱图像分类方法。该方法设计了两种轻量化模块,其中一个轻量化模块具有4个卷积层,另一个具有3个卷积层。该方法利用7个轻量化模块,2个池化层和1个全连接层构建三维轻量化深度网络实现了有限样本条件下,高光谱图像深度特征的自主提取。该方法通过修改全连接层的输出通道数来处理不同领域的高光谱图像分类。当全连接层的输出通道数设置为2时,该方法即可从高光谱图像中分类出有云图像和无云图像。该方法虽然考虑到了网络的轻量化设计,但是,该方法仍然存在的不足之处是,该方法提取云的边缘信息时容易受到下垫面地物信息的干扰,使得该方法提取到的图像特征信息存在冗余,网络模型容易产生过拟合现象,导致云分类后的高光谱图像的边缘模糊。而且该方法设计的两种轻量化模块结构复杂,加深了神经网络的层数,使得该方法复杂度高,计算资源消耗巨大。
云南电网有限责任公司电力科学研究院在其申请的专利文献“一种基于扁平混合卷积神经网络的高光谱图像分类方法”(专利申请号:201910901178.6,申请公开号:110689065A)中提出了一种高光谱图像分类方法。该方法利用多种维度的卷积,在初级神经网络模型中引入3个三维卷积,3个池化层和1个二维卷积层,将学习到的空间-谱间特征进行整合,使之在较少的训练样本下也能保持特征学习能力。该方法采用softmax分类器对神经网络提取的高光谱图像特征信息进行提纯并给出高光谱图像每个类别的预测概率。当softmax分类器的类别数设置为2时,该方法即可从高光谱图像中分类出有云图像和无云图像。该方法虽然考虑到了三维卷积内存占用大、耗时长的问题,但是,该方法仍然存在的不足之处是,该方法构建的神经网络保留了三维卷积和大量的浮点参数,使得该方法占用高额的存储空间,产生大量的乘法运算,并且该方法构建的神经网络仅有1个二维卷积层,使得该方法应用在高光谱图像云分类时提取云的空间特征信息不足,降低了高光谱图像的云分类精度。
发明内容
本发明的目的在于针对上述现有技术存在的不足,提出了一种基于二值量化网络的高光谱图像分类方法,用于解决现有高光谱图像分类方法用于云分类时存在的图像边缘模糊、方法复杂度高、运算量大和分类精度低的技术问题。
为实现上述目的,本发明的思路是,先构建全精度卷积神经网络,将训练集输入到全精度卷积神经网络,利用交叉熵损失函数对全精度卷积神经网络进行训练,然后构建二值量化卷积神经网络,利用训练好的全精度卷积神经网络初始化二值量化卷积神经网络,再利用交叉熵损失函数对二值量化卷积神经网络进行训练,最后将待分类的高光谱图像输入到训练好的二值量化卷积神经网络中,对高光谱图像进行分类。
本发明的技术方案包括如下步骤:
(1)生成训练集:
(1a)将N张大小为W×H×C含有云层的高光谱图像裁剪成M张大小为512×512×N的高光谱图像,其中,60<N<120,W、H和C分别表示高光谱图像的宽、高和波段数,1000<W<2000,1000<H<2000,3<C<256,W、H和C的单位为像素,8000<M<16000;
(1b)利用云占比公式,计算裁剪后每幅图像的云占比,将云占比低于10%的裁剪后高光谱图像判为无云图,其余的判为有云图;
(1c)从所有的无云图和所有的有云图中各自随机选取80%高光谱图像组成训练集,若训练集中的高光谱图像是有云图,那么实际有云的概率值为1,实际无云的概率值为0,否则,实际有云的概率值为0,实际无云的概率值为1;
(2)构建全精度卷积神经网络:
(2a)搭建一个10层的全精度卷积神经网络,其结构依次为:第一卷积层→第二卷积层→第三卷积层→第四卷积层→第五卷积层→第六卷积层→第七卷积层→池化层Pool1→全连接层FC1
(2b)设置全精度卷积神经网络每层的尺寸大小如下:
将第一至第五卷积层的卷积核的个数依次设置为16,32,64,128,256,每个卷积核的大小均设置为3×3,卷积步长均设置为2;
将第六至第七卷积层的卷积核的个数依次设置为128,256,每个卷积核大小均设置为1×1,卷积步长均设置为1;
池化层Pool1采用平均池化方式,将池化层的池化卷积核大小设置为4×4,池化步长设置为4;
将全连接层FC1的输出节点个数设置为2;
(3)训练全精度卷积神经网络:
(3a)将训练集输入到全精度卷积神经网络中,得到全连接层FC1的两个输出节点值,利用soft-max多分类函数分别计算全精度卷积神经网络预测有云的概率值和预测无云的概率值;
(3b)将全精度卷积神经网络预测有云的概率值和预测无云的概率值分别输入到交叉熵损失函数中,得到损失值;
(3c)利用损失值和梯度下降法,计算全精度量化卷积神经网络中每个卷积层的每个卷积核的所有权重的梯度和全连接层FC1的每个输出节点的所有权重的梯度;
(3d)利用每个卷积层的每个卷积核的所有梯度和全连接层FC1的每个输出节点的所有梯度,迭代更新全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层FC1的每个输出节点的所有权重,直到交叉熵损失值小于0.1时,得到训练好的全精度卷积神经网络,保存训练好的全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层FC1的每个输出节点的所有权重;
(4)构建二值量化卷积神经网络:
(4a)搭建一个10层的二值量化卷积神经网络,其结构依次为:第一量化模块→第二量化模块→第三量化模块→第四量化模块→第五量化模块→第六量化模块→第七量化模块→池化层Pool2→全连接层FC2
每个量化模块中只有一个卷积层;
(4b)设置二值量化卷积神经网络每层的尺寸大小如下:
将第一至第五量化模块中卷积层的卷积核的个数依次设置为16,32,64,128,256,每个卷积核大小均设置为3×3,卷积步长均设置为2;
将第六至第七量化模块中卷积层的卷积核的个数依次设置为128,256,每个卷积核大小均设置为1×1,卷积步长均设置为1;
池化层Pool2采用平均池化方式,将池化层的池化卷积核大小设置为4×4,池化步长设置为4;
将全连接层FC2的输出节点个数设置为2;
(5)初始化二值量化卷积神经网络:
(5a)将训练好的全精度卷积神经网络中第一至第七卷积层的每个卷积核的每个权重,分别赋值给二值量化卷积神经网络中第一至第七量化模块中卷积层的每个卷积核的每个权重,将赋值后的二值量化卷积神经网络中每个卷积核的所有权重组成一个权重矩阵;
(5b)利用下式,二值量化每个量化模块中卷积层的每个卷积核的权重矩阵:
Figure BDA0002402484830000041
其中,Wlk表示二值量化后第l个量化模块中卷积层的第k个卷积核的权重矩阵,nlk表示二值量化后第l个量化模块中卷积层的第k个卷积核的权重矩阵中元素的总数,
Figure BDA0002402484830000042
表示赋值后第l个量化模块中卷积层的第k个卷积核的权重矩阵,||·||1表示一范数操作,*表示乘法操作,sign(·)表示符号函数;
(5c)将训练好的全精度卷积神经网络中全连接层FC1的每个输出节点的所有权重,各自赋值给二值量化卷积神经网络中全连接层FC2的每个输出节点的所有权重;
(6)训练二值量化卷积神经网络:
将训练集输入到初始化后的二值量化卷积神经网络中,采用与步骤(3)训练全精度卷积神经网络相同的步骤训练初始化后的二值量化卷积神经网络,得到训练好的二值量化卷积神经网络;
(7)对高光谱图像进行分类:
将一幅待分类的高光谱图像输入到训练好的二值量化卷积神经网络中,得到全连接层FC2的两个输出节点值,若第一个输出节点值大于第二个输出节点值则判定输入的待分类的高光谱图像为有云图,否则,判为无云图。
本发明与现有技术相比较,具有以下优点:
第一,本发明通过生成的高光谱图像训练集对全精度卷积神经网络进行训练并保存训练好的全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层的每个节点的所有权重,再将训练好的全精度卷积神经网络中第一至第七卷积层的每个卷积核的每个权重依次赋值给二值量化卷积神经网络中第一至第七量化模块中卷积层的每个卷积核的每个权重,然后将训练好的全精度卷积神经网络中全连接层的每个节点的每个权重依次赋值给二值量化卷积神经网络中全连接层的每个节点的每个权重,避免了高光谱图像中下垫面地物信息的干扰,减少了高光谱图像特征信息的冗余,精简了二值量化卷积神经网络结构,解决了现有技术高光谱图像的边缘模糊和神经网络结构复杂的问题,使得本发明在优化神经网络结构的同时避免了高光谱图像的边缘模糊问题。
第二,本发明通过生成的高光谱图像训练集对二值量化卷积神经网络进行训练,减少了二值量化卷积神经网络的浮点参数,降低了二值量化卷积神经网络的乘法运算数量,提取了充足的高光谱图像云的空间特征信息,解决了现有技术神经网络高额的存储空间和提取云的空间特征信息不足的问题,使得本发明在节省大量存储空间的同时提高了高光谱图像云分类的精度。
附图说明
图1是本发明的流程图;
图2是本发明的仿真结果图,其中,图2(a)为云占比5%的多光谱无云图,图2(b)为云占比7%的多光谱无云图,图2(c)为云占比61%的多光谱有云图,图2(d)为云占比32%的多光谱有云图。
具体实施方式
下面结合附图对本发明做进一步的描述。
参照附图1,对本发明的具体步骤做进一步的描述。
步骤1.生成训练集。
将N张大小为W×H×C含有云层的高光谱图像裁剪成M张大小为512×512×N的高光谱图像,其中,60<N<120,W、H和C分别表示高光谱图像的宽、高和波段数,1000<W<2000,1000<H<2000,3<C<256,W、H和C的单位为像素,8000<M<16000。
利用云占比公式,计算裁剪后每幅图像的云占比,将云占比低于10%的裁剪后高光谱图像判为无云图,其余的判为有云图。
所述的云占比公式如下:
Figure BDA0002402484830000061
其中,εi表示裁剪后第i幅图像的云占比,pi表示裁剪后第i幅图像中云像素点的总数,qi表示裁剪后第i幅图像中像素点的总数。
从所有的无云图和所有的有云图中各自随机选取80%高光谱图像组成训练集,若训练集中的高光谱图像是有云图,那么实际有云的概率值为1,实际无云的概率值为0,否则,实际有云的概率值为0,实际无云的概率值为1。
步骤2.构建全精度卷积神经网络。
搭建一个10层的全精度卷积神经网络,其结构依次为:第一卷积层→第二卷积层→第三卷积层→第四卷积层→第五卷积层→第六卷积层→第七卷积层→池化层Pool1→全连接层FC1
设置全精度卷积神经网络每层的尺寸大小如下。
将第一至第五卷积层的卷积核的个数依次设置为16,32,64,128,256,每个卷积核的大小均设置为3×3,卷积步长均设置为2。
将第六至第七卷积层的卷积核的个数依次设置为128,256,每个卷积核大小均设置为1×1,卷积步长均设置为1。
池化层Pool1采用平均池化方式,将池化层的池化卷积核大小设置为4×4,池化步长设置为4。
将全连接层FC1的输出节点个数设置为2。
步骤3.训练全精度卷积神经网络。
将训练集输入到全精度卷积神经网络中,得到全连接层FC1的两个输出节点值,利用soft-max多分类函数分别计算全精度卷积神经网络预测有云的概率值和预测无云的概率值。
所述的将训练集输入到全精度卷积神经网络中,得到全连接层FC1的两个输出节点值的步骤如下:
第1步,将512×512×4像素大小的高光谱图像输入到全精度卷积神经网络的第一卷积层,依次进行卷积操作和非线性Relu变换,得到256×256×16像素大小的第一卷积层的输出特征图。
第2步,将第一卷积层的输出特征图输入到第二卷积层,依次进行卷积操作和非线性Relu变换,得到128×128×32像素大小的第二卷积层的输出特征图。
第3步,将第二卷积层的输出特征图输入到第三卷积层,依次进行卷积操作和非线性Relu变换,得到64×64×64像素大小的第三卷积层的输出特征图。
第4步,将第三卷积层的输出特征图输入到第四卷积层,依次进行卷积操作和非线性Relu变换,得到32×32×128像素大小的第四卷积层的输出特征图。
第5步,将第四卷积层的输出特征图输入到第五卷积层,依次进行卷积操作和非线性Relu变换,得到16×16×256像素大小的第五卷积层的输出特征图。
第6步,将第五卷积层的输出特征图输入到第六卷积层,依次进行卷积操作和非线性Relu变换,得到16×16×128像素大小的第六卷积层的输出特征图。
第7步,将第六卷积层的输出特征图输入到第七卷积层,依次进行卷积操作和非线性Relu变换,得到16×16×256像素大小的第七卷积层的输出特征图。
第8步,将第七卷积层的输出特征图输入到池化层Pool1,经过平均池化操作,得到维数为4096的输出向量。
第9步,将池化层的维数为4096的输出向量输入到全连接层FC1中,得到两个输出节点值。
所述的soft-max多分类函数如下:
Figure BDA0002402484830000071
Figure BDA0002402484830000072
其中,
Figure BDA0002402484830000081
表示预测有云的概率值,exp表示以自然常数e为底的指数操作,t1表示全连接层的第一个输出节点值,t2表示全连接层的第二个输出节点值,
Figure BDA0002402484830000082
表示预测无云的概率值。
将全精度卷积神经网络预测有云的概率值和预测无云的概率值分别输入到交叉熵损失函数中,得到损失值。
所述的交叉熵损失函数如下:
Figure BDA0002402484830000083
其中,L表示两个预测概率值与两个实际概率值之间的损失值,y1表示实际有云的概率值,y2表示实际无云的概率值,log表示以10为底的对数操作。
利用损失值和梯度下降法,计算全精度量化卷积神经网络中每个卷积层的每个卷积核的所有权重的梯度和全连接层FC1的每个输出节点的所有权重的梯度。
利用每个卷积层的每个卷积核的所有梯度和全连接层FC1的每个输出节点的所有梯度,迭代更新全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层FC1的每个输出节点的所有权重,直到交叉熵损失值小于0.1时,得到训练好的全精度卷积神经网络,保存训练好的全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层FC1的每个输出节点的所有权重。
步骤4.构建二值量化卷积神经网络。
搭建一个10层的二值量化卷积神经网络,其结构依次为:第一量化模块→第二量化模块→第三量化模块→第四量化模块→第五量化模块→第六量化模块→第七量化模块→池化层Pool2→全连接层FC2
每个量化模块中只有一个卷积层。
设置二值量化卷积神经网络每层的尺寸大小如下。
将第一至第五量化模块中卷积层的卷积核的个数依次设置为16,32,64,128,256,每个卷积核大小均设置为3×3,卷积步长均设置为2。
将第六至第七量化模块中卷积层的卷积核的个数依次设置为128,256,每个卷积核大小均设置为1×1,卷积步长均设置为1。
由于七个量化模块中共有五个卷积核大小为3×3的卷积层,因此,二值量化卷积神经网络具有很大的感受野,能够充分提取出高光谱图像云层的空间特征信息。
池化层Pool2采用平均池化方式,将池化层的池化卷积核大小设置为4×4,池化步长设置为4。
将全连接层FC2的输出节点个数设置为2。
步骤5.初始化二值量化卷积神经网络。
将训练好的全精度卷积神经网络中第一至第七卷积层的每个卷积核的每个权重,分别赋值给二值量化卷积神经网络中第一至第七量化模块中卷积层的每个卷积核的每个权重,将赋值后的二值量化卷积神经网络中每个卷积核的所有权重组成一个权重矩阵。
利用下式,二值量化每个量化模块中卷积层的每个卷积核的权重矩阵。
Figure BDA0002402484830000091
其中,Wlk表示二值量化后第l个量化模块中卷积层的第k个卷积核的权重矩阵,nlk表示二值量化后第l个量化模块中卷积层的第k个卷积核的权重矩阵中元素的总数,
Figure BDA0002402484830000092
表示赋值后第l个量化模块中卷积层的第k个卷积核的权重矩阵,||·||1表示一范数操作,*表示乘法操作,sign(·)表示符号函数。
将训练好的全精度卷积神经网络中全连接层FC1的每个输出节点的所有权重,各自赋值给二值量化卷积神经网络中全连接层FC2的每个输出节点的所有权重。
步骤6.训练二值量化卷积神经网络。
将训练集输入到初始化后的二值量化卷积神经网络中,采用与步骤3训练全精度卷积神经网络相同的步骤训练初始化后的二值量化卷积神经网络,得到训练好的二值量化卷积神经网络。
步骤7.对高光谱图像进行分类。
将一幅待分类的高光谱图像输入到训练好的二值量化卷积神经网络中,得到全连接层FC2的两个输出节点值,若第一个输出节点值大于第二个输出节点值则判定输入的待分类的高光谱图像为有云图,否则,判为无云图。
下面结合仿真实验对本发明的效果做进一步的说明:
1.仿真实验条件:
本发明的仿真实验的硬件平台:处理器为Intel(R)Xeon(R)E5-2650 v4 CPU、主频为2.20GHz、内存为125GB、显卡为GeForce GTX 1080Ti。
本发明的仿真实验的软件平台:python3.6和pytorch0.4.1。
2.仿真内容及其结果分析:
本发明的仿真实验是采用本发明的方法对高分一号机载相机拍摄的108张大小为1663×1542×4含有云层的多光谱图像进行云分类,多光谱图像是一种波段数小于10的高光谱图像,将108张大小为1663×1542×4含有云层的多光谱图像裁剪成15660张大小为512×512×4的多光谱图像,从15660张大小为512×512×4的多光谱图像中随机选取12528张多光谱图像组成训练集,将剩余的多光谱图像组成测试集。
为了验证本发明的仿真实验效果,将测试集中所有多光谱图像输入到训练好的二值量化卷积神经网络中进行分类,得到测试集中所有多光谱图像的分类结果,图2是从测试集中选取的分类难度最高的4张多光谱图。
图2(a)和图2(b)代表测试集中分类难度最高的2张多光谱无云图,大小均为512×512×4个像素,云占比均低于10%。图2(a)的水汽含量高使其难以被判为多光谱无云图,图2(b)的下垫面地物的纹理特性与云层的纹理特性近似使其难以被判为多光谱无云图,本发明的方法能够将图2(a)和图2(b)正确地判为多光谱无云图,说明本发明方法能够有效地避免将水汽含量高的无云多光谱图误判为有云多光谱图,能够区分下垫面地物和云层的纹理特性。
图2(c)和图2(d)代表测试集中分类难度最高的2张多光谱有云图,大小均为512×512×4个像素,图2(c)的云占比为61%,图2(d)的云占比为32%。图2(c)大量云层的特征信息与下垫面地物的特征信息大量混合使其难以被判为多光谱有云图,图2(d)云层的特征信息受到云层阴影面的特征信息的干扰使其难以被判为多光谱有云图,本发明的方法能够将图2(a)和图2(b)正确地判为多光谱有云图,说明本发明方法能够有效地抑制下垫面地物特征信息的干扰的同时能够有效地提取云层的空间特征信息,得到正确的分类结果。
为了证明本发明的云分类效果,通过精度公式计算本发明在测试集中的多光谱图像分类精度,所述的精度公式如下:
Figure BDA0002402484830000101
其中,η表示本发明在测试集中的多光谱图像分类精度,α表示测试集中正确分类的多光谱图像数目,β表示测试集中多光谱图像数目。
使用本发明对测试集中所有多光谱图像进行云分类,得到测试集中正确分类的多光谱图像数目为3077,已知测试集中多光谱图像数目为3132,利用精度公式得到本发明在测试集中的多光谱图像分类精度为98.25%,证明本发明可以得到很高的多光谱图像分类精度。
本发明的方法需要2130000个加法运算数量和319000000个乘法运算数量,加法运算数量是乘法运算数量的149倍,需要9072个浮点参数量和457648个二值参数量,二值参数量是浮点参数量的50倍,证明本发明可以节省大量的乘法运算数量和网络的浮点参数量。
以上仿真实验表明:本发明通过生成的高光谱图像训练集对全精度卷积神经网络进行训练并保存训练好的全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层的每个节点的所有权重,再将训练好的全精度卷积神经网络中第一至第七卷积层的每个卷积核的每个权重依次赋值给二值量化卷积神经网络中第一至第七量化模块中卷积层的每个卷积核的每个权重,然后将训练好的全精度卷积神经网络中全连接层的每个节点的每个权重依次赋值给二值量化卷积神经网络中全连接层的每个节点的每个权重,能够减少高光谱图像特征信息的冗余,精简二值量化卷积神经网络结构,通过生成的高光谱图像训练集对二值量化卷积神经网络进行训练,能够减少二值量化卷积神经网络的浮点参数,降低二值量化卷积神经网络的乘法运算数量,解决了现有技术方法中存在的高光谱图像的边缘模糊、神经网络结构复杂、神经网络高额的存储空间和提取云的空间特征信息不足的问题,是一种非常实用的高光谱图像分类方法。

Claims (4)

1.一种基于二值量化网络的高光谱图像分类方法,其特征在于,利用交叉熵损失函数对全精度卷积神经网络进行训练,利用训练好的全精度卷积神经网络初始化二值量化卷积神经网络,利用交叉熵损失函数对初始化后的二值量化卷积神经网络进行训练;该方法具体步骤包括如下:
(1)生成训练集:
(1a)将N张大小为W×H×C含有云层的高光谱图像裁剪成M张大小为512×512×N的高光谱图像,其中,60<N<120,W、H和C分别表示高光谱图像的宽、高和波段数,1000<W<2000,1000<H<2000,3<C<256,W、H和C的单位为像素,8000<M<16000;
(1b)利用云占比公式,计算裁剪后每幅图像的云占比,将云占比低于10%的裁剪后高光谱图像判为无云图,其余的判为有云图;
(1c)从所有的无云图和所有的有云图中各自随机选取80%高光谱图像组成训练集,若训练集中的高光谱图像是有云图,那么实际有云的概率值为1,实际无云的概率值为0,否则,实际有云的概率值为0,实际无云的概率值为1;
(2)构建全精度卷积神经网络:
(2a)搭建一个10层的全精度卷积神经网络,其结构依次为:第一卷积层→第二卷积层→第三卷积层→第四卷积层→第五卷积层→第六卷积层→第七卷积层→池化层Pool1→全连接层FC1
(2b)设置全精度卷积神经网络每层的尺寸大小如下:
将第一至第五卷积层的卷积核的个数依次设置为16,32,64,128,256,每个卷积核的大小均设置为3×3,卷积步长均设置为2;
将第六至第七卷积层的卷积核的个数依次设置为128,256,每个卷积核大小均设置为1×1,卷积步长均设置为1;
池化层Pool1采用平均池化方式,将池化层的池化卷积核大小设置为4×4,池化步长设置为4;
将全连接层FC1的输出节点个数设置为2;
(3)训练全精度卷积神经网络:
(3a)将训练集输入到全精度卷积神经网络中,得到全连接层FC1的两个输出节点值,利用soft-max多分类函数分别计算全精度卷积神经网络预测有云的概率值和预测无云的概率值;
(3b)将全精度卷积神经网络预测有云的概率值和预测无云的概率值分别输入到交叉熵损失函数中,得到损失值;
(3c)利用损失值和梯度下降法,计算全精度量化卷积神经网络中每个卷积层的每个卷积核的所有权重的梯度和全连接层FC1的每个输出节点的所有权重的梯度;
(3d)利用每个卷积层的每个卷积核的所有梯度和全连接层FC1的每个输出节点的所有梯度,迭代更新全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层FC1的每个输出节点的所有权重,直到交叉熵损失值小于0.1时,得到训练好的全精度卷积神经网络,保存训练好的全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层FC1的每个输出节点的所有权重;
(4)构建二值量化卷积神经网络:
(4a)搭建一个10层的二值量化卷积神经网络,其结构依次为:第一量化模块→第二量化模块→第三量化模块→第四量化模块→第五量化模块→第六量化模块→第七量化模块→池化层Pool2→全连接层FC2
每个量化模块中只有一个卷积层;
(4b)设置二值量化卷积神经网络每层的尺寸大小如下:
将第一至第五量化模块中卷积层的卷积核的个数依次设置为16,32,64,128,256,每个卷积核大小均设置为3×3,卷积步长均设置为2;
将第六至第七量化模块中卷积层的卷积核的个数依次设置为128,256,每个卷积核大小均设置为1×1,卷积步长均设置为1;
池化层Pool2采用平均池化方式,将池化层的池化卷积核大小设置为4×4,池化步长设置为4;
将全连接层FC2的输出节点个数设置为2;
(5)初始化二值量化卷积神经网络:
(5a)将训练好的全精度卷积神经网络中第一至第七卷积层的每个卷积核的每个权重,分别赋值给二值量化卷积神经网络中第一至第七量化模块中卷积层的每个卷积核的每个权重,将赋值后的二值量化卷积神经网络中每个卷积核的所有权重组成一个权重矩阵;
(5b)利用下式,二值量化每个量化模块中卷积层的每个卷积核的权重矩阵:
Figure FDA0002402484820000031
其中,Wlk表示二值量化后第l个量化模块中卷积层的第k个卷积核的权重矩阵,nlk表示二值量化后第l个量化模块中卷积层的第k个卷积核的权重矩阵中元素的总数,
Figure FDA0002402484820000032
表示赋值后第l个量化模块中卷积层的第k个卷积核的权重矩阵,||·||1表示一范数操作,*表示乘法操作,sign(·)表示符号函数;
(5c)将训练好的全精度卷积神经网络中全连接层FC1的每个输出节点的所有权重,各自赋值给二值量化卷积神经网络中全连接层FC2的每个输出节点的所有权重;
(6)训练二值量化卷积神经网络:
将训练集输入到初始化后的二值量化卷积神经网络中,采用与步骤(3)训练全精度卷积神经网络相同的步骤训练初始化后的二值量化卷积神经网络,得到训练好的二值量化卷积神经网络;
(7)对高光谱图像进行分类:
将一幅待分类的高光谱图像输入到训练好的二值量化卷积神经网络中,得到全连接层FC2的两个输出节点值,若第一个输出节点值大于第二个输出节点值则判定输入的待分类的高光谱图像为有云图,否则,判为无云图。
2.根据权利要求1所述的基于二值量化网络的高光谱图像分类方法,其特征在于,步骤(1b)中所述的云占比公式如下:
Figure FDA0002402484820000033
其中,εi表示裁剪后第i幅图像的云占比,pi表示裁剪后第i幅图像中云像素点的总数,qi表示裁剪后第i幅图像中像素点的总数。
3.根据权利要求1所述的基于二值量化网络的高光谱图像分类方法,其特征在于,步骤(3a)中所述的soft-max多分类函数如下:
Figure FDA0002402484820000041
Figure FDA0002402484820000042
其中,
Figure FDA0002402484820000043
表示预测有云的概率值,exp表示以自然常数e为底的指数操作,t1表示全连接层的第一个输出节点值,t2表示全连接层的第二个输出节点值,
Figure FDA0002402484820000044
表示预测无云的概率值。
4.根据权利要求3所述的基于二值量化网络的高光谱图像分类方法,其特征在于,步骤(3b)中所述的交叉熵损失函数如下:
Figure FDA0002402484820000045
其中,L表示两个预测概率值与两个实际概率值之间的损失值,y1表示实际有云的概率值,y2表示实际无云的概率值,log表示以10为底的对数操作。
CN202010151137.2A 2020-03-06 2020-03-06 基于二值量化网络的高光谱图像分类方法 Active CN111382788B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010151137.2A CN111382788B (zh) 2020-03-06 2020-03-06 基于二值量化网络的高光谱图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010151137.2A CN111382788B (zh) 2020-03-06 2020-03-06 基于二值量化网络的高光谱图像分类方法

Publications (2)

Publication Number Publication Date
CN111382788A true CN111382788A (zh) 2020-07-07
CN111382788B CN111382788B (zh) 2022-03-04

Family

ID=71218730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010151137.2A Active CN111382788B (zh) 2020-03-06 2020-03-06 基于二值量化网络的高光谱图像分类方法

Country Status (1)

Country Link
CN (1) CN111382788B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633402A (zh) * 2020-12-30 2021-04-09 南京大学 一种实现动态计算的高精度高比例的分类模型及分类方法
CN113159301A (zh) * 2021-05-25 2021-07-23 电子科技大学 一种基于二值化量化模型的图像处理方法
CN113420795A (zh) * 2021-06-07 2021-09-21 核工业北京地质研究院 一种基于空洞卷积神经网络的矿物光谱分类方法
CN113688990A (zh) * 2021-09-09 2021-11-23 贵州电网有限责任公司 用于电力边缘计算分类神经网络的无数据量化训练方法
CN114677548A (zh) * 2022-05-26 2022-06-28 之江实验室 基于阻变存储器的神经网络图像分类系统及方法
CN114972885A (zh) * 2022-06-17 2022-08-30 西安电子科技大学 基于模型压缩的多模态遥感图像分类方法
CN116051896A (zh) * 2023-01-28 2023-05-02 西南交通大学 一种轻量化混合张量神经网络的高光谱图像分类方法
CN116664958A (zh) * 2023-07-27 2023-08-29 鹏城实验室 基于二值神经网络模型的图像分类方法以及相关设备
CN114972885B (zh) * 2022-06-17 2024-06-07 西安电子科技大学 基于模型压缩的多模态遥感图像分类方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855491A (zh) * 2012-07-26 2013-01-02 中国科学院自动化研究所 一种基于网络中心性的脑功能磁共振图像分类方法
CN103093216A (zh) * 2013-02-04 2013-05-08 北京航空航天大学 基于人脸图像的性别分类方法及系统
CN108564168A (zh) * 2018-04-03 2018-09-21 中国科学院计算技术研究所 一种对支持多精度卷积神经网络处理器的设计方法
CN109086866A (zh) * 2018-07-02 2018-12-25 重庆大学 一种适用于嵌入式设备的部分二值卷积方法
US10311342B1 (en) * 2016-04-14 2019-06-04 XNOR.ai, Inc. System and methods for efficiently implementing a convolutional neural network incorporating binarized filter and convolution operation for performing image classification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855491A (zh) * 2012-07-26 2013-01-02 中国科学院自动化研究所 一种基于网络中心性的脑功能磁共振图像分类方法
CN103093216A (zh) * 2013-02-04 2013-05-08 北京航空航天大学 基于人脸图像的性别分类方法及系统
US10311342B1 (en) * 2016-04-14 2019-06-04 XNOR.ai, Inc. System and methods for efficiently implementing a convolutional neural network incorporating binarized filter and convolution operation for performing image classification
CN108564168A (zh) * 2018-04-03 2018-09-21 中国科学院计算技术研究所 一种对支持多精度卷积神经网络处理器的设计方法
CN109086866A (zh) * 2018-07-02 2018-12-25 重庆大学 一种适用于嵌入式设备的部分二值卷积方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RASTEGARI M等: "Xnor-net: Imagenet classification using binary", 《EUROPEAN CONFERENCE ON COMPUTER VISION》 *
周光朕等: "基于残差量化卷积神经网络的人脸识别方法", 《计算机系统应用》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633402B (zh) * 2020-12-30 2024-05-03 南京大学 一种实现动态计算的高精度高比例的分类模型及分类方法
CN112633402A (zh) * 2020-12-30 2021-04-09 南京大学 一种实现动态计算的高精度高比例的分类模型及分类方法
CN113159301B (zh) * 2021-05-25 2022-10-28 电子科技大学 一种基于二值化量化模型的图像处理方法
CN113159301A (zh) * 2021-05-25 2021-07-23 电子科技大学 一种基于二值化量化模型的图像处理方法
CN113420795A (zh) * 2021-06-07 2021-09-21 核工业北京地质研究院 一种基于空洞卷积神经网络的矿物光谱分类方法
CN113420795B (zh) * 2021-06-07 2024-04-26 核工业北京地质研究院 一种基于空洞卷积神经网络的矿物光谱分类方法
CN113688990A (zh) * 2021-09-09 2021-11-23 贵州电网有限责任公司 用于电力边缘计算分类神经网络的无数据量化训练方法
CN114677548B (zh) * 2022-05-26 2022-10-14 之江实验室 基于阻变存储器的神经网络图像分类系统及方法
CN114677548A (zh) * 2022-05-26 2022-06-28 之江实验室 基于阻变存储器的神经网络图像分类系统及方法
CN114972885A (zh) * 2022-06-17 2022-08-30 西安电子科技大学 基于模型压缩的多模态遥感图像分类方法
CN114972885B (zh) * 2022-06-17 2024-06-07 西安电子科技大学 基于模型压缩的多模态遥感图像分类方法
CN116051896A (zh) * 2023-01-28 2023-05-02 西南交通大学 一种轻量化混合张量神经网络的高光谱图像分类方法
CN116664958A (zh) * 2023-07-27 2023-08-29 鹏城实验室 基于二值神经网络模型的图像分类方法以及相关设备
CN116664958B (zh) * 2023-07-27 2023-11-14 鹏城实验室 基于二值神经网络模型的图像分类方法以及相关设备

Also Published As

Publication number Publication date
CN111382788B (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
CN111382788B (zh) 基于二值量化网络的高光谱图像分类方法
CN110516596B (zh) 基于Octave卷积的空谱注意力高光谱图像分类方法
CN110334765B (zh) 基于注意力机制多尺度深度学习的遥感影像分类方法
CN110084159B (zh) 基于联合多级空谱信息cnn的高光谱图像分类方法
CN108647655B (zh) 基于轻型卷积神经网络的低空航拍影像电力线异物检测方法
CN110211137B (zh) 基于残差网络和U-Net分割网络的卫星图像分割方法
CN112052755B (zh) 基于多路注意力机制的语义卷积高光谱图像分类方法
CN103927531B (zh) 一种基于局部二值和粒子群优化bp神经网络的人脸识别方法
CN109840560B (zh) 基于胶囊网络中融入聚类的图像分类方法
CN111310666B (zh) 一种基于纹理特征的高分辨率影像地物识别与分割方法
CN108229589B (zh) 一种基于迁移学习的地基云图分类方法
CN110084311B (zh) 基于三元权值卷积神经网络的高光谱图像波段选择方法
CN110569860B (zh) 结合判别分析和多核学习的图像有趣性二分类预测方法
CN111814875A (zh) 基于样式生成对抗网络的红外图像中舰船样本扩充方法
CN107832797B (zh) 基于深度融合残差网的多光谱图像分类方法
CN113705580B (zh) 基于深度迁移学习的高光谱图像分类方法
CN111028327A (zh) 一种三维点云的处理方法、装置及设备
CN111008975B (zh) 一种空间人造目标线性模型的混合像元解混方法及系统
CN114170512A (zh) 基于网络剪枝和参数量化结合的遥感sar目标检测方法
CN112183742A (zh) 基于渐进式量化和Hessian信息的神经网络混合量化方法
CN108256557B (zh) 结合深度学习和邻域集成的高光谱图像分类方法
CN110647977B (zh) 一种用于星上对舰船目标检测的Tiny-YOLO网络的优化方法
CN111222545B (zh) 基于线性规划增量学习的图像分类方法
CN114373099A (zh) 一种基于稀疏图卷积的三维点云分类方法
CN115880497A (zh) 基于自编码器结合多层感知机的翼型结冰冰形预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant