CN111382788A

CN111382788A - 基于二值量化网络的高光谱图像分类方法

Info

Publication number: CN111382788A
Application number: CN202010151137.2A
Authority: CN
Inventors: 雷杰; 苏展; 吴凌云; 李云松; 谢卫莹; 张鑫
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2020-03-06
Filing date: 2020-03-06
Publication date: 2020-07-07
Anticipated expiration: 2040-03-06
Also published as: CN111382788B

Abstract

本发明提出了一种基于二值量化网络的高光谱图像分类方法，主要解决高光谱图像的边缘模糊、模型复杂和提取云的空间特征信息不足的技术问题。实现步骤为：生成训练集；构建全精度卷积神经网络；训练全精度卷积神经网络；构建二值量化卷积神经网络；初始化二值量化卷积神经网络的；训练二值量化卷积神经网络；对高光谱图像进行分类。本发明利用了七个量化模块，简化了传统的卷积神经网络结构，充分提取高光谱图像云层的空间特征信息，在节省计算资源的同时提高了高光谱图像云分类的精度。

Description

基于二值量化网络的高光谱图像分类方法

技术领域

本发明属于图像处理技术领域，更进一步涉及图像分类技术领域中的一种基于二值量化网络的高光谱图像分类方法。本发明可用于从高光谱图像中分类出有云图像和无云图像。

背景技术

高光谱成像仪可以在数百个狭窄波段内对物体进行成像，其波段范围从可见光覆盖到红外波段，“图谱合一”的特点使其能获得更多的信息。目前高光谱数据处理已成为了国内外的一个重要研究领域。其中，高光谱图像云分类在航空飞行保障和天气预报等方面都具有重要的理论价值和应用前景。根据云的占比，高光谱图像可以分为少云和多云两大类别。然而，高光谱图像千变万化，无论云的高度、厚度、种类以及太阳高度角等因素，还是高光谱图像中个别通道中的噪声以及部分云层在红外和水汽上的特征与晴空的特征近似等都会干扰到高光谱图像的分类结果。基于深度学习的神经网络技术通过特有的非线性映射、自学习、自组织的信息处理能力可以深度挖掘图像特征信息。

西北工业大学在其申请的专利文献“基于三维轻量化深度网络的高光谱图像分类方法”(专利申请号：201811542534.1，申请公开号：109753996A)中提出了一种高光谱图像分类方法。该方法设计了两种轻量化模块，其中一个轻量化模块具有4个卷积层，另一个具有3个卷积层。该方法利用7个轻量化模块，2个池化层和1个全连接层构建三维轻量化深度网络实现了有限样本条件下，高光谱图像深度特征的自主提取。该方法通过修改全连接层的输出通道数来处理不同领域的高光谱图像分类。当全连接层的输出通道数设置为2时，该方法即可从高光谱图像中分类出有云图像和无云图像。该方法虽然考虑到了网络的轻量化设计，但是，该方法仍然存在的不足之处是，该方法提取云的边缘信息时容易受到下垫面地物信息的干扰，使得该方法提取到的图像特征信息存在冗余，网络模型容易产生过拟合现象，导致云分类后的高光谱图像的边缘模糊。而且该方法设计的两种轻量化模块结构复杂，加深了神经网络的层数，使得该方法复杂度高，计算资源消耗巨大。

云南电网有限责任公司电力科学研究院在其申请的专利文献“一种基于扁平混合卷积神经网络的高光谱图像分类方法”(专利申请号：201910901178.6，申请公开号：110689065A)中提出了一种高光谱图像分类方法。该方法利用多种维度的卷积，在初级神经网络模型中引入3个三维卷积，3个池化层和1个二维卷积层，将学习到的空间-谱间特征进行整合，使之在较少的训练样本下也能保持特征学习能力。该方法采用softmax分类器对神经网络提取的高光谱图像特征信息进行提纯并给出高光谱图像每个类别的预测概率。当softmax分类器的类别数设置为2时，该方法即可从高光谱图像中分类出有云图像和无云图像。该方法虽然考虑到了三维卷积内存占用大、耗时长的问题，但是，该方法仍然存在的不足之处是，该方法构建的神经网络保留了三维卷积和大量的浮点参数，使得该方法占用高额的存储空间，产生大量的乘法运算，并且该方法构建的神经网络仅有1个二维卷积层，使得该方法应用在高光谱图像云分类时提取云的空间特征信息不足，降低了高光谱图像的云分类精度。

发明内容

本发明的目的在于针对上述现有技术存在的不足，提出了一种基于二值量化网络的高光谱图像分类方法，用于解决现有高光谱图像分类方法用于云分类时存在的图像边缘模糊、方法复杂度高、运算量大和分类精度低的技术问题。

为实现上述目的，本发明的思路是，先构建全精度卷积神经网络，将训练集输入到全精度卷积神经网络，利用交叉熵损失函数对全精度卷积神经网络进行训练，然后构建二值量化卷积神经网络，利用训练好的全精度卷积神经网络初始化二值量化卷积神经网络，再利用交叉熵损失函数对二值量化卷积神经网络进行训练，最后将待分类的高光谱图像输入到训练好的二值量化卷积神经网络中，对高光谱图像进行分类。

本发明的技术方案包括如下步骤：

(1)生成训练集：

(1a)将N张大小为W×H×C含有云层的高光谱图像裁剪成M张大小为512×512×N的高光谱图像，其中，60＜N＜120，W、H和C分别表示高光谱图像的宽、高和波段数，1000＜W＜2000，1000＜H＜2000，3＜C＜256，W、H和C的单位为像素，8000＜M＜16000；

(1b)利用云占比公式，计算裁剪后每幅图像的云占比，将云占比低于10％的裁剪后高光谱图像判为无云图，其余的判为有云图；

(1c)从所有的无云图和所有的有云图中各自随机选取80％高光谱图像组成训练集，若训练集中的高光谱图像是有云图，那么实际有云的概率值为1，实际无云的概率值为0，否则，实际有云的概率值为0，实际无云的概率值为1；

(2)构建全精度卷积神经网络：

(2a)搭建一个10层的全精度卷积神经网络，其结构依次为：第一卷积层→第二卷积层→第三卷积层→第四卷积层→第五卷积层→第六卷积层→第七卷积层→池化层Pool₁→全连接层FC₁；

(2b)设置全精度卷积神经网络每层的尺寸大小如下：

将第一至第五卷积层的卷积核的个数依次设置为16，32，64，128，256，每个卷积核的大小均设置为3×3，卷积步长均设置为2；

将第六至第七卷积层的卷积核的个数依次设置为128，256，每个卷积核大小均设置为1×1，卷积步长均设置为1；

池化层Pool₁采用平均池化方式，将池化层的池化卷积核大小设置为4×4，池化步长设置为4；

将全连接层FC₁的输出节点个数设置为2；

(3)训练全精度卷积神经网络：

(3a)将训练集输入到全精度卷积神经网络中，得到全连接层FC₁的两个输出节点值，利用soft-max多分类函数分别计算全精度卷积神经网络预测有云的概率值和预测无云的概率值；

(3b)将全精度卷积神经网络预测有云的概率值和预测无云的概率值分别输入到交叉熵损失函数中，得到损失值；

(3c)利用损失值和梯度下降法，计算全精度量化卷积神经网络中每个卷积层的每个卷积核的所有权重的梯度和全连接层FC₁的每个输出节点的所有权重的梯度；

(3d)利用每个卷积层的每个卷积核的所有梯度和全连接层FC₁的每个输出节点的所有梯度，迭代更新全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层FC₁的每个输出节点的所有权重，直到交叉熵损失值小于0.1时，得到训练好的全精度卷积神经网络,保存训练好的全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层FC₁的每个输出节点的所有权重；

(4)构建二值量化卷积神经网络：

(4a)搭建一个10层的二值量化卷积神经网络，其结构依次为：第一量化模块→第二量化模块→第三量化模块→第四量化模块→第五量化模块→第六量化模块→第七量化模块→池化层Pool₂→全连接层FC₂；

每个量化模块中只有一个卷积层；

(4b)设置二值量化卷积神经网络每层的尺寸大小如下：

将第一至第五量化模块中卷积层的卷积核的个数依次设置为16，32，64，128，256，每个卷积核大小均设置为3×3，卷积步长均设置为2；

将第六至第七量化模块中卷积层的卷积核的个数依次设置为128，256，每个卷积核大小均设置为1×1，卷积步长均设置为1；

池化层Pool₂采用平均池化方式，将池化层的池化卷积核大小设置为4×4，池化步长设置为4；

将全连接层FC₂的输出节点个数设置为2；

(5)初始化二值量化卷积神经网络：

(5a)将训练好的全精度卷积神经网络中第一至第七卷积层的每个卷积核的每个权重，分别赋值给二值量化卷积神经网络中第一至第七量化模块中卷积层的每个卷积核的每个权重，将赋值后的二值量化卷积神经网络中每个卷积核的所有权重组成一个权重矩阵；

(5b)利用下式，二值量化每个量化模块中卷积层的每个卷积核的权重矩阵：

其中，W_lk表示二值量化后第l个量化模块中卷积层的第k个卷积核的权重矩阵，n_lk表示二值量化后第l个量化模块中卷积层的第k个卷积核的权重矩阵中元素的总数，

表示赋值后第l个量化模块中卷积层的第k个卷积核的权重矩阵，||·||₁表示一范数操作，*表示乘法操作，sign(·)表示符号函数；

(5c)将训练好的全精度卷积神经网络中全连接层FC₁的每个输出节点的所有权重，各自赋值给二值量化卷积神经网络中全连接层FC₂的每个输出节点的所有权重；

(6)训练二值量化卷积神经网络：

将训练集输入到初始化后的二值量化卷积神经网络中，采用与步骤(3)训练全精度卷积神经网络相同的步骤训练初始化后的二值量化卷积神经网络，得到训练好的二值量化卷积神经网络；

(7)对高光谱图像进行分类：

将一幅待分类的高光谱图像输入到训练好的二值量化卷积神经网络中，得到全连接层FC₂的两个输出节点值，若第一个输出节点值大于第二个输出节点值则判定输入的待分类的高光谱图像为有云图，否则，判为无云图。

本发明与现有技术相比较，具有以下优点：

第一，本发明通过生成的高光谱图像训练集对全精度卷积神经网络进行训练并保存训练好的全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层的每个节点的所有权重，再将训练好的全精度卷积神经网络中第一至第七卷积层的每个卷积核的每个权重依次赋值给二值量化卷积神经网络中第一至第七量化模块中卷积层的每个卷积核的每个权重，然后将训练好的全精度卷积神经网络中全连接层的每个节点的每个权重依次赋值给二值量化卷积神经网络中全连接层的每个节点的每个权重，避免了高光谱图像中下垫面地物信息的干扰，减少了高光谱图像特征信息的冗余，精简了二值量化卷积神经网络结构，解决了现有技术高光谱图像的边缘模糊和神经网络结构复杂的问题，使得本发明在优化神经网络结构的同时避免了高光谱图像的边缘模糊问题。

第二，本发明通过生成的高光谱图像训练集对二值量化卷积神经网络进行训练，减少了二值量化卷积神经网络的浮点参数，降低了二值量化卷积神经网络的乘法运算数量，提取了充足的高光谱图像云的空间特征信息，解决了现有技术神经网络高额的存储空间和提取云的空间特征信息不足的问题，使得本发明在节省大量存储空间的同时提高了高光谱图像云分类的精度。

附图说明

图1是本发明的流程图；

图2是本发明的仿真结果图，其中，图2(a)为云占比5％的多光谱无云图，图2(b)为云占比7％的多光谱无云图，图2(c)为云占比61％的多光谱有云图，图2(d)为云占比32％的多光谱有云图。

具体实施方式

下面结合附图对本发明做进一步的描述。

参照附图1，对本发明的具体步骤做进一步的描述。

步骤1.生成训练集。

将N张大小为W×H×C含有云层的高光谱图像裁剪成M张大小为512×512×N的高光谱图像，其中，60＜N＜120，W、H和C分别表示高光谱图像的宽、高和波段数，1000＜W＜2000，1000＜H＜2000，3＜C＜256，W、H和C的单位为像素，8000＜M＜16000。

利用云占比公式，计算裁剪后每幅图像的云占比，将云占比低于10％的裁剪后高光谱图像判为无云图，其余的判为有云图。

所述的云占比公式如下：

其中，ε_i表示裁剪后第i幅图像的云占比，p_i表示裁剪后第i幅图像中云像素点的总数，q_i表示裁剪后第i幅图像中像素点的总数。

从所有的无云图和所有的有云图中各自随机选取80％高光谱图像组成训练集，若训练集中的高光谱图像是有云图，那么实际有云的概率值为1，实际无云的概率值为0，否则，实际有云的概率值为0，实际无云的概率值为1。

步骤2.构建全精度卷积神经网络。

搭建一个10层的全精度卷积神经网络，其结构依次为：第一卷积层→第二卷积层→第三卷积层→第四卷积层→第五卷积层→第六卷积层→第七卷积层→池化层Pool₁→全连接层FC₁。

设置全精度卷积神经网络每层的尺寸大小如下。

将第一至第五卷积层的卷积核的个数依次设置为16，32，64，128，256，每个卷积核的大小均设置为3×3，卷积步长均设置为2。

将第六至第七卷积层的卷积核的个数依次设置为128，256，每个卷积核大小均设置为1×1，卷积步长均设置为1。

池化层Pool₁采用平均池化方式，将池化层的池化卷积核大小设置为4×4，池化步长设置为4。

将全连接层FC₁的输出节点个数设置为2。

步骤3.训练全精度卷积神经网络。

将训练集输入到全精度卷积神经网络中，得到全连接层FC₁的两个输出节点值，利用soft-max多分类函数分别计算全精度卷积神经网络预测有云的概率值和预测无云的概率值。

所述的将训练集输入到全精度卷积神经网络中，得到全连接层FC₁的两个输出节点值的步骤如下：

第1步，将512×512×4像素大小的高光谱图像输入到全精度卷积神经网络的第一卷积层，依次进行卷积操作和非线性Relu变换，得到256×256×16像素大小的第一卷积层的输出特征图。

第2步，将第一卷积层的输出特征图输入到第二卷积层，依次进行卷积操作和非线性Relu变换，得到128×128×32像素大小的第二卷积层的输出特征图。

第3步，将第二卷积层的输出特征图输入到第三卷积层，依次进行卷积操作和非线性Relu变换，得到64×64×64像素大小的第三卷积层的输出特征图。

第4步，将第三卷积层的输出特征图输入到第四卷积层，依次进行卷积操作和非线性Relu变换，得到32×32×128像素大小的第四卷积层的输出特征图。

第5步，将第四卷积层的输出特征图输入到第五卷积层，依次进行卷积操作和非线性Relu变换，得到16×16×256像素大小的第五卷积层的输出特征图。

第6步，将第五卷积层的输出特征图输入到第六卷积层，依次进行卷积操作和非线性Relu变换，得到16×16×128像素大小的第六卷积层的输出特征图。

第7步，将第六卷积层的输出特征图输入到第七卷积层，依次进行卷积操作和非线性Relu变换，得到16×16×256像素大小的第七卷积层的输出特征图。

第8步，将第七卷积层的输出特征图输入到池化层Pool₁，经过平均池化操作，得到维数为4096的输出向量。

第9步，将池化层的维数为4096的输出向量输入到全连接层FC₁中，得到两个输出节点值。

所述的soft-max多分类函数如下：

其中，

表示预测有云的概率值，exp表示以自然常数e为底的指数操作，t₁表示全连接层的第一个输出节点值，t₂表示全连接层的第二个输出节点值，

表示预测无云的概率值。

将全精度卷积神经网络预测有云的概率值和预测无云的概率值分别输入到交叉熵损失函数中，得到损失值。

所述的交叉熵损失函数如下：

其中，L表示两个预测概率值与两个实际概率值之间的损失值，y₁表示实际有云的概率值，y₂表示实际无云的概率值，log表示以10为底的对数操作。

利用损失值和梯度下降法，计算全精度量化卷积神经网络中每个卷积层的每个卷积核的所有权重的梯度和全连接层FC₁的每个输出节点的所有权重的梯度。

利用每个卷积层的每个卷积核的所有梯度和全连接层FC₁的每个输出节点的所有梯度，迭代更新全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层FC₁的每个输出节点的所有权重，直到交叉熵损失值小于0.1时，得到训练好的全精度卷积神经网络,保存训练好的全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层FC₁的每个输出节点的所有权重。

步骤4.构建二值量化卷积神经网络。

搭建一个10层的二值量化卷积神经网络，其结构依次为：第一量化模块→第二量化模块→第三量化模块→第四量化模块→第五量化模块→第六量化模块→第七量化模块→池化层Pool₂→全连接层FC₂。

每个量化模块中只有一个卷积层。

设置二值量化卷积神经网络每层的尺寸大小如下。

将第一至第五量化模块中卷积层的卷积核的个数依次设置为16，32，64，128，256，每个卷积核大小均设置为3×3，卷积步长均设置为2。

将第六至第七量化模块中卷积层的卷积核的个数依次设置为128，256，每个卷积核大小均设置为1×1，卷积步长均设置为1。

由于七个量化模块中共有五个卷积核大小为3×3的卷积层，因此，二值量化卷积神经网络具有很大的感受野，能够充分提取出高光谱图像云层的空间特征信息。

池化层Pool₂采用平均池化方式，将池化层的池化卷积核大小设置为4×4，池化步长设置为4。

将全连接层FC₂的输出节点个数设置为2。

步骤5.初始化二值量化卷积神经网络。

将训练好的全精度卷积神经网络中第一至第七卷积层的每个卷积核的每个权重，分别赋值给二值量化卷积神经网络中第一至第七量化模块中卷积层的每个卷积核的每个权重，将赋值后的二值量化卷积神经网络中每个卷积核的所有权重组成一个权重矩阵。

利用下式，二值量化每个量化模块中卷积层的每个卷积核的权重矩阵。

表示赋值后第l个量化模块中卷积层的第k个卷积核的权重矩阵，||·||₁表示一范数操作，*表示乘法操作，sign(·)表示符号函数。

将训练好的全精度卷积神经网络中全连接层FC₁的每个输出节点的所有权重，各自赋值给二值量化卷积神经网络中全连接层FC₂的每个输出节点的所有权重。

步骤6.训练二值量化卷积神经网络。

将训练集输入到初始化后的二值量化卷积神经网络中，采用与步骤3训练全精度卷积神经网络相同的步骤训练初始化后的二值量化卷积神经网络，得到训练好的二值量化卷积神经网络。

步骤7.对高光谱图像进行分类。

下面结合仿真实验对本发明的效果做进一步的说明：

1.仿真实验条件：

本发明的仿真实验的硬件平台：处理器为Intel(R)Xeon(R)E5-2650 v4 CPU、主频为2.20GHz、内存为125GB、显卡为GeForce GTX 1080Ti。

本发明的仿真实验的软件平台：python3.6和pytorch0.4.1。

2.仿真内容及其结果分析：

本发明的仿真实验是采用本发明的方法对高分一号机载相机拍摄的108张大小为1663×1542×4含有云层的多光谱图像进行云分类，多光谱图像是一种波段数小于10的高光谱图像，将108张大小为1663×1542×4含有云层的多光谱图像裁剪成15660张大小为512×512×4的多光谱图像，从15660张大小为512×512×4的多光谱图像中随机选取12528张多光谱图像组成训练集，将剩余的多光谱图像组成测试集。

为了验证本发明的仿真实验效果，将测试集中所有多光谱图像输入到训练好的二值量化卷积神经网络中进行分类，得到测试集中所有多光谱图像的分类结果，图2是从测试集中选取的分类难度最高的4张多光谱图。

图2(a)和图2(b)代表测试集中分类难度最高的2张多光谱无云图，大小均为512×512×4个像素，云占比均低于10％。图2(a)的水汽含量高使其难以被判为多光谱无云图，图2(b)的下垫面地物的纹理特性与云层的纹理特性近似使其难以被判为多光谱无云图，本发明的方法能够将图2(a)和图2(b)正确地判为多光谱无云图，说明本发明方法能够有效地避免将水汽含量高的无云多光谱图误判为有云多光谱图，能够区分下垫面地物和云层的纹理特性。

图2(c)和图2(d)代表测试集中分类难度最高的2张多光谱有云图，大小均为512×512×4个像素，图2(c)的云占比为61％，图2(d)的云占比为32％。图2(c)大量云层的特征信息与下垫面地物的特征信息大量混合使其难以被判为多光谱有云图，图2(d)云层的特征信息受到云层阴影面的特征信息的干扰使其难以被判为多光谱有云图，本发明的方法能够将图2(a)和图2(b)正确地判为多光谱有云图，说明本发明方法能够有效地抑制下垫面地物特征信息的干扰的同时能够有效地提取云层的空间特征信息，得到正确的分类结果。

为了证明本发明的云分类效果，通过精度公式计算本发明在测试集中的多光谱图像分类精度，所述的精度公式如下：

其中，η表示本发明在测试集中的多光谱图像分类精度，α表示测试集中正确分类的多光谱图像数目，β表示测试集中多光谱图像数目。

使用本发明对测试集中所有多光谱图像进行云分类，得到测试集中正确分类的多光谱图像数目为3077，已知测试集中多光谱图像数目为3132，利用精度公式得到本发明在测试集中的多光谱图像分类精度为98.25％，证明本发明可以得到很高的多光谱图像分类精度。

本发明的方法需要2130000个加法运算数量和319000000个乘法运算数量，加法运算数量是乘法运算数量的149倍，需要9072个浮点参数量和457648个二值参数量，二值参数量是浮点参数量的50倍，证明本发明可以节省大量的乘法运算数量和网络的浮点参数量。

以上仿真实验表明：本发明通过生成的高光谱图像训练集对全精度卷积神经网络进行训练并保存训练好的全精度卷积神经网络中每个卷积层的每个卷积核的所有权重和全连接层的每个节点的所有权重，再将训练好的全精度卷积神经网络中第一至第七卷积层的每个卷积核的每个权重依次赋值给二值量化卷积神经网络中第一至第七量化模块中卷积层的每个卷积核的每个权重，然后将训练好的全精度卷积神经网络中全连接层的每个节点的每个权重依次赋值给二值量化卷积神经网络中全连接层的每个节点的每个权重，能够减少高光谱图像特征信息的冗余，精简二值量化卷积神经网络结构，通过生成的高光谱图像训练集对二值量化卷积神经网络进行训练，能够减少二值量化卷积神经网络的浮点参数，降低二值量化卷积神经网络的乘法运算数量，解决了现有技术方法中存在的高光谱图像的边缘模糊、神经网络结构复杂、神经网络高额的存储空间和提取云的空间特征信息不足的问题，是一种非常实用的高光谱图像分类方法。