CN111325259A

CN111325259A - 一种基于深度学习和二进制编码的遥感图像分类方法

Info

Publication number: CN111325259A
Application number: CN202010093312.7A
Authority: CN
Inventors: 何楚; 张清怡; 石紫珊; 汪悦恺; 林明远
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2020-02-14
Filing date: 2020-02-14
Publication date: 2020-06-23

Abstract

本发明公开了一种基于深度学习和二进制编码的遥感图像分类方法。首先采用局部二值模式LBP提取图像的统计纹理特征，对ResNet‑50提取的深层特征的进行补充，并进一步指导融合网络的特征学习，以增强特征的可分辨性。特征融合后，特征的多样性和复杂性都增加了，因此本发明提出了新的损失函数，在交叉熵函数的基础上加入了一个正则项，来进一步指导网络参数的学习从而提高网络在遥感图像上的分类性能。

Description

一种基于深度学习和二进制编码的遥感图像分类方法

技术领域

本发明属于图像处理技术领域，特别涉及一种基于深度学习和二进制编码的网络用于遥感图像分类的。

背景技术

图像分类一直以来就是计算机视觉中重要的基本问题，也是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。本发明主要针对遥感图像分类。遥感图像分类是一个具有开放性和挑战性的研究方向，对于理解包括植被图，城市规划，土地资源管理和环境监测在内的众多应用的高分辨率遥感图像至关重要。由于遥感图像中目标的多样性与复杂性，遥感图像信息类型的多样性，以及从遥感图像中提取信息的多样性，该问题具有挑战性。目前，传统的分类方法在遥感应用中仍然起到较大的作用。随着计算机计算能力的迅速增强，决策树分类法、专家系统、模糊分类方法和神经网络等一些先前工程实现困难的新方法也在遥感图像处理中开始发挥作用。近年来，深度学习方法在卫星影像分析方面取得了突破性进展。

纵观现有技术的方法，至少存在如下技术问题：

首先，在深度模型中用于分类的特征通常是在模型后端提取的全局特征，只包含很少的图像局部特征。全局特征已经被证明在分类任务中很重要，但同时局部特征可以增强特征的判别性，也有助于图像分类。此外，当图像中存在旋转和噪声时，与深度特征相比，传统的手工特征已被证明很有竞争性。这两种类型的特征各有特点，在某些方面可以互相借鉴。

其次，特征融合后，不仅特征的多样性增加了，特征的复杂度也增加了。当通过最小化损失函数来训练模型时，正则项可以被用来与损失函数一起改善模型的分类性能，因此更适合该算法的损失函数需要被提出。

由此可知，现有技术中的方法存在构建的模型分类性能不佳的技术问题。

发明内容

本发明针对现有技术的不足，提供一种基于深度学习和二进制编码的的遥感图像分类方法。

本发明的技术方案为一种基于深度学习和二进制编码的遥感图像分类方法，包括以下步骤：

步骤1，准备好N张待分类遥感图像数据集D，数据集中的图像类别数为A；

步骤2，利用LBP算法提取图像的纹理特征，

步骤3，在数据集D上训练ResNet-50深度模型；

首先加载在ImageNet数据集上预训练好的ResNet-50网络模型，然后将最后一层全连接层的输出维数由原来的2048维修改为数据集D的图像类别A，在数据集D上采用随机梯度下降和反向传播算法进行微调，通过反复的迭代学习得到在数据集D上收敛的ResNet-50 深度模型；

步骤4，训练用于分类的融合网络，

融合网络的处理过程为：首先将步骤2中提取的LBP特征与步骤3中ResNet-50深度模型中最后一层全连接层之前的深度特征进行融合，然后输入到最后一层全连接层，并通过 softmax函数将全连接层的输出转换为概率分布，然后使用损失函数L计算实际概率分布与预测概率分布之间的损失，最后使损失函数L收敛，完成融合网络的训练；

步骤5，利用训练好的融合网络进行遥感图像分类。

进一步的，在步骤2中，LBP算子计算过程可分为三步，对于一张灰度图像，首先计算图像中邻域像素值和中心像素值的差值x，然后将差值x代入阶跃函数

像素值不低于中心像素值的邻域置1，像素值低于中心像素值的邻域置0；然后，按照LBP编码规则

将二进制关系加权成LBP码，其中P表示采样数，R表示采样半径，g_c表示该中心像素的灰度值，g_p表示该中心像素的第p个邻域的灰度值；最后通过遍历所有LBP像素值，建立直方图来表示该图的纹理特征；

假设图像尺寸是I×J，对于3×3邻域内8个采样点来说，LBP一共有256种不同的编码值，则直方图表达为：

其中：

其中，i是图像的横坐标，j是图像的纵坐标，对于3*3邻域来说，k是特征值0-255中的值。

进一步的，在步骤4中，融合网络通过softmax函数将全连接层的输出转换为概率分布，然后使用损失函数L计算实际概率分布与预测概率分布之间的损失，损失函数L由交叉熵损失函数和正则项构成，

交叉熵损失函数为

其中y_i是第i个实际概率分布，p_i是第i个预测概率分布，A表示维度，i的取值为1-A；正则项为

其中λ是正则项系数，d_ij是距离矩阵D中的元素，表示将y_i移动到p_j上的成本，当i＝j时，d_ij＝0，当i≠j时，d_ij＝1；f_ij是耦合矩阵F中的元素，表示从y_i移动到p_j时需要分配的概率质量，f_ij≥0，

通过求解最优传输问题找到合适的耦合矩阵F使得

取得最小值。

进一步的，λ的取值为10。

本发明目的在于探索传统手工特征和深度特征之间结合的可能性，并且有机的结合这两种特征来提高遥感图像分类性能。首先，由于基于深度特征的方法和基于手工特征的方法在某些方面是互补的，因此本发明将这两种类型的特征结合起来以获得更好的图像特征。具体地说，引入了LBP提取的手工二进制编码特征，以补充有代表性的深度模型ResNet-50提取的深层特征，从而使图像特征更加准确和全面。其次，本发明提出了一种新的损失函数，该函数将交叉熵损失函数与一个正则项相结合来判断实际概率分布与预测概率分布之间的损失。在遥感图像分类上本发明的性能与一般深度网络相比具有明显的提升。

附图说明

图1本发明实施例的网络结构说明图。

具体实施方式

以下结合附图和实施例详细说明本发明技术方案。本发明中利用LBP与深度模型互相补充得到的网络结构如图1所示。网络的训练过程包括以下4个步骤：

步骤1，准备待分类的遥感图像数据集。

准备好N张待分类遥感图像数据集D，数据集中的图像类别数为A。将数据集D平均分成两个不重叠的子数据集D_t,D_v，分别用于训练和验证；所有数据集图像的大小为m×m像素。

步骤2，通过手工设计的LBP算法提取图像的纹理特征。

LBP算子计算过程可分为三步。对于一张灰度图像，首先计算图像中邻域像素值和中心像素值的差值x，然后将差值x代入阶跃函数

像素值不低于中心像素值的邻域置1，像素值低于中心像素值的邻域置0。然后，按照LBP编码规则

将二进制关系加权成LBP码，其中P表示采样数，R表示采样半径，g_c表示该中心像素的灰度值，g_p表示该中心像素的第p个邻域的灰度值。最后通过遍历所有LBP像素值，建立直方图来表示该图的纹理特征。假设图片尺寸是I×J，对于3×3邻域内8个采样点来说，LBP一共有256种不同的编码值，则直方图表达为：

其中：

i是图像的横坐标， j是图像的纵坐标，对于3*3邻域来说，k是特征值0-255中的值。这里当k＝0时，遍历图像中每个像素的LBP值，当LBP值为0时，H(0)加1，因此得到图像中LBP特征值为0的个数。以此类推，得到LBP特征图中0-255特征值的统计直方图。

步骤3，在数据集D上训练ResNet-50深度模型；本发明用ResNet-50网络来提取深度特征。ResNet-50网络在卷积神经网络中引入了残差模块来解决加深网络导致准确度下降的问题。每个残差模块包含两条路径，其中一条路径对该特征做三次卷积操作得到该特征的残差，另一条路径是输入特征的直连通路，最后再将两条路径上的特征相加。模块中第一个1*1 卷积用来降维，第二个1*1卷积用来升维，这样中间3*3卷积的输入和输出通道数都较小，要学习的参数可以明显减少。ResNet-50网络中共有4种残差模块，每种残差模块分别重复3 次、4次、6次、3次。首先加载在ImageNet数据集上预训练好的ResNet-50网络模型，然后将最后一层全连接层的输出维数由原来的2048维修改为数据集D的图像类别A，在数据集D上采用随机梯度下降和反向传播算法进行微调，通过反复的迭代学习得到在数据集D上收敛的ResNet-50深度模型。

步骤4，训练用于分类的融合网络。

网络结合了传统方法与深度方法，由两条并联的网络构成，分别是深度模型ResNet-50 网络和LBP特征流，不同于将深度特征与手工纹理特征直接融合，本发明利用手工纹理特征来指导深度网络进一步学习，得到融合网络，在数据集D上训练好ResNet-50深度模型以后，将手工提取的256维LBP特征与最后一层全连接层之前的深度特征进行融合，然后输入到输入维数为2304维(2304维是指最终融合后的特征的维度，2048+256＝2304)，输出维数为数据集D的图像类别A的全连接层。我们对交叉熵损失函数加上一个正则项，然后重新在数据集D上进行微调。损失函数L由交叉熵损失函数和正则项构成，交叉熵损失函数为

其中λ是正则项系数(本实施例中，λ的经验取值为10)，d_ij是距离矩阵D中的元素，表示将y_i移动到p_j上的成本，当i＝j时，d_ij＝0，当i≠j时，d_ij＝1，即将相同类别的距离值设为0，不同类别的距离值设为1。f_ij是耦合矩阵F中的元素，表示从y_i移动到p_j时需要分配的概率质量，f_ij≥0，

通过求解最优传输问题找到合适的耦合矩阵F使得

取得最小值；因此损失函数

当分数向量(即融合网络最后一层全连接层的输出，是A维向量)从全连接层输出时，本发明通过softmax函数将其转换为概率分布，然后使用损失函数L计算实际概率分布与预测概率分布之间的损失。由于LBP特征流中没有可学习的参数，因此反传时不会改变LBP的特征值，但是LBP特征中含有丰富的先验信息，和深度特征融合以后输入全连接层，在经过损失函数以及随机梯度下降和反向传播算法以后可以间接的对深度特征流的网络参数产生影响，对融合后的网络进行学习直到收敛；

至此，训练好的网络可用于遥感图像分类。

在AID遥感数据库上，训测比20：80，CaffeNet的分类准确率89.53％，GoogLeNet的分类准确率90.15％，本发明方法的分类准确率为92.42％，由此可以说明本发明方法在精度上有一定的提升。

本文中所描述的具体实施例仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims

1.一种基于深度学习和二进制编码的遥感图像分类方法，其特征在于，包含以下步骤：

步骤2，利用LBP算法提取图像的纹理特征，

步骤3，在数据集D上训练ResNet-50深度模型；

首先加载在ImageNet数据集上预训练好的ResNet-50网络模型，然后将最后一层全连接层的输出维数由原来的2048维修改为数据集D的图像类别A，在数据集D上采用随机梯度下降和反向传播算法进行微调，通过反复的迭代学习得到在数据集D上收敛的ResNet-50深度模型；

步骤4，训练用于分类的融合网络，

融合网络的处理过程为：首先将步骤2中提取的LBP特征与步骤3中ResNet-50深度模型中最后一层全连接层之前的深度特征进行融合，然后输入到最后一层全连接层，并通过softmax函数将全连接层的输出转换为概率分布，然后使用损失函数L计算实际概率分布与预测概率分布之间的损失，最后使损失函数L收敛，完成融合网络的训练；

步骤5，利用训练好的融合网络进行遥感图像分类。

2.根据权利要求书1所述一种基于深度学习和二进制编码的遥感图像分类方法，其特征在于：在步骤2中，LBP算子计算过程可分为三步，对于一张灰度图像，首先计算图像中邻域像素值和中心像素值的差值x，然后将差值x代入阶跃函数

其中：

3.根据权利要求书1所述一种基于深度学习和二进制编码的遥感图像分类方法，其特征在于：在步骤4中，融合网络通过softmax函数将全连接层的输出转换为概率分布，然后使用损失函数L计算实际概率分布与预测概率分布之间的损失，损失函数L由交叉熵损失函数和正则项构成，

交叉熵损失函数为

通过求解最优传输问题找到合适的耦合矩阵F使得

取得最小值。

4.根据权利要求书3所述一种基于深度学习和二进制编码的遥感图像分类方法，其特征在于：λ的取值为10。