CN115049941A

CN115049941A - 一种改进的ShuffleNet卷积神经网络及其遥感图像的分类方法

Info

Publication number: CN115049941A
Application number: CN202210738442.0A
Authority: CN
Inventors: 苏宇轩; 李子奇; 施林枫; 廖俊杰
Original assignee: Wuxi University
Current assignee: Wuxi University
Priority date: 2022-06-27
Filing date: 2022-06-27
Publication date: 2022-09-13

Abstract

本发明公开了一种改进的ShuffleNet卷积神经网络及其遥感图像的分类方法，该方法构建并训练ShuffleNet卷积神经网络，获取图像数据集并将图像数据集中的数据划分为训练集和测试集，对图像数据集进行预处理，并裁剪成分辨率为224×224的图像，将裁剪后的图像输入到Conv1层进行卷积运算，并对训练集中的图像进行特征提取，将特征提取后的图像输入到最大重叠池化层，将最大重叠池化层处理后的图像输入到ShuffleNet V2网络组成的三个阶段中，将第三个阶段输出的图像依次输入到Conv5层、SE模块、全局平均池化层、全连接层中，得到训练好的ShuffleNet卷积神经网络，将测试集输入至训练好的ShuffleNet卷积神经网络，得到图像分类结果。本发明可以有效地减少网络的内存占用量，有着较好的分类准确率。

Description

一种改进的ShuffleNet卷积神经网络及其遥感图像的分类方法

技术领域

本发明涉及图像分类技术领域，特别是涉及一种改进的ShuffleNet卷积神经网络及其遥感图像的分类方法。

背景技术

近些年，随着航空遥感技术与卫星遥感技术的不断发展，出现了越来越多的由特殊卫星传感器提供的高分辨率遥感图像。对于这些遥感图像的有效处理，在城市规划、土地利用、灾害检测、天气预测、环境监测等众多实际应用中具有重要的意义，这些应用的有效性取决于分类模型的精度是否足够优秀。

人工手动对大量遥感图像进行识别与分类是不容易实现的，这些数量庞大的遥感图像迫切需要以自动和准确的方式进行处理与解释。提高遥感图像处理的自动化程度，不仅可节省大量的人力资源，并且可在保证解译精度的前提下，有效提升遥感图像的处理速度，从而提高遥感图像的利用率。

近些年，研究学者们对遥感图像的处理大多是采用机器学习的方法。视觉词袋模型(BoVW)是将图像分割成越来越精细的子区域，根据场景的低层特征来提取出相互独立的特征词汇，然后利用K-means算法等聚类算法合并词义相近的视觉词，构成一个单词表，但它基于手工提取的特征，难度大且耗时长。其他的传统机器学习方法如支持向量机(SVM)、决策树和贝叶斯分类网络也经常被用到，不过对遥感图像的分类准确性不高。

卷积神经网络(CNN)在解决图像处理问题时大放异彩，赢得了很多研究学者的青睐。卷积神经网络是一种前馈型神经网络，由一堆可自主学习的卷积滤波器组成，这些滤波器可以提取分层的上下文图像特征。卷积神经网络具有的局部感受野和权值共享特点，能够有效减少训练参数数目，池化层能够聚集不同位置的特征，在降低维度的同时还能避免过拟合。与传统的统计学方法相比，卷积神经网络无需对概率模型做出假设，提取特征的能力更强，具有极强的学习能力和容错能力，适用于解决模式识别的各种问题。

卷积神经网络相较于传统的图像处理算法的优点之一在于避免了对图像复杂的前期预处理过程，尤其是人工参与图像预处理过程，卷积神经网络可以直接输入原始图像进行一系列工作。因此，卷积神经网络因其能够自动发现图像分类问题中的相关上下文特征而受到广泛的应用，其在大型图像处理方面有出色的表现，目前已经被大范围使用到图像分类、定位等领域中。

现如今，研究学者们在构建卷积神经网络时为了追求更高的网络性能，通常通过加深网络的层数的操作使得卷积神经网络拥有更好的分类准确率，但同时CNN的体积越来越大、结构越来越复杂，训练和预测所需要的硬件资源也逐步增多，这些弊端使得大型的CNN往往只能在高计算能力的服务器中运行。因此移动嵌入式设备也就由于硬件资源、计算能力以及存储的限制，很难运行复杂的深度学习网络模型。所以需要一种能减少计算成本，且能提高卷积神经网络性能的图像分类方法。

现有技术公开了一种图像分类方法、装置、存储介质及电子设备，其中，首先确定需要进行图像分类的目标图像，然后调用预训练的图像分类模型，该图像分类模型包括特征提取模块和分类模块，其中特征提取模块包括依次连接的多个ShuffleNet v2单元，ShuffleNet v2单元采用Leaky ReLu函数作为激活函数，利用基于多个ShuffleNet v2单元逐层对目标图像进行特征提取，得到目标图像的图像特征，最后基于分类模块对图像特征进行分类预测，得到目标图像的预测类别。相较于相关技术，无需用户手动对电子设备上的图像进行分类，能够有效提高电子设备进行图像分类的效率，但该发明图像分类准确率较低，

发明内容

本发明提供一种改进的ShuffleNet卷积神经网络及其遥感图像的分类方法，以较少的参数量和计算量获得高准确度的遥感图像分类结果。

为解决上述技术问题，本发明的技术方案如下：

一种改进的ShuffleNet卷积神经网络，所述改进的ShuffleNet卷积神经网络从前至后为Conv1层、最大重叠池化层、ShuffleNet V2网络、Conv5层、SE模块、全局平均池化层和全连接层，ShuffleNet V2网络包括依次连接的Stage1、Stage2和Stage3。

进一步的，最大重叠池化层由以下步骤实现：将ShuffleNet V2网络中最大池化层的填充补零操作移除，使得池内核的大小大于步长值，池化层的输出相互重叠并覆盖以形成最大重叠池化层。

进一步的，改进的ShuffleNet卷积神经网络中的每一个卷积层均包含一系列的非线性变换，所述非线性变换包含批量归一化、ReLU激活函数和卷积操作；其中，

批量归一化：把每一层的输入图像变换为均值为0、方差为1的正态分布，得到标准化结果，公式如下：

其中，μ_B为特征平均值，

为特征的方差，γ、β为引入的参数，∈是添加到最小批量方差的常数；

ReLU激活函数通过以下公式实现：

卷积操作公式如下：

其中，xi＝[x₁,x₂,...,x_D]是有D个通道的张量输入，w_i是卷积核上对应第i个通道上的权重；卷积层的输出张量大小满足以下公式：

其中，O为输出张量的尺寸，I为输入张量的尺寸，K为卷积核的尺寸，P为零填充数，S为移动步长，输出张量的通道数等于卷积核数。

进一步的，Conv1层卷积核大小由原来的3×3改进为5×5。

进一步的，最大重叠池化层采用步长为2的3×3的最大重叠池化层。

进一步的，Conv5层的卷积核大小由原来的1×1改进为3×3。

上述方案中，卷积核大小由原来的1×1改进为3×3后，与小卷积核相比，尺寸较大的卷积核可以提取出输入图像更大邻域范围的信息。

一种遥感图像的分类方法，包括以下步骤：

步骤1、获取图像数据集并将图像数据集中的数据划分为训练集和测试集；

步骤2、对图像数据集进行预处理，并裁剪成分辨率为224×224的图像；

步骤3、将裁剪后的图像输入到Conv1层进行卷积运算，并对训练集中的图像进行特征提取；

步骤4、将特征提取后的图像输入到最大重叠池化层来增强输入图像的细节特征和分类精度；

步骤5、将最大重叠池化层处理后的图像输入到ShuffleNet V2网络组成的三个阶段中；

步骤6、将第三个阶段输出的图像依次输入到Conv5层、SE模块、全局平均池化层、全连接层中，得到训练好的ShuffleNet卷积神经网络；

步骤7、将测试集输入至训练好的ShuffleNet卷积神经网络，得到图像分类结果。

上述方案中，SE模块是注意力机制模块中的一种。步骤1中图像数据集的分辨率为256×256，训练集用于训练模型，测试集用于预测和评估模型，将图像数据集作为输入图像。

进一步的，步骤2中预处理包括标准化和归一化，即：

其中，μ是图片的均值，X表示图片的张量，σ表示标准方差，max表示图片张量的最大值，min表示图片张量的最小值，X₁表示标准化后的图片张量，x⁰表示归一化后的图片张量。

进一步的，步骤5中三个阶段卷积核的大小设置为7×7，每个阶段均包括下采样模块和基本模块，Stage1由1个下采样模块和3个普通模块组成，Stage2由1个下采样模块和7个普通模块组成，Stage3由1个下采样模块和3个普通模块组成。

进一步的，对步骤7中训练好的ShuffleNet卷积神经网络的ShuffleNet V2网络设置如下交叉熵损失函数：

其中，y_i为标签值，y′_i为预测值。

与现有技术相比，本发明技术方案的有益效果是：

1.本发明ShuffleNetV2网络为轻量化网络，通过适当地增大卷积核的尺寸，特别是增大ShuffleNet V2模块中的卷积核，可以有效地减少网络的内存占用量，有着较好的分类准确率。

2.本发明在ShuffleNetV2网络中加入了SE模块，解决在卷积池化过程中特征图的不同通道所占的重要性不同带来的损失问题。与传统轻量化网络相比，本发明ShuffleNetV2网络分类性能更好，同时占用内存远小于大型网络；与大型网络相比，本发明ShuffleNetV2网络训练速度更快，可以部署到移动设备中。

3.本发明将ShuffleNet V2网络中最大池化层的填充补零操作移除，使得池内核的大小大于步长值，池化层的输出相互重叠并覆盖以形成最大重叠池化层，从而增强输入图像的细节特征和分类精度。

4.本发明对测试样本的分类效果良好，在遥感图像数据集上得到的实验结果均优于基础网络，可以用于遥感图像的分类。

附图说明

附图仅用于示例性说明，不能理解为对本专利的限制；

为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；

对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

图1为本发明实施例提供的图像分类方法流程示意图；

图2是本发明实施例提供的改进的ShuffleNet V2网络结构示意图。

图3是本发明实施例提供的改进后的ShuffleNet V2网络示意图；

图4是本发明实施例提供的SE模块的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都是本发明保护的范围。

实施例1

为了便于理解，请参阅图1-图4，本发明提供的一种改进的ShuffleNet卷积神经网络及其遥感图像的分类方法的一个实施例，包括：

具体的，最大重叠池化层由以下步骤实现：将ShuffleNet V2网络中最大池化层的填充补零操作移除，使得池内核的大小大于步长值，池化层的输出相互重叠并覆盖以形成最大重叠池化层。

具体的，改进的ShuffleNet卷积神经网络中的每一个卷积层均包含一系列的非线性变换，所述非线性变换包含批量归一化、ReLU激活函数和卷积操作；其中，

其中，μ_B为特征平均值，

ReLU激活函数通过以下公式实现：

卷积操作公式如下：

其中，x_i＝[x₁,x₂,...,x_D]是有D个通道的张量输入，w_i是卷积核上对应第i个通道上的权重；卷积层的输出张量大小满足以下公式：

上述方案中，ReLU激活函数用来加入非线性因素，既能增强模型的学习能力，又不会存在梯度消失问题。

具体的，Conv1层卷积核大小由原来的3×3改进为5×5。与小卷积核相比，尺寸较大的卷积核可以提取出输入图像更大邻域范围的信息。

具体的，最大重叠池化层采用步长为2的3×3的最大重叠池化层。

具体的，Conv5层的卷积核大小由原来的1×1改进为3×3。

一种遥感图像的分类方法，包括以下步骤：

上述方案中，通过全局平均池化运算可以进一步增强图像的特征信号。

具体的，步骤5中三个阶段卷积核的大小设置为7×7，每个阶段均包括下采样模块和基本模块，下采样模块步长为2，普通模块步长为1。Stage1由1个下采样模块和3个普通模块组成，Stage2由1个下采样模块和7个普通模块组成，Stage3由1个下采样模块和3个普通模块组成。这样可以使模型做更多次的卷积运算从而更好地提取输入图像的特性信息。如图3所示，(a)为普通模块，(b)为下采样模块，Channel Split操作表示将特征通道的输入分成两支；Channel Shuffle的操作表示通道重排操作，增强通道间信息的交流，增强模型的学习能力。

上述方案中，通过引入注意力机制使模型获得更好的性能。如图4所示SE模块中，输入X是C’×H’×W’的张量，经过卷积操作F_tr生成特征图U，大小为C×H×W，然后对特征图U进行压缩F_sq操作，保留通道数C不变，将H×W变成1×1，接下来通过F_ex激活操作，使用一个全连接网络对压缩后的结果进行非线性变换，但不改变操作前后的大小和通道数，最终算出不同通道的权值。最后再将激活后的结果与U对位相乘得到最后的结果。

本发明提出的卷积神经网络是在ShuffleNet V2模型的基础上进行改进。为了能够接近大型卷积神经网络的分类准确率，同时又保证占用较少内存，故本发明以轻量化网络ShuffleNet作为主干网络，并且适当地增大ShuffleNet V2网络中的卷积核的尺寸，使卷积神经网络模型做更多次的卷积运算，从而更好地提取输入图像的特性信息，同时在一定程度上减少计算量。

实施例2

具体地，在实施例1的基础上，结合具体的实施例子对方案进行说明，进一步体现本方案的技术效果。具体为：

对步骤6中训练好的ShuffleNet卷积神经网络的ShuffleNet V2网络设置如下交叉熵损失函数：

其中，y_i为标签值，y′_i为预测值。

将测试集的图片张量输入到卷积神经网络进行反复训练，得到测试图片属于每个类别的概率，将概率最大的类别，记为图片的预测标签。预测结果实际为[0,1]之间的数值。假设得到的预测结果为P＝(0.7,0.2,0.1)，则预测标签记为Y＝(1,0,0)。对比预测标签和图片的正确类别，计算测试集中预测正确的数量，从而计算得到ShuffleNet V2卷积神经网络的预测准确度，即预测正确的数量与总图片数的比值。

在实施过程中，设定训练100次，达到规定的训练次数后，输出分类准确度，保存ShuffleNet卷积神经网络模型，此时得到分类准确率结果90.9％，比原来提升了3.1％。

当前卷积神经网络ShuffleNet卷积神经网络为了获得性能提升，容易造成模型容量规模过大的问题，本发明对轻量级的ShuffleNet V2网络卷积核大小进行改进，得到改进的ShuffleNet V2网络，改进的ShuffleNet V2网络使用少量参数就可以获得很好的性能，通过引入注意力机制，增加少量参数，使改进的ShuffleNet V2网络更好地获取不同通道上的特征，从而提高准确率。此外，本发明将最大池化层的填充补零操作移除，使步长值小于池内核的大小，使其变为最大重叠池化操作，从而提高输入图像的细节特征和分类精度。

本发明将轻量级卷积神经网络中的ShuffleNet V2网络选取为主干网络，同时适当增大部分卷积核来提升网络的分类精度，并且使用最大重叠池化层增强输入图像的细节特征，最后引入高性能的激励模块(SE模块)作为注意力机制来改进网络的体系结构。通过训练ShuffleNet V2网络，计算损失函数，测试ShuffleNet V2网络，计算分类准确度，构建保存训练结束后的ShuffleNet V2网络模型参数，本发明设计的ShuffleNet V2网络相较于传统的卷积神经网络图像中的分类方法，能够以较少的参数量和计算量获得高准确度的遥感图像分类结果。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种改进的ShuffleNet卷积神经网络，其特征在于，所述改进的ShuffleNet卷积神经网络从前至后为Conv1层、最大重叠池化层、ShuffleNet V2网络、Conv5层、SE模块、全局平均池化层和全连接层，ShuffleNet V2网络包括依次连接的Stage1、Stage2和Stage3。

2.根据权利要求1所述一种改进的ShuffleNet卷积神经网络，其特征在于，最大重叠池化层由以下步骤实现：将ShuffleNet V2网络中最大池化层的填充补零操作移除，使得池内核的大小大于步长值，池化层的输出相互重叠并覆盖以形成最大重叠池化层。

3.根据权利要求1所述的一种改进的ShuffleNet卷积神经网络，其特征在于，改进的ShuffleNet卷积神经网络中的每一个卷积层均包含一系列的非线性变换，所述非线性变换包含批量归一化、ReLU激活函数和卷积操作；其中，

其中，μ_B为特征平均值，

ReLU激活函数通过以下公式实现：

卷积操作公式如下：

4.根据权利要求1所述一种改进的ShuffleNet卷积神经网络，其特征在于，Conv1层卷积核大小由原来的3×3改进为5×5。

5.根据权利要求1所述一种改进的ShuffleNet卷积神经网络，其特征在于，最大重叠池化层采用步长为2的3×3的最大重叠池化层。

6.根据权利要求1所述一种改进的ShuffleNet卷积神经网络，其特征在于，Conv5层的卷积核大小由原来的1×1改进为3×3。

7.一种遥感图像的分类方法，应用于权利要求1-6任一项所述的一种改进的ShuffleNet卷积神经网络中，其特征在于，包括以下步骤：

8.根据权利要求7所述的一种遥感图像的分类方法，其特征在于，步骤2中预处理包括标准化和归一化，具体为：

9.根据权利要求7所述的一种遥感图像的分类方法，其特征在于，步骤5中三个阶段卷积核的大小设置为7×7，每个阶段均包括下采样模块和基本模块，Stage1由1个下采样模块和3个普通模块组成，Stage2由1个下采样模块和7个普通模块组成，Stage3由1个下采样模块和3个普通模块组成。

10.根据权利要求7所述的一种遥感图像的分类方法，其特征在于，对步骤6中训练好的ShuffleNet卷积神经网络的ShuffleNet V2网络设置如下交叉熵损失函数：

其中，y_i为标签值，y′_i为预测值。