CN117351354B

CN117351354B - 基于改进MobileViT的轻量级遥感图像目标检测方法

Info

Publication number: CN117351354B
Application number: CN202311348496.7A
Authority: CN
Inventors: 李冠群
Original assignee: Genyu Muxing Beijing Space Technology Co ltd
Current assignee: Genyu Muxing Beijing Space Technology Co ltd
Priority date: 2023-10-18
Filing date: 2023-10-18
Publication date: 2024-04-16
Anticipated expiration: 2043-10-18
Also published as: CN117351354A

Abstract

本发明涉及遥感图像处理技术领域，具体涉及一种基于改进MobileViT的轻量级遥感图像目标检测方法，包括：搭建基于改进MobileViT的轻量级骨干特征提取网络；轻量级骨干特征提取网络包括：基础卷积算子、多尺度特征提取模块和轻量级通道计算模块；基于轻量级骨干特征提取网络搭建遥感图像目标检测模型；对遥感图像目标检测模型进行训练和测试。本发明具有体积小，计算量低，模型轻量化的优点，有效解决了传统模型因计算量和体积过大导致的边缘设备部署难题。

Description

基于改进MobileViT的轻量级遥感图像目标检测方法

技术领域

本发明涉及遥感图像处理技术领域，更具体的说是涉及一种基于改进MobileViT的轻量级遥感图像目标检测方法。

背景技术

遥感图像目标检测旨在解读遥感图像以获取潜在目标的类别和位置信息，这在交通检测、海洋监管和空间侦察中具有重要意义。随着深度学习技术的发展，许多深度学习模型被用于遥感图像目标检测，这些模型通常在大规模数据集上进行训练，可以实现高精度的目标检测。然而，目前的深度学习模型在遥感图像目标检测中存在一些问题，其中之一是它们的计算量和体积较大。这些模型通常包含数百万到数亿个参数，需要大量的计算资源来运行。这导致了在边缘设备上部署这些模型时的难题，因为边缘设备通常具有有限的计算和存储资源。此外，遥感图像具有目标尺度变化大的特点，给目标检测任务带来了挑战，这使得典型目标检测模型在遥感图像上的检测性能存在瓶颈。因此，提取潜在目标的多尺度特征，从而提升模型预测性能变得尤为重要。因此，需要一种轻量级的遥感图像目标检测方法，以实现在计算和存储资源有限的边缘设备上高效运行并且保持足够的检测精度，同时具备优秀的多尺度特征提取能力，以应对遥感图像目标尺度变化的难题。

发明内容

有鉴于此，本发明提供了一种基于改进MobileViT的轻量级遥感图像目标检测方法，具有体积小，计算量低，模型轻量化的优点，有效解决了传统模型因计算量和体积过大导致的边缘设备部署难题。

为了实现上述目的，本发明采用如下技术方案：

一种基于改进MobileViT的轻量级遥感图像目标检测方法，包括以下步骤：

搭建基于改进MobileViT的轻量级骨干特征提取网络；所述轻量级骨干特征提取网络包括：基础卷积算子、多尺度特征提取模块和轻量级通道计算模块；所述基础卷积算子对原始遥感图像进行特征提取，得到初始特征图；所述多尺度特征提取模块对所述初始特征图进行多尺度特征提取，得到多尺度特征图；所述轻量级通道计算模块对所述多尺度特征图进行局部特征提取，并采用通道代表性思想对局部特征图进行划分、部分特征编解码和拼接，再将拼接后的特征图与初始的所述多尺度特征图进行融合；

基于所述轻量级骨干特征提取网络搭建遥感图像目标检测模型；

对所述遥感图像目标检测模型进行训练和测试；

基于训练和测试后的所述遥感图像目标检测模型对遥感图像进行目标检测。

进一步的，所述多尺度特征提取模块包括：点卷积单元、深度分离卷积单元和多尺度卷积单元；

所述点卷积单元负责调整输入特征图和输出特征图的通道维度；

所述深度分离卷积单元作为主要的特征提取器对输入图像进行特征提取；

所述多尺度卷积单元对所述深度分离卷积单元所提取特征的基础上进一步提取多尺度特征，以丰富特征图的信息表示；

所述多尺度特征提取模块的计算过程表示为：

F₁＝PSConv(Conw1_1*1(DWConv(Conv2_1*1((input₁)))))+Conv1_1*1(DWConv(Conv2_1*1((input₁))))

其中，Conv1_1*1为第一点卷积单元；Conv2_1*1为第二点卷积单元；DWConv为深度分离卷积单元；input₁为多尺度特征提取模块的输入特征图；F₁为经多尺度特征提取模块提取后的输出特征图；+表示特征图像的相加操作；PSConv为多尺度卷积单元。

进一步的，所述多尺度卷积单元由多个不同扩张系数的卷积算子和通道混洗算子组成；多个所述卷积算子相并联，并组成多个分支，其中一个分支上的所述卷积算子接收所述通道混洗算子混洗后的特征图输出，其他分支上的所述卷积算子分别进行多尺度特征提取，最后将各分支输出的特征图进行相加，得到所述多尺度特征图；

所述多尺度卷积单元的计算过程表示为：

output₁＝Conv_d＝1(input₂)+Conv_d＝2(input₂)+f_{channelReplace}(Conv_d＝4(input₂))

其中，Conv_d表示扩张系数为d的卷积算子，input₂为所述多尺度卷积单元的输入特征图，output₁为所述多尺度卷积单元的输出特征图；f_{channelReplace}表示通道混洗算子，用于重新排列特征图的通道位置，以辅助卷积算子获得多尺度特征。

进一步的，所述轻量级通道计算模块包括：局部特征表示算子、编码-解码结构、通道划分算子和特征复用算子；

所述局部特征表示算子由尺寸为3×3和1×1的卷积级联得到，用于改变所述多尺度特征图的尺寸和通道数，并通过点卷积计算得到局部特征图；

所述通道划分算子将所述局部特征图划分为3∶1，将1/4部分特征图输入至所述编码-解码结构进行编解码计算，剩余3/4部分特征图不参与任何计算并且与编解码计算后的1/4特征图进行拼接，得到拼接特征图；

所述特征复用算子将所述拼接特征图与初始输入的所述多尺度特征图进行融合，得到最终用于检测的完整特征图。

进一步的，所述局部特征表示算子的计算过程表示为：

Feature＝f_{LocalRepresent}(X)

其中，X为所述局部特征表示算子的输入特征图，即所述多尺度特征提取模块输出的多尺度特征图；Feature为经过所述局部特征表示算子计算后得到的输出特征图，即所述局部特征图；f_{LocalRepresent}表示局部特征表示算子；

所述通道划分算子的计算过程表示为：

Feature_1/4，Feature_3/4＝f_ChannelSplit(Feature)

F₂＝Concat(f_Transfomrmer(Feature_1/4)，Feature_3/4)

其中，f_ChannelSplit为通道划分算子；Feature_1/4，Feature_3/4分别为经过通道划分算子计算后得到的1/4部分特征图和3/4部分特征图；Concat为特征拼接算子；f_Transfomrmer为编码-解码器结构；F₂为拼接后的输出特征图；

所述特征复用算子的计算过程表示为：

Y＝f_Fusion(F₂，X)

其中，Y为最终用于检测的输出特征图，f_Fusion为特征复用算子。

进一步的，所述轻量级骨干特征提取网络的整体计算过程表示为：

Feature＝Conv(img)

Feature＝f_MV2M+(Feature)^N×

Feature＝f_MViTL+(f_MV2M+(Feature))^N×

其中，Feature为经过特征提取的中间层特征，按照顺序结构进行逐层级的运算提取特征；img为原始遥感图像；Conv为基础卷积算子；f_MV2M+和f_MViTL+分别表示所述多尺度特征提取模块和所述轻量级通道计算模块；N×表示模型经过N次运算，即N个相同的所述多尺度特征提取模块堆叠组成。

进一步的，所述遥感图像目标检测模型由所述轻量级骨干特征提取网络、数据加载器、颈部网络和检测头组成；

所述数据加载器将原始遥感图像及其对应的标签信息加载进数据预处理阶段；

所述颈部网络包括卷积模块和融合模块；所述卷积模块负责修改所述轻量级骨干特征提取网络输出特征图的尺寸和通道数；所述融合模块融合不同层级的特征图信息以辅助预测；

所述检测头对所述融合模块融合后的特征图进行解耦，得到潜在目标的类别和位置信息。

进一步的，所述数据加载器的计算过程表示为：

data＝f_dataloder(imgs，labels)

其中，imgs∈R^H×W×3，为尺寸为H×W，通道数为3的原始遥感输入图像；labels为图像中目标的标注信息，包括检测框和类别；f_dataloder为数据加载器函数，用于加载数据和数据增强；

所述轻量级骨干特征提取网络对imgs进行特征提取的过程表示为：

[F₁，F₂，…，F_i，…，F_n]＝f_MobileViT++(imgs)

其中，表示经过特征提取后得到的特征图，尺寸为H_i×W_i，并且有C_i个通道；f_MobileViT++为所述轻量级骨干特征提取网络；

选取最后3层由所述轻量级通道计算模块提取的特征图[F_n-4，F_n-2，F_n]传递给所述颈部网络进行特征融合；所述颈部网络的计算过程表示为：

[P_n-4，P_n-2，P_n]＝f_Neck([F_n-4，F_n-2，F_n])

其中，f_Neck为所述颈部网络，用于特征融合；[P_n-4，P_n-2，P_n]为融合后的输出特征图；

所述检测头的计算过程表示为：

其中，为预测获得的分类信息；/>为预测获得的位置信息；P_i为所述颈部网络进行特征融合输出的特征图；f_cls为分类函数，f_reg为位置回归函数。

进一步的，采用二元交叉熵损失和IoU损失对所述遥感图像目标检测模型进行训练，损失函数表示为：

其中，BCE为二元交叉熵，用于分类；IoU为预测框与真值的交并比损失，用于定位；y为与输入的原始遥感图像对应的目标真值标签；为预测得到的目标类别和位置信息；Loss为网络所述遥感图像目标检测模型所采用的损失。

进一步的，对训练完成后的所述遥感图像目标检测模型进行测试，表示为：

其中，MobileViT-Detector为训练完毕的遥感图像目标检测模型；x_Test和分别为待测试的遥感图像和与其对应的目标检测结果。

经由上述的技术方案可知，与现有技术相比，本发明具有以下有益效果：

1、本发明构建好的遥感图像目标检测模型具有体积小，计算量低，模型轻量化的优点，有效解决了传统模型因计算量和体积过大导致的边缘设备部署难题。

2、本发明遥感图像目标检测模型，能够充分提取遥感图像目标的多尺度特征信息，在面对尺度变化剧烈的遥感图像目标时能够保持高精度的检测性能，提高了遥感图像处理的实际应用价值。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明提供的多尺度特征提取模块的结构示意图；

图2为本发明提供的轻量级通道计算模块的结构示意图；

图3为本发明提供的遥感图像目标检测模型的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种基于改进MobileViT的轻量级遥感图像目标检测方法，包括以下步骤：

步骤一、搭建基于改进MobileViT的轻量级骨干特征提取网络；轻量级骨干特征提取网络包括：基础卷积算子、多尺度特征提取模块和轻量级通道计算模块；基础卷积算子对原始遥感图像进行特征提取，得到初始特征图；多尺度特征提取模块对初始特征图进行多尺度特征提取，得到多尺度特征图；轻量级通道计算模块对多尺度特征图进行局部特征提取，并采用通道代表性思想对局部特征图进行划分、部分特征编解码和拼接，再将拼接后的特征图与初始的多尺度特征图进行融合；

步骤二、基于轻量级骨干特征提取网络搭建遥感图像目标检测模型；

步骤三、对遥感图像目标检测模型进行训练和测试；

步骤四、基于训练和测试后的遥感图像目标检测模型对遥感图像进行目标检测。

下面，对上述各步骤做进一步的说明。

步骤一、轻量级骨干特征提取网络MobileViT++的搭建。

选取当前主流的轻量级骨干特征提取网络模型MobileViT作为基线模块，对MobileViT进行改进，搭建MobileViT++网络。MobileViT++网络的整体结构如图3所示。轻量级骨干特征提取网络MobileViT++包括：基础卷积算子、多尺度特征提取模块(MV2M+)和轻量级通道计算模块(MViTL+)；多尺度特征提取模块和轻量级通道计算模块作为核心模块

具体来说；

(1)MV2M+模块的搭建。

MV2M+模块的结构图如图1所示，核心模块包括点卷积单元(pointwiseconvolution)，深度分离卷积单元(depthwise separable convolution)和多尺度卷积单元(PSConv)。其中，点卷积单元负责调整输入特征图和输出特征图的通道维度，深度分离卷积单元作为主要的特征提取器对输入图像进行特征提取，多尺度卷积单元在所述深度分离卷积所提取特征的基础上进一步提取多尺度特征以丰富特征图的信息表示。

多尺度特征提取模块的计算过程表示为：

F₁＝PSConv(Conv1_1*1(DWConv(Conv2_1*1((input₁)))))+Conv1_1*1(DWConv(Conv2_1*1((input₁))))

其中，Conv1_1*1为第一点卷积单元；Conv2_1*1为第二点卷积单元；DWConv为深度分离卷积单元；input₁为MV2M+模块的输入特征图；F₁为经过MV2M+模块特征提取后的输出特征图；+表示特征图像的相加操作；PSConv为多尺度卷积单元。

多尺度卷积单元由多个不同扩张系数的卷积算子和通道混洗算子组成，在卷积内部运算过程中进行多尺度特征提取，本发明的多尺度卷积单元由扩展率为1的第一卷积算子，扩展率为2的第二卷积算子以及扩展率为4的第三卷积算子并联组成，其中，扩展率为4的第三卷积算子接收来自通道混洗算子的特征图输出，并且最终将三个分支的输出特征图进行相加，得到多尺度特征图进行最后的输出；

多尺度卷积单元的计算过程表示为：

其中，Conv_d表示扩张系数为d的卷积算子，input₂为多尺度卷积单元的输入特征图，output₁为多尺度卷积单元的输出特征图；f_{channelReplace}表示通道混洗算子，用于重新排列特征图的通道位置，以辅助卷积算子获得多尺度特征。

MV2M+模块为MVIT模块提供了丰富的多尺度特征信息，以辅助Transformer结构进行全局特征的建模和提取。

(2)MViTL+模块的搭建。

轻量级通道计算模块(MViTL+模块)的结构图如图2所示，以原始MobileViT网络的MViT模块作为基线，引入通道代表性思想改进得到，其核心包括：局部特征表示算子(LocalRepresent operator)、编码-解码结构(Transformer)、通道划分算子(Channel Splitoperator)和特征复用算子(Fusion operator)。

首先，将输入特征图经过局部特征表示算子以获得符合Transformer输入条件的特征向量，并在这一步进行局部特征抽取，其建模过程可以形式化地表示为：

Feature＝f_{LocalRepresent}(X)

其中，X为局部特征表示算子的输入特征图，即多尺度特征提取模块输出的多尺度特征图；Feature为经过局部特征表示算子计算后得到的输出特征图，即局部特征图；f_{LocalRepresent}表示局部特征表示算子，局部特征表示算子由尺寸为3×3和1×1的卷积级联得到，用于改变多尺度特征图的尺寸和通道数，并通过点卷积计算得到局部特征图，其建模过程可以形式化地表示为：

output₂＝Conv_3×3(Conv_1×1(input₃))

其中，input₃为局部特征表示算子的输入特征图，output₂为局部特征表示算子的输出特征图，Conv_3×3和Conv_1×1分别表示核尺寸为3×3和1×1的卷积算子。

为了减少Transformer结构的计算复杂度，以方便后续边缘设备的部署，通道划分算子将局部特征图划分为3∶1，将1/4部分特征图输入至编码-解码结构进行编解码计算，剩余3/4部分特征图不参与任何计算并且与编解码计算后的1/4特征图进行拼接，得到拼接特征图，再征程流转后续网络部分，该计算过程表示为：

Feature_1/4，Feature_3/4＝f_ChannelSplit(Feature)

F₂＝Concat(f_Transfomrmer(Feature_1/4)，Feature_3/4)

其中，f_ChannelSplit为通道划分算子；Feature_1/4，Feature_3/4分别为经过通道划分算子计算后得到的1/4部分特征图和3/4部分特征图；Concat为特征拼接算子；f_Transfomrmer为编码-解码器结构；F₂为拼接后的输出特征图。

最后，特征复用算子将上述计算得到的拼接特征图与MViTL+模块的初始输入(多尺度特征图)进行融合，得到最终用于检测的完整特征图，其计算过程表示为：

Y＝f_Fusion(F₂，X)

其中，Y为最终用于检测的输出特征图，f_Fusion为特征复用算子。MViTL+模块的初始输入X通过跳跃连接的方式与Transformer结构计算后的特征图进行拼接，此处不限定融合方式，Add或Concat以及互补拼接等方式均可。

通过上述步骤即可完成多尺度特征提取模块(MV2M+)和轻量级通道计算模块(MViTL+)的搭建。本发明以二者为基础构建MobileViT++骨干特征提取网络结构，模型结构如图3所示。整体来说，MobileViT++骨干特征提取网络由基础卷积算子(Conv)，多尺度特征提取模块(MV2M+)和轻量级通道计算模块(MViTL+)组成。其中，Conv负责对原始遥感图像提取特征，后续通过堆叠N个MV2M+模块的方式获得深层特征，在由MV2M+和MViTL+模块组合的方式来获取全局特征和局部特征的结合以增强模型的预测能力，其计算过程可以形式化地表示为：

Feature＝Conv(img)

Feature＝f_MV2M+(Feature)^N×

Feature＝f_MViTL+(f_MV2M+(Feature))^N×

其中，Feature为经过特征提取的中间层特征，按照顺序结构进行逐层级的运算提取特征；img为原始遥感图像；Conv为基础卷积算子；f_MV2M+和f_MViTL+分别表示多尺度特征提取模块和轻量级通道计算模块；N×表示模型经过N次运算，即N个相同的多尺度特征提取模块堆叠组成。

至此，基于改进MobileViT的轻量级骨干特征提取网络MobileViT++搭建完成。

步骤二、遥感图像目标检测模型的搭建。

遥感图像目标检测模型由轻量级骨干特征提取网络(MobileViT++)、数据加载器(Dataloder)、颈部网络(Neck)(也称为特征融合网络)和检测头(Head)组成。

数据加载器将原始遥感图像及其对应的标签信息加载进数据预处理阶段，计算过程表示为：

data＝f_dataloder(imgs，labels)

其中，imgs∈R^H×W×3，为尺寸为H×W，通道数为3的原始遥感输入图像；labels为图像中目标的标注信息，包括检测框和类别；f_dataloder为数据加载器函数，除加载数据外还包括必要的数据增强方法，如投影，旋转，翻转等对数据进行扩充增强。进一步的，使用MobileViT++做为骨干特征提取网络对imgs进行特征提取，形式化地表示为：

[F₁，F₂，…，F_i，…，F_n]＝f_MobileViT++(imgs)

其中，表示经过特征提取后得到的特征图，尺寸为H_i×W_i，并且有C_i个通道；f_MobileViT++为轻量级骨干特征提取网络。

然后，选取最后3层由轻量级通道计算模块提取的特征图[F_n-4，F_n-2，F_n]传递给颈部网络进行特征融合；颈部网络包括卷积模块(Conv)和融合模块(Concat)；卷积模块(Conv)负责修改轻量级骨干特征提取网络输出特征图的尺寸和通道数；融合模块(Concat)融合不同层级的特征图信息以辅助预测，该过程表示为：

[P_n-4，P_n-2，P_n]＝f_Neck([F_n-4，F_n-2，F_n])

其中，f_Neck为颈部网络，用于特征融合；[P_n-4，P_n-2，P_n]为融合后的输出特征图。

最后，检测头对融合模块融合后的特征图进行解耦，得到潜在目标的类别和位置信息，该过程表示为：

其中，为预测获得的分类信息；/>为预测获得的位置信息；P_i为颈部网络进行特征融合输出的特征图；f_cls为分类函数，f_reg为位置回归函数。

至此，基于改进MobileViT骨干网络的遥感图像目标检测模型搭建完毕。

步骤三、遥感图像目标检测模型的训练和测试。

搭建好遥感图像目标检测模型之后，采用二元交叉熵损失和IoU损失对遥感图像目标检测模型进行训练，损失函数表示为：

其中，BCE为二元交叉熵，用于分类；IoU为预测框与真值的交并比损失，用于定位；y为与输入的原始遥感图像对应的目标真值标签；为预测得到的目标类别和位置信息；Loss为网络遥感图像目标检测模型所采用的损失。当网络训练至损失不再下降，则表示网络训练达到稳定，训练过程结束，得到训练完毕的基于改进MobileViT骨干网络的遥感图像目标检测模型。

之后，对训练完成后的遥感图像目标检测模型进行测试，表示为：

步骤四，利用测试好的遥感图像目标检测模型对待测遥感图像进行检测，输出目标类别和位置信息。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于改进MobileViT的轻量级遥感图像目标检测方法，其特征在于，包括以下步骤：

对所述遥感图像目标检测模型进行训练和测试；

基于训练和测试后的所述遥感图像目标检测模型对遥感图像进行目标检测；

所述多尺度特征提取模块包括：点卷积单元、深度分离卷积单元和多尺度卷积单元；

所述轻量级通道计算模块包括：局部特征表示算子、编码-解码结构、通道划分算子和特征复用算子；

所述通道划分算子将所述局部特征图划分为3:1，将1/4部分特征图输入至所述编码-解码结构进行编解码计算，剩余3/4部分特征图不参与任何计算并且与编解码计算后的1/4特征图进行拼接，得到拼接特征图；

2.根据权利要求1所述的基于改进MobileViT的轻量级遥感图像目标检测方法，其特征在于，所述多尺度特征提取模块的计算过程表示为：

3.根据权利要求2所述的基于改进MobileViT的轻量级遥感图像目标检测方法，其特征在于，所述多尺度卷积单元由多个不同扩张系数的卷积算子和通道混洗算子组成；多个所述卷积算子相并联，并组成多个分支，其中一个分支上的所述卷积算子接收所述通道混洗算子混洗后的特征图输出，其他分支上的所述卷积算子分别进行多尺度特征提取，最后将各分支输出的特征图进行相加，得到所述多尺度特征图；

所述多尺度卷积单元的计算过程表示为：

4.根据权利要求1所述的基于改进MobileViT的轻量级遥感图像目标检测方法，其特征在于，所述局部特征表示算子的计算过程表示为：

Feature＝f_{LocalRepresent}(X)

所述通道划分算子的计算过程表示为：

Feature_1/4，Feature_3/4＝f_ChannelSplit(Feature)

F₂＝Concat(f_Transfomrmer(Feature_1/4)，Feature_3/4)

所述特征复用算子的计算过程表示为：

Y＝f_Fusion(F₂，X)

5.根据权利要求1所述的基于改进MobileViT的轻量级遥感图像目标检测方法，其特征在于，所述轻量级骨干特征提取网络的整体计算过程表示为：

Feature＝Conv(img)

Feature＝f_MV2M+(Feature)^N×

Feature＝f_MViTL+(f_MV2M+(Feature))^N×

其中，Feature为经过特征提取的中间层特征，按照顺序结构进行逐层级的运算提取特征；img为原始遥感图像；Con为基础卷积算子；f_MV2M+和f_MViTL+分别表示所述多尺度特征提取模块和所述轻量级通道计算模块；N×表示模型经过N次运算，即N个相同的所述多尺度特征提取模块堆叠组成。

6.根据权利要求1所述的基于改进MobileViT的轻量级遥感图像目标检测方法，其特征在于，所述遥感图像目标检测模型由所述轻量级骨干特征提取网络、数据加载器、颈部网络和检测头组成；

7.根据权利要求6所述的基于改进MobileViT的轻量级遥感图像目标检测方法，其特征在于，所述数据加载器的计算过程表示为：

data＝f_dataloder(imgs,labels)

[F₁,F₂,…,F_i,…,F_n]＝f_MobileViT++(imgs)

选取最后3层由所述轻量级通道计算模块提取的特征图[F_n-4,F_n-2,F_n]传递给所述颈部网络进行特征融合；所述颈部网络的计算过程表示为：

[P_n-4,P_n-2,P_n]＝f_Neck([F_n-4,F_n-2,F_n])

其中，f_Neck为所述颈部网络，用于特征融合；[P_n-4,P_n-2,P_n]为融合后的输出特征图；

所述检测头的计算过程表示为：

8.根据权利要求1所述的基于改进MobileViT的轻量级遥感图像目标检测方法，其特征在于，采用二元交叉熵损失和IoU损失对所述遥感图像目标检测模型进行训练，损失函数表示为：

9.根据权利要求1所述的基于改进MobileViT的轻量级遥感图像目标检测方法，其特征在于，对训练完成后的所述遥感图像目标检测模型进行测试，表示为：