CN113222068B

CN113222068B - 基于邻接矩阵指导标签嵌入的遥感图像多标签分类方法

Info

Publication number: CN113222068B
Application number: CN202110617141.8A
Authority: CN
Inventors: 张向荣; 单守平
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2021-06-03
Filing date: 2021-06-03
Publication date: 2022-12-27
Anticipated expiration: 2041-06-03
Also published as: CN113222068A

Abstract

本发明提出了一种基于邻接矩阵指导标签嵌入的遥感图像多标签分类方法，实现步骤为：获取训练样本集、测试样本集、邻接矩阵和标签向量矩阵；构建基于邻接矩阵指导标签嵌入的遥感图像多标签分类模型；对基于邻接矩阵指导标签嵌入的遥感图像多标签分类模型进行迭代训练；获取多标签图像分类结果。本发明通过邻接矩阵和嵌入向量余弦相似度矩阵的最小均方误差损失对标签向量矩阵嵌入过程进行约束，充分考虑了邻接矩阵这一先验信息，提高了多标签图像分类的mF1值；通过引入标签和图像协同嵌入方法，对标签和特征图中每一个像素之间的响应关系进行联合建模，减少了遥感图像背景对于多标签图像分类的影响，进而提高了多标签图像分类的mF1值。

Description

基于邻接矩阵指导标签嵌入的遥感图像多标签分类方法

技术领域

本发明属于图像处理技术领域，涉及一种图像多标签分类方法，具体涉及一种基于邻接矩阵指导标签嵌入的遥感图像多标签分类方法，可用于城市制图，场景理解及图像检索。

背景技术

遥感图像是由高空传感器对地表进行扫描和拍摄捕获的图像，具有全天性、视角广、少遮挡等优良的特性，在军事、民生等领域得到了广泛的应用。根据遥感图像中目标类别数目的多少可以将遥感图像分为单标签遥感图像和多标签遥感图像。如果单幅遥感图像包含一个及以上的目标类别，称这种图像为多标签遥感图像。遥感图像多标签分类是指对遥感图像中存在的多个目标类别进行分类，最终得到遥感图像中存在的所有目标类别的标签信息，被广泛应用于城市制图、场景理解等领域。

表征遥感图像多标签分类的指标主要是基于精准率和召回率的平均F1值mF1。mF1是准确率和召回率的加权调和平均数，其核心思想是在尽可能地提高准确率和召回率的同时，也希望两者之间的差异尽可能小。

遥感图像多标签分类方法分为传统的遥感图像多标签分类方法和基于深度学习的遥感图像多标签分类方法。相比于传统方法，基于深度学习的遥感图像多标签分类方法的mF1值高，算法复杂性低，因此得到了广泛关注。根据所给的监督信息的不同，基于深度学习的遥感图像多标签分类方法可分为两类：基于强监督的遥感图像多标签分类方法和基于弱监督的遥感图像多标签分类方法。相比于基于强监督的遥感图像多标签分类方法，基于弱监督的遥感图像多标签分类方法只利用图像类别标签进行多标签分类，而不使用额外的目标位置信息。基于弱监督的遥感图像多标签分类方法一般过程为：首先，对遥感图像进行特征提取；其次，通过不同的标签嵌入方法，对多标签进行嵌入操作，利用提取到的特征和嵌入得到标签嵌入特征进行关联学习；最后对关联学习得到的图像和标签之间的关联特征对遥感图像进行多标签分类。基于弱监督的遥感图像多标签分类方法具有训练效率高以及标签成本低等优点，是当前遥感图像多标签分类领域的研究热点。

图像多标签分类任务面临着两个主要的挑战。其中一个挑战是如何挖掘多标签之间的依赖关系；另一个挑战是如何对标签和图像进行跨模态语义信息的关联学习。例如，Renchun You等人于2020年在《Proceedings of the AAAI Conference on ArtificialIntelligence》会议上发表了一篇题为“Cross-modality attention with semanticgraph embedding for multi-label classification”的文章，卷号为34，公开了一种跨模态注意力图嵌入图像多标签分类方法，该方法利用标签图建模标签之间的语义关系并对标签进行嵌入操作；然后将学习到的标签嵌入和图像特征一起输入跨模态注意力模块，得到具有标签相关性的特征图。最后将标签相关性的特征图输入多标签分类器进行分类，得到分类结果。该方法解决了图像多标签分类任务中多模态联合建模的问题，但是没有考虑标签之间的局部依赖关系，此外，由于遥感图像存在背景复杂、目标尺度差异大等特点，该方法难以对多标签和图像区域进行精确的关联，且仅适用于自然图像。

为了充分挖掘多标签之间的依赖关系，并对标签和遥感图像进行跨模态语义信息的关联学习，Yuansheng Hua等人于2019年《IEEE Transactions on Geoscience andRemote Sensing》期刊上发表了一篇题为“Relation Network for Multilabel AerialImage Classification”的文章，卷号为58，公开了一种基于关系网络的遥感影像多标签分类方法，该方法利用标签的特征学习模块提取和标签相关的的高级特征然后使用注意力区域提取模块定位这些特征中的语义区域，不需要生成候选区域就可以直接产生标签特有的特征，在遥感影像多标签数据集上的mF1值相较于对比算法有效的提升。但是其存在的不足之处在于：由于该方法只考虑了标签和图像块之间的相应关系，忽略了数据中隐含的标签依赖关系，使得获得的标签特征向量缺乏先验信息的指导，此外，该方法无法对多标签和遥感图像进行像素级的关联学习，影响了分类精度的进一步提升。

发明内容

本发明的目的在于克服上述现有技术存在的不足，提出了一种基于邻接矩阵指导标签嵌入的遥感影像多标签分类方法，旨在提高遥感影像多标签分类的mF1值。

为实现上述目的，本发明采取的技术方案包括如下步骤：

(1)获取训练样本集、测试样本集、邻接矩阵和标签向量矩阵：

(1a)获取包含C个目标类别的S幅光学遥感图像X＝{X_s|1≤s≤S}，每幅光学遥感图像X_s至少包含一个目标类别

每个目标类别包含在P幅光学遥感图像中，其中，S≥1500，C≥2，X_s表示第s幅光学遥感图像，P≥2，

时，表示X_s中包含第l个目标类别，

时，表示X_s中不包含第l个目标类别；

(1b)对每幅光学遥感图像X_s包含的目标进行标注，得到多标签集合L＝{L_l|0≤l≤C-1}，并对标注目标的每幅光学遥感图像进行归一化处理，再将S幅经过归一化处理后的半数以上遥感图像及其对应的标签作为训练样本集，将其余遥感图像及其对应的标签作为测试样本集；

(1c)遍历训练样本集中每幅光学遥感图像对应的标签中存在的目标类别，统计目标类别中存在的每一个标签出现的总次数，并计算当每幅光学遥感图像中的目标类别数大于1时Y_s中存在的标签对出现的总次数，然后构建标签共现次数矩阵B＝{B_ij|0≤i≤C-1,0≤j≤C-1}，再对B进行列归一化，得到邻接矩阵

其中，B_ij表示标签L_i和标签L_j在训练样本集中同时出现的次数，j≠i，B_ii表示标签L_i在训练样本集中出现的次数，

表示实数域；

(1d)通过在预训练的GloVe词典中所查询的多标签集合L中每一个标签对应的标签向量表示，构建大小为C×r的标签向量矩阵

(2)构建基于邻接矩阵指导标签嵌入的遥感图像多标签分类模型M：

(2a)构建包括并行分布的标签嵌入网络M_e和在公开的ImageNet数据集上预训练的图像语义特征提取及嵌入网络M_f，以及与M_f和M_e的输出端依次级联的标签图像协同嵌入网络M_fe和多标签分类网络M_cls的遥感图像多标签分类模型M，其中M_f包含多个卷积层和一个或多个池化层；M_e包含多个第一全连接层；M_fe包含多个第二全连接层；M_cls包含一个或多个第三全连接层；

(2b)定义遥感图像多标签分类模型M的损失函数

其中

表示多标签分类网络M_cls的多标签交叉熵损失函数，λ₁表示

在

中的加权因子，

表示M_cls对于训练样本第c个标签的预测结果，y^c表示训练样本对应的标签，σ(·)表示sigmoid函数，log(·)表示对数函数，∑(·)表示求和函数；

表示标签嵌入网络M_e的标签距离度量损失函数，λ₂表示

在

中的加权因子，

表示训练样本标签中包含标签L_i，

表示训练样本标签中包含标签L_j，

表示训练样本标签中不包含标签L_k，

表示训练样本中标签L_i的嵌入向量和标签L_j的嵌入向量之间的欧氏距离，

表示训练样本中标签L_i的嵌入向量和标签L_k的嵌入向量的欧氏距离，n表示批处理mini-batch的大小；

表示M_e的最小均方误差损失函数，λ₃表示

在

中的加权因子，w表示用于放松相似度度量限制的指示函数，τ表示用于忽略邻接矩阵噪声的常数，e_i和e_j分别表示标签L_i和标签L_j的嵌入向量，||·||表示取模操作，(·)^T表示转置操作；

(3)对基于邻接矩阵指导标签嵌入的遥感图像多标签分类模型M进行迭代训练：

(3a)初始化迭代次数为t，最大迭代次数为T，T≥80，当前邻接矩阵指导标签嵌入的遥感图像多标签分类模型为M^t，当前图像语义特征提取及嵌入网络

的网络参数为

当前标签嵌入网络

的网络参数为

当前标签图像协同嵌入网络

的网络参数为

当前多标签分类网络

的网络参数为

的学习速率为α_f，

和

网络参数的学习速率为α_g，并令M^t＝M，

t＝0；

(3b)将无放回随机选取训练样本集的R幅训练图像作为图像语义特征提取及嵌入网络

的输入进行特征图提取，得到宽度、高度和通道数分别为W、H和D的每幅训练图像的特征图

并对F_cnn进行嵌入操作，得到F_cnn对应的嵌入特征图

其中，1≤R≤S，r₁表示F的通道数；

(3c)将标签向量矩阵G作为标签嵌入网络

的输入，构建标签向量嵌入矩阵E′，并计算E′中每一行与其他各行标签嵌入向量之间的余弦相似度，构建嵌入向量余弦相似度矩阵

然后通过邻接矩阵A和H′之间的最小均方误差损失对G嵌入过程进行约束，实现邻接矩阵A对标签嵌入的指导，得到标签嵌入矩阵

(3d)标签图像协同嵌入网络

对标签嵌入矩阵E和嵌入特征图F进行对应元素乘积，然后对乘积结果进行嵌入操作，得到每个标签L_i关于F的注意力图

并将

与F进行乘积操作，得到标签相关的特征响应向量

(3e)多标签分类网络

对标签相关的特征响应向量

进行多标签分类，并通过分类结果计算每幅训练图像中每一个标签存在的概率；

(3f)采用基于邻接矩阵指导标签嵌入的遥感图像多标签分类模型M^t的损失函数

并通过R幅训练图像及其对应的标签、步骤(3c)和(3e)的输出结果以及邻接矩阵A，计算M^t的损失值Q_total；

(3g)采用链式求导方法，通过损失值Q_total分别计算M^t中的网络参数

和

的梯度

和

并采用梯度下降法，通过

和

对

和

进行更新；

(3h)判断t≥T是否成立，若是，得到训练好的遥感图像多标签分类模型M^*，否则，令t＝t+1，并执行步骤(3b)；

(4)获取多标签图像分类结果：

将测试样本集作为训练好的遥感图像多标签分类模型M^*的输入，图像语义特征提取及嵌入网络

得到每一幅测试图像的嵌入特征图，标签嵌入网络

得到每一幅测试图像的标签嵌入矩阵，标签图像协同嵌入网络

得到每一幅测试图像中和类别相关的特征响应向量，多标签分类网络

对每个类别相关的特征响应向量进行多标签分类，计算每一幅测试图像中每一个标签存在的概率，并选择其中大于阈值的目标类别作为每幅测试图像中的多标签标注，得到所有测试图像的多标签分类结果。

本发明与现有技术相比，具有以下优点：

1.本发明在对遥感图像多标签分类模型进行训练，以及获取多标签图像分类结果的过程中，标签嵌入网络通过邻接矩阵和嵌入向量余弦相似度矩阵的最小均方误差损失对标签向量矩阵嵌入过程进行约束，得到标签嵌入矩阵，由于在标签嵌入过程中充分考虑了邻接矩阵这一全局标签依赖先验信息，使得标签嵌入向量在嵌入空间中能够保持原有的标签依赖关系，消除了标签嵌入向量难以表征标签依赖关系的不利因素，与现有技术相比，有效提高了多标签图像分类的mF1值。

2.本发明采用的标签图像协同嵌入网络对标签嵌入矩阵和图像嵌入特征图进行对应元素乘积，得到每个标签关于图像嵌入特征图的注意力图，并将注意力图与图像嵌入特征图进行乘积操作，得到标签相关的特征响应向量，由于在对标签嵌入向量和图像特征嵌入向量的相关性建模中计算了标签和特征图中每一个像素之间的响应关系，使得标签图像协同嵌入网络能够学习到标签和图像之间更加精细的响应关系，减少了遥感图像背景对于多标签图像分类的影响，与现有方法相比，进一步提高了多标签图像分类的mF1值。

附图说明

图1为本发明的实现流程图；

图2为本发明仿真实验所采用的遥感图像；

图3为本发明和现有技术分类精度的仿真结果对比图。

具体实施方式

以下结合附图和具体实施例，对本发明作进一步详细描述。

参照图1，本发明包括如下步骤。

步骤1)获取训练样本集、测试样本集、邻接矩阵和标签向量矩阵：

每个目标类别包含在P幅光学遥感图像中，其中，S≥100，C≥2，X_s表示第s幅光学遥感图像，P≥2，

时，表示X_s中包含第l个目标类别，

时，表示X_s中不包含第l个目标类别。其中，S＝2100，C＝17。

(1b)对每幅光学遥感图像X_s包含的目标进行标注，得到多标签集合L＝{L_l|0≤l≤C-1}，并对标注目标的每幅光学遥感图像减去ImageNet数据集中的图像均值再除以图像方差进行归一化处理，再将S幅经过归一化处理后的80％遥感图像及其对应的标签作为训练样本集，将其余遥感图像及其对应的标签作为测试样本集。

其中，B_ij表示标签共现次数矩阵B的非对角线元素，表示标签L_i和标签L_j在训练样本集中同时出现的次数，j≠i，B_ii表示标签共现次数矩阵B的对角线元素，其表示标签L_i在训练样本集中出现的次数，

表示实数域；

(1d)通过在预训练的GloVe词典中所查询的多标签集合L中每一个标签对应的标签向量表示，构建大小为C×r的向量矩阵

其中，r＝300；

步骤2)构建基于邻接矩阵指导标签嵌入的遥感图像多标签分类模型M：

(2a)构建包括并行分布的标签嵌入网络M_e和在公开的ImageNet数据集上预训练的图像语义特征提取及嵌入网络M_f，相比于随机初始化的方法，使用ImageNet预训练网络参数的方法能够加快特征提取及嵌入网络的收敛速度，以及与M_f和M_e的输出端依次级联的标签图像协同嵌入网络M_fe和多标签分类网络M_cls的遥感图像多标签分类模型M，其中M_f包含多个卷积层和一个或多个池化层；M_e包含多个第一全连接层；M_fe包含多个第二全连接层；M_cls包含一个或多个第三全连接层。

在本实施例中，图像语义特征提取及嵌入网络M_f包括五十一个卷积层和一个池化层，其中第二个卷积层到四十八个卷积层可以分成四组，M_f的结构关系为：第一卷积层→池化层→第一组卷积层→第二组卷积层→第三组卷积层→第四组卷积层→第二卷积层→第三卷积层，其中具体参数为：

第一卷积层的卷积核大小为7×7，卷积核数量为64，步长为2；

池化层是最大池化层，大小为3×3，步长为2；

第一组卷积层包括三组重复堆叠的组合卷积层，每个组合卷积层包括：一个卷积核大小为1×1，卷积核数量为64，步长为1。一个卷积核大小为3×3，卷积核数量为64，步长为1。一个卷积核大小为1×1，卷积核数量为256，步长为1；

第二组卷积层包括四组重复堆叠的组合卷积层，每个组合卷积层包括：一个卷积核大小为1×1，卷积核数量为128，步长为1。一个卷积核大小为3×3，卷积核数量为128，步长为2。一个卷积核大小为1×1，卷积核数量为512，步长为1；

第三组卷积层包括六组重复堆叠的组合卷积层，每个组合卷积层包括：一个卷积核大小为1×1，卷积核数量为256，步长为1。一个卷积核大小为3×3，卷积核数量为256，步长为2。一个卷积核大小为1×1，卷积核数量为1024，步长为1；

第四组卷积层包括三组重复堆叠的组合卷积层，每个组合卷积层包括：一个卷积核大小为1×1，卷积核数量为512，步长为1。一个卷积核大小为3×3，卷积核数量为512，步长为2。一个卷积核大小为1×1，卷积核数量为2048，步长为1；

第二卷积层包括一个卷积核大小为1×1，卷积核数量为150，步长为1；

第三卷积层包括一个卷积核大小为1×1，卷积核数量为300，步长为1；

在本实施例中，标签嵌入网络M_e包含两个第一全连接层，具体参数为：

第一个第一全连接层的大小为300×150，第二个第一全连接层的大小为150×300。

在本实施例中，标签图像协同嵌入网络M_fe包括两个第二全连接层，具体参数为：

第一个第二全连接层的大小是300×300，第二个第二全连接层大小为300×1。

在本实施例中，多标签分类网络M_cls包含一个第三全连接层，大小为300×1。

(2b)定义遥感图像多标签分类模型M的损失函数

其中

表示多标签分类网络M_cls的多标签交叉熵损失函数，λ₁表示

在

中的加权因子，

表示标签嵌入网络M_e的标签距离度量损失函数，λ₂表示

在

中的加权因子，

表示训练样本标签中包含标签L_i，

表示训练样本标签中包含标签L_j，

表示训练样本标签中不包含标签L_k，

表示M_e的最小均方误差损失函数，λ₃表示

在

步骤3)对基于邻接矩阵指导标签嵌入的遥感图像多标签分类模型M进行迭代训练：

的网络参数为

当前标签嵌入网络

的网络参数为

当前标签图像协同嵌入网络

的网络参数为

当前多标签分类网络

的网络参数为

的学习速率为α_f，

和

网络参数的学习速率为α_g，并令M^t＝M，

T≥80，并令t＝0，α_f＝0.001，α_g＝0.01。

的输入进行特征图提取，根据卷积层中包含的卷积核数量的大小对每幅训练图像进行相应的卷积操作，得到与卷积核数量相同的多维特征图

F_cnn的宽度、高度和通道数分别为W、H和D，并对F_cnn进行嵌入操作，得到F_cnn对应的嵌入特征图

其中，r₁表示F的通道数。在本实施例中，R＝8，W＝14，H＝14，D＝2048，r₁＝300。

(3c)将标签向量矩阵G作为标签嵌入网络

这种邻接矩阵指导嵌入方法充分考虑了全局标签依赖先验信息，约束标签嵌入向量在嵌入空间中能够保持原有的标签依赖关系，消除了标签嵌入向量难以表征标签依赖关系的不利因素。

(3d)标签图像协同嵌入网络

并将

与F进行乘积操作，得到标签相关的特征响应向量

其具体步骤为：

(3d1)嵌入特征图

和标签嵌入矩阵

大小不一致，需要对两者进行通道复制操作，将F进行转置和复制C次之后得到

并将E进行转置和复制W×H次后得到

(3d2)将

和

按照对应元素进行乘积操作，然后通过正切函数对乘积进行非线性处理，最后通过标签图像协同嵌入网络两个第一全连接层和softmax层得到标签关于嵌入特征图F的注意力图

f_i,wh＝U^T(tanh(f_wh⊙e_i))+b

α_i,wh＝fc(f_i,wh)

(3d3)将标签关于特征图的注意力图

和嵌入特征图F相乘再沿着长宽维度加和即可得到标签相关的特征响应向量

其计算公式为：

(3e)多标签分类网络

对标签相关的特征响应向量

进行多标签分类，并通过分类结果计算每幅训练图像中每一个标签存在的概率。其具体步骤为：

(3e1)将标签相关的特征响应向量

通过一个第三全连接层得到

(3e2)将

通过一个softmax函数进行归一化将

的值限制在0～1之间，计算得到每个标签存在的概率

并通过R幅训练图像及其对应的标签、步骤(3c)和(3e)的输出结果以及邻接矩阵A，计算M^t的损失值Q_total，具体实现步骤为：

(3f1)标签嵌入网络使用最小均方误差损失函数

通过最小化嵌入向量之间的余弦相似度矩阵和标签邻接矩阵A之间的均方误差，得到损失值为Q_mse，其计算公式为：

(3f2)标签距离度量机制的损失函数

通过计算每一个训练批次中标签组合的共现情况，得到损失值为Q_ld，该损失函数可以在嵌入空间中拉近经常一起出现的嵌入向量之间的距离，同时拉远没有一起出现的嵌入向量之间的距离，其计算公式为：

其中，n＝8。

(3f3)多标签分类网络使用交叉熵损失函数

通过计算每幅训练图像中对于标签存在的预测概率和该幅图像对应标签之间的交叉熵，得到损失值为Q_ce，其计算公式为；

其中，y^c表示训练图像中标签L_c是否存在的真实类标，

表示图像多标签分类网络预测标签L_c存在的概率值。

(3f4)计算A的损失值Q_total：

Q_total＝λ₁Q_le+λ₂Q_ld+λ₃Q_mse。

在本实例中，λ₁＝1，λ₂＝10，λ₃＝1。

和

的梯度

和

并采用梯度下降法，通过

和

对

和

进行更新：

(3g1)通过链式求导方法，通过损失值Q_total分别计算

的网络参数

的网络参数

的网络参数

和

的网络参数

的梯度

和

其计算公式为：

其中

表示求偏导函数，

表示

的输出值，

表示

的输出值，

表示

的输出值，

表示

的输出值。

(3g2)采用梯度下降法，通过

和

对网络参数

和

进行更新，其更新公式为：

其中，

表示

的参数

的更新值，

表示

的参数

的更新值，

表示

的参数

的更新值，

表示

的参数

的更新值。

(3h)判断t≥T是否成立，若是，得到训练好的遥感图像多标签分类模型M^*，否则，令t＝t+1，并执行步骤(3b)。

步骤4)获取多标签图像分类结果：

得到每一幅测试图像的嵌入特征图，标签嵌入网络

以下结合仿真实验，对本发明的技术效果进一步说明：

1.仿真条件及内容：

仿真实验采用公共的UCM遥感影像多标签数据集，该数据集包含1680张训练样本集，420张测试样本集。

仿真所用的处理器为

Xeon(R)CPU E5-2678v3，内存容量为128.00GB，GPU为12G的GeForce GTX1080Ti，仿真平台为Ubuntu16.04操作系统，使用Pytorch深度学习框架，采用Python语言实现。

仿真所使用的测试图像如图2所示，图2所示的光学遥感图像包含了“土壤”、“建筑”、“球场”、“草地”、“道路”、“树木”共六个标签，其中“球场”位于遥感图像的右下角，而且只有小部分区域出现在遥感图像中。

对本发明和现有的基于关系网络的遥感影像多标签分类方法的分类精度进行对比仿真，其结果如图3所示。

2.仿真结果分析：

图3(a)为现有技术多标签分类仿真结果图，图3(b)为本发明多标签分类仿真结果图。从图3(a)的结果看出，现有技术多标签分类的仿真结果中没有预测到图3(a)虚线框区域中的“球场”标签；从图3(b)可以看出，尽管测试图像中“球场”标签的区域并不完整，但是本发明采用的标签图像协同嵌入网络在对标签嵌入向量和图像特征嵌入向量的相关性建模中考虑了标签和特征图中每一个像素之间的响应关系，能够学习到标签和图像之间更加精细的响应关系，因此，本发明能够完全预测到所有的标签，大幅提高了遥感影像多标签图像分类精度。将本发明的在整个数据集测试集上的仿真结果与真实标注结果进行比对，仿真结果表明，本发明的多标签分类的mF1值由86.76％提高到87.04％。

以上描述仅是本发明的一个具体实例，并未构成对本发明的任何限制，显然对于本领域的专业人员来说，在了解了本发明内容和原理后，都可能在不背离本发明原理、结构的情况下，进行形式和细节上的各种修改和改变，但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。

Claims

1.一种基于邻接矩阵指导标签嵌入的遥感图像多标签分类方法，其特征在于，包括如下步骤：

(1a)获取包含C个目标类别的S幅光学遥感图像X＝{X_s|1≤s≤S}，每幅光学遥感图像X_s至少包含一个目标类别Y_s＝{Y_s ^l∈{0,1}|0≤l≤C-1}，每个目标类别包含在P幅光学遥感图像中，其中，S≥1500，C≥2，X_s表示第s幅光学遥感图像，P≥2，Y_s ^l＝1时，表示X_s中包含第l个目标类别，Y_s ^l＝0时，表示X_s中不包含第l个目标类别；