CN114332570A

CN114332570A - 基于cdl深度学习进行作物迁移分类的方法和系统

Info

Publication number: CN114332570A
Application number: CN202210262470.XA
Authority: CN
Inventors: 丁志平; 梁治华; 刘文达
Original assignee: Beijing Aisi Times Technology Co ltd
Current assignee: Beijing Aisi Times Technology Co ltd
Priority date: 2022-03-17
Filing date: 2022-03-17
Publication date: 2022-04-12
Anticipated expiration: 2042-03-17
Also published as: CN114332570B

Abstract

本申请涉及数据识别技术领域，提供了一种基于CDL深度学习进行作物迁移分类的方法、系统、计算机可读存储介质和电子设备。该方法通过将训练区域的CDL数据和遥感影像数据进行合成，得到作物分类的多个不同时间周期的训练数据集；然后，根据训练数据集，构建多个不同时间周期的多个作物分类模型；最后，根据获取的目标区域的测试数据集，基于训练完成的多个作物分类模型对目标区域进行时空泛化分析，确定最佳作物分类模型，以对目标区域作物进行分类。如此，通过CDL数据与遥感数据合成构建多个不同时间周期的训练数据集，解决样本稀缺的问题，同时通过对多个作物分类模型进行分析，提高了作物分类模型在目标区域的分类预测精度。

Description

基于CDL深度学习进行作物迁移分类的方法和系统

技术领域

本申请涉及数据识别技术领域，特别涉及一种基于CDL深度学习进行作物迁移分类的方法、系统、计算机可读存储介质和电子设备。

背景技术

基于CNN进行农作物分类在国内外研究中取得了巨大的成果，但是其基础支撑条件之一是大样本，然而大样本的获取需要花费大量的人力和时间成本，造成作物样本稀缺。CDL数据是目前已存的能够及时更新的高精度作物标签数据；以CDL制作的标签数据作为CNN模型的训练样本，通过迁移学习将CNN已经学习的相关任务中的知识迁移到新的任务中来减少模型训练和标签数据的使用，在一定程度上可以提升迁移学习的效率。

现有技术中，使用CDL数据作为训练样本进行作物迁分类移学习时，通常基于作物生长的特点，选择单个生长周期内的CDL数据与相应时间段内的遥感影像作为训练数据对作物分类模型进行训练，得到该生长周期对应的作物分类模型。由于作物具有生长周期性，当该生长周期内的遥感影像受到天气干扰，导致遥感影像覆盖度不够时，仍然存在样本稀缺的问题，导致训练得到的作物分类模型对迁移目标区域的作物预测精度较低。

因此，需要提供一种针对上述现有技术不足的改进技术方案。

发明内容

本申请的目的在于提供一种基于CDL深度学习进行作物迁移分类的方法、系统、计算机可读存储介质和电子设备，以解决或缓解上述现有技术中存在的问题。

为了实现上述目的，本申请提供如下技术方案：

本申请提供了一种基于CDL深度学习进行作物迁移分类的方法，该方法包括：

将训练区域的CDL数据和遥感影像数据进行合成，得到作物分类的多个不同时间周期的训练数据集；其中，所述CDL数据和所述遥感影像数据均包含所述训练区域的多个不同时间周期的数据；

根据所述训练数据集，构建多个不同时间周期的多个作物分类模型；其中，每一个所述时间周期对应一个所述作物分类模型；

根据获取的目标区域的测试数据集，基于训练完成的多个所述作物分类模型对所述目标区域进行时空泛化分析，确定最佳作物分类模型，以对目标区域作物进行分类；其中，所述测试数据集中的多个时间周期与所述训练数据集的多个时间周期为不同的时间周期。

优选地，所述将训练区域的CDL数据和遥感影像数据进行合成，得到作物分类的多个不同时间周期的训练数据集，包括：

对所述训练区域的CDL数据按照预设周期进行标签重分类和标准化处理，得到每个所述预设周期内的标准化后的CDL数据；

对所述训练区域的遥感影像数据按照所述预设周期进行去云处理，得到每个所述预设周期内的无云影像数据；

对所述无云影像数据和所述标准化后的CDL数据按照所述预设周期进行波段合成，得到作物分类的多个不同时间周期的所述训练数据集。

优选地，所述对所述训练区域的遥感影像数据按照所述预设周期进行去云处理，得到每个所述预设周期内的无云影像数据，包括：

基于Fmask算法，计算每个所述预设周期内的所述训练区域的遥感影像数据的云分数，得到每个所述预设周期内的所述遥感影像数据对应的云分数值；

根据每个所述预设周期内的所述遥感影像数据对应的云分数值与所述遥感影像数据的质量评估波段进行逐像元去云处理，得到每个所述预设周期内的所述无云影像数据。

优选地，所述根据所述训练数据集，构建多个不同时间周期的多个作物分类模型进行训练，包括：

每个所述作物分类模型的卷积层与SoftmaxWithLoss层相连接，计算得到每个所述作物分类模型的损失函数；

根据所述训练数据集和每个所述作物分类模型的损失函数，对每个所述作物分类模型进行训练，以构建所述作物分类模型。

优选地，所述根据所述训练数据集和每个所述作物分类模型的损失函数，对每个所述作物分类模型进行训练，以构建所述作物分类模型，包括：

根据所述训练数据集，对每个所述作物分类模型依次循环进行梯度下降、权值更新，直至对应的所述损失函数收敛，得到对应的所述作物分类模型。

所述根据获取的目标区域的测试数据集，基于训练完成的多个所述作物分类模型对所述目标区域进行时空泛化分析，确定最佳作物分类模型，以对作物进行分类，包括：

根据获取的所述目标区域的测试数据集，基于多个所述作物分类模型，得到所述目标区域的多个所述预测结果，以得到训练完成的多个所述作物分类模型；

基于训练完成的多个所述作物分类模型对所述目标区域的作物分类进行时空泛化分析，并根据所述目标区域的时空泛化分析结果，确定所述最佳作物分类模型，以对作物进行分类。

优选地，所述遥感影像数据为蓝、绿、红、近红外、第一短波红外、第二短波红外波段。

本申请实施例还提供一种基于CDL深度学习进行作物分类的系统，包括：

训练数据获取单元，配置为：将训练区域的CDL数据和遥感影像数据进行合成，得到作物分类的多个不同时间周期的训练数据集；其中，所述CDL数据和所述遥感影像数据均包含所述训练区域的多个不同时间周期的数据；

模型训练单元，配置为：根据所述训练数据集，构建多个不同时间周期的多个作物分类模型；其中，每一个所述时间周期对应一个所述作物分类模型；

泛化分析单元，配置为：根据获取的目标区域的测试数据集，基于训练完成的多个所述作物分类模型对所述目标区域进行时空泛化分析，确定最佳作物分类模型，以对目标区域作物进行分类；其中，所述测试数据集中的多个时间周期与所述训练数据集的多个时间周期为不同的时间周期。

本申请实施例还提供一种计算机可读存储介质，其上存储有计算机程序，所述程序为上述任一所述的基于CDL深度学习进行作物迁移分类的方法。

本申请实施例还提供一种电子设备，包括：存储器、处理器、以及存在所述存储器中并可在所述处理器上运行的程序，所述处理器执行所述程序时实现如上述任一所述的基于CDL深度学习进行作物迁移分类的方法。

有益效果：

本申请中，将训练区域的CDL数据和遥感影像数据进行合成，得到作物分类的多个不同时间周期的训练数据集；然后，根据所述训练数据集，构建多个不同时间周期的多个作物分类模型；最后，根据获取的目标区域的测试数据集，基于训练完成的多个所述作物分类模型对所述目标区域进行时空泛化分析，确定最佳作物分类模型，以对目标区域作物进行分类。如此，通过CDL数据与遥感数据合成构建多个不同时间周期的训练数据集，扩充了作物分类模型的训练样本，解决了样本稀缺的问题；同时，基于对个不同时间周期，分别对多个作物分类模型进行时空泛化分析，确定最佳作物分类模型，提高了对目标区域作物分类预测的准确度。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。其中：

图1为根据本申请的一些实施例提供的基于CDL深度学习进行作物迁移分类的方法的流程示意图；

图2为根据本申请的一些实施例提供的训练数据集构建的流程示意图；

图3为根据本申请的一些实施例提供的生成CDL数据的流程示意图；

图4为根据本申请的一些实施例提供的作物分类模型库构建的流程示意图；

图5为根据本申请的一些实施例提供的model_2016的收敛速度示意图；

图6为根据本申请的一些实施例提供的model_2017的收敛速度示意图；

图7为根据本申请的一些实施例提供的model_2018的收敛速度示意图；

图8为根据本申请的一些实施例提供的model_2019的收敛速度示意图；

图9为根据本申请的一些实施例提供的model_2016_17的收敛速度示意图；

图10为根据本申请的一些实施例提供的model_2016_17_18的收敛速度示意图；

图11为根据本申请的一些实施例提供的训练数据集的光谱特征分布图；

图12为根据本申请的一些实施例提供的区域A1的测试数据集的光谱特征分布图；

图13为根据本申请的一些实施例提供的不同模型在目标区域预测当年数据的总体精度示意图；

图14为根据本申请的一些实施例提供的不同模型在目标区域预测不同年份作物分类的总体精度示意图；

图15为根据本申请的一些实施例提供的基于CDL深度学习进行作物迁移分类的系统的结构示意图；

图16为根据本申请的一些实施例提供的电子设备的结构示意图；

图17为根据本申请的一些实施例提供的电子设备的硬件结构。

具体实施方式

下面将参考附图并结合实施例来详细说明本申请。各个示例通过本申请的解释的方式提供而非限制本申请。实际上，本领域的技术人员将清楚，在不脱离本申请的范围或精神的情况下，可在本申请中进行修改和变型。例如，示为或描述为一个实施例的一部分的特征可用于另一个实施例，以产生又一个实施例。因此，所期望的是，本申请包含归入所附权利要求及其等同物的范围内的此类修改和变型。

示例性方法

图1为根据本申请的一些实施例提供的基于CDL深度学习进行作物迁移分类的方法的流程示意图；如图1所示，该方法包括：

步骤S101、将训练区域的CDL数据和遥感影像数据进行合成，得到作物分类的多个不同时间周期的训练数据集；其中，所述CDL数据和所述遥感影像数据均包含所述训练区域的多个不同时间周期的数据。

本申请实施例中，根据训练区域与目标区域的作物熟制和物候之间的关系，以美国玉米大豆种植较为集中的印第安州和伊利诺伊州作为训练区域；选择美国本土的明尼苏达州南部（记为区域A1）、爱荷华州中西部（记为区域A2）和俄亥俄州东北部的部分区域（记为区域A3）和我国东北的H市为作物分类模型迁移的目标区域。

本申请实施例中，作物可以为主要粮食作物，比如玉米、小麦、水稻等，也可以是小面积种植作物，比如高粱等。为了便于说明，以下以玉米、大豆为例进行作物分类模型的训练以及模型迁移后对目标区域进行分类预测的作物。

本申请实施例中，训练数据集通过CDL(Cropland Data Layer)数据和遥感影像数据进行合成得到，其中，CDL数据和遥感数据均包含训练区域的多个不同时间周期的数据，可以理解地，不同时间周期，可以为不同的单年份或者多个不同年份的组合。示例性地，CDL数据可以为训练区域的2016-2019年的CDL数据，遥感影像可以为2016-2020年作物生长关键物候期的Landsat8 OLI地表反射率数据。

其中，Landsat8 OLI地表反射率数据的空间分辨率为30米，波段选取蓝、绿、红、近红外、短波红外1（第一短波红外）和短波红外2（第二短波红外）波段。需要说明的是，短波红外1波段和短波红外2波段用于作物分类模型的训练和作物分类预测，比可见光波段更能反映玉米、大豆的光谱信息，能够取得更好的分类效果。

CDL数据为覆盖美国全境的农作物类型数据，是高精度的作物类型分类产品数据，其生产使用数据包括：1）影像数据：以IRS-P6（RESOURCESAT-1）的AWIFS传感器影像，空间分辨率56米数据为主、同时使用Landsat TM/ETM、Landsat 8 OLI/TIRS、MODIS、灾害监测星座(DMC) DEIMOS-1和UK2、ISRO ResourceSat-2 LISS-3和SENTINEL-2 A和SENTINEL-2B数据。2）作物标签数据：生产CDL数据所用的农作物标签为CLU（公共用地单元）数据集，其中70%用于训练，30%用于验证；非农作物标签来自NLCD（国家土地覆盖数据）数据集。CDL数据生产方法是包括ARTMAP分类器和决策树的混合模型，以州为单位分别进行分类器训练。具体地，CDL数据生产使用的混合模型决策方案如图3所示，该图中C _i表示像元的类标签，λ表示置信水平，D _i是像元i在决策树中的类标签，A _i是像元i在ARTMAP中的类标签，V _i和P _i分别是像元i在决策树和ARTMAP中的置信水平：每个像元的类别标签和置信水平根据决策树和ARTMAP分类器之间是否一致决定。当某像元在两个分类中的类别一致时，该像元的类别为任意分类器的类别；否则，判断两个分类器的置信水平是否一致，不一致时选择置信水平更高的分类器的结果，一致时根据两个分类器的先验分类精度(PA _Ai 、PA _Pi)高低决定当前像元类别；当两个分类器的置信水平一致时，总的置信水平被指定为较高的一个。用模糊公式表示为：

在一些可选实施例中，所述将训练区域的CDL数据和遥感影像数据进行合成，得到作物分类的多个不同时间周期的训练数据集，包括：对所述训练区域的CDL数据按照预设周期进行标签重分类和标准化处理，得到每个所述预设周期内的标准化后的CDL数据；对所述训练区域的遥感影像数据按照所述预设周期进行去云处理，得到每个所述预设周期内的无云影像数据；对所述无云影像数据和所述标准化后的CDL数据按照所述预设周期进行波段合成，得到作物分类的多个不同时间周期的所述训练数据集。

其中，训练区域的CDL数据可以为2016-2019年的CDL数据。在将CDL数据与遥感影像数据合成之前，对CDL数据按照预设的周期进行标签重分类和标准化处理，得到每个预设周期内的标准化后的CDL数据。具体步骤如下：将CDL数据中原有的作物分类标签进行重新分类，将作物分类标签转换为自然数序列，其中，由于作物生长有物候期，选择作物播种期和生长旺盛期作为作物识别的时间段（预设周期）。如此，能够使其与作物分类模型相适配，提高模型训练的效率。

在另一可选实施例中，所述对所述训练区域的遥感影像数据按照所述预设周期进行去云处理，得到每个所述预设周期内的无云影像数据，包括：基于Fmask算法，计算每个所述预设周期内的所述训练区域的遥感影像数据的云分数，得到每个所述预设周期内的所述遥感影像数据对应的云分数值；根据每个所述预设周期内的所述遥感影像数据对应的云分数值与所述遥感影像数据的质量评估波段进行逐像元去云处理，得到每个所述预设周期内的所述无云影像数据。

考虑到遥感影像受到云污染和大气条件的影响，需要将作物识别的时间段的遥感影像进行影像合成，以得到无云影像数据，保证用于训练的遥感影像的质量。该过程包括：首先，进行云/云阴影检测，即基于Fmask算法，计算每个预设周期内的训练区域的遥感影像数据的云分数，得到每个预设周期内的遥感影像数据对应的云分数值；然后，使用质量评估（QA）波段与每个预设周期内的遥感影像数据对应的云分数值进行逐个像元按位与运算，得到每个预设周期内的无云影像数据，其中，按位与运算具体是：将遥感影像数据中每个像元的云分数值与每个像元的灰度值按位执行与运算；最后，将无云影像数据进行中值合成以重新生成地表反射率数据，并进行坐标转换，以统一数据的空间参照系，例如，转换成UTM投影，WGS-84地理坐标系。

其中，Fmask（Function of mask）算法可以根据遥感图像中云的亮温和反射特性计算得到遥感图像中每一个像素的云判别概率（云分数值）。QA波段是关于遥感影像数据中像元质量的波段单位，其通过标识遥感影像中每个像元受到仪器或云层影响的可能性，使得遥感影像的使用者能够更容易地识别出成像质量较差的像元、挑选出成像质量较好的像元。QA波段对与云层易混淆的情景具有更好的适用性，例如能够有效区分城市屋顶被积雪覆盖时的光谱特征与云层的光谱特征，从而得到更准确的遥感影像。

示例性地，训练数据集中遥感影像选取时间窗口可以反映作物的时间物候，在地理空间上均匀选取作物（玉米、大豆）种植区域作为训练样本，其中，作物的种植面积占整个训练区域的面积比例可以反映训练样本的空间分布情况，如表1所示，表1如下：

如表1所示，训练区域的遥感影像为2016-2019年作物生长季的遥感影像，对其进行去云处理得到无云影像数据后，对无云影像数据和标准化后的CDL数据按照预设周期进行波段合成，得到作物分类的多个不同时间周期的训练数据集。其中，波段合成可以采用中值合成，也可以采用其他波段合成算法，比如最大值合成。需要说明的是，对遥感影像进行去云处理以及对CDL数据进行重分类和标准化处理的过程均为逐年进行，详细流程如图2所示。

本申请实施例中，训练数据集的训练样本中包含时间物候信息，且，训练数据集的训练样本在空间上均匀分布，从而提高作物分类模型的分类性能。

步骤S102、根据所述训练数据集，构建多个不同时间周期的多个作物分类模型；其中，每一个所述时间周期对应一个所述作物分类模型。

本申请实施例中，多个不同时间周期的多个作物分类模型中，每个时间周期对应一个作物分类模型，其中，对多个单年CDL数据与遥感数据对应的训练数据集进行训练得到单年份作物分类模型，以及，对多年CDL数据与遥感数据对应的训练数据集训练得到多年份作物分类模型。通过在训练数据集中加入多年份的训练样本，随着训练数据集中包含的训练样本年数的增加，迁移到目标区域后，其分类的准确性随之增加，从而提升作物分类模型在大尺度空间上作物分类的模型泛化能力。

在一具体的例子中，分别用2016、2017、2018、2019年的美国的训练数据集进行模型训练，得到model_2016、model_2017、model_2018和model_2019四个单年份作物分类模型；使用2016年和2017年的训练数据集训练得到model_16_17，使用2016-2018年的训练数据集训练得到model_16_17_18，从而得到多个单年份作物分类模型和多年份作物分类模型构成的作物分类模型库，如图4所示。

本申请实施例中，用于迁移学习的作物分类模型为预训练U-net模型，使用训练数据集，基于深度学习框架Caffe (Convolutional architecture for fast feature)对模型进行训练。

在训练模型的过程中，设置超参数如下：初始学习率设置为10^-4，下降策略为inv，学习率变化指数为0.0001，power为0.75，梯度下降算法设置为Adam，权值衰减为0.0005；单年份作物分类模型训练的batch_size设置为32，model_2016_17的batch_size设置为64，model_2016_17_18的batch_size设置为128。在训练模型的过程中，通过设置不同的batch_size，一方面使得训练服务器的CPU或GPU能够满载运行，提高训练速度，另一方面，使得梯度下降算法的方向更加准确。

在一些可选实施例中，所述根据所述训练数据集，构建多个不同时间周期的多个作物分类模型进行训练，包括：每个所述作物分类模型的卷积层与SoftmaxWithLoss层相连接，计算得到每个所述作物分类模型的损失函数；根据所述训练数据集和每个所述作物分类模型的损失函数，对每个所述作物分类模型进行训练，以构建所述作物分类模型。其中，所述根据所述训练数据集和每个所述作物分类模型的损失函数，对每个所述作物分类模型进行训练，以构建所述作物分类模型，包括：根据所述训练数据集，对每个所述作物分类模型依次循环进行梯度下降、权值更新，直至对应的所述损失函数收敛，得到对应的所述作物分类模型。

具体地，在作物分类模型的训练阶段，模型通过卷积层与SoftmaxWithLoss层相连接计算出训练损失和验证损失，即分别计算训练数据集和验证数据集在作物分类模型的损失函数，训练过程中不断进行梯度下降、权值更新直至损失函数收敛，从而得到对应的作物分类模型。

图5为根据本申请的一些实施例提供的model_2016的收敛速度示意图；图6为根据本申请的一些实施例提供的model_2017的收敛速度示意图；图7为根据本申请的一些实施例提供的model_2018的收敛速度示意图；图8为根据本申请的一些实施例提供的model_2019的收敛速度示意图；图9为根据本申请的一些实施例提供的model_2016_17的收敛速度示意图；图10为根据本申请的一些实施例提供的model_2016_17_18的收敛速度示意图。如图5、图6、图7、图8、图9、图10所示，在作物分类模型的训练过程中，不同的训练数据集，对应的作物分类模型的收敛能力不同，具体地，4个单年份作物分类模型（model_2016、model_2017、model_2018和model_2019）的迭代次数为50万次以上，验证精度维持在90%以上，而2个多年份作物分类模型（model_16_17、model_2016_17_18），由于训练数据集的数据量增大，其训练速度有所下降，但是，相对于单年份作物分类模型，其迭代次数更少，收敛速度更快。

步骤S103、根据获取的目标区域的测试数据集，基于训练完成的多个所述作物分类模型对所述目标区域进行时空泛化分析，确定最佳作物分类模型，以对目标区域作物进行分类；其中，所述测试数据集中的多个时间周期与所述训练数据集的多个时间周期为不同的时间周期。

在一些可选实施例中，所述根据获取的目标区域的测试数据集，基于训练完成的多个所述作物分类模型对所述目标区域进行时空泛化分析，确定最佳作物分类模型，以对作物进行分类，包括：根据获取的所述目标区域的测试数据集，基于多个所述作物分类模型，得到训练完成的多个所述作物分类模型；基于训练完成的多个所述作物分类模型对所述目标区域的作物分类进行时空泛化分析，并根据所述目标区域的时空泛化分析结果，确定所述最佳作物分类模型，以对作物进行分类。

本申请实施例中，根据作物种植熟制与物候，迁移学习的目标区域设置为美国本土的明尼苏达州南部（记为A1）、爱荷华州中西部（记为A2）和俄亥俄州东北部的部分区域（记为A3）和我国东北的H市。

其中，目标区域的测试数据集包括：2016-2020年的遥感影像数据。目标区域的测试数据集的预处理方式与训练数据集的预处理方式相同，即通过云检测和去云处理，然后与CDL数据进行波段合成，得到目标区域的作物生长季的遥感影像，即测试数据集。

示例性地，表2给出了本实施例中部分测试数据集的选取时间窗口，表2如下：

表 2 目标区域的测试数据集的遥感影像选取时间窗口

本申请实施例中，根据获取的目标区域的测试数据集，将目标区域的测试数据集对应输入到多个作物分类模型，得到目标区域的多个预测结果，以得到训练完成的多个作物分类模型。其中，测试数据集中的多个时间周期与训练数据集的多个时间周期可以为不同的时间周期，例如，训练数据集的时间周期为2016年，则测试数据集可以为2016年以外时间周期内获取的数据，该2016年以外时间周期可以是单年份，也可以是多年份时间周期。

优选地，当训练数据集为多年份时间周期内获取，并以此为基础训练作物分类模型时，能够显著缩短测试数据集合成的时间窗口，提高该多年份时间周期对应的作物分类模型的分类预测精度。例如，训练数据集为2016-2018年，根据该训练数据集训练得到的作物分类模型为model_2016_17_18，基于该作物分类模型，对目标区域进行提取测试数集时，可以将测试数据集的合成时间窗口缩小至一个半月内。使用model_2016_17_18进行作物识别时，该模型的分类预测结果总体精度得到了提高，且大豆的分类预测精度提升较为明显。

基于训练完成的多个作物分类模型对目标区域的作物分类进行时空泛化分析，并根据目标区域的时空泛化分析结果，确定最佳作物分类模型，以对作物进行分类。其中，对目标区域进行时空泛化分析，具体包括：对训练数据集与测试数据集进行光谱特征分析、对多个作物分类模型进行空间泛化分析、对多个作物分类模型进行时间泛化分析。下面，对各个时空泛化分析进行详细介绍：

对训练数据集与测试数据集进行光谱特征分析，具体为：通过分析训练数据的光谱特征与作物分类模型的分类预测结果的光谱特征之间的匹配程度，判断作物分类模型在该目标区域的分类预测精度以及模型的适用性。图11为根据本申请的一些实施例提供的训练数据集的光谱特征分布图；图12为根据本申请的一些实施例提供的区域A1的测试数据集的光谱特征分布图；如图11、图12所示，训练数据集中，玉米和大豆的光谱特征约在500-800之间具有可分性，与CDL数据在目标区域对应的光谱特征相匹配，同时，model_2016对A1区域的预测结果中，玉米和大豆的光谱特征也同样集中在500-800范围内，由此可以判断，基于训练数据集得到的作物分类模型，在迁移到目标区域后具有较好的适用性。

对多个作物分类模型进行空间泛化分析，具体为：根据目标区域的测试数据集，基于多个作物分类模型，分别对目标区域的当年大豆、玉米进行分类预测，并计算分类预测结果的总体精度，以及，大豆、玉米的制图精度、用户精度和F1分数，用于评价各个作物分类模型的空间泛化能力，由此判断作物分类模型在该目标区域的分类预测精度。需要说明的是，这里，训练数据集的时间范围与测试数据集的时间范围相同。

示例性地，图13示出了本申请的一些实施例提供的不同模型在目标区域预测当年数据的总体精度，同时，表3示出了不同模型在不同目标区域分类预测当年玉米、大豆的精度，表3如下：

表3 不同作物分类模型对不同目标区域进行分类预测的精度

如图13、表3所示，单年份作物分类模型在美国的A1、A2、A3三个测试区都能完成当年数据的空间泛化，且三个区域的总体精度在80%以上，玉米的制图精度在83%-87%之间，F1分数在0.8-0.84之间，大豆的制图精度略低于玉米，在73%-85%之间，F1分数在0.78-0.84之间；在H市，单年份作物分类模型的总体精度介于60%-77%之间。

对多个作物分类模型进行时间泛化分析，具体为：分别用各个作物分类模型对目标区域不同时间范围的作物进行分类预测，并计算预测结果的总体精度，用于评价各个作物分类模型的时间泛化能力。这里，作物分类模型的训练数据集的时间范围与测试数据集的时间范围不同。

示例性地，如图14所示，不同模型在我国H市预测不同年份作物分类的总体精度不同，在4个单年份作物分类模型的预测结果中，每年的总体精度在69%-79%之间，玉米F1分数在0.69-0.80之间；大豆的F1分数低于玉米，在0.65-0.73之间。两个多年份的作物分类模型识别结果的总体精度得到了提升，介于72%-79%之间，玉米的F1分数在0.69-0.81之间；大豆F1分数在0.66-0.76之间。

在另一些可选实施例中，基于训练完成的多个作物分类模型对目标区域的作物分类进行时空泛化分析，并根据目标区域的时空泛化分析结果，确定最佳作物分类模型，以对作物进行分类。

具体地，根据训练数据集与测试数据集的光谱特征分析、多个作物分类模型的空间泛化分析、多个作物分类模型的时间泛化分析，确定每个目标区域最佳作物分类模型，并基于该最佳作物分类模型，对作物进行分类预测。

本申请中，以美国伊利诺伊州和印第安州作为训练区域，以CDL数据作为作物标签，将训练区域的CDL数据和遥感影像数据进行合成，得到作物分类的多个不同时间周期的训练数据集；然后，根据所述训练数据集，构建多个不同时间周期的多个作物分类模型；最后，根据获取的目标区域的测试数据集，基于训练完成的多个所述作物分类模型对所述目标区域进行时空泛化分析，确定最佳作物分类模型，以对目标区域作物进行分类。如此，通过CDL数据与遥感数据合成构建多个不同时间周期的训练数据集，扩充了作物分类模型的训练样本，解决了样本稀缺的问题；同时，基于对个不同时间周期，分别对多个作物分类模型进行时空泛化分析，确定最佳作物分类模型，提高了对目标区域作物分类预测的准确度。

本申请以多个时间周期的训练数据集为基础，基于深度学习训练得到多个作物分类模型，在此基础上进行作物迁移分类，不仅能够提取到光谱之外的深层信息，鲁棒性强，时空泛化能力较强，且对目标区域的测试数据集要求更加宽松，有利于快速收集目标区域的测试数据集并进行作物分类预测。

示例性系统

图15为根据本申请的一些实施例提供的基于CDL深度学习进行作物迁移分类的系统的结构示意图，如图15所示，该系统包括：训练数据获取单元1501、模型训练单元1502和泛化分析单元1503。

训练数据获取单元1501，配置为：将训练区域的CDL数据和遥感影像数据进行合成，得到作物分类的多个不同时间周期的训练数据集；其中，所述CDL数据和所述遥感影像数据均包含所述训练区域的多个不同时间周期的数据。

模型训练单元1502，配置为：根据所述训练数据集，构建多个不同时间周期的多个作物分类模型；其中，每一个所述时间周期对应一个所述作物分类模型。

泛化分析单元1503，配置为：根据获取的目标区域的测试数据集，基于训练完成的多个所述作物分类模型对所述目标区域进行时空泛化分析，确定最佳作物分类模型，以对目标区域作物进行分类；其中，所述测试数据集中的多个时间周期与所述训练数据集的多个时间周期为不同的时间周期。

本申请实施例提供的基于CDL深度学习进行作物迁移分类的系统能够实现上述任一基于CDL深度学习进行作物迁移分类的方法实施例的步骤、流程，并达到相同的有益效果，在此不再一一赘述。

示例性设备

图16为根据本申请的一些实施例提供的电子设备的结构示意图；如图16所示，该电子设备包括：

一个或多个处理器1601；

计算机可读介质，可以配置为存储一个或多个程序1602，一个或多个处理器1601执行一个或多个程序1602时，实现如下步骤：

图17为根据本申请的一些实施例提供的电子设备的硬件结构，如图17所示，该电子设备的硬件结构可以包括：处理器1701、通信接口1702、计算机可读介质1703和通信总线1704。

其中，处理器1701、通信接口1702、计算机可读介质1703通过通信总线1704完成相互间的通信。

可选地，通信接口1702可以为通信模块的接口，如GSM模块的接口。

其中，处理器1701具体可以配置为：

处理器可以是通用处理器，包括中央处理器（central processing unit，简称CPU）、网络处理器（Network Processor，简称NP）等，还可以是数字信号处理器（DSP）、专用集成电路（ASIC）、现成可编程门阵列（FPGA）或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本申请实施例的电子设备以多种形式存在，包括但不限于：

（1）移动通信设备：这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括：智能手机（例如：iPhone）、多媒体手机、功能性手机，以及低端手机等。

（2）超移动个人计算机设备：这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括：PDA、MID和UMPC设备等，例如iPad。

（3）便携式娱乐设备：这类设备可以显示和播放多媒体内容。该类设备包括：音频、视频播放器（例如：iPod），掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

（4）服务器：提供计算服务的设备，服务器的构成包括处理器、硬盘、内存、系统总线等，服务器和通用的计算机架构类似，但是由于需要提供高可靠的服务，因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。

（5）其他具有数据交互功能的电子装置。

需要指出，根据实施的需要，可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤，也可以将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤，以实现本申请实施例的目的。

上述根据本申请实施例的方法可在硬件、固件中实现，或者被实现为可存储在记录介质（诸如CD ROM、RAM、软盘、硬盘或磁光盘）中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器存储介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件（诸如ASIC或FPGA）的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件（例如，RAM、ROM、闪存等），当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的基于CDL深度学习进行作物迁移分类的方法。此外，当通用计算机访问用于实现在此示出的方法的代码时，代码的执行将通用计算机转换为用于执行在此示出的方法的专用计算机。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和涉及约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请实施例的范围。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其它实施例的不同之处。尤其，对于设备及系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述得设备及系统实施例仅仅是示意性的，其中作为分离不见说明的单元可以使或者也可以不是物理上分开的，作为单元提示的不见可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅为本申请的优选实施例，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种基于CDL深度学习进行作物迁移分类的方法，其特征在于，包括：

2.根据权利要求1所述的基于CDL深度学习进行作物迁移分类的方法，其特征在于，所述将训练区域的CDL数据和遥感影像数据进行合成，得到作物分类的多个不同时间周期的训练数据集，包括：

3.根据权利要求2所述的基于CDL深度学习进行作物迁移分类的方法，其特征在于，所述对所述训练区域的遥感影像数据按照所述预设周期进行去云处理，得到每个所述预设周期内的无云影像数据，包括：

4.根据权利要求1所述的基于CDL深度学习进行作物迁移分类的方法，其特征在于，所述根据所述训练数据集，构建多个不同时间周期的多个作物分类模型进行训练，包括：

5.根据权利要求4所述的基于CDL深度学习进行作物迁移分类的方法，其特征在于，所述根据所述训练数据集和每个所述作物分类模型的损失函数，对每个所述作物分类模型进行训练，以构建所述作物分类模型，包括：

6.根据权利要求1所述的基于CDL深度学习进行作物迁移分类的方法，其特征在于，所述根据获取的目标区域的测试数据集，基于训练完成的多个所述作物分类模型对所述目标区域进行时空泛化分析，确定最佳作物分类模型，以对作物进行分类，包括：

7.根据权利要求1所述的基于CDL深度学习进行作物迁移分类的方法，其特征在于，所述遥感影像数据为蓝、绿、红、近红外、第一短波红外、第二短波红外波段。

8.一种基于CDL深度学习进行作物分类的系统，其特征在于，包括：

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序为如权利要求1-7任一所述的基于CDL深度学习进行作物分类的方法。

10.一种电子设备，其特征在于，包括：存储器、处理器、以及存在所述存储器中并可在所述处理器上运行的程序，所述处理器执行所述程序时实现如权利要求1-7任一所述的基于CDL深度学习进行作物分类的方法。