WO2022214039A1

WO2022214039A1 - 一种农业种植结构的遥感识别方法

Info

Publication number: WO2022214039A1
Application number: PCT/CN2022/085640
Authority: WO
Inventors: 黄冠华; 冯子怡
Original assignee: 中国农业大学
Priority date: 2021-04-07
Filing date: 2022-04-07
Publication date: 2022-10-13
Also published as: CN112906666A

Abstract

本公开属于农业遥感领域，涉及一种农业种植结构的遥感识别方法，采用机器学习算法提取农作物的种植结构，并且满足多种训练数据类型，自动训练后得到高精度农业种植结构栅格化数据。本发明通过非监督算法k-means将相似像元先聚类成单一类别，而后运用自标记算法对样本集进行扩充，最后利用D-ELM算法将合并后的像元类别进行训练和计算。通过训练后的分类器再将所有区域分类判别，这样大大提高了分类器的效率，避免了使用监督分类算法时间空间复杂度过高而导致大区域种植结构分类不可行的问题，同时D-ELM混合分类器在保证分类精度前提下，满足农业遥感种植结构识别的制图精度。

Description

一种农业种植结构的遥感识别方法

本公开要求于2021年04月07日提交中国专利局、申请号为202110371126.X、发明名称为“一种农业种植结构的遥感识别方法”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开属于农业遥感领域，涉及一种农业种植结构的遥感识别方法，采用机器学习算法提取农作物的种植结构，并且满足多种训练数据类型，自动训练后得到高精度农业种植结构栅格化数据。

背景技术

20世纪以来，遥感能准确地获取农业生产信息，成为指导传统农业向信息科学化农业转变的主要技术方法。如今，利用遥感技术可以实现农作物识别及对应种植面积估算、农作物长势监测与产量估计、农作物叶面指数、叶绿素含量监测与养分诊断、农用地提取与动态监测等。因此，遥感和地理信息技术结合已经成为快速收集和定量分析农业信息、实现科学快速决策的基本手段。其中农作物种植结构识别和种植面积估算是进行农业结构调整的依据，也是研究水文模型、农业决策的重要数据源。从20世纪80年代中期，中国就开始利用气象卫星开展小麦、水稻、玉米等大宗作物的面积监测、长势及产量估计等技术研究。极限学习机(Extreme Learning Machine,ELM)因其学习速度快、泛化能力强而被广泛应用于各种分类任务中。

极限学习机(Extreme Learning Machine,ELM)作为一类针对前馈神经网络设计的机器学习算法，在2004年由Guang-Bin Huang、Qin-Yu Zhu和Chee-Kheong Siew提出，其诞生的动机是为了克服传统神经网络算法学习效率低、参数设定繁琐的问题。

ELM的特点是其学习过程不需要调整隐含层节点参数，输入层至隐含层的特征映射可以是随机的或人为给定的。由于仅需求解输出权重，ELM在本质上是一个线性参数模式(linear-in-the-parameter model)，其学习过程易于在全局极小值收敛。ELM在学习效率和泛化性能上的优势已经在许多领域得到证实，在与反向传播算法(Back-Propagation,BP)和支持向量机(Support Vector Machine,SVM)的比较中，ELM的学习时间显著缩短，且学习精度相当。ELM最初是为传统的分类和回归类问题而设计的，但在随后的研究中，其应用范围被推广至几乎所有机器学习领域，包括聚类和特征学习(representational learning)等，并出现许多变体和改进算法。ELM保持了前馈神经网络的万能近似定理(universal approximation theorem)适用性，而其学习策略为机器学习领域带来了诸多启发。然而，由于其浅层结构特征，ELM无法有效提取数据深层抽象信息。因此应用深度极限学习机，对解决大数据稀疏样本条件下种植结构的识别应用十分重要。

针对卫星遥感图像现有的分类算法难以在大范围高精度图像中实施、运算时间长且耗费大量的内存。对农业种植结构识别应用而言，单一的分类算法以及分类器很难解决实际情况所面对的计算量大，样本稀疏等问题。

在实际工作中聚类算法、SVM、随机森林、ELM等各种分类器都具有其优点与缺点，因此本公开结合各种算法的优势，取长补短，提高分类的效率以及精度。监督分类算法的优势在于可以根据训练数据样本对像元进行类别判别，根据样本的特征来确定像元的归属。监督分类的主要缺陷是必须在分类前定义样本的性质，分类效率低，而非监督分类是在没有样本的条件下，根据像元相似度自动判别归类，没有人工干预的成分，具有速度较快的优势，但当地物光谱的差异比较微小的时候，分类效果不如监督分类效果好，且无监督分类不能判别像元的归类，既为聚类算法。

发明内容

(一)要解决的技术问题

针对卫星遥感图像，现有的分类算法难以在大范围高精度图像中实施，且单一的分类算法以及分类器的分类效率较低。

(二)技术方案

针对上述技术问题，本公开的目的是提供一种农业种植结构的遥感识别方法，通过非监督算法k-means将相似像元先聚类成单一类别，而后运用自标记算法对样本集进行扩充，最后利用D-ELM算法将这些合并后的像元类别训练和计算。通过训练后的再将所有区域分类判别，这样大大提高了分类器的效率，避免了使用监督分类算法时间空间复杂度过高而导致大区域种植结构分类不可行的问题，同时D-ELM混合分类器在保证分类精度前提下，满足农业遥感种植结构识别的制图精度。

为了实现上述目的，本公开提供了如下技术方案：

一种农业种植结构的遥感识别方法，包括如下步骤：

步骤S1、利用k-means无监督学习算法对原始卫星图像进行分割：

S1.1、将原始卫星图像中的像素点分为K个簇，随机选取K个像素点作为初始的聚类中心点；

S1.2、计算原始卫星图像中的未聚类的像素点与各个聚类中心点之间的距离，将各像素点和与其距离最近的聚类中心点归为一类，完成一次聚类；判断此次聚类前后像素点的聚类情况是否相同，若相同，则完成聚类，进行步骤S1.4；若不同，则继续进行步骤S1.3；

S1.3、每分配一个像素点，重新计算该聚类中各像素点的中心点，并将该中心点设为新的聚类中心点，重复步骤S1.2；

S1.4、应用图例对聚类后的图像中各个簇与原始图像人工比对进行分析；然后将非农业区域覆盖的簇进行组合，最终对组合后的非农业区域进行裁剪，得到只包含农业区域的卫星图像；

步骤S2、应用基于支持向量机SVM和极限学习机ELM分类器结合训练的自标记算法对样本集进行扩充，得到最终扩大样本集EL：

在步骤S1图像分割的基础上，应用联合训练自标记算法来扩充训练集；

在训练过程中，使用标记样本集作为初始训练集，创建支持向量机SVM和极限学习机ELM分类器，然后以扩大后的标记样本集作为训练集，对支持向量机SVM和极限学习机ELM分类器进行更新；在标记阶段，将一部分未标记样本输入到经过初始训练的支持向量机SVM和极限学习机ELM分类器中，输出每个类别的置信度；CTSLAL算法根据置信度高于80％对样本进行标记，训练和标记过程是通过迭代重复进行；

步骤S3、利用D-ELM算法对扩大样本集EL的区域土地利用和/或农业种植结构进行分类：

将步骤S1中被分割后的只包含农业区域的卫星图像作为输入，同时将步骤S2中得到的最终扩大样本集EL作为新的训练集合，最终应用D-ELM分类器对整个包含农业区域的卫星图像的土地利用和/或种植结构进行分类；分类的结果是得到带有分类标签色彩的一张图像。

在使用k-means无监督学习算法进行图像分割时，为得到一个稳定的聚类结果，选择参数为K＝50个簇进行聚类。

所述步骤S2包括如下步骤：

S2.1、以标记样本集L和未标记样本集U作为输入；

其中，标记样本集L，为人工标记带有类别标签的像素点集合；

未标记样本集U，即在原始图像中随机抽取的大量没有标记类别的像素点集合；

S2.2、将标记样本集L和协同标记集CL结合，得到一个扩大样本集EL；协同标记集CL为协同标记自标记完成的样本集合，扩大样本集EL为人工标记样本与协同标记集CL的并集；

S2.3、支持向量机SVM分类器和极限学习机ELM分类器分别用标记样本集L进行初始训练学习；

S2.4、支持向量机SVM分类器和极限学习机ELM分类器分别从未标记样本集U中取得一组样本，进行标记，得到两个注释集，并应用基于协同训练评估器对两个注释集进行比较，将具有相同标注且置信度均高于80％的样本添加到协同标记集CL中，扩大样本集EL将相应地得到更新；

S2.5、通过更新的扩大样本集EL，重复步骤S2.4，重新训练支持向量机SVM分类器和极限学习机ELM分类器，然后应用协同训练评估器持续地执行标记任务；

S2.6、未标记样本集通过步骤S2.5被持续地标记，直到扩大样本集EL中的样本数量不再增加，从而得到最终扩大样本集EL。

所述标记样本集L包括葵花、玉米、小麦。

分类的结果的每一个图像中的像素点都有一个分类，不同颜色代表不同分类。

(三)有益效果

与现有技术相比，本公开的有益效果在于：

1、本公开解决实地样本获取困难，样本稀疏的情况下，合理提高样本的数量以及质量，保证分类器的分类精度以及稳定性。

2、本公开算法与传统分类器相比，降低了时间复杂度以及空间复杂度，使得在面对大区域高精度的图像时，可以用普通的硬件设备求得可观的分类结果，使得大区域的农业遥感种植结构自动获取成为可能。

附图说明

图1为本公开农业种植结构的遥感识别方法的流程图；

图2为本公开实施例的局部原始卫星图像(本描述中举例使用google earth历史影像，其他卫星原始图像均可)；

图3为对图2进行非监督算法k-means聚类后的图像；

图4为本公开实施例的分类后的图像；

图5为土地利用和(或)种植结构联合自标记算法流程图；

图6为遥感图像各个类别的图例。

具体实施方式

下面结合附图和实施例对本公开进行进一步说明。

如图1所示，本公开的一种农业种植结构的遥感识别方法，该方法将图像分割与自标记算法相结合。包括如下步骤：

S1.1、将原始卫星图像中的像素点分为K个簇，随机选取K个像素点作为初始的聚类中心点。

优选地，在本公开中，在使用k-means无监督学习算法进行图像分割时，为得到一个稳定的聚类结果，选择参数为K＝50个簇进行聚类。

S1.4、应用图例对聚类后的图像中各个簇与原始图像人工比对进行分析。然后将非农业区域覆盖的簇进行组合，最终对组合后的非农业区域进行裁剪，得到只包含农业区域的卫星图像。

如图6所示，为遥感图像各个类别的图例，包括荒地、沙地、水体、居民地、裸地、沼泽、建筑用地和农业耕地。其中，荒地、沙地、水体、居民地、裸地、沼泽、建筑用地为非农业区域，农业耕地为农业区域。

在步骤S1图像分割的基础上，应用联合训练自标记算法(CTSLAL)来扩充训练集。

在训练过程中，使用标记样本集作为初始训练集，创建SVM和 ELM分类器，然后以扩大后的标记样本集作为训练集，对支持向量机SVM和极限学习机ELM分类器进行更新。在标记阶段，将一部分未标记样本输入到经过初始训练的支持向量机SVM和极限学习机ELM分类器中，输出每个类别的置信度。CTSLAL算法根据置信度高于80％对样本进行标记，训练和标记过程是通过迭代重复进行。

S2.1、以标记样本集L和未标记样本集U作为输入。

其中，标记样本集L，为人工标记带有类别标签的像素点集合。如图5所示，本公开的标记样本集L例如包括葵花、玉米、小麦等。

未标记样本集U，即在原始图像中随机抽取的大量没有标记类别的像素点集合。

S2.2、将标记样本集L和协同标记集CL结合，得到一个扩大样本集EL。如图5中所示，协同标记集CL为协同标记自标记完成的样本集合，扩大样本集EL为人工标记样本与协同标记集CL的并集。

S2.4、支持向量机SVM分类器和极限学习机ELM分类器分别从未标记样本集U中取得一组样本，进行标记，得到两个注释集，并应用基于协同训练评估器对两个注释集进行比较，将具有相同标注且置信度均高于80％的样本添加到协同标记集CL中，扩大样本集EL将相应地得到更新。

S2.5、通过更新的扩大样本集EL，重复步骤S2.4，重新训练支持向量机SVM分类器和极限学习机ELM分类器，然后应用协同训练评估器可持续地执行标记任务。

将步骤S1中被分割后的只包含农业区域的卫星图像作为输入，同时将步骤S2得到的最终中扩大样本集EL作为新的训练集合，最终应用D-ELM分类器对整个包含农业区域的卫星图像的土地利用和/或种植结构进行分类。

分类的结果是得到带有分类标签色彩的一张图像。

图1中输出的部分就是分类结果。优选地，每一个图像中的像素点都有一个分类，不同颜色代表不同分类。

工业实用性

本公开提供的农业种植结构的遥感识别方法，通过非监督算法k-means将相似像元先聚类成单一类别，而后运用自标记算法对样本集进行扩充，最后利用D-ELM算法将合并后的像元类别训练和计算，可以解决实地样本获取困难的问题。在样本稀疏的情况下，可以合理提高样本的数量以及质量，保证分类器的分类精度以及稳定性，具有很强的工业实用性。

Claims

一种农业种植结构的遥感识别方法，其特征在于，该方法包括如下步骤：

步骤S1、利用k-means无监督学习算法对原始卫星图像进行分割：

S1.1、将原始卫星图像中的像素点分为K个簇，随机选取K个像素点作为初始的聚类中心点；

S1.2、计算原始卫星图像中的未聚类的像素点与各个聚类中心点之间的距离，将各像素点和与其距离最近的聚类中心点归为一类，完成一次聚类；判断此次聚类前后像素点的聚类情况是否相同，若相同，则完成聚类，进行步骤S1.4；若不同，则继续进行步骤S1.3；

S1.3、每分配一个像素点，重新计算该聚类中各像素点的中心点，并将该中心点设为新的聚类中心点，重复步骤S1.2；

S1.4、应用图例对聚类后的图像中各个簇与原始图像人工比对进行分析；然后将非农业区域覆盖的簇进行组合，最终对组合后的非农业区域进行裁剪，得到只包含农业区域的卫星图像；

步骤S2、应用基于支持向量机SVM和极限学习机ELM分类器结合训练的自标记算法对样本集进行扩充，得到最终扩大样本集EL：

在步骤S1图像分割的基础上，应用联合训练自标记算法来扩充训练集；

在训练过程中，使用标记样本集作为初始训练集，创建支持向量机SVM和极限学习机ELM分类器，然后以扩大后的标记样本集作为训练集，对支持向量机SVM和极限学习机ELM分类器进行更新；在标记阶段，将一部分未标记样本输入到经过初始训练的支持向量机SVM和极限学习机ELM分类器中，输出每个类别的置信度；CTSLAL算法根据置信度高于80％对样本进行标记，训练和标记过程是通过迭代重复进行；

步骤S3、利用D-ELM算法对扩大样本集EL的区域土地利用和/ 或农业种植结构进行分类：

将步骤S1中被分割后的只包含农业区域的卫星图像作为输入，同时将步骤S2中得到的最终扩大样本集EL作为新的训练集合，最终应用D-ELM分类器对整个包含农业区域的卫星图像的土地利用和/或种植结构进行分类；分类的结果是得到带有分类标签色彩的一张图像。
根据权利要求1所述的农业种植结构的遥感识别方法，其特征在于，在使用k-means无监督学习算法进行图像分割时，为得到一个稳定的聚类结果，选择参数为K＝50个簇进行聚类。
根据权利要求1所述的农业种植结构的遥感识别方法，其特征在于，所述步骤S2包括如下步骤：

S2.1、以标记样本集L和未标记样本集U作为输入；

其中，标记样本集L，为人工标记带有类别标签的像素点集合；

未标记样本集U，即在原始图像中随机抽取的大量没有标记类别的像素点集合；

S2.2、将标记样本集L和协同标记集CL结合，得到一个扩大样本集EL；协同标记集CL为协同标记自标记完成的样本集合，扩大样本集EL为人工标记样本与协同标记集CL的并集；

S2.3、支持向量机SVM分类器和极限学习机ELM分类器分别用标记样本集L进行初始训练学习；

S2.4、支持向量机SVM分类器和极限学习机ELM分类器分别从未标记样本集U中取得一组样本，进行标记，得到两个注释集，并应用基于协同训练评估器对两个注释集进行比较，将具有相同标注且置信度均高于80％的样本添加到协同标记集CL中，扩大样本集EL将相应地得到更新；

S2.5、通过更新的扩大样本集EL，重复步骤S2.4，重新训练支持向量机SVM分类器和极限学习机ELM分类器，然后应用协同训练评估器持续地执行标记任务；

S2.6、未标记样本集通过步骤S2.5被持续地标记，直到扩大样本集EL中的样本数量不再增加，从而得到最终扩大样本集EL。
根据权利要求3所述的农业种植结构的遥感识别方法，其特征在于，所述标记样本集L包括葵花、玉米、小麦。
根据权利要求1所述的农业种植结构的遥感识别方法，其特征在于，分类的结果的每一个图像中的像素点都有一个分类，不同颜色代表不同分类。