CN111462223B - 基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法 - Google Patents

基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法 Download PDF

Info

Publication number
CN111462223B
CN111462223B CN202010321528.4A CN202010321528A CN111462223B CN 111462223 B CN111462223 B CN 111462223B CN 202010321528 A CN202010321528 A CN 202010321528A CN 111462223 B CN111462223 B CN 111462223B
Authority
CN
China
Prior art keywords
image
soybean
corn
sentinel
random forest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010321528.4A
Other languages
English (en)
Other versions
CN111462223A (zh
Inventor
张东彦
杨玉莹
佘宝
黄林生
梁栋
杜世州
赵晋陵
彭代亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN202010321528.4A priority Critical patent/CN111462223B/zh
Publication of CN111462223A publication Critical patent/CN111462223A/zh
Application granted granted Critical
Publication of CN111462223B publication Critical patent/CN111462223B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10032Satellite or aerial image; Remote sensing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30181Earth observation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geometry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Processing (AREA)

Abstract

本发明特别涉及一种基于Sentinel‑2影像的江淮地区大豆和玉米种植面积识别方法,包括如下步骤:A、获取Sentinel‑2卫星拍摄的待测区域卫星图像并进行预处理;B、采用JM距离计算土地覆盖类型之间的可分离性,选择最佳分类时相的图像;C、通过分类算法对目标区图像中的像素点进行分类;D、根据被分类为大豆/玉米的像素点数量计算得到大豆/玉米的种植面积。本发明利用具有较高时空分辨率的Sentinel‑2影像数据,结合相关分类算法,可以很好地实现江淮地区大豆和玉米的识别。采用这些步骤,可以在大豆和玉米收获之前,以相对快速和低成本的方式,在种植结构破碎的主产区对大豆和玉米进行识别并制图,获得相对可靠的大豆和玉米的空间分布结果,从而为种植结构复杂和气候多变地区的大豆和玉米种植面积提取提供技术支持。

Description

基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别 方法
技术领域
本发明涉及农作物图像识别技术领域,特别涉及一种基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法。
背景技术
在全球粮食生产中备受关注的大豆和玉米两种农作物在世界范围内广泛种植。作为高产食品且营养价值极高的玉米在世界上被称为黄金作物;大豆是食用油,蛋白质食品和饲料蛋白的重要原料,两者在世界粮食生产安全中均占有重要地位。中国是大豆和玉米的主要生产国之一。2018年,中国的玉米播种面积达到42159kha,位于全球第一,大豆的播种面积达到7974kha,居于全球第五位。由于动物饲养、食用油压榨等多项需求导致大豆和玉米在国内供不应求,每年仍需大量进口。近年来,农业部门不断实施大豆振兴政策和玉米种植调整政策,努力扩大大豆种植规模和优化玉米种植方案。因此,迫切需要一种及时、准确地获取大豆和玉米的空间分布信息,进而帮助相关政府部门制定农业政策指导大豆和玉米优质生产的无损监测方法。传统估计大豆和玉米种植面积的农业普查方法通常消耗大量的人力和资源,且效率低,主观性强。目前,遥感监测技术为提取大豆和玉米种植面积提供了一种更方便、经济、客观、可靠和更快的方法。
中等分辨率成像光谱仪(MODIS)以其高时间、光谱分辨率和丰富的产品类型的优势,已被大量用于美国、巴西和阿根廷的大豆和玉米的制图研究。该卫星影像数据适合绘制大面积的作物分布图,但是,受混合像元的影响使其不适用于夏季作物种植结构复杂且分布破碎的地区,例如中国江淮地区(安徽)和东南部地区。近年来,一些研究还集中探索空间分辨率较高卫星数据(Landsat,GF-1)和高等空间分辨率卫星数据(RapidEye)在大豆和玉米种植面积提取中的潜力。Landsat类型的卫星重访周期相对较长,限制了大豆和玉米关键生长期影像的获取;GF-1的重访周期较短,但是光谱分辨率较低(4个光谱波段),不能提供足够有利的特征来区分大豆和玉米两种农作物。RapidEye空间分辨率高,可以提供更多的地物细节信息,但其高昂的成本限制了其普遍使用。相比上述几种卫星影像数据,Sentinel-2卫星在时间、空间和光谱分辨率三个方面都具有优势,可用于江淮地区大豆和玉米种植面积识别。
使用遥感数据进行大豆和玉米制图主要是基于光谱和作物物候方面的差异。一些研究旨在通过时间序列分析和混合像素分解方法来区分大豆和玉米,但大多数研究都将多时相数据和植被指数结合起来进行分析。随着农作物遥感监测技术的发展,监督分类方法也是一个有利的工具,越来越多地被应用于遥感领域。因此,一些研究已经利用决策树和最大似然方法以及机器学习算法,如支持向量机,随机森林来识别大豆和玉米,并获得令人满意的结果。但是在遥感背景下进行大豆和玉米提取的研究仍然存在一些困难,特别是在多雨多云,种植作物类型较多的地区——长江和淮河之间地区(安徽)。首先,该地区因大豆和玉米生长期间受气候变化影响,导致卫星影像的云污染比例高。其次,小农种植造成种植结构复杂。此外,由于大豆和玉米之间的物候和光谱相似性也增加了两种作物制图的难度。国内外现有的关于大豆和玉米提取的研究都集中在连片种植地区,例如美国、巴西和中国东北部。作为中国大豆和玉米的主要产区之一的江淮地区,鲜有关注。
发明内容
本发明的目的在于提供一种基于Sentinel-2影像的大豆和玉米的种植面积识别方法,能够方便、快速且准确的对大豆和玉米进行识别。
为实现以上目的,本发明采用的技术方案为:一种基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法,包括如下步骤:A、获取Sentinel-2卫星拍摄的待测区域卫星图像并进行预处理;B、采用JM距离统计量来计算大豆/玉米与其他土地覆盖类型之间的可分离性,选择最佳分类时相的图像执行下一步;C、通过对比随机森林算法、支持向量机算法和反向传播神经网络算法,选择最佳分类算法对图像中的像素点进行分类;D、根据被分类为大豆/玉米的像素点数量计算得到大豆/玉米的种植面积。
与现有技术相比,本发明存在以下技术效果:利用具有较高时空分辨率的Sentinel-2影像数据,结合常见的分类算法,可以很好的实现大豆和玉米种植面积的识别,采用这些步骤,可以在大豆和玉米收获之前,以相对快速和低成本的方式,在种植结构破碎的主产区对大豆和玉米进行识别和制图,获得相对可靠的大豆和玉米的空间分布结果,弥补了在种植结构复杂和气候多变地区(安徽)的大豆和玉米提取研究的不足。
附图说明
图1是大豆和玉米提取流程图;
图2是研究区的行政区划矢量边界以及六个样方的分布和编号图;
图3是基于最佳提取影像的特征重要性排序;
图4是基于序列前向选择的特征数量与分类精度之间的关系图;
图5是三种分类方案的分类结果图;
图6是三种分类方案的六个样方的分类结果图和无人机影像的大豆玉米实际空间分布图。
具体实施方式
下面结合图1至图6,对本发明做进一步详细叙述。
参阅图1和图2,一种基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法,包括如下步骤:A、获取Sentinel-2卫星拍摄的待测区域卫星图像并进行预处理;B、采用JM距离统计量来计算大豆/玉米与其他土地覆盖类型之间的可分离性,选择最佳分类时相的图像执行下一步;C、通过随机森林算法、支持向量机算法、反向传播神经网络算法对图像中的像素点进行分类并选出最优分类算法;D、根据被分类为大豆/玉米的像素点数量计算得到大豆/玉米的种植面积。这里利用具有较高时空分辨率的Sentinel-2影像数据,结合常见的分类算法,可以很好的实现大豆和玉米种植面积的识别,采用这些步骤,可以在大豆和玉米收获之前,以相对快速和低成本的方式,在种植结构破碎的主产区对大豆和玉米进行识别和制图,获得相对可靠的大豆和玉米的空间分布结果,弥补了在种植结构复杂和气候多变的条件下大豆和玉米种植面积提取研究的不足。
Sentinel-2拥有两颗相同的卫星Sentinel-2A(于2015年6月发射)和Sentinel-2B(于2017年3月发射),是欧洲航天局(ESA)开发的广泛用于提供地球观测服务的卫星。它带有一个290km宽视野的多光谱成像仪(MSI),具有四个10m波段,六个20m波段和三个60m波段,覆盖的光谱范围从可见光、近红外(NIR)到短波红外(SWIR)。Sentinel-2的一颗卫星重访周期为10天,两颗卫星互补,重访周期为5天。在光学卫星影像中,Sentinel-2是唯一具有三个红边波段的数据,这对于植被监测非常有效,因此本发明中的步骤A中,对Sentinel-2卫星拍摄的图像进行处理。Sentinel-2卫星的部分参数信息如表1所示:
表1 Sentinel-2卫星的部分参数信息
Figure BDA0002461617630000041
Sentinel-2卫星拍摄的图像有很多,我们选择大豆河玉米差异最大的生育期图像进行两种作物的识别。为了评估训练样本之间的差异程度,可以使用多种方法来确定不同地物之间的可分离性,例如Jeffries-Matusita(JM)距离、Bhattacharyya距离、离散度、样本之间的平均距离以及类别之间的相对距离等。前人研究表明,基于条件概率理论的JM距离被认为比其他指标更适合表示不同类别的可分离性,并且是评估各种训练样本可分离性的有效方法。本发明中,选择大豆结荚期的Sentinel-2卫星影像(三幅),每种地物类型选取50个训练样本集,采用JM距离统计量来计算大豆、玉米和其他土地覆盖类型(高粱、建筑物、林地、道路、水体和裸地等)之间的可分离性来确定最佳分类时相。
进一步地,所述的步骤A中,包括如下步骤:A1、获取Sentinel-2卫星拍摄的可利用的待测地区影像,10m分辨率的四个波段,即表1中的Band 2-Blue、Band 3-Green、Band 4-Red以及Band 8-NIR,这四个波段对应的反射率值分别记为B2、B3、B4、B8,以及20m分辨率的六个波段图像,即表1中的Band 5-Vegetation Red Edge、Band 6-Vegetation Red Edge、Band 7-Vegetation Red Edge、Band 8A-Vegetation Red Edge、Band 11-SWIR以及Band12-SWIR,这六个波段对应的反射率值分别记为B5、B6、B7、B8a、B11以及B12;A2、采用在Sentinel应用程序平台SNAP V6.0.0(http://step.esa.int/main/download/)上可用的Sentinel-2工具箱里的Sen2Cor 2.8处理器(http://step.esa.int/main/third-party-plugins-2/sen2cor/)对所获得的图像进行大气校正;A3、为了使本发明中使用的波段具有相同的空间分辨率,采用最近邻插值方法将20m分辨率重采样至10m;A4、使用ENVI 5.3.1(https://www.harrisgeospatial.com/)将十个10m分辨率波段合成并裁剪即可获得预处理图像。
进一步地,所述的步骤A中,连续获取多张大豆结荚期的影像,并对每张图像都进行预处理,以方便计算每张图像中大豆/玉米与其他土地覆盖类型之间的可分离性。地物类型之间可分离性的计算方式多样,本发明中选择JM距离方法,步骤B中,JM距离按照如下公式计算:
Figure BDA0002461617630000061
cj,ck表示所考虑的两种不同作物或其他土地覆盖类型,P(x|cj)表示条件概率密度,即第j个像元属于cj类别的概率。在正态假设下,上面的公式可定义为下面的公式:
JM=2(1-e-B),
其中,
Figure BDA0002461617630000062
式中,μj和μk表示特定类型光谱反射率的平均值,T是转置函数,∑j和∑k分别是协方差矩阵j和k的无偏估计。JM距离的范围是0~2,不同的值表示不同类别的样本之间的可分离性大小。大于1.9的值表示样本之间具有很好的可分离性;如果小于1.8,则需要重新选择样本;如果小于1,可以考虑将两种类型的样本组合为一种类型。
相关研究表明,大豆结荚期适合玉米和大豆的识别与制图,因该时期类内光谱差异最小,类间的光谱差异较大。由于Sentinel-2卫星的重复周期为5天,即每隔5天即可获取到一张卫星图像,大豆结荚期内可获取多张卫星图像,理论上来说,任一张卫星图像都可以进行大豆和玉米的识别,但本发明在引入JM距离后,可以从这些图像中选择大豆/玉米和其他土地覆盖类型之间JM距离最大的图像来进行大豆和玉米的识别,此时就需要确定哪幅影像更适合研究区作物的分类。
本发明中在大豆结荚期获得了三幅可用的Sentinel-2图像,基于这三幅图像计算了大豆、玉米和其他主要土地覆盖类型之间的可分离性,具体数据如下方的表2所示。根据表2的结果,大豆,玉米和非植被在三个时期中均具有良好的可分离性。尽管三幅影像都处于大豆的结荚期,但由2019年8月18日和2018年8月28日的影像计算得出的大豆,玉米与其他主要土地覆盖类型之间的JM距离值均大于1.8,明显高于由2019年9月7日的图像计算出的JM距离。此外,从2019年8月18日的图像得出的大豆,玉米和除森林以外的其他土地覆被类型之间的可分离性要好于2019年8月28日的可分离性。因此本发明将2019年8月18日的影像用于后续分类识别。从这些结果可得出,大豆的早期或中期结荚期(安徽北部每年大约在八月中旬和八月下旬)是大豆和玉米提取的最佳时期,当然,对于不同的地域、品种、待识别作物种类,最佳分类时相可能存在差异,具体可以按照前述的步骤进行JM距离计算然后根据所得结果择优选择即可。
表2大豆、玉米与其他地物类型之间的JM距离
Figure BDA0002461617630000071
随机森林算法、支持向量机算法和反向传播神经网络算法都是分类常用的算法,本发明通过这三种常见的算法对大豆和玉米进行识别,根据分析结果确定随机森林算法的总体识别精度最高,因此本发明中优选地,所述的步骤C中,通过随机森林算法对图像中的像素点进行分类。与其他机器学习算法相比,随机森林算法只需要设置两个关键的用户定义参数即可构建模型,参数之一是决策树的数量,本发明中优选地,随机森林的决策树数量为100个,另一个参数就是在每个拆分节点中使用的特征变量的个数,本发明中优选地,其取值为特征变量总数的平方根向下取整。特征变量为以下特征中任选的多个:10m分辨率的四个波段和20m分辨率的六个波段的原始反射率值{B2,B3,B4,B5,B6,B7,B8,B8a,B11,B12}以及使用这十个原始波段反射率值计算出的常用指数。使用不同的特征变量和训练集数据就可以训练出不同的决策树,很多决策树一起就构成了随机森林算法的模型,模型建立完成后,以后只需要将图像输入模型中,就可以直接输出识别好的图像,十分方便。
常用指数有很多,用户可以根据实际的使用需求来选择,本发明中优选地,所述的常用指数有十个,分别按照以下公式计算得出:
Figure BDA0002461617630000081
/>
根据光谱特征组合的不同,可以设计出多个分类方案。比如实施例一:只采用十个原始波段反射率作为特征变量;实施例二,采用十个原始波段反射率和上述十个常用植被指数作为特征变量;实施例三,从这二十个特征中选择最优的特征子集作为特征变量。下面对这三个实施例进行详细的阐述。
实施例二,所述的步骤C中,包括如下步骤:C11、从卫星图像中随机位置提取多个设定尺寸的样方图像,样方区域中包括大豆、玉米、高粱、建筑、森林、道路、水体、裸地、其他植被共九种土地覆盖类型;C12、从无人机搭载高清相机和谷歌地球拍摄的高清图像中获取样方对应位置的高清图像;C13、人工标记样方对应位置高清图像中的土地覆盖类型;C14、将标记好的土地覆盖类型按照坐标位置对应到原始的样方的卫星图像上构成训练集;C15、将训练集数据、二十个特征、设定好的决策树数量和每个拆分节点中使用的特征变量的个数代入随机森林算法中训练得到第一随机森林算法模型;C16、将步骤B中的图像代入第一随机森林算法模型中即可实现图像中每个像素点的识别。将步骤C15中的二十个特征改为十个原始波段反射率即得到实施例一。
这里首先通过步骤C11从原始的卫星图像中裁剪出多个样方,样方的大小可选择1km×1km,对于分辨率为10m的卫星图像而言,每个样方即对应100像素×100像素,从样方的原始图像无法进行人工识别,故这里通过步骤C12中获取样方对应位置的高清图像,高清图像可以通过谷歌地球拍摄的高清图片,也可以通过无人机搭载高清相机去拍摄获得,从这些高清的图像中,就可以人工进行土地覆盖类型的标记,然后根据坐标位置就可以将土地覆盖类型与样方原始卫星图像对应起来,即可获得用于训练随机森林算法的训练集数据。而后,按照常规的模型建立方法建立第一随机森林算法模型,该模型可用于大豆和玉米的识别。
实施例三,所述的步骤C中,包括如下步骤:C21、执行权利要求6中的步骤C11-C14得到训练集;C22、计算二十个特征在随机森林算法中的重要性得分;C23、根据特征的得分从高到低,将二十个特征依次添加到随机森林分类器中,由顺序前向选择构建分类模型,然后验证不同模型的分类精度确定最佳特征集中的特征数量;C24、将训练集数据、最佳特征集中的特征、设定好的决策树数量和每个拆分节点中使用的特征变量的个数代入随机森林算法中训练得到第二随机森林算法模型;C25、将步骤B中的图像代入第二随机森林算法模型中即可实现图像中每个像素点的识别。特征越多,随机森林算法的训练时间越久且处理速度越慢,并且,当识别精度达到一定程度后,过多特征只能带来极小的精度提升甚至会降低精度,每个特征对分类精度的贡献也是不一样的,这里通过步骤C22和步骤C23,选择出合适数量的重要特征,简化随机森林算法模型,提高数据处理速度。
具体地,基于2019年8月18日获取的Sentinel-2影像,通过随机森林算法得出的特征重要性排名如图3所示。从图中可看出,特征B6得分最高(3.75),而NDWI得分最低(0.19)。也就是说,B6在大豆和玉米的提取中贡献最大,而NDWI的影响最小。
尽管已经确定了二十个特征的重要性,但是用于分类的最佳特征集仍需要进一步研究才能最终得到实施例三。首先,根据特征的得分从高到低,将二十个特征依次添加到随机森林分类器由顺序前向选择(SFS)构建分类模型。即得分最高的B6首先添加到分类器中,NDWI最后添加。然后,通过不同模型的分类精度确定最佳特征集中的特征数量,最后得到如图4所示的折线图。
从图4中可看出,随着重要特征的不断添加,分类精度不断提高。当添加第七个特征时,分类精度取得局部最大值(94.12%)。之后,特征的数量从7个增加到20个,冗余特征的出现可能会导致分类精度略有下降。但是,总体精度在很小的范围内变化,这意味着可以通过减少65%的数据量来提高随机森林分类器的性能,并确保了高精度的分类结果。因此,本发明选择图4中所示的前七个重要特征(B6,B12,B8,B3,NDVI,B2,NDVIre2)作为实施例三中的最佳特征集。这七个重要特征只是经过专门实验中得出的,实际情况下,由于地理位置、物种、待识别作物等差异,重要特征集可能有所差异,只要按照这个步骤就能获得对应的最佳特征集。
图5是基于上述三个实施例的分类结果,其中,上排的A、B、C分别对应采用实施例一、二、三进行分类识别的结果,下排的a、b、c分别为A、B、C的局部放大图,图中可以清晰的看出:颜色较深的为玉米,颜色较浅的为大豆,颜色为白色的是其他。这样就可以通过统计某个颜色的面积,再通过面积换算得到大豆和玉米的实际种植面积。图6是三种实施例识别的和人工标记的六个样方分类结果,每个小图下方的序号中,1-6代表样方编号,A、B、C、D分别代表实施例一、实施例二、实施例三以及人工标记的分类结果,图中黑色框框表示三种方案下的存在主要差异的区域。
以上处理步骤中,对于不同的分类算法或者不同的随机森林算法实施方式,都需要评价模型的优劣,故本发明中优选地,所述的步骤C24中,利用混淆矩阵生成总体分类精度、用户精度、制图精度以及卡帕系数作为评估指标,这四个评估指标中,可以选用其中的一种指标或多种指标来进行评估。
本发明运用混淆矩阵对三种分类算法以及三种随机森林算法实施例进行精度评估,其具体数据如表3、表4所示。
表3三种分类算法的混淆矩阵
Figure BDA0002461617630000111
/>
Figure BDA0002461617630000121
表4三种分类方案的混淆矩阵
Figure BDA0002461617630000122
表3中,第一行类型名称表示的是实际物,第二列的类型名称表示对应算法识别出的识别物,以SVM分类算法为例,其对应的第一列数据表明:大豆被正确识别的个数有73个,大豆被识别成玉米和高粱分别是14和4个。从该混淆矩阵中,可以轻易的计算各指标。总体分类精度,即正确识别的类型占总数的比例,即将矩阵中对角线数据求和除以总数;制图精度,即假定地表真实为X类,分类器能将一幅图像的像元归为X的概率;用户精度,即假定分类器将像元归到X类时,相应的地表真实类别是X的概率。卡帕系数按如下公式计算:
Figure BDA0002461617630000131
其中N用于表征像素总数,m表示类别数,Xii是混淆矩阵中对角线上的像素个数,Xi+和X+i表示第i行和第i列的像素数目。
以上步骤中,详细叙述了如果从Sentinel-2影像中进行大豆和玉米的识别,需要注意的是,通过这些步骤可以单独实现大豆的识别,也可以单独实现玉米的识别,也可以同时识别出大豆和玉米,这个可以根据需要进行单独的模型训练。
本发明中,利用具有较高时空分辨率的Sentinel-2影像数据,对江淮地区(以安徽省北部为例)大豆和玉米的识别与制图进行了综合研究。结果表明,Sentinel-2数据在大豆和玉米制图方面具有很大潜力。大豆的结荚早期或中期是识别大豆和玉米的最佳时期,随机森林算法被确定为提取大豆和玉米的最佳分类器。此外,由随机森林算法生成的最佳分类特征是B6,B12,B8,B3,NDVI,B2和NDVIre2。当比较不同的分类方案时,随机森林分类器基于最佳特征方案生成的Kappa值介于0.70~0.82之间,由此发现将计算量减少65%的最佳特征方案用更少的输入获得更准确的结果。本发明中的识别方法,在大豆和玉米收获之前,以相对快速和低成本的方式,在种植结构破碎的主产区对大豆和玉米进行识别与制图,最终获得了相对可靠的大豆和玉米的空间分布结果,弥补了在种植结构复杂和气候多变的条件下大豆和玉米种植面积提取研究的不足,且这些具体步骤是精准农业在遥感领域的关键性和基础性工作,为数字农业提供了的借鉴和参考,具有非常高的商用价值。

Claims (6)

1.一种基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法,其特征在于:包括如下步骤:
A、获取Sentinel-2卫星拍摄的待测区域遥感图像并进行预处理;
B、采用JM距离统计量来计算大豆/玉米与其他土地覆盖类型之间的可分离性,选择最佳分类时相的图像执行下一步;
C、通过随机森林算法(RF)对图像中的像素点进行分类;
D、根据被分类为大豆/玉米的像素点数量计算得到大豆/玉米的种植面积;
所述的步骤C中,通过随机森林算法对图像中的像素点进行分类,随机森林的决策树数量为100,在每个拆分节点中使用的特征变量的个数为特征变量总数的平方根向下取整,特征变量为以下特征中优选的多个:10m分辨率的四个波段和20m分辨率的六个波段的原始反射率值{B2,B3,B4,B5,B6,B7,B8,B8a,B11,B12}以及使用这十个原始波段反射率生成的指数特征;
所述的指数特征有十个,分别按照以下公式计算得出:
Figure QLYQS_1
所述的步骤C中,包括如下步骤:
C11、从卫星影像中随机位置提取多个设定尺寸的样方区域,样方区域中主要包括大豆、玉米、高粱、其他植被四种土地覆盖类型;
C12、从无人机搭载高清相机和谷歌地球拍摄的高清图像中获取样方区域对应位置的高清图像;
C13、人工标记样方对应位置高清图像中的土地覆盖类型;
C14、将标记好的土地覆盖类型按照坐标位置对应到原始的样方的卫星图像上构成训练集;
C15、将训练集数据、二十个特征、设定好的决策树数量和每个拆分节点中使用的特征变量的个数代入随机森林算法中训练得到第一随机森林算法模型;
C16、将步骤B中的图像代入第一随机森林算法模型中即可实现图像中每个像素点的识别。
2.如权利要求1所述的基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法,其特征在于:所述的步骤C还可按如下步骤执行:
C21、执行权利要求1中的步骤C11-C14得到训练集;
C22、采用随机森林算法计算二十个特征在分类中的重要性得分;
C23、根据特征的得分从高到低,将二十个特征依次添加到随机森林分类器中,由顺序前向选择构建分类模型,然后验证不同模型的分类精度确定最佳特征集中的特征数量;
C24、将训练集数据、最佳特征集中的特征、设定好的决策树数量和每个拆分节点中使用的特征变量的个数代入随机森林算法中训练得到第二随机森林算法模型;
C25、将步骤B中的图像代入第二随机森林算法模型中即可实现图像中每个像素点的识别。
3.如权利要求1所述的基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法,其特征在于:所述的步骤C15中,利用混淆矩阵生成总体分类精度、用户精度、制图精度以及卡帕系数作为评估指标,其中卡帕系数按如下公式计算:
Figure QLYQS_2
,其中N用于表征像素总数,m表示类别数,/>
Figure QLYQS_3
是混淆矩阵中对角线上的像素个数,/>
Figure QLYQS_4
和/>
Figure QLYQS_5
表示第i行和第i列的像素数目。
4.如权利要求2所述的基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法,其特征在于:所述的步骤C24中,利用混淆矩阵生成总体分类精度、用户精度、制图精度以及卡帕系数作为评估指标,其中卡帕系数按如下公式计算:
Figure QLYQS_6
,其中N用于表征像素总数,m表示类别数,/>
Figure QLYQS_7
是混淆矩阵中对角线上的像素个数,/>
Figure QLYQS_8
和/>
Figure QLYQS_9
表示第i行和第i列的像素数目。
5.如权利要求1所述的基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法,其特征在于:所述的步骤A中,包括如下步骤:
A1、获取Sentinel-2卫星拍摄的覆盖待测区域的可利用图像;
A2、对所获得的图像进行大气校正;
A3、采用最近邻插值方法将20m空间分辨率重采样至10m;
A4、将十个10m分辨率波段合成并剪裁获得预处理图像。
6.如权利要求5所述的基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法,其特征在于:所述的步骤A中,连续获得大豆结荚期的多张卫星影像,并对每张影像都进行预处理;步骤B中,不同地物类型之间的JM距离按照如下公式计算:
Figure QLYQS_10
,/>
Figure QLYQS_11
表示所考虑的两种不同作物或其他土地覆盖类型,/>
Figure QLYQS_12
为条件概率密度,即第j个像元属于/>
Figure QLYQS_13
类别的概率。/>
CN202010321528.4A 2020-04-22 2020-04-22 基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法 Active CN111462223B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010321528.4A CN111462223B (zh) 2020-04-22 2020-04-22 基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010321528.4A CN111462223B (zh) 2020-04-22 2020-04-22 基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法

Publications (2)

Publication Number Publication Date
CN111462223A CN111462223A (zh) 2020-07-28
CN111462223B true CN111462223B (zh) 2023-05-26

Family

ID=71680249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010321528.4A Active CN111462223B (zh) 2020-04-22 2020-04-22 基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法

Country Status (1)

Country Link
CN (1) CN111462223B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283281A (zh) * 2021-02-26 2021-08-20 中科禾信遥感科技(苏州)有限公司 基于多时相遥感影像的茭白种植面积提取方法
CN113252583B (zh) * 2021-06-25 2021-10-08 成都信息工程大学 一种基于枯草植被指数计算高寒枯草覆盖度的方法
CN114283335B (zh) * 2021-12-27 2022-11-22 河南大学 一种历史时期遥感识别精度验证制备方法
CN114494909B (zh) * 2022-02-16 2023-04-18 中国科学院空天信息创新研究院 一种大豆生长季空间分布图的生成方法和系统
CN114882359B (zh) * 2022-05-07 2023-03-31 中国科学院空天信息创新研究院 基于植被指数时序谱特征的大豆种植区提取方法和系统
CN115222717B (zh) * 2022-07-29 2023-05-16 四川农业大学 一种大豆种荚快速计数方法、装置及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8189877B2 (en) * 2005-10-21 2012-05-29 Carnegie Institution Of Washington Remote sensing analysis of forest disturbances
CN107480706A (zh) * 2017-07-24 2017-12-15 中国农业大学 一种制种玉米田遥感识别方法及装置
CN109389049A (zh) * 2018-09-19 2019-02-26 中国科学院东北地理与农业生态研究所 基于多时相sar数据与多光谱数据的作物遥感分类方法

Also Published As

Publication number Publication date
CN111462223A (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
CN111462223B (zh) 基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法
Ok et al. Evaluation of random forest method for agricultural crop classification
Johansen et al. Mapping the condition of macadamia tree crops using multi-spectral UAV and WorldView-3 imagery
CN112183209B (zh) 一种基于多维特征融合的区域农作物分类方法及系统
Murugan et al. Fusion of drone and satellite data for precision agriculture monitoring
CN109325431B (zh) 草原放牧绵羊采食路径中植被覆盖度的检测方法及其装置
Baron et al. Combining image processing and machine learning to identify invasive plants in high-resolution images
Sun et al. Monitoring maize lodging grades via unmanned aerial vehicle multispectral image
Adelabu et al. Employing ground and satellite-based QuickBird data and random forest to discriminate five tree species in a Southern African Woodland
CN112818749B (zh) 一年两熟地区大宗粮油作物复种模式遥感监测方法
Xu et al. An improved approach to estimate ratoon rice aboveground biomass by integrating UAV-based spectral, textural and structural features
She et al. Identification and mapping of soybean and maize crops based on Sentinel-2 data.
CN117197668A (zh) 基于深度学习的作物倒伏级别的预测方法及系统
Silva et al. Mapping two competing grassland species from a low-altitude Helium balloon
Schindler et al. Method for national mapping spatial extent of southern beech forest using temporal spectral signatures
Nzimande et al. Mapping the spatial distribution of the yellowwood tree (Podocarpus henkelii) in the Weza-Ngele forest using the newly launched Sentinel-2 multispectral imager data
CN115861836A (zh) 基于多时相Sentinel-2数据的大豆种植区提取方法
CN115063678A (zh) 基于国产gf-6 wfv数据的大豆种植区提取方法
Xie et al. Multielement Classification of a Small Fragmented Planting Farm Using Hyperspectral Unmanned Aerial Vehicle Image
CN115035423A (zh) 一种基于无人机遥感影像的杂交水稻父母本识别提取方法
CN116883853B (zh) 基于迁移学习的作物时空信息遥感分类方法
Wang et al. Scaling effects of chlorophyll content in walnut leaves estimations with coupling Boruta algorithm and machine learning model
Njenga Multiple endmember spectral mixture analysis (MESMA) on multi-temporal VHR images for weed detection in smallholder farms
You et al. Winter wheat plant area monitoring using GF-1 WFV imagery
Li et al. Principal variable selection to explain grain yield variation in winter wheat from UAV-derived phenotypic traits

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant