CN114882359A - 基于植被指数时序谱特征的大豆种植区提取方法和系统 - Google Patents

基于植被指数时序谱特征的大豆种植区提取方法和系统 Download PDF

Info

Publication number
CN114882359A
CN114882359A CN202210494973.XA CN202210494973A CN114882359A CN 114882359 A CN114882359 A CN 114882359A CN 202210494973 A CN202210494973 A CN 202210494973A CN 114882359 A CN114882359 A CN 114882359A
Authority
CN
China
Prior art keywords
feature
extracting
soybean
features
vegetation index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210494973.XA
Other languages
English (en)
Other versions
CN114882359B (zh
Inventor
彭代亮
罗旺
刘锦绣
陈月
楼子杭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Information Research Institute of CAS
Original Assignee
Aerospace Information Research Institute of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Information Research Institute of CAS filed Critical Aerospace Information Research Institute of CAS
Priority to CN202210494973.XA priority Critical patent/CN114882359B/zh
Publication of CN114882359A publication Critical patent/CN114882359A/zh
Application granted granted Critical
Publication of CN114882359B publication Critical patent/CN114882359B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/188Vegetation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Processing (AREA)

Abstract

本发明提出基于植被指数时序谱特征的大豆种植区提取方法和系统。方法包括:通过构建中高时空分辨率的时间序列植被指数,利用线性谐波模型提取研究区植被指数时序谱特征。其次,基于关键生育期遥感原始影像波段反射率,通过百分位数、最大值、最小值、平均值、标准差方法提取光谱特征。另外,利用航天飞机雷达地形测绘任务数字高程数据提取地形特征。借助随机森林分类模型,分析整个生育期时序谱特征、关键生育期光谱特征及地形特征对大豆识别精度的差异,探究不同类别特征的最优组合,实现大豆种植区高精度提取。本申请提出的方案提供了大区域尺度大豆种植区快速准确的识别方法,为大豆面积、产量、病虫害监测等提供科学依据。

Description

基于植被指数时序谱特征的大豆种植区提取方法和系统
技术领域
本发明属于遥感影像处理技术领域,尤其涉及基于植被指数时序谱特征的大豆种植区提取方法和系统。
背景技术
目前大豆种植区提取方法主要基于中高空间分辨率的遥感图像分类方法和基于中低空间分辨率的时序数据提取方法,其中基于中高空间分辨率的遥感图像分类方法一般选择几景影像,会因为缺少对时序特征的充分利用而限制分类精度。而基于中低空间分辨率时序数据的提取方法又因较低空间分辨率产生的混合像元问题而影响提取精度。随着大量中高分辨率的遥感卫星发射升空,使得利用中高空间分辨率高频度时序数据成为可能。例如,Sentinel-2A/B卫星的空间分辨率为10米(蓝色、绿色、红色和近红外波段)和20米(红边1、红边2、红边3、红色边缘4、短波红外1和短波红外2波段),它的一颗卫星的重访周期为10天,两颗互补,重访周期为5天,相对较短的重访周期可以提供作物更详细物候信息。此外,红边范围含有三个波段,这可能有助于区分形态相似作物类型之间的细微差异。因此,亟需充分挖掘中高空间分辨率高频度时序数据优势,构建大豆种植区高精度提取方法。
专利:一种大豆生长季空间分布图的生成方法和系统,大豆生长季的影像的提取和预处理;随机森林分类模型的构建与训练;时间窗口的设置;特征子集的选择;大豆生长季空间分布图的获得。本申请构造大豆生长季内Sentinel-2光谱波段的时间序列合成影像,然后结合随机森林分类模型探究大豆最早识别的时间窗口,其次通过评估时间窗口内所有特征的重要性进一步筛选特征子集,最终绘制出大豆空间分布图。
发明内容
为解决上述技术问题,本发明提出基于植被指数时序谱特征的大豆种植区提取方法和系统的技术方案,以解决上述技术问题。
本发明第一方面公开了一种基于植被指数时序谱特征的大豆种植区提取方法,所述方法包括:
步骤S1、遥感数据预处理:对Sentinel-2卫星影像进行预处理,并进行耕地掩膜;
步骤S2、特征提取:提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征,简称时序谱特征;提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征,简称光谱特征;提取海拔及坡度特征,简称地形特征,并利用耕地数据对所述时序谱特征、光谱特征和地形特征分别进行掩膜;
步骤S3、分类模型的构建与训练:构建分类模型并通过训练设置参数;
步骤S4、以所述时序谱特征为主,将所述时序谱特征、光谱特征和地形特征进行组合得到待选特征组合,得到待选特征组合;将所述待选特征组合输入分类模型,计算待选特征组合的分类精度,根据分类精度得到最优特征组合;
步骤S5、大豆种植区提取及精度评价:将最优特征组合输入随机森林分类模型提取大豆种植区分布图并进行精度评价。
根据本发明第一方面的方法在所述步骤S2中,所述提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征的方法包括:
利用线性谐波模型提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征;
所述线性谐波模型的公式为:
Figure BDA0003632522510000031
其中,f(t)是第t时刻的拟合的增强型植被指数的值,ak是余弦系数,bk是正弦系数,c是截距项,n是谐波级数的阶数,w是频率等于1.5;自变量t是一年中的某一天;n分别设置为1至5,每次增加1,依据大豆的时间序列中原始值与拟合值之间均方误差最小确定n的值,此处n取2;取相位和振幅作为时序特征输入,振幅定义为二维矢量[ak,bk]的长度,相位定义为二维矢量[ak,bk]形成的角度。
根据本发明第一方面的方法在所述步骤S2中,所述提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征的方法包括:
利用百分位数、最大值、最小值、平均值和标准差方法提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征。
根据本发明第一方面的方法在所述步骤S2中,大豆关键生育期内掩膜后的Sentinel-2影像波段包含,红边1、红边2、红边3、短波红外1和短波红外2;
所述关键生育期为1-2月,或者为8-9月,具体包含大豆开花期、结荚期和灌浆期三个生长阶段。
根据本发明第一方面的方法在所述步骤S2中,所述提取海拔及坡度特征的方法包括:
利用航天飞机雷达地形测绘任务数字高程数据提取海拔及坡度特征。
根据本发明第一方面的方法在所述步骤S4中,所述待选特征组合的具体组合方式包括:
时序谱特征、光谱特征、地形特征、时序谱特征及光谱特征、时序谱特征及地形特征、时序谱特征和光谱特征以及地形特征,共6组待选特征组合。
根据本发明第一方面的方法在所述步骤S4中,计算待选特征组合的分类精度的方法包括:
采用基于混淆矩阵的随机森林分类精度评价方法计算待选特征组合的分类精度。
本发明第二方面公开了一种基于植被指数时序谱特征的大豆种植区提取系统,所述系统包括:
第一处理模块,被配置为,遥感数据预处理:对Sentinel-2卫星影像进行预处理,并进行耕地掩膜;
第二处理模块,被配置为,特征提取:提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征,简称时序谱特征;提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征,简称光谱特征;提取海拔及坡度特征,简称地形特征,并利用耕地数据对所述时序谱特征、光谱特征和地形特征分别进行掩膜;
第三处理模块,被配置为,分类模型的构建与训练:构建分类模型并通过训练设置参数;
第四处理模块,被配置为,以所述时序谱特征为主,将所述时序谱特征、光谱特征和地形特征进行组合得到待选特征组合,得到待选特征组合;将所述待选特征组合输入分类模型,计算待选特征组合的分类精度,根据分类精度得到最优特征组合;
第五处理模块,被配置为,大豆种植区提取及精度评价:将最优特征组合输入随机森林分类模型提取大豆种植区分布图并进行精度评价。
根据本发明第二方面的系统,第二处理模块,被配置为,所述提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征包括:
利用线性谐波模型提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征;
所述线性谐波模型的公式为:
Figure BDA0003632522510000041
其中,f(t)是第t时刻的拟合的增强型植被指数的值,ak是余弦系数,bk是正弦系数,c是截距项,n是谐波级数的阶数,w是频率等于1.5;自变量t是一年中的某一天;n分别设置为1至5,每次增加1,依据大豆的时间序列中原始值与拟合值之间均方误差最小确定n的值,此处n取2;取相位和振幅作为时序特征输入,振幅定义为二维矢量[ak,bk]的长度,相位定义为二维矢量[ak,bk]形成的角度。
根据本发明第二方面的系统,第二处理模块,被配置为,所述提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征包括:
利用百分位数、最大值、最小值、平均值和标准差方法提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征。
根据本发明第一方面的方法在所述步骤S2中,大豆关键生育期内掩膜后的Sentinel-2影像波段包含,红边1、红边2、红边3、短波红外1和短波红外2;
所述关键生育期为1-2月,或者为8-9月,具体包含大豆开花期、结荚期和灌浆期三个生长阶段。
根据本发明第二方面的系统,第二处理模块,被配置为,所述提取海拔及坡度特征包括:
利用航天飞机雷达地形测绘任务数字高程数据提取海拔及坡度特征。
根据本发明第二方面的系统,第四处理模块,被配置为,所述待选特征组合的具体组合方式包括:
时序谱特征、光谱特征、地形特征、时序谱特征及光谱特征、时序谱特征及地形特征、时序谱特征和光谱特征以及地形特征,共6组待选特征组合。
根据本发明第二方面的系统,第四处理模块,被配置为,计算待选特征组合的分类精度包括:
采用基于混淆矩阵的随机森林分类精度评价方法计算待选特征组合的分类精度。
本发明第三方面公开了一种电子设备。电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时,实现本公开第一方面中任一项的一种基于植被指数时序谱特征的大豆种植区提取方法中的步骤。
本发明第四方面公开了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本公开第一方面中任一项的一种基于植被指数时序谱特征的大豆种植区提取方法中的步骤。
本发明提出的方案,提供了大区域尺度大豆种植区快速准确的识别方法,为大豆面积、产量、病虫害监测等提供科学依据。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例的一种基于植被指数时序谱特征的大豆种植区提取方法的流程图;
图2为根据本发明实施例的2020/2021生长季巴西大豆种植区分布图;
图3为根据本发明实施例的一种基于植被指数时序谱特征的大豆种植区提取系统的结构图;
图4为根据本发明实施例的一种电子设备的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明第一方面公开了一种基于植被指数时序谱特征的大豆种植区提取方法。图1为根据本发明实施例的一种基于植被指数时序谱特征的大豆种植区提取方法的流程图,如图1所示,所述方法包括:
步骤S1、遥感数据预处理:对Sentinel-2卫星影像进行预处理,并进行耕地掩膜;
步骤S2、特征提取:提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征,简称时序谱特征;提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征,简称光谱特征;提取海拔及坡度特征,简称地形特征,并利用耕地数据对所述时序谱特征、光谱特征和地形特征分别进行掩膜;
步骤S3、分类模型的构建与训练:构建分类模型并通过训练设置参数;
步骤S4、以所述时序谱特征为主,将所述时序谱特征、光谱特征和地形特征进行组合得到待选特征组合,得到待选特征组合;将所述待选特征组合输入分类模型,计算待选特征组合的分类精度,根据分类精度得到最优特征组合;
步骤S5、大豆种植区提取及精度评价:将最优特征组合输入随机森林分类模型提取大豆种植区分布图并进行精度评价。
在步骤S1,遥感数据预处理:对Sentinel-2卫星影像进行预处理,并进行耕地掩膜。
具体地,1)在GEE云计算平台中调用大豆整个生育期内所有的Sentinel-2大气底端反射率数据,利用质量控制QA60波段将云量限制在10%以内,并将所有波段值除以10000得到各个光谱波段反射率值,获得大豆整个生育期内预处理后的Sentinel-2影像;
此处,大豆整个生育期指大豆从播种至收获期结束。
2)在GEE平台中调用欧洲航天局(ESA)2020年空间分辨率为10m的全球土地覆盖数据,利用ee.Filter.eq()筛选器获得耕地数据(此处耕地数据的标签为40,故筛选器参数设置为eq(40))。
在步骤S2,特征提取:提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征,简称时序谱特征;提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征,简称光谱特征;提取海拔及坡度特征,简称地形特征,并利用耕地数据对所述时序谱特征、光谱特征和地形特征分别进行掩膜。
在一些实施例中,在所述步骤S2中,所述提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征的方法包括:
利用线性谐波模型提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征;
所述线性谐波模型的公式为:
Figure BDA0003632522510000081
其中,f(t)是第t时刻的拟合的增强型植被指数的值,ak是余弦系数,bk是正弦系数,c是截距项,n是谐波级数的阶数,ω是频率等于1.5;自变量t是一年中的某一天;n分别设置为1至5,每次增加1,依据大豆的时间序列中原始值与拟合值之间均方误差最小确定n的值,此处n取2;取相位和振幅作为时序特征输入,振幅定义为二维矢量[ak,bk]的长度,相位定义为二维矢量[ak,bk]形成的角度。
所述提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征的方法包括:
利用百分位数、最大值、最小值、平均值和标准差方法提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征。
大豆关键生育期内掩膜后的Sentinel-2影像波段包含,红边1、红边2、红边3、短波红外1和短波红外2;
所述关键生育期为1-2月,或者为8-9月,具体包含大豆开花期、结荚期和灌浆期三个生长阶段。
所述提取海拔及坡度特征的方法包括:
利用航天飞机雷达地形测绘任务数字高程数据提取海拔及坡度特征。
具体地,表1为不同类别特征信息简介。
表1
Figure BDA0003632522510000091
1)构建线性谐波模型提取大豆整个生育期内预处理后的Sentinel-2影像的增强型植被指数(EVI)时序谱特征(简称时序谱特征),再利用mask函数对所提时序谱特征进行耕地掩膜;
此处,大豆整个生育期内预处理后的Sentinel-2影像的增强型植被指数(EVI)的计算公式为:
Figure BDA0003632522510000101
其中,Red、Blue、NIR分别是大豆整个生育期内预处理后的Sentinel-2影像的红色、蓝色和近红外波段值,数值2.5为增益因子的值,6、7.5和1对应校正气溶胶对冠层反射率和土壤背景信号的影响的系数。
所述线性谐波模型的公式为:
Figure BDA0003632522510000102
其中,f(t)是第t时刻的拟合的增强型植被指数的值,ak是余弦系数,bk是正弦系数,c是截距项,n是谐波级数的阶数,ω是频率等于1.5;自变量t是一年中的某一天;n分别设置为1至5,每次增加1,依据大豆的时间序列中原始值与拟合值之间均方误差最小确定n的值,此处n取2;取相位和振幅作为时序特征输入,振幅定义为二维矢量[ak,bk]的长度,相位定义为二维矢量[ak,bk]形成的角度。
2)利用百分位数(15/50/90)、最大值、最小值、平均值、标准差方法提取大豆关键生育期内预处理后的Sentinel-2影像的5个波段反射率特征(简称光谱特征),再利用mask函数对所提光谱特征进行耕地掩膜;
此处,大豆关键生育期指大豆开花期、结荚期至灌浆期三个生长阶段。在大豆整个生育期内预处理后的Sentinel-2影像的基础上,利用GEE中的filterDate()筛选器获得大豆关键生育期内预处理后的Sentinel-2影像。
此处,大豆关键生育期内预处理后的Sentinel-2影像的5个波段,包含红边1、红边2、红边3、短波红外1、短波红外2。在大豆关键生育期内预处理后的Sentinel-2影像的基础上,利用GEE中的select()筛选出这5个波段,获得大豆关键生育期内预处理后的Sentinel-2影像的5个波段。
此处,百分位数的计算方法可表述如下:
Figure BDA0003632522510000103
Figure BDA0003632522510000111
其中,k表示15/50/90,N为某个像素大豆关键生育期内预处理后的Sentinel-2影像清晰观察的总数,R是第k百分位的排名,Pk是第k百分位的百分位合成值。具体来说,如果公式(2)获得的R是整数,则第k个百分位是第R个和第(R+1)个值的平均像素值;如果公式(2)获得的R不是整数,则将其四舍五入到最接近的整数。
此处,最大值、最小值、平均值、标准差的计算方法分别可表述如下:
Figure BDA0003632522510000112
Figure BDA0003632522510000113
Figure BDA0003632522510000114
Figure BDA0003632522510000115
其中,N为某个像素大豆关键生育期内预处理后的Sentinel-2影像清晰观察的总数,xj表示N个观测值中第j个观测值,max表示取N个观测值中的最大值函数,min表示取N个观测值中的最小值函数,mean表示取N个观测值中的平均值函数,stdDev表示取N个观测值中的标准差函数。
3)利用航天飞机雷达地形测绘任务(SRTM)数字高程数据提取海拔及坡度特征(简称地形特征),再利用mask函数对所提特征进行耕地掩膜。
此处,在GEE中直接调用航天飞机雷达地形测绘任务(SRTM)数字高程数据,其中已包含海拔波段,利用ee.Algorithms.Terrain()算法计算坡度数据,获得海拔及坡度特征。
在步骤S3,分类模型的构建与训练:构建分类模型并通过训练设置参数。
具体地,依据随机森林(RF)/支持向量机(SVM)/反向传播神经网络(BPNN)三种分类精度,最终选择RF,即随机森林,随机森林分类模型采用随机重复自抽样方法有放回的在原始数据中抽取K组数据集,每组数据集所包含的数据量为原始数据总量的约三分之二。通过K组数据集选定合适的特征节点数P构建K棵决策树,集合K棵决策树对结果进行简单的投票即可获得所需分类器。其中特征数量和决策树棵树是决定决策树生长的主要参数,该参数的最优解是通过袋外误差获取。袋外误差指未参与模型构建的三分之一数据集对常规误差进行无偏估计所获得的结果。具体计算方法是将未参与模型构建的三分之一数据集,应用生成的分类器,对其进行分类获得分类结果,由于该部分的类别为已知,故将分类器生成的分类结果与已知类别进行比对,计算分类器所得的每一类别的错误分类结果的占比即为该类别的分类误差,将所有类别的误差通过均值计算可得该分类器的平均袋外误差。袋外误差具有高效性,且与交叉验证的结果相近,故而在随机森林分类中无需进行交叉验证或采用独立数据建立误差无偏估计。
其具体方法包括:
1)基于原始训练集,采用随机且有放回地抽样Bagging方法产生每棵决策树的训练子集;
2)构建随机森林分类模型,设定随机森林由多棵CART决策树组成,CART决策树采用基尼Gini系数选择最优特征;其具体步骤如下:
①计算每个特征的基尼系数,选择基尼系数最小的特征X进行节点划分,基尼系数的计算公式如下所示:
Figure BDA0003632522510000121
其中,M1和M2是根据特征X的某个属性值,将M分成的两部分数据集;
②对于特征X,根据某一属性值将其划分为两个子集M1和M2,计算该属性值进行节点划分得到的基尼系数,计算公式如下所示:
Figure BDA0003632522510000131
其中,M表示给定样本集中样本数量,k表示类别个数,Mi表示第i个类别的样本数量;
③遍历特征X的所有属性值,选择基尼系数最小的属性值作为特征X的最优划分节点值;
④不断遍历这棵树的特征子集,重复步骤①和步骤②直至所有的特征都被选择完毕或子数据集都属于同一类;
3)利用训练好的随机森林模型对分类样本进行预测,其中每棵树都得到一个独立的预测结果,对每棵树的预测结果进行汇总统计,按照投票的方式,将获得票数最多的类作为最终结果。
随机森林模型中的需要设置的参数主要有决策树的数量、最大特征数、决策树深度、叶子节点最少样本数、节点划分的最小样本数。
①决策树的数量:决策树的数量是影响分类精度的重要参数之一,若该数值设置过小,会使模型对数据的拟合能力不足,而若决策树数目设置过大,分类精度会提高,但模型的复杂程度和运行时间会大幅增加。②最大特征数:随机森林在构建每棵树时,不是所有的特征都参与节点分裂过程,而是随机地选择某些特征,最大特征数是指从特征空间可随机抽取的特征的最大数量。若该数值设置过小,则决策树的分类能力较弱,反之,最大特征数设置过大,单棵决策树的分类能力可能会上升,但会导致决策树之间的相关性增加,从而使得随机森林的性能下降。常用的最大特征数取值有:所有特征数、所有特征数量的开平方、所有特征数量的对数。③决策树深度:即随机森林模型中决策树生长的最大深度,若深度值设置过小,单棵决策树的分类能力较弱,降低其分类精度,设置过大则容易引起模型过度拟合,同时会增加模型的复杂程度及运行时间。④叶子节点最少样本数:该值决定决策子树中叶子节点是否剪枝,当子树中叶子节点地样本数目小于该值,则舍弃该节点。⑤节点划分的最少样本数:当模型中决策子树节点的样本数小于该值时,不再选取最优特征对其进行划分。
在GEE中调用随机森林分类模型,主要设置以下参数:森林中决策树的数量。在GEE中将棵数分别设置为50至400每次增加50。依据棵树大于100且分类精度第一次达到局部最大值确定树的数量。其中,由于随机森林每次取样的随机性,为了避免每次重复实验结果的细微差别,设置随机种子(seed)为999。其他参数保持默认值。
在步骤S4,以所述时序谱特征为主,将所述时序谱特征、光谱特征和地形特征进行组合得到待选特征组合,得到待选特征组合;将所述待选特征组合输入分类模型,计算待选特征组合的分类精度,根据分类精度得到最优特征组合。
在一些实施例中,在所述步骤S4中,所述待选特征组合的具体组合方式包括:
时序谱特征、光谱特征、地形特征、时序谱特征及光谱特征、时序谱特征及地形特征、时序谱特征和光谱特征以及地形特征,共6组待选特征组合。
计算待选特征组合的分类精度的方法包括:
采用基于混淆矩阵的随机森林分类精度评价方法计算待选特征组合的分类精度。
具体地,1)以时序谱特征为主将不同类别特征进行组合得到待选特征组合时序谱特征、光谱特征、地形特征、时序谱特征及光谱特征、时序谱特征及地形特征、时序谱特征和光谱特征以及地形特征,共6组待选特征组合。
2)分别计算待选特征组合,利用随机森林分类精度;
其中随机森林分类精度评价是基于混淆矩阵的统计方法,混淆矩阵定义如下所示:
Figure BDA0003632522510000151
式中,n表示类别数,mij表示实际属于i类的像元在分类结果图中被分到j类的像元数量,对角线元素的值即是各类别被正确分类的像元数,因此混淆矩阵中对角线元素的值越大,表示被正确分类的像元数越多,分类结果越可靠。利用混淆矩阵总体精度(OA)、Kappa系数、生产者精度(PA)、用户精度(UA)和F1-Score。其计算公式分别为:
Figure BDA0003632522510000152
Figure BDA0003632522510000153
Figure BDA0003632522510000154
Figure BDA0003632522510000155
Figure BDA0003632522510000156
式中,mi+为混淆矩阵中的行总和,m+i为混淆矩阵中的列总和;
3)以时序谱特征为主形成不同的待选特征组合,对比不同待选特征组合随机森林分类精度,选择分类精度均最高的特征组合作为最优特征组合。
在步骤S5,大豆种植区提取及精度评价:将最优特征组合输入随机森林分类模型提取大豆种植区分布图并进行精度评价。
具体地,将最优特征组合输入随机森林分类模型提取大豆种植区分布图,并计算随机森林分类精度及大豆种植面积提取精度,即大豆提取面积与官方农业统计数据对比的精度,其中大豆种植面积提取精度评价指标包括:相对误差、均方根误差,计算公式如下所示,
Figure BDA0003632522510000161
其中,RE表示相对误差,S表示提取的大豆面积,S’表示大豆面积农业统计数据;
Figure BDA0003632522510000162
其中,RMSE表示均方根误差,fi表示第i个区域大豆提取面积,yi表示第i个区域大豆农业统计面积,N表示区域个数。
具体计算结果:
借助Google earth engine(GEE)云平台,利用多种遥感数据提取不同类别特征,然后结合随机森林分类模型探究不同类别特征组合对大豆识别精度的影响,最终选择最优特征组合提取大豆种植区。结果如下:如表2所示时序谱特征、光谱特征及地形特征组合为最优组合,由此提取巴西2020/2021生长季大豆空间分布图,如图2所示。其中,OA为0.93,Kappa为0.86,大豆的PA、UA和F1分别为0.94、0.93和0.94;大豆面积为36612千公顷与农业统计数据的相对误差为-5.94%;大豆面积省级数据与农业统计数据对比均方根误差为590千公顷。
表2
Figure BDA0003632522510000163
综上,本发明提出的方案提供了大区域尺度大豆种植区快速准确的识别方法,为大豆面积、产量、病虫害监测等提供科学依据。
本发明第二方面公开了一种基于植被指数时序谱特征的大豆种植区提取系统。图3为根据本发明实施例的一种基于植被指数时序谱特征的大豆种植区提取系统的结构图;如图3所示,所述系统100包括:
第一处理模块101,被配置为,遥感数据预处理:对Sentinel-2卫星影像进行预处理,并进行耕地掩膜;
第二处理模块102,被配置为,特征提取:提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征,简称时序谱特征;提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征,简称光谱特征;提取海拔及坡度特征,简称地形特征,并利用耕地数据对所述时序谱特征、光谱特征和地形特征分别进行掩膜;
第三处理模块103,被配置为,分类模型的构建与训练:构建分类模型并通过训练设置参数;
第四处理模块104,被配置为,以所述时序谱特征为主,将所述时序谱特征、光谱特征和地形特征进行组合得到待选特征组合,得到待选特征组合;将所述待选特征组合输入分类模型,计算待选特征组合的分类精度,根据分类精度得到最优特征组合;
第五处理模块105,被配置为,大豆种植区提取及精度评价:将最优特征组合输入随机森林分类模型提取大豆种植区分布图并进行精度评价。
根据本发明第二方面的系统,第二处理模块102,被配置为,所述提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征包括:
利用线性谐波模型提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征;
所述线性谐波模型的公式为:
Figure BDA0003632522510000171
其中,f(t)是第t时刻的拟合的增强型植被指数的值,ak是余弦系数,bk是正弦系数,c是截距项,n是谐波级数的阶数,w是频率等于1.5;自变量t是一年中的某一天;n分别设置为1至5,每次增加1,依据大豆的时间序列中原始值与拟合值之间均方误差最小确定n的值,此处n取2;取相位和振幅作为时序特征输入,振幅定义为二维矢量[ak,bk]的长度,相位定义为二维矢量[ak,bk]形成的角度。
根据本发明第二方面的系统,第二处理模块102,被配置为,所述提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征包括:
利用百分位数、最大值、最小值、平均值和标准差方法提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征。
根据本发明第一方面的方法在所述步骤S2中,大豆关键生育期内掩膜后的Sentinel-2影像波段包含,红边1、红边2、红边3、短波红外1和短波红外2;
所述关键生育期为1-2月,或者为8-9月,具体包含大豆开花期、结荚期和灌浆期三个生长阶段。
根据本发明第二方面的系统,第二处理模块102,被配置为,所述提取海拔及坡度特征包括:
利用航天飞机雷达地形测绘任务数字高程数据提取海拔及坡度特征。
根据本发明第二方面的系统,第四处理模块104,被配置为,所述待选特征组合的具体组合方式包括:
时序谱特征、光谱特征、地形特征、时序谱特征及光谱特征、时序谱特征及地形特征、时序谱特征和光谱特征以及地形特征,共6组待选特征组合。
根据本发明第二方面的系统,第四处理模块104,被配置为,计算待选特征组合的分类精度包括:
采用基于混淆矩阵的随机森林分类精度评价方法计算待选特征组合的分类精度。
本发明第三方面公开了一种电子设备。电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时,实现本发明公开第一方面中任一项的一种基于植被指数时序谱特征的大豆种植区提取方法中的步骤。
图4为根据本发明实施例的一种电子设备的结构图,如图4所示,电子设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、近场通信(NFC)或其他技术实现。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本公开的技术方案相关的部分的结构图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本发明第四方面公开了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本发明公开第一方面中任一项的一种基于植被指数时序谱特征的大豆种植区提取方法中的步骤中的步骤。
请注意,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于植被指数时序谱特征的大豆种植区提取方法,其特征在于,所述方法包括:
步骤S1、遥感数据预处理:对Sentinel-2卫星影像进行预处理,并进行耕地掩膜;
步骤S2、特征提取:提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征,简称时序谱特征;提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征,简称光谱特征;提取海拔及坡度特征,简称地形特征,并利用耕地数据对所述时序谱特征、光谱特征和地形特征分别进行掩膜;
步骤S3、分类模型的构建与训练:构建分类模型并通过训练设置参数;
步骤S4、以所述时序谱特征为主,将所述时序谱特征、光谱特征和地形特征进行组合得到待选特征组合,得到待选特征组合;将所述待选特征组合输入分类模型,计算待选特征组合的分类精度,根据分类精度得到最优特征组合;
步骤S5、大豆种植区提取及精度评价:将最优特征组合输入随机森林分类模型提取大豆种植区分布图并进行精度评价。
2.根据权利要求1所述的一种基于植被指数时序谱特征的大豆种植区提取方法,其特征在于,在所述步骤S2中,所述提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征的方法包括:
利用线性谐波模型提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征;
所述线性谐波模型的公式为:
Figure FDA0003632522500000011
其中,f(t)是第t时刻的拟合的增强型植被指数的值,ak是余弦系数,bk是正弦系数,c是截距项,n是谐波级数的阶数,w是频率等于1.5;自变量t是一年中的某一天;n分别设置为1至5,每次增加1,依据大豆的时间序列中原始值与拟合值之间均方误差最小确定n的值,此处n取2;取相位和振幅作为时序特征输入,振幅定义为二维矢量[ak,bk]的长度,相位定义为二维矢量[ak,bk]形成的角度。
3.根据权利要求1所述的一种基于植被指数时序谱特征的大豆种植区提取方法,其特征在于,在所述步骤S2中,所述提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征的方法包括:
利用百分位数、最大值、最小值、平均值和标准差方法提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征。
4.根据权利要求1所述的一种基于植被指数时序谱特征的大豆种植区提取方法,其特征在于,在所述步骤S2中,大豆关键生育期内掩膜后的Sentinel-2影像波段包含,红边1、红边2、红边3、短波红外1和短波红外2;
所述关键生育期为1-2月,或者为8-9月,具体包含大豆开花期、结荚期和灌浆期三个生长阶段。
5.根据权利要求1所述的一种基于植被指数时序谱特征的大豆种植区提取方法,其特征在于,在所述步骤S2中,所述提取海拔及坡度特征的方法包括:
利用航天飞机雷达地形测绘任务数字高程数据提取海拔及坡度特征。
6.根据权利要求1所述的一种基于植被指数时序谱特征的大豆种植区提取方法,其特征在于,在所述步骤S4中,所述待选特征组合的具体组合方式包括:
时序谱特征、光谱特征、地形特征、时序谱特征及光谱特征、时序谱特征及地形特征、时序谱特征和光谱特征以及地形特征,共6组待选特征组合。
7.根据权利要求1所述的一种基于植被指数时序谱特征的大豆种植区提取方法,其特征在于,在所述步骤S4中,计算待选特征组合的分类精度的方法包括:
采用基于混淆矩阵的随机森林分类精度评价方法计算待选特征组合的分类精度。
8.一种用于基于植被指数时序谱特征的大豆种植区提取系统,其特征在于,所述系统包括:
第一处理模块,被配置为,遥感数据预处理:对Sentinel-2卫星影像进行预处理,并进行耕地掩膜;
第二处理模块,被配置为,特征提取:提取大豆整个生育期内掩膜后的Sentinel-2影像增强型植被指数时序谱特征,简称时序谱特征;提取大豆关键生育期内掩膜后的Sentinel-2影像波段反射率特征,简称光谱特征;提取海拔及坡度特征,简称地形特征,并利用耕地数据对所述时序谱特征、光谱特征和地形特征分别进行掩膜;
第三处理模块,被配置为,分类模型的构建与训练:构建分类模型并通过训练设置参数;
第四处理模块,被配置为,以所述时序谱特征为主,将所述时序谱特征、光谱特征和地形特征进行组合得到待选特征组合,得到待选特征组合;将所述待选特征组合输入分类模型,计算待选特征组合的分类精度,根据分类精度得到最优特征组合;
第五处理模块,被配置为,大豆种植区提取及精度评价:将最优特征组合输入随机森林分类模型提取大豆种植区分布图并进行精度评价。
9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时,实现权利要求1至7中任一项所述的一种基于植被指数时序谱特征的大豆种植区提取方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1至7中任一项所述的一种基于植被指数时序谱特征的大豆种植区提取方法中的步骤。
CN202210494973.XA 2022-05-07 2022-05-07 基于植被指数时序谱特征的大豆种植区提取方法和系统 Active CN114882359B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210494973.XA CN114882359B (zh) 2022-05-07 2022-05-07 基于植被指数时序谱特征的大豆种植区提取方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210494973.XA CN114882359B (zh) 2022-05-07 2022-05-07 基于植被指数时序谱特征的大豆种植区提取方法和系统

Publications (2)

Publication Number Publication Date
CN114882359A true CN114882359A (zh) 2022-08-09
CN114882359B CN114882359B (zh) 2023-03-31

Family

ID=82672992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210494973.XA Active CN114882359B (zh) 2022-05-07 2022-05-07 基于植被指数时序谱特征的大豆种植区提取方法和系统

Country Status (1)

Country Link
CN (1) CN114882359B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116563706A (zh) * 2023-05-08 2023-08-08 哈尔滨工业大学 一种针对多光谱图像反射率多特征的作物产量估计方法
CN117726902A (zh) * 2023-12-19 2024-03-19 中国科学院空天信息创新研究院 一种基于Sentinel2时序曲线分布的大豆样本生成方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280440A (zh) * 2018-02-09 2018-07-13 三亚中科遥感研究所 一种果林识别方法和系统
CN111462223A (zh) * 2020-04-22 2020-07-28 安徽大学 基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法
CN111738144A (zh) * 2020-06-19 2020-10-02 中国水利水电科学研究院 一种基于Google Earth Engine云平台的地表水体产品生成方法和系统
CN113205475A (zh) * 2020-01-16 2021-08-03 吉林大学 基于多源卫星遥感数据的森林高度反演方法
CN113343808A (zh) * 2021-05-27 2021-09-03 海南省林业科学研究院(海南省红树林研究院) 一种基于卫星遥感技术的热带森林资源测量方法
CN113870425A (zh) * 2021-09-03 2021-12-31 中林信达(北京)科技信息有限责任公司 基于随机森林和多源遥感技术的森林蓄积量空间制图方法
CN114219847A (zh) * 2022-02-18 2022-03-22 清华大学 基于物候特征的作物种植面积确定方法、系统及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280440A (zh) * 2018-02-09 2018-07-13 三亚中科遥感研究所 一种果林识别方法和系统
CN113205475A (zh) * 2020-01-16 2021-08-03 吉林大学 基于多源卫星遥感数据的森林高度反演方法
CN111462223A (zh) * 2020-04-22 2020-07-28 安徽大学 基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法
CN111738144A (zh) * 2020-06-19 2020-10-02 中国水利水电科学研究院 一种基于Google Earth Engine云平台的地表水体产品生成方法和系统
CN113343808A (zh) * 2021-05-27 2021-09-03 海南省林业科学研究院(海南省红树林研究院) 一种基于卫星遥感技术的热带森林资源测量方法
CN113870425A (zh) * 2021-09-03 2021-12-31 中林信达(北京)科技信息有限责任公司 基于随机森林和多源遥感技术的森林蓄积量空间制图方法
CN114219847A (zh) * 2022-02-18 2022-03-22 清华大学 基于物候特征的作物种植面积确定方法、系统及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116563706A (zh) * 2023-05-08 2023-08-08 哈尔滨工业大学 一种针对多光谱图像反射率多特征的作物产量估计方法
CN116563706B (zh) * 2023-05-08 2024-05-17 哈尔滨工业大学 一种针对多光谱图像反射率多特征的作物产量估计方法
CN117726902A (zh) * 2023-12-19 2024-03-19 中国科学院空天信息创新研究院 一种基于Sentinel2时序曲线分布的大豆样本生成方法和系统

Also Published As

Publication number Publication date
CN114882359B (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
US11521380B2 (en) Shadow and cloud masking for remote sensing images in agriculture applications using a multilayer perceptron
Tenreiro et al. Using NDVI for the assessment of canopy cover in agricultural crops within modelling research
CN114882359B (zh) 基于植被指数时序谱特征的大豆种植区提取方法和系统
CN114494882B (zh) 一种基于随机森林的冬小麦遥感识别分析方法和系统
CN114926748A (zh) Sentinel-1/2微波与光学多光谱影像结合的大豆遥感识别方法
CN114494909B (zh) 一种大豆生长季空间分布图的生成方法和系统
Ramadhani et al. Mapping of rice growth phases and bare land using Landsat-8 OLI with machine learning
CN116543316B (zh) 一种利用多时相高分辨率卫星影像识别稻田内草皮的方法
Fei et al. Bayesian model averaging to improve the yield prediction in wheat breeding trials
Bhuyar et al. Crop classification with multi-temporal satellite image data
CN113642464A (zh) 结合twdtw算法和模糊集的时序遥感影像作物分类方法
Qu et al. Monitoring lodging extents of maize crop using multitemporal GF-1 images
Zhu et al. Identification of soybean based on Sentinel-1/2 SAR and MSI imagery under a complex planting structure
Li et al. A large-scale, long time-series (1984‒2020) of soybean mapping with phenological features: Heilongjiang Province as a test case
CN116579521A (zh) 产量预测时间窗口确定方法、装置、设备及可读存储介质
Singla et al. Sugarcane ratoon discrimination using LANDSAT NDVI temporal data
CN115496999A (zh) 田间立地秸秆产量估计方法及装置
CN115438934A (zh) 一种基于区块链的农作物生长环境监测方法及系统
CN114782835A (zh) 作物倒伏面积比例检测方法及装置
Luo et al. Staple crop mapping with Chinese GaoFen-1 and GaoFen-6 satellite images: A case study in Yanshou County, Heilongjiang Province, China
Jadhav et al. Optimum band selection in sentinel-2A satellite for crop classification using machine learning technique
Chen et al. Coupling optical and SAR imagery for automatic garlic mapping
Wijaya et al. Curating Multimodal Satellite Imagery for Precision Agriculture Datasets with Google Earth Engine
She et al. Identification of Cotton Using Random Forest Based on Wide-Band Imaging Spectrometer Data of Tiangong-2
Mfuka Characterizing Spatiotemporal Patterns of White Mold in Soybean across South Dakota Using Remote Sensing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant