CN117079059A - 一种基于多源卫星图像的树种自动分类方法 - Google Patents

一种基于多源卫星图像的树种自动分类方法 Download PDF

Info

Publication number
CN117079059A
CN117079059A CN202311323610.0A CN202311323610A CN117079059A CN 117079059 A CN117079059 A CN 117079059A CN 202311323610 A CN202311323610 A CN 202311323610A CN 117079059 A CN117079059 A CN 117079059A
Authority
CN
China
Prior art keywords
classification
feature
tree species
features
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311323610.0A
Other languages
English (en)
Other versions
CN117079059B (zh
Inventor
李�杰
王金亮
王辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan Normal University
Original Assignee
Yunnan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan Normal University filed Critical Yunnan Normal University
Priority to CN202311323610.0A priority Critical patent/CN117079059B/zh
Publication of CN117079059A publication Critical patent/CN117079059A/zh
Application granted granted Critical
Publication of CN117079059B publication Critical patent/CN117079059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/778Active pattern-learning, e.g. online learning of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Remote Sensing (AREA)
  • Astronomy & Astrophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Processing (AREA)

Abstract

本发明公开一种基于多源卫星图像的树种自动分类方法,涉及计算机技术和树种分类技术领域,通过构建随机森林‑递归特征消除算法进行特征优化获得最佳特征子集,该方法是基于每轮中特征因子的重要性排序来递归地调整特征,最终选择具有最高精度最佳特征子集,能在树种分类中提供更稳健的优化方案,其既显著减少了模型的训练时间,又普遍可以保持较好的精度,对于涉及多维特征的图像分类任务的优化效果显著;此外,通过将模型堆叠和软投票集成框架进行再组合构建的模型堆叠‑软投票集成算法,能够发挥这两种集成框架的优势,并在现有条件的基础上,进一步提升树种的分类精度,能快速识别大区域树种分布信息。

Description

一种基于多源卫星图像的树种自动分类方法
技术领域
本发明涉及计算机技术和树种分类技术领域,尤其涉及一种基于多源卫星图像的树种自动分类方法。
背景技术
准确掌握森林存量以及树种分布对制定森林管理和开发战略以促进其可持续发展至关重要。现有的研究已证实树种信息可有力协助森林资源保护、采伐和造林决策、生态环境评估、碳估算以及生物多样性建模等。传统劳动密集型的森林资源清查工作虽可获得森林树种标准数据,却存在人力成本昂贵,时空连续性差等弊端,特别是在偏远山区,其地形、气候均给地面调查带来巨大挑战。近几十年来,日益发展更新的遥感技术展示出了在树种分类领域的巨大潜力,其可提供大范围的空间信息和连续的更新频率,被人们一致认为是协助甚至代替传统森林资源清查工作的最佳方案。
目前,联合遥感卫星图像以及机器学习分类算法是树种分类的热点与趋势。基于遥感技术对树种进行分类和制图的研究可以追溯到40多年前,数据源方面,光学遥感数据一直是树种分类的主要数据源,早年间由于可用数据有限,大多数研究更倾向于基于像Landsat系列的中等分辨率卫星图像绘制大区域森林。然而,相对低的分辨率难以描述物种层面的细节信息,特别是在地形复杂的山区异质环境中,这使得树种制图仍然具有挑战性。随后,更多更高分辨率的数据依次加入了树种分类的数据源阵营,如亚米级别的WorldView 1/2/3、GeoEye-1、IKONOS,RapidEye卫星数据。近年来,随着激光扫描设备和无人机技术的快速发展,一些研究联合激光雷达数据和高分辨率多光谱和高光谱图像一起用于单木识别或树种制图。得益于以上数据高分辨率优势,再联合新的分类技术(如面向对象分类技术和深度学习技术),据统计,这些研究的树种分类精度普遍高于85%。然而,受限于有限的空间范围、耗时的数据处理过程和昂贵的数据获取成本,使得高分辨率数据的研究仅限于典型小区域,而专注于大面积且森林景观复杂的多云山区树种分类方法的研究很少。相比之下,已开源的哨兵2号(Sentinel-2)和哨兵1号(Sentinel-1)数据覆盖全球,且拥有比Landsat更好的时间分辨率、光谱分辨率和空间分辨率,并且拥有比高分辨率数据更实用的经济成本和处理效率。因此,哨兵2号和哨兵1号数据无疑是大区域树种分类的最优选择。
分类技术上,从遥感数据中有效提取不同树种特征进而实现树种分类依赖于分类器算法,非参数的机器学习算法可以提供多变量、非线性和非参数分类,通过数十年的发展,其已经被证明能够胜任树种分类研究。如传统的基于统计学的机器学习方法:CART决策树(Classification and regression trees,CART)、支持向量机(Support vectormachines,SVM)、随机森林(Random forest,RF)、最大熵模型(Maximum entropy,MaxEnt)和梯度提升树(Gradient tree boost,GTB)。据所知,CART决策树、随机森林和支持向量机是最受欢迎且性能相对好的机器学习分类器,这已经被大量已发表研究所证实。而最大熵模型和梯度提升树分类器由于缺乏实践使其在森林树种分类中的表现仍然存在较大不确定性。值得注意的是,近年来基于仿生学原理的卷积神经网络(深度学习)模型逐渐被应用于树种识别,并取得了良好的效果。然而,过高的数据成本和算力需求使其只能局限于小区域研究,此外,精细的标签制作过程将耗费大量的时间,这极大地限制了科学研究向实际应用的转化。相比之下,传统机器学习分类器仍是大区域树种分类的有效选择。
基于以上数据源和分类算法,目前诸多研究已经实现了区域尺度的树种分类,但仍然存在数据处理耗时长、分类过程速度慢以及分类精度普遍较低的问题。
发明内容
本发明的目的在于:针对现有技术的不足,现提出一种兼顾特征层面和决策层面的可移植树种分类新框架,即特征-决策(Feature-Decision,F-D)云计算框架。整体上,该框架首先整合多源数据,然后在特征层面依次进行多维特征构建、筛选和优化;同时,在决策层依次进行多分类器的构建、筛选和集成,可以更快速地提取大面积山区的树种信息。
本发明的技术方案如下:
本发明公开了一种基于多源卫星图像的树种自动分类方法,包括如下步骤:
S1、收集多源数据,包括遥感卫星影像、地形数据、生物气候数据和土地覆被样本;
S2、基于多源数据构建包括光谱特征、指数特征、纹理特征、后向散射特征、地形特征和生物气候特征的多个原始特征场景;
S3、选择五个机器学习分类器,包括CART决策树、随机森林、支持向量机、梯度提升树和最大熵模型,并基于土地覆被样本和原始特征场景构建分类算法,对多个原始特征场景进行分类;
S4、评估五个分类器在不同原始特征场景中的准确性,初步筛选最佳原始特征场景;
S5、基于随机森林模型的特征重要性构建随机森林-递归特征消除算法进行特征优化,通过递归的方式,逐渐减少特征集的规模来获得最佳特征子集;
S6、将最佳特征子集作为新的分类场景输送给S3中的五个分类器再次进行树种分类,通过与S4中基于原始特征场景的分类结果的精度对比,选出在所有特征场景中平均精度最高的前三个分类器作为最佳基础分类器,选出精度最高的前三个分类结果作为最佳基础分类结果;
S7、将最佳基础分类器和最佳基础分类结果根据模型堆叠、软投票和模型堆叠-软投票三种集成框架分别进行集成,并选择最优的集成模型及其分类结果,该分类结果作为最佳分类结果;
S8、基于最佳分类结果进行树种制图并分析其空间格局。
以上方法,依靠Google earth engine遥感大数据云平台(GEE平台)快速的云计算能力及其海量的遥感数据,提出了一个兼顾特征层面和决策层面的新框架(即F-D云计算框架),其在特征层面依次执行特征构建、初筛和优化,同时在决策层面依次执行基础分类器构建、筛选和集成,可快速的遴选出合理有效的特征组合及联合不同算法优势的集成分类模型。
进一步地,所述遥感卫星影像包括哨兵2号光学影像和哨兵1号SAR影像,哨兵2号光学影像经过影像调取、时间过滤、云过滤、裁剪和中值合成以获得高质量哨兵2号合成图像;哨兵1号SAR影像通过轨道文件应用、GRD边界噪声去除、热噪声去除、辐射校正、地形校正、时间过滤、裁剪和中值合成获得高质量哨兵1号合成图像;所述地形数据为SRTM V3地形数据在GEE平台通过编程实现数据的调用、裁剪等处理;所述生物气候数据可从WordClim网站(http://www.wordclim.org)获取,然后进行重投影、裁剪,以及上传至GEE云平台;所述土地覆被样本为实地采集以及室内筛选和解译扩增获得。
进一步地,所述多源数据中所有栅格数据使用最近邻插值函数重新采样到相同的分辨率,并重新投影到相同的投影坐标。
进一步地,所述光谱特征为从哨兵2号合成图像中进行波段选取获得;指数特征通过哨兵2号合成图像的波段计算所得;纹理特征首先基于哨兵2号合成图像的NIR、Red和Green波段的线性组合计算得到灰度图像,再通过灰度共生矩阵计算所得;后向散射特征为哨兵1号合成图像中选择极化方式所得;地形特征从SRTM V3地形数据中计算获得;生物气候特征从生物气候数据集中提取。
进一步地,基于所述光谱特征、指数特征、纹理特征、后向散射特征、地形特征和生物气候特征组合形成不同的场景类型,包括单类特征场景和多类特征场景,所构建多种特征场景旨在通过对比以获得适用于树种分类的最佳场景。
进一步地,基于所述单类特征场景和多类特征场景,执行CART决策树、随机森林、支持向量机、梯度提升树、最大熵模型分类算法进行树种分类,并评估其准确性,从单类特征场景和多类特征场景初步筛选出最佳原始特征场景。
进一步地,所述RF-RFE算法步骤为:
基于原始特征场景训练RF分类模型,获得该轮次总体精度,并根据每个特征的重要性对所有特征进行排序,剔除重要性低的特征;
其余特征继续训练RF模型,直至迭代完所有特征;
选择精度最高的迭代轮次对应的特征因子组成最佳特征子集。
以上方法,RF-RFE特征优化方法既显著减少了模型的训练时间,又普遍可以保持相似的精度,对于涉及多维特征的图像分类任务的优化效果显著。
进一步地,所述集成框架之一的模型堆叠是以顺序模式构建分类器链,即:通过步骤S6选出精度排名前三的分类器,并以排名第一的为元分类器,以排名第二和第三的分类器为子分类器,将元分类器的输出以及通过步骤S5获得的最佳特征子集作为链中子分类器的输入,形成分类器链。
以上方法,选择精度最高的前三个单分类器进行模型堆叠集成,包括最大熵模型(MaxEnt)、梯度提升树(GTB)和随机森林(RF),其中,MaxEnt为元分类器,GTB和RF为子分类器,以MaxEnt的最优输出和最优特征子集作为GTB和RF的输入,最终构建两个模型堆叠集成模型,即“MaxEnt+GTB”和“MaxEnt+RF”模型,“+”表示堆叠。
进一步地,所述集成框架之一的软投票具体操作方法为:选取通过步骤S6选出的精度排名前三的最佳基础分类结果参与投票,并根据参与投票的基础分类结果的精度赋予相应的权重,最终根据权重的加权求和确定类别。
以上方法,MaxEnt、GTB和RF的最优输出为最佳基础分类结果,根据其精度进行加权,最终构建“MaxEnt/GTB//RF”软投票集成模型,“//”表示投票。
进一步地,所述模型堆叠-软投票为基于模型堆叠和软投票构建的组合模型,将通过模型堆叠获得的分类结果进一步执行软投票,以尝试提取出更高精度的分类结果。
以上方法,进一步对“MaxEnt+GTB”和“MaxEnt+RF”的输出进行软投票,最终构建一个综合的集成模型,即“MaxEnt+GTB//MaxEnt+RF”模型。
与现有的技术相比本发明的有益效果是:
1、本发明通过GEE平台,从特征优化和分类器集成角度改进山区树种分类现状,提出了兼顾特征层面和决策层面的可移植树种分类新框架。通过GEE平台可快速地完成数据集的筛选和预处理工作,并极大提升各种分类算法的运算速度,从而能快速完成大区域的树种分类工作,提高树种分类的时效性。还进一步通过特征优化和分类器集成算法来提升树种的分类精度;其中通过RF-RFE算法进行特征优化,该方法是基于每轮中特征因子的重要性排序来递归地调整特征,最终选择具有最高精度最佳特征子集,能在树种分类中提供更稳健的优化方案,其既显著减少了模型的训练时间,又普遍可以保持较好的精度,对于涉及多维特征的图像分类任务的优化效果显著;此外,通过将模型堆叠和软投票集成框架进行再组合构建的模型堆叠-软投票集成算法,能够发挥这两种集成框架的优势,并在现有条件的基础上,进一步提升树种的分类精度。
2、本发明通过已公开且可获取的多源数据构建了光谱特征、指数特征、纹理特征、后向散射特征、地形特征和生物气候特征,总特征因子达68个,与以往仅依靠某一类或少数几类特征的研究相比,整合来自多源数据的多维特征的策略可为不同树种之间的有效分离提供多方面的补充信息,更精确地挖掘出了隐藏在森林类型下的具体林分信息,这更有利于森林资源管理和生态环境定量评估,能更有效地提升分类精度。
3、本发明的树种分类技术兼具泛化性、高精度、可移植性,方法科学可靠,可很好地快速识别大区域树种分布信息,为区域森林管理和森林生态系统可持续发展提供新的科学指导。
附图说明
图1为本发明的树种分类总体技术流程示意图;
图2为本发明的RF-RFE特征优化算法过程示意图;
图3为本发明的模型堆叠集成框架示意图;
图4为本发明的软投票集成框架示意图;
图5为本发明的模型堆叠-软投票集成框架示意图;
图6为本发明的3个基本分类器和4个集成模型的精度比较及其可视化;
图7为本发明的F-D云计算框架生产的最优树种分类结果及其与20个验证区域的无人机图像视觉对比图;
图8为本发明的框架的树种制图结果与已发表的相关产品的视觉对比;
图9为本发明中香格里拉地区树种在水平方向上的空间格局;
图10为本发明中香格里拉地区树种在垂直方向上的空间格局。
具体实施方式
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
下面结合实施例对本发明的技术方案作进一步的详细描述。
如图1所示,本发明公开一种基于多源卫星图像的树种自动分类方法,具体包括如下步骤:
S1、收集多源数据,包括遥感卫星影像(哨兵2号光学影像和哨兵1号SAR影像)、SRTM V3地形数据、生物气候数据、土地覆被样本;
S2、基于多源数据构建包括光谱特征、指数特征、纹理特征、后向散射特征、地形特征和生物气候特征的多个原始特征场景;
S3、选择GEE平台中五个机器学习分类器,包括CART决策树、随机森林、支持向量机、梯度提升树和最大熵模型,并基于土地覆被样本和原始特征场景构建分类算法,对多个原始特征场景进行分类;
S4、评估五个分类器在不同原始特征场景中的准确性,初步筛选最佳原始特征场景;
S5、基于随机森林模型的特征重要性构建随机森林-递归特征消除算法进行特征优化,通过递归的方式,逐渐减少特征集的规模来获得最佳特征子集;
S6、将最佳特征子集作为新的分类场景输送给S3中的五个分类器再次进行树种分类,通过与S4中基于原始特征场景的分类结果的精度对比,选出在所有特征场景中平均精度最高的前三个分类器作为最佳基础分类器,选出精度最高的前三个分类结果作为最佳基础分类结果;
S7、将最佳基础分类器和最佳基础分类结果根据模型堆叠、软投票和模型堆叠-软投票三种集成框架分别进行集成,并选择最优的集成模型及其分类结果,该分类结果作为最佳分类结果;
S8、基于最佳分类结果进行树种制图并分析其空间格局。
如下表1所示,步骤S1中使用的多源数据主要包括遥感卫星影像、地形数据、生物气候数据和分类参考数据(包括土地覆被样本),相关数据源及预处理过程如表1所示;其中,所有栅格数据均使用最近邻插值函数重新采样到相同的10米分辨率,并重新投影到相同的WGS_1984_UTM_Zone_47N投影坐标。
表1 使用的多源数据及其预处理过程
哨兵2号光学影像因较高的光谱(13个光谱带)、时间(5天)、空间分辨率(10-60米)而被广泛用于区域树种制图。本发明使用的是经过大气层底层反射率(BOA)正射校正的产品S2-Level-2A,可以在GEE中通过ee.ImageCollection('COPERNICUS/S2_SR')代码直接调用。值得一提的是,GEE中的密集时间堆栈方法可以利用大量光学观测影像创建最佳的中值合成像素,从而有效解决高原山区多云问题。在经过一系列包括影像调取、时间过滤、去云、裁剪,以及中值合成等编程处理后,如上表1所示,最后获得高质量哨兵2号合成图像。
哨兵1号SAR影像执行C波段合成孔径雷达成像,可以提供不受天气和环境条件影响的双偏振观测图像。在本发明中,使用了2016年IW模式下C波段SAR地面探测数据的所有可用VV和VH偏振方案,可通过“COPERNICUS/S1_GRD”代码段直接调用。该数据最高空间分辨率为10 m,已用Sentinel-1工具箱进行了轨道文件应用、GRD边界噪声去除、热噪声去除、辐射校正、地形校正,数据质量得到了保证,在经过数据筛选和中值合成后,如上表1所示,最后获得了高质量哨兵1号合成图像。
STRM数据集包含全球范围内的数字高程模型。选择SRTM V3产品作为提供地形特征的辅助数据,空间分辨率为30m。在GEE平台通过编程实现数据的调用(‘USGS/SRTMGL1_003’)、裁剪、重采样等处理。从WordClim网站(http://www.wordclim.org)下载的生物气候数据包含19个维度的生物气候特征。该数据集的预处理过程包括下载、重投影、重采样、裁剪,以及上传至GEE云平台。土地覆被样本的收集是首先通过实地收集初始样本,然后经室内筛查和目视解译扩充获得,在后续的分类过程中,这些样本分别被划分为70%的训练样本和30%的验证样本,分别用于机器学习分类器的训练和精度验证。
步骤S2中,因为山区天然森林具有混合性和复杂性,从视觉上看,卫星影像中不同树种的光谱特征十分相似,区分难度比较大。因此,要准确识别树种需要联合多维的特征变量。从山区森林的物理特性以及分布机制考虑,最终基于多源数据构建了包含6类特征的特征空间,总特征因子达68个,如下表2所示:
表2 68个特征因子信息
续表
其中光谱特征(Spectrum,ST)、指数特征(Index,ID)、纹理特征(Texture,TT)、后向散射特征(Backscatter,BS)主要描述林分的物理特性。12个光谱因子选自哨兵2号合成图像的原始波段;24个常用的指数因子均通过哨兵2号合成图像的波段计算所得;8个最常用的纹理因子首先基于哨兵2号合成图像的NIR、Red和Green波段的线性组合计算得到灰度图像,再通过灰度共生矩阵计算所得;2个后向散射因子通过从哨兵1号合成图像中极化方式过滤所得。
地形特征(Terrain,TR)和生物气候特征(Bioclimate,BC)可有效反映不同树种的地理空间分布。其中,3个地形因子可通过GEE平台提供的ee.Algoriths.terrain()函数直接从SRTM V3地形数据中计算获得;19个生物气候因子可直接从生物气候数据集中提取。
基于以上特征因子,以渐增的方式设计16个初始特征场景来评估不同数据组合的性能,旨在通过对比以获得适用于树种分类的最佳场景。
表3 基于68个特征因子构建的特征场景
步骤S3中,为找到最适用于山区树种分类的分类器,选择GEE云平台可提供的5个公认的具有较好性能的分类器进行树种分类,如下表4所示包括CART决策树、随机森林、支持向量机、梯度提升树、最大熵模型。这些分类器均可以在GEE平台通过相应的调用方式直接调用,通过多次实验对比,设置各分类器主要超参数如表4所示:
表4 所选分类器的调用方式及主要超参数
在步骤S4中,基于表3中的16种原始特征场景,执行CART决策树、随机森林、支持向量机、梯度提升树、最大熵模型分类算法进行树种分类,并评估其准确性,以初步筛选最佳原始特征场景。
在步骤S5中,机器学习分类任务中,高维特征不仅可能影响分类器性能,甚至可能降低精度,因此,有必要对初筛的最佳原始特征场景进行优化。基于RFE算法能提供稳健的特征优化方案,这是一种贪婪的优化算法,通过递归的方式,逐渐减少特征集的规模来选择最优的特征,以及RF模型的特征重要性构建了RF-RFE算法。该算法的流程如图2所示为(图中OA、f、RF分别为总体精度(Overall accuracy)、特征(Feature)以及随机森林模型(Random forest)的缩写):首先,基于原始特征场景训练RF分类模型,获得该轮次总体精度,并根据每个特征(f)的重要性对所有特征进行排序,剔除重要性低的特征;然后,其余特征继续训练RF模型,以此类推,直至迭代完所有特征;最终,选择精度最高的迭代轮次对应的特征因子组成最佳特征子集。
在步骤S7中,基于步骤S6中的最佳基础分类器和最佳基础分类结果进行集成,使用常规的模型堆叠和软投票以及本发明新提出的模型堆叠-软投票集成框架分别进行集成,并选择最优的集成模型及其分类结果,该分类结果作为最佳分类结果。
如图3所示,模型堆叠是以顺序模式构建分类器链,通过步骤S6选出精度排名前三的分类器,并以排名第一的为元分类器,以排名第二和第三的分类器为子分类器,将元分类器的输出以及通过步骤S5获得的最佳特征子集作为链中子分类器的输入,形成分类器链。
如图4所示,软投票集成框架的规则为基础单分类器的分类结果分配权重,以支持在投票决策中具有更好性能的分类器,软投票具体操作方法为:
选取通过步骤S6选出的精度排名前三的最佳基础分类结果参与投票;
根据参与投票的基础分类结果的精度赋予相应的权重:
其中,是第/>个基础分类结果的权重,/>和/>分别表示第/>和第/>个基础分类结果的总体精度,/>表示参与投票的基础分类结果的数量,/>表示参与投票的基础分类结果的精度之和;
根据权重的加权求和确定类别:
其中,是关于决策问题/>的所选分类数,/>和/>分别表示参与投票的基础分类结果的序号和数量,/>是基础分类结果在决策问题/>上的二进制向量one-hot编码,/>是在求和向量/>中获得最大值的索引码,若找到多个最大值,则返回第一次出现的索引。
如图5所示,模型堆叠-软投票为基于模型堆叠和软投票构建的组合模型,将通过模型堆叠获得的分类结果进一步执行软投票,以尝试提取出更高精度的分类结果。
针对目前大区域树种分类中普遍存在的数据类型单一、数据处理时间成本高、特征冗余、分类过程效率低、分类结果精度低等现实问题,首次提出一种基于GEE遥感大数据云平台,从特征优化和分类器集成角度改进山区树种分类现状的新框架,并成功提取了香格里拉地区约11613 平方千米范围内11类树种,研究结果将为该区域的森林管理提供支持。具体技术效果如下:
如图6所示,本发明产生的香格里拉地区最优树种分类结果取得突破,“MaxEnt+GTB//MaxEnt+RF”模型取得了最高的分类精度,达到了80.92%。本发明所提出的兼顾特征层面和决策层面的可移植树种分类新框架(F-D云计算框架)中,特征优化和分类器集成均对树种分类结果产生了积极影响。其中,RF-RFE特征优化方法对最佳特征组合方案(即表3中的4-1)进行迭代,每次删除重要性在10分位数以下的特征因子,经过31轮迭代后,选择OA最高的迭代轮次对应的特征子集,当迭代到第10轮时,此时还剩26个特征,OA达到了最高值,因此最后选取26个特征,其涵盖了所有类型的特征。
将不同分类器基于原始特征方案的最优精度与特征优化后的精度进行对比,基于优化后的特征子集的分类结果对RF、GTB、CART分类器均有轻微提升,分别为0.95%(72.39%vs. 73.35%)、0.44%(73.96% vs. 74.40%)和0.92%(59.44% vs. 60.36%)。相反,MaxEnt和SVM在特征优化后的精度有所下降,分别为-1.53%(76.80% vs. 75.27%)和-5.32%(64.68%vs. 59.35%);总之,除了SVM外大多数分类器在特征优化前后的精度差异仅介于-1.53%—0.95%,表明特征优化既显著减少了模型的训练时间,又普遍可以保持相似的精度,对于涉及多维特征的图像分类任务的优化效果显著。对于分类器集成,所有集成模型的平均精度均高于单分类器,其中基于模型堆叠-软投票集成框架构建的“MaxEnt+GTB//MaxEnt+RF”模型取得了最高的精度。这表明模型堆叠-软投票集成框架可以在现有条件的基础上,进一步提升树种的分类精度。
如图7所示,进一步利用无人机拍摄的香格里拉常见树种航片来直观检验分类结果。结果显示,乔木覆盖区域可以被准确清晰地识别,并且所提取的优势树种与20个航摄区的无人机照片全部吻合。因此,本发明所提取的树种具备较高的精度,并且能经受住无人机的现场航拍检查。
如图8所示,将本发明树种制图结果与已发布的香格里拉地区相关森林产品对比,本发明的树种分类结果能提供更详细和更精确的林分信息。目前香格里拉的森林分类产品很少,主要搜集到中国多时期土地利用土地覆被遥感监测数据集(CNLUCC),2020年的全球森林/非森林地图(The global forest/non-forest map in 2020,FNF 2020)、2010年30米国家森林覆盖图(The 30 meter national forest cover map in 2010,NFC 2010)以及李等(2020)发表的2020年香格里拉森林分类产品(The forest classification product ofShangri La in 2020,FCP 2020),视觉对比显示,这四种产品的森林分布格局与本发明基本相同,这与香格里拉被广泛森林覆盖的现实情况是相符的。这四项数据仅能提供粗略的森林信息,如CNLUCC和FNF 2020只是将森林分为密林和疏林,NFC 2010和FCP 2020更详细地区分了不同的森林类型。其中,NFC 2010数据将绝大部分的森林划分为常绿针叶林,然而,实际调查发现香格里拉分布着一定数量的阔叶林,如海拔较高的山腰上广泛分布着高山栎,而海拔相对低的平原地区分布着白桦,这说明NFC 2010数据对阔叶林的提取精度较差,而FCP 2020似乎更符合实际。对比FCP 2020与本发明,发现将不同树种按照森林类型归类后,两数据一致性较好,尤其是常绿针叶林(云冷杉、高山松、云南松、柏木、华山松、铁杉)和常绿阔叶林(高山栎)。相比之下,本发明更精确地挖掘出了隐藏在森林类型下的具体林分信息,这更有利于森林资源管理和生态环境定量评估。
一般而言,如果利用传统分布于本地计算机上的遥感处理软件(如ENVI、ERDAS等)进行大区域目标识别研究,不考虑训练样本制作的过程,从海量数据下载、预处理,到分类结束,所花费的时间、人力成本通常以周,甚至是月为时间计量单位。而本方法中使用的GEE遥感大数据云平台包括海量数据,可直接在平台完成数据集的筛选和预处理工作;此外平台还集成数千台服务器,其优越的算力可极大提升各种分类算法的运算速度,从而能快速完成大区域的树种分类工作。在GEE平台从数据筛选到树种分类结束的代码运行仅需十余分钟,其运算效率呈几何倍数高于传统遥感处理软件,进而提高了树种分类的时效性,可更好地服务于区域森林管理工作。
如图9和图10所示,本发明所提出的框架依靠GEE平台快速的云计算能力及其海量的遥感数据,实现了香格里拉地区约11613 平方千米范围内11类树种的信息数字化,从水平和垂直视角分析了香格里拉不同树种的空间格局,整体上,云冷杉分布最广泛,占森林总面积的33.23%,其次是川滇高山栎(20.47%)、高山松(11.25%)、落叶松(7.88%)、云南松(7.09%)、杨树(6.95%)、以及柏树(5.38%),以上树种是香格里拉的优势树种,合占92.26%,其他树种占比均低于5%。受森林立地条件的异质性影响,研究区内相同树种的分布呈现局部集聚特征,不同树种的分布呈现明显的空间异质性。具体而言,水平方向以香格里拉的中心点分别向南和向北延申25km将研究区划分为北部、中部和南部,统计数据显示,云冷杉、高山松和川滇高山栎在北部、中部和南部的分布差异较小,而其他树种呈现出较高的纬度异质性,如云南松、白桦和铁杉主要分布在中部和南部,鲜少分布在北部,而柏树和杨树则相反。如图10,垂直方向上,香格里拉树种主要分布在3000-4500m的高程区间,合占85.69%。不同树种分布的海拔异质性显著,如云冷杉、柏树和落叶松主要分布在3500-4500米的高海拔地区,高山松(PD)、川滇高山栎(QA)、白桦(BP)、杨树(PS)、铁杉(TC)则主要分布在3000-4000米的较高海拔地区,而云南松(PY)和华山松(PA)几乎全部分布在3000米以下的较低海拔区域。进一步将分类结果通过三维效果展示,这直观地呈现出研究区森林分布的海拔差异性,即同一座山的山谷,山麓,山腰,山顶等不同位置往往分布着不同的树种。这为掌握区域树种的空间分布情况以及空间分析奠定了基础,在大区域山区森林清查工作中具备极大潜力。
总之,本发明的树种分类技术兼具泛化性、高精度、可移植性,方法科学可靠,可很好地提取大区域树种分布信息,为区域森林管理和森林生态系统可持续发展提供新的科学指导。
本申请的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请技术方案构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。

Claims (10)

1.一种基于多源卫星图像的树种自动分类方法,其特征在于,包括如下步骤:
S1、收集多源数据,包括遥感卫星影像、地形数据、生物气候数据和土地覆被样本;
S2、基于多源数据构建包括光谱特征、指数特征、纹理特征、后向散射特征、地形特征和生物气候特征的多个原始特征场景;
S3、选择五个机器学习分类器,包括CART决策树、随机森林、支持向量机、梯度提升树和最大熵模型,并基于土地覆被样本和原始特征场景构建分类算法,对多个原始特征场景进行分类;
S4、评估五个分类器在不同原始特征场景中的准确性,初步筛选最佳原始特征场景;
S5、基于随机森林模型的特征重要性构建随机森林-递归特征消除算法进行特征优化,通过递归的方式,逐渐减少特征集的规模来获得最佳特征子集;
S6、将最佳特征子集作为新的分类场景输送给S3中的五个分类器再次进行树种分类,通过与S4中基于原始特征场景的分类结果的精度对比,选出在所有特征场景中平均精度最高的前三个分类器作为最佳基础分类器,选出精度最高的前三个分类结果作为最佳基础分类结果;
S7、将最佳基础分类器和最佳基础分类结果根据模型堆叠、软投票和模型堆叠-软投票三种集成框架分别进行集成,并选择最优的集成模型及其分类结果,该分类结果作为最佳分类结果;
S8、基于最佳分类结果进行树种制图并分析其空间格局。
2.根据权利要求1所述的一种基于多源卫星图像的树种自动分类方法,其特征在于,所述遥感卫星影像包括哨兵2号光学影像和哨兵1号SAR影像,哨兵2号光学影像经过影像调取、时间过滤、云过滤、裁剪和中值合成高质量哨兵2号合成图像;哨兵1号SAR影像通过轨道文件应用、GRD边界噪声去除、热噪声去除、辐射校正、地形校正、时间过滤、裁剪和中值合成高质量哨兵1号合成图像;所述地形数据为SRTM V3地形数据通过编程进行数据调用和裁剪;所述生物气候数据获取后进行重投影和裁剪;所述土地覆被样本为实地采集以及室内筛选和解译扩增获得。
3.根据权利要求1所述的一种基于多源卫星图像的树种自动分类方法,其特征在于,所述多源数据中所有栅格数据使用最近邻插值函数重新采样到相同的分辨率,并重新投影到相同的投影坐标。
4.根据权利要求1所述的一种基于多源卫星图像的树种自动分类方法,其特征在于,所述光谱特征为从哨兵2号合成图像中进行波段选取获得;指数特征通过哨兵2号合成图像的波段计算所得;纹理特征首先基于哨兵2号合成图像的NIR、Red和Green波段的线性组合计算得到灰度图像,再通过灰度共生矩阵计算所得;后向散射特征由哨兵1号合成图像中极化方式过滤所得;地形特征从SRTM V3地形数据中计算获得;生物气候特征从生物气候数据集中提取。
5.根据权利要求4所述的一种基于多源卫星图像的树种自动分类方法,其特征在于,基于所述光谱特征、指数特征、纹理特征、后向散射特征、地形特征和生物气候特征组合形成不同的原始特征场景,包括单类特征场景和多类特征场景,所构建的多种不同的原始特征场景通过对比获得适用于树种分类的最佳场景。
6.根据权利要求5所述的一种基于多源卫星图像的树种自动分类方法,其特征在于,基于所述单类特征场景和多类特征场景,执行CART决策树、随机森林、支持向量机、梯度提升树、最大熵模型分类算法进行树种分类,并评估其准确性,从单类特征场景和多类特征场景初步筛选出最佳原始特征场景。
7.根据权利要求1所述的一种基于多源卫星图像的树种自动分类方法,其特征在于,所述随机森林-递归特征消除算法步骤为:
基于原始特征场景训练随机森林分类模型,获得该轮次总体精度,并根据每个特征的重要性对所有特征进行排序,剔除重要性低的特征;
其余特征继续训练随机森林模型,直至迭代完所有特征;
选择精度最高的迭代轮次对应的特征因子组成最佳特征子集。
8.根据权利要求1所述的一种基于多源卫星图像的树种自动分类方法,其特征在于,所述集成框架之一的模型堆叠是以顺序模式构建分类器链,即:通过步骤S6选出精度排名前三的分类器,并以排名第一的为元分类器,以排名第二和第三的分类器为子分类器,将元分类器的输出以及通过步骤S5获得的最佳特征子集作为链中子分类器的输入,形成分类器链。
9.根据权利要求1所述的一种基于多源卫星图像的树种自动分类方法,其特征在于,所述集成框架之一的软投票具体操作方法为:选取通过步骤S6选出的精度排名前三的最佳基础分类结果参与投票,并根据参与投票的基础分类结果的精度赋予相应的权重,最终根据权重的加权求和确定类别。
10.根据权利要求1所述的一种基于多源卫星图像的树种自动分类方法,其特征在于,所述模型堆叠-软投票为基于模型堆叠和软投票构建的组合模型,将通过模型堆叠获得的分类结果进一步执行软投票,提取出更高精度的分类结果。
CN202311323610.0A 2023-10-13 2023-10-13 一种基于多源卫星图像的树种自动分类方法 Active CN117079059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311323610.0A CN117079059B (zh) 2023-10-13 2023-10-13 一种基于多源卫星图像的树种自动分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311323610.0A CN117079059B (zh) 2023-10-13 2023-10-13 一种基于多源卫星图像的树种自动分类方法

Publications (2)

Publication Number Publication Date
CN117079059A true CN117079059A (zh) 2023-11-17
CN117079059B CN117079059B (zh) 2023-12-19

Family

ID=88702847

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311323610.0A Active CN117079059B (zh) 2023-10-13 2023-10-13 一种基于多源卫星图像的树种自动分类方法

Country Status (1)

Country Link
CN (1) CN117079059B (zh)

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138913A (zh) * 2015-07-24 2015-12-09 四川大学 一种基于多视集成学习的恶意软件检测方法
CN106778832A (zh) * 2016-11-28 2017-05-31 华南理工大学 基于多目标优化的高维数据半监督集成分类方法
CN107180155A (zh) * 2017-04-17 2017-09-19 中国科学院计算技术研究所 一种基于异构集成模型的疾病预测方法及系统
CN109117956A (zh) * 2018-07-05 2019-01-01 浙江大学 一种最佳特征子集的确定方法
CN109934796A (zh) * 2018-12-26 2019-06-25 苏州雷泰医疗科技有限公司 一种基于深度集成学习的器官自动勾画方法
CN110991335A (zh) * 2019-11-29 2020-04-10 福州大学 一种基于多特征优选的可见光无人机遥感影像森林树种分类方法
CN111291789A (zh) * 2020-01-19 2020-06-16 华东交通大学 基于多阶段多特征深度融合的乳腺癌图像识别方法及系统
CN111461354A (zh) * 2019-12-24 2020-07-28 武汉大学 一种面向高维数据的机器学习集成分类方法及软件系统
CN112668400A (zh) * 2020-12-08 2021-04-16 深圳先进技术研究院 一种植被识别方法及应用
CN112992346A (zh) * 2021-04-09 2021-06-18 中山大学附属第三医院(中山大学肝脏病医院) 重症脊髓损伤预后的预测模型的建立方法
CN113206824A (zh) * 2021-03-23 2021-08-03 中国科学院信息工程研究所 动态网络异常攻击检测方法、装置、电子设备和存储介质
CN113360730A (zh) * 2021-06-03 2021-09-07 哈尔滨理工大学 一种基于过滤器和rf-rfe算法的特征选择方法
CN114662568A (zh) * 2022-03-04 2022-06-24 清华大学 数据分类方法、装置、设备和存储介质
CN114694036A (zh) * 2022-03-18 2022-07-01 南京农业大学 一种基于高分影像和机器学习的高海拔地区作物分类识别的方法
CN115270959A (zh) * 2022-07-27 2022-11-01 中国石油大学(北京) 基于递归特征消除融合随机森林的页岩岩性识别法及装置
CN115830464A (zh) * 2022-11-04 2023-03-21 云南师范大学 基于多源数据的高原山地农业大棚自动提取方法
CN116310864A (zh) * 2023-02-20 2023-06-23 北京师范大学 一种作物倒伏自动识别方法、系统、电子设备及介质
CN116738339A (zh) * 2023-06-09 2023-09-12 北京航空航天大学 一种小样本电信号多分类深度学习识别检测方法

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138913A (zh) * 2015-07-24 2015-12-09 四川大学 一种基于多视集成学习的恶意软件检测方法
CN106778832A (zh) * 2016-11-28 2017-05-31 华南理工大学 基于多目标优化的高维数据半监督集成分类方法
CN107180155A (zh) * 2017-04-17 2017-09-19 中国科学院计算技术研究所 一种基于异构集成模型的疾病预测方法及系统
CN109117956A (zh) * 2018-07-05 2019-01-01 浙江大学 一种最佳特征子集的确定方法
CN109934796A (zh) * 2018-12-26 2019-06-25 苏州雷泰医疗科技有限公司 一种基于深度集成学习的器官自动勾画方法
CN110991335A (zh) * 2019-11-29 2020-04-10 福州大学 一种基于多特征优选的可见光无人机遥感影像森林树种分类方法
CN111461354A (zh) * 2019-12-24 2020-07-28 武汉大学 一种面向高维数据的机器学习集成分类方法及软件系统
CN111291789A (zh) * 2020-01-19 2020-06-16 华东交通大学 基于多阶段多特征深度融合的乳腺癌图像识别方法及系统
CN112668400A (zh) * 2020-12-08 2021-04-16 深圳先进技术研究院 一种植被识别方法及应用
CN113206824A (zh) * 2021-03-23 2021-08-03 中国科学院信息工程研究所 动态网络异常攻击检测方法、装置、电子设备和存储介质
CN112992346A (zh) * 2021-04-09 2021-06-18 中山大学附属第三医院(中山大学肝脏病医院) 重症脊髓损伤预后的预测模型的建立方法
CN113360730A (zh) * 2021-06-03 2021-09-07 哈尔滨理工大学 一种基于过滤器和rf-rfe算法的特征选择方法
CN114662568A (zh) * 2022-03-04 2022-06-24 清华大学 数据分类方法、装置、设备和存储介质
CN114694036A (zh) * 2022-03-18 2022-07-01 南京农业大学 一种基于高分影像和机器学习的高海拔地区作物分类识别的方法
CN115270959A (zh) * 2022-07-27 2022-11-01 中国石油大学(北京) 基于递归特征消除融合随机森林的页岩岩性识别法及装置
CN115830464A (zh) * 2022-11-04 2023-03-21 云南师范大学 基于多源数据的高原山地农业大棚自动提取方法
CN116310864A (zh) * 2023-02-20 2023-06-23 北京师范大学 一种作物倒伏自动识别方法、系统、电子设备及介质
CN116738339A (zh) * 2023-06-09 2023-09-12 北京航空航天大学 一种小样本电信号多分类深度学习识别检测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JIE LI 等: "Combining Multi-Source Data and Feature Optimization for Plastic-Covered Greenhouse Extraction and Mapping Using the Google Earth Engine: A Case in Central Yunnan Province, China", 《REMOTE SENSING》, pages 1 - 27 *
QIAN LI: "Fusion Approaches to Individual Tree Species Classification Using Multi-Source Remotely Sensed Data", 《YORK UNIVERSITY》, pages 1 - 104 *
YUNCHENG DENG 等: "Mapping of Forest Biomass in Shangri-La City Based on LiDAR Technology and Other Remote Sensing Data", 《REMOTE SENSING》, pages 1 - 20 *
毛金凤 等: "基于Stacking集成机器学习算法的审计风险评估研究", 《电脑知识与技术》, vol. 18, no. 4, pages 15 - 18 *
王圆圆 等: "面向类别不平衡负荷序列模式识别的两阶段选择集成学习策略", 《电力系统及其自动化学报》, vol. 35, no. 1, pages 86 - 95 *

Also Published As

Publication number Publication date
CN117079059B (zh) 2023-12-19

Similar Documents

Publication Publication Date Title
Hartling et al. Urban tree species classification using UAV-based multi-sensor data fusion and machine learning
Mucher et al. Land cover characterization and change detection for environmental monitoring of pan-Europe
George et al. Forest tree species discrimination in western Himalaya using EO-1 Hyperion
Wang et al. Comparison of IKONOS and QuickBird images for mapping mangrove species on the Caribbean coast of Panama
CN110363246B (zh) 一种高时空分辨率植被指数ndvi的融合方法
CN111462223B (zh) 基于Sentinel-2影像的江淮地区大豆和玉米种植面积识别方法
Yancho et al. Fine-scale spatial and spectral clustering of UAV-acquired digital aerial photogrammetric (DAP) point clouds for individual tree crown detection and segmentation
Berveglieri et al. Identification of successional stages and cover changes of tropical forest based on digital surface model analysis
Zhu et al. Estimating and mapping mangrove biomass dynamic change using WorldView-2 images and digital surface models
Song et al. Estimation and validation of 30 m fractional vegetation cover over China through integrated use of Landsat 8 and Gaofen 2 data
CN107121681B (zh) 基于高分卫星遥感数据的居民地提取系统
Jónsson RGB and Multispectral UAV image classification of agricultural fields using a machine learning algorithm
Somers et al. Endmember library approaches to resolve spectral mixing problems in remotely sensed data: Potential, challenges, and applications
Fu et al. Forest cover classification with MODIS images in Northeastern Asia
Kupková et al. Towards reliable monitoring of grass species in nature conservation: Evaluation of the potential of UAV and PlanetScope multi-temporal data in the Central European tundra
CN117079059B (zh) 一种基于多源卫星图像的树种自动分类方法
CN115830464A (zh) 基于多源数据的高原山地农业大棚自动提取方法
Hirschmugl Derivation of forest parameters from UltracamD data
Effiom UAV-RGB and Multispectral Pleiades images, for tree species identification and forest carbon estimation in Amtsvenn, Germany
Lin et al. A model for forest type identification and forest regeneration monitoring based on deep learning and hyperspectral imagery
Phiri Monitoring land cover dynamics for Zambia using remote sensing: 1972–2016.
Awuah Effects of spatial resolution, land-cover heterogeneity and different classification methods on accuracy of land-cover mapping
Lu et al. Tree Species Classification based on Airborne Lidar and Hyperspectral Data
Li et al. Forest type classification with multitemporal sentinel-2 data
Yancho Individual tree detection in coastal western hemlock forests using remotely piloted aircraft system acquired digital aerial photogrammetric point clouds

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant