CN110823190B - 基于随机森林的岛礁浅海水深预测方法 - Google Patents

基于随机森林的岛礁浅海水深预测方法 Download PDF

Info

Publication number
CN110823190B
CN110823190B CN201910943217.9A CN201910943217A CN110823190B CN 110823190 B CN110823190 B CN 110823190B CN 201910943217 A CN201910943217 A CN 201910943217A CN 110823190 B CN110823190 B CN 110823190B
Authority
CN
China
Prior art keywords
water depth
island
shallow sea
random forest
reflectivity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910943217.9A
Other languages
English (en)
Other versions
CN110823190A (zh
Inventor
荆文龙
刘杨晓月
李勇
杨骥
夏小琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Institute of Geography of GDAS
Original Assignee
Guangzhou Institute of Geography of GDAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Institute of Geography of GDAS filed Critical Guangzhou Institute of Geography of GDAS
Priority to CN201910943217.9A priority Critical patent/CN110823190B/zh
Publication of CN110823190A publication Critical patent/CN110823190A/zh
Application granted granted Critical
Publication of CN110823190B publication Critical patent/CN110823190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C13/00Surveying specially adapted to open water, e.g. sea, lake, river or canal
    • G01C13/008Surveying specially adapted to open water, e.g. sea, lake, river or canal measuring depth of open water
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Hydrology & Water Resources (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本申请涉及一种基于随机森林的岛礁浅海水深预测方法、装置、存储介质和计算机设备,所述方法包括如下步骤:获取岛礁浅海区的多光谱反射率;获取岛礁浅海区的水深控制点的实际水深值;根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;以多光谱反射率、悬浮泥沙含量预测值作为特征向量的特征分量;以水深控制点的实际水深值为预期输出来训练随机森林模型;将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值。本申请所述的基于随机森林的岛礁浅海水深预测方法具有高效快速地获取岛礁浅海水深,结果精确可靠的优点。

Description

基于随机森林的岛礁浅海水深预测方法
技术领域
本申请涉及地理信息技术领域,特别是涉及一种基于随机森林的岛礁浅海水深预测方法、装置、存储介质和计算机设备。
背景技术
目前,对于岛礁浅海区的水深测量主要是依靠搭载了测深仪的无人船在岛礁浅海区进行实地测量,但由于不清楚水深和岛礁的限制,部分浅海区的水深无法测量或者会对无人船造成损伤,效率低下并且测量的结果不够精确。
随着卫星遥感技术的广泛应用,推动了水深测量方法的改进,其中通过遥感水深反演的方法测量水深成为了一个值得研究的课题。
发明内容
基于此,本申请实施例的目的在于,提供一种基于随机森林的岛礁浅海水深预测方法、装置、存储介质和计算机设备,其具有高效快速地获取岛礁浅海水深,结果精确可靠的优点。
第一方面,本申请实施例提供一种基于随机森林的岛礁浅海水深预测方法,包括如下步骤:
获取岛礁浅海区的多光谱反射率;
获取岛礁浅海区的水深控制点的实际水深值;
根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;
以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型;
将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值。在一个实施例中,所述将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得岛礁浅海水深的步骤之后,还包括:
获取岛礁浅海区的水深验证点的实际水深值;
根据所述水深验证点的实际水深值与通过时空序列连续反演获得的水深验证点的水深预测值计算反演精度,并建立反演精度与实际水深值的关系模型;
所述在每个子集内,随机抽取部分特征分量训练一棵回归树的步骤包括:
在训练样本所在的输入空间中,递归地选择最优变量St和对应最优值S*将所述回归树t节点分裂为tL和tR两棵子树,并使每棵子树之间的样本具有最大差异性;
衡量分裂的误差指标为分裂之前的回归误差减去分裂之后两棵子树的回归误差;当误差指标最大化时,每棵子树之间的样本具有最大差异性;所述误差指标具体为:
Δi(s,t)=i(t)-pLi(tL)-pRi(tR)
Figure GDA0002716352440000021
其中,
Figure GDA0002716352440000022
分别是两个子树tL、tR的样本数量,i(t)是回归误差:
Figure GDA0002716352440000023
Nt是节点t包含的样本数,yi是节点t中训练样本i的岛礁浅海区的实际水深值,y是yi集合算术平均值:
Figure GDA0002716352440000024
在一个实施例中,所述水深控制点的实际水深值和悬浮泥沙含量根据所述多光谱遥感数据的来源卫星的过境时间,对岛礁浅海区的水深控制点进行实测而获得。
在一个实施例中,所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤,具体通过如下关系模型进行计算:
Figure GDA0002716352440000025
式中,Rnir和Rred分别为近红外波段和红光波段的反射率,TSS为悬浮泥沙浓度,单位为mg/L,a,b,c为回归系数。
在一个实施例中,所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤之后,还包括:
获取水深控制点的悬浮泥沙含量实测值;
根据所述悬浮泥沙含量实测值对悬浮泥沙含量预测值进行精度验证和对所述关系模型进行校准。
在一个实施例中,所述以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型的步骤中,按照以下方式计算每一个特征分量参与所述随机森林模型的权重值:
Figure GDA0002716352440000031
其中,p(t)是样本到达节点t的比率,即Nt/N,Nt是节点t包含的样本数,N是样本数据的样本数,v(st)是用于分割st的变量,p(t)Δi(st,t)为节点t的加权精度减少比率。
第二方面,本申请实施例还提供一种基于随机森林的岛礁浅海水深预测装置,包括:
第一数据获取模块,用于获取岛礁浅海区的多光谱反射率;
第二数据获取模块,用于获取岛礁浅海区的水深控制点的实际水深值;
悬浮泥沙含量预测模块,用于根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;
随机森林构建模块,用于以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型;
水深预测模块,用于将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值;
所述随机森林构建模块在训练样本所在的输入空间中,递归地选择最优变量St和对应最优值S*将所述回归树t节点分裂为tL和tR两棵子树,并使每棵子树之间的样本具有最大差异性;
衡量分裂的误差指标为分裂之前的回归误差减去分裂之后两棵子树的回归误差;当误差指标最大化时,每棵子树之间的样本具有最大差异性;所述误差指标具体为:
Δi(s,t)=i(t)-pLi(tL)-pRi(tR)
Figure GDA0002716352440000032
其中,
Figure GDA0002716352440000034
分别是两个子树tL、tR的样本数量,i(t)是回归误差:
Figure GDA0002716352440000033
Nt是节点t包含的样本数,yi是节点t中训练样本i的岛礁浅海区的实际水深值,y是yi集合算术平均值:
Figure GDA0002716352440000041
第三方面,本申请实施例还提供一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如上任一项的基于随机森林的岛礁浅海水深预测方法的步骤。
第四方面,本申请实施例还提供一种计算机设备,包括:
处理器以及存储器;
其中,所述存储器存储有计算机程序;所述计算机程序适于由所述处理器加载并执行如上任一所述的基于随机森林的岛礁浅海水深预测方法的步骤。
在本申请实施例的技术方案中,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型,再将岛礁浅海区的多光谱反射率应用于该随机森林模型即可以反演预测水深,只需实测数量较少的水深控制点的水深值,即可以构建随机森林模型,再由随机森林模型高效快速地反演获得整个岛礁浅海区的不同点的水深值;并且由于考虑到悬浮泥沙含量引起水面反射率的变化,在构建模型时,将悬浮泥沙含量也作为水深的影响因素,使得水深预测值精确可靠。由于子集的随机性和使用的特征分量进行回归树训练的随机性使得随机森林可以在一定程度上消除过拟合。并且相较于单棵决策树模型的输出而言,随机森林模型使用多棵回归树联合进行预测可以有效降低模型的方差。
为了更好地理解和实施,下面结合附图详细说明本申请。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的基于随机森林的岛礁浅海水深预测方法的流程步骤图;
图2为本申请实施例提供的基于随机森林的岛礁浅海水深预测方法的步骤S100的流程步骤图;
图3为本申请实施例提供的基于随机森林的岛礁浅海水深预测方法步骤S300之后还包括的流程步骤图;
图4为本申请实施例提供的基于随机森林的岛礁浅海水深预测方法步骤S500之后还包括的流程步骤图;
图5为本申请实施例提供的基于随机森林的岛礁浅海水深预测装置的结构示意图;
图6为本申请实施例的计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请实施例公开了一种基于随机森林的岛礁浅海水深预测方法,请参阅图1,为本申请实施例提供的基于随机森林的岛礁浅海水深预测方法的流程图。该方法包括如下步骤:
步骤S100:获取岛礁浅海区的多光谱反射率。
在一个具体的实施例中,请参阅图2,所述获取岛礁浅海区的多光谱反射率的步骤,包括:
步骤S110:获取岛礁浅海区的中高分辨率的多光谱遥感数据;
步骤S120:通过大气校正和小波变换对多光谱遥感数据进行数据预处理;
步骤S130:将多光谱遥感数据转换为多光谱反射率。
其中,所述中高分辨率的多光谱遥感数据的来源卫星包括高分-1/2(GF-1、GF-2)、资源三号(ZY-3)、SPOT-6/7、LandsatOLI和Sentinel-2。所述步骤S130是将多光谱波段的DN值转换为多光谱反射率。所述多光谱反射率与岛礁浅海区的水深、悬浮泥沙含量和盐度条件等相关。
步骤S200:获取岛礁浅海区的水深控制点的实际水深值。
所述水深控制点是预先选定的位于岛礁浅海区内的几个用于无人船实测的控制点。在一个实施例中,所述水深控制点的实际水深值和悬浮泥沙含量根据所述多光谱遥感数据的来源卫星的过境时间,选择晴朗无云的时间对岛礁浅海区的水深控制点进行实测而获得。具体地,利用搭载单波速测深仪、全球定位系统和实时动态载波相位差分技术的无人船开展水深采样,在岛礁周围2000米缓冲区内均匀采样,采样间隔40m,精度误差为±1cm。考虑到受引潮力作用,水体在垂直方向上作一定规律性的涨落运动,所以水深遥感反演的水深控制点的实际水深值应该是多光谱遥感数据获取时刻的瞬时水深。本申请实施例的深度起算面为理论深度基准面,与潮汐表中潮高基准面一致,因此某一时刻的实际水深值等于实测水深值加上该时刻的潮高。针对每一景影像的过境时刻,对实测水深值分别开展水深控制点的潮汐校正,得到实际水深值。
步骤S300:根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值。
在一个实施例中,基于近红外和红光波段与水体悬浮泥沙浓度有较高的相关性,所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤S300,具体通过如下关系模型进行计算:
Figure GDA0002716352440000061
式中,Rnir和Rred分别为近红外波段和红光波段的反射率,TSS为悬浮泥沙浓度,单位为mg/L,a,b,c为回归系数。
在本申请实施例中,悬浮泥沙浓度为悬浮泥沙含量在采样水体的比例,通过近红外和红外波段反射率计算出水深控制点的悬浮泥沙浓度,也即能推算出悬浮泥沙含量预测值。
在一个实施例中,请参阅图3,所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤S300之后,还包括:
S300a:获取水深控制点的悬浮泥沙含量实测值;
S300b:根据所述悬浮泥沙含量实测值对悬浮泥沙含量预测值进行精度验证和对所述关系模型进行校准。
其中,在获取水深控制点的悬浮泥沙含量实测值时,用于测定悬浮泥沙含量的现场水样采集按照中华人民共和国海洋调查规范(GB/T 12763.1-2007)与海洋测量规范(GB/T 12763.4-2007)进行,现场水样装在黑色瓶内密封遮光保存,送至专业分析实验室采用GB11901-89烘干称重法进行悬浮泥沙含量测定。
步骤S400:以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型。
在一个实施例中,从总训练集中随机有放回地抽取子集Ntree,每个子集的大小为总训练集的2/3。对样本进行采样是必须的,如果不进行采样,每次都用完整的训练样本集训练出来的多棵树是相同的,这没有任何意义。
由于子集的随机性和使用的特征分量进行回归树训练的随机性使得随机森林可以在一定程度上消除过拟合。并且相较于单棵决策树模型的输出而言,随机森林模型使用多棵回归树联合进行预测可以有效降低模型的方差。
在一个实施例中,所述在每个子集内,随机抽取部分特征分量训练一棵回归树的步骤包括:
在训练样本所在的输入空间中,递归地选择最优变量St和对应最优值S*将所述分类与回归树t节点分裂为tL和tR两棵子树,并使每棵子树之间的样本具有最大差异性;
衡量分裂的误差指标为分裂之前的回归误差减去分裂之后两棵子树的回归误差;当误差指标最大化时,每棵子树之间的样本具有最大差异性;所述误差指标具体为:
Δi(s,t)=i(t)-pLi(tL)-pRi(tR)
Figure GDA0002716352440000071
其中,
Figure GDA0002716352440000072
分别是两个子树tL、tR的样本数量,i(t)是分裂之前的回归误差,i(tL)、i(tR)是分裂之后两个子树tL、tR的回归误差;并且有回归误差的计算公司为
Figure GDA0002716352440000073
Nt是节点t包含的样本数,yi是节点t中训练样本i的岛礁浅海区的实际水深值,y是yi集合算术平均值:
Figure GDA0002716352440000074
每次分裂时选用使得绝对值误差最小化的那个分裂,与均方和误差相比,绝对值误差能够刻画误差的原本真实水平。也即,每次分裂应该使得i(tL)、i(tR)的值最小,则Δi(s,t)达到最大。
在一个实施例中,通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型的步骤,具体按照如下公式进行平均计算:
Figure GDA0002716352440000081
其中,Ntree是回归树的数量,fi(x)是每棵回归树的输出值。
在一个实施例中,所述以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型的步骤中,按照以下方式计算每一个特征分量参与所述随机森林模型的权重值:
Figure GDA0002716352440000082
其中,p(t)是样本到达节点t的比率,即Nt/N,Nt是节点t包含的样本数,N是样本数据的样本数,v(st)是用于分割st的变量,p(t)Δi(st,t)为节点t的加权精度减少比率。所述随机森林模型还通过计算每一个特征分量参与所述随机森林模型的权重值,减少相关性低的特征分量对随机森林模型预测结果的影响,提高预测准确性。
最终构建的随机森林模型如下:
Figure GDA0002716352440000083
λ1……λn指不同的波段,Rw1)是第一个波段的波段反射率,R1)是第一个波段的深水区反射率;
Figure GDA0002716352440000084
是自然对数ln(Rw1)与自然对数ln(R1))的比值,其他波段亦是同理。
步骤S500:将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值。因为悬浮泥沙含量与红光波段、近红外波段的反射率有关,则事实上所述随机森林模型的输入即为所述岛礁浅海区的多光谱反射率,并且基于所述岛礁浅海区的多光谱反射率得到的水深预测值是y样本在树中传播时所达到对应叶子节点的值。
在一个实施例中,为了验证构建的随机森林模型的精确性,请查阅图4,所述将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得岛礁浅海水深的步骤S500之后,还包括:
S601:获取岛礁浅海区的水深验证点的实际水深值;
S602:根据所述水深验证点的实际水深值与通过时空序列连续反演获得的水深验证点的水深预测值计算反演精度,并建立反演精度与实际水深值的关系模型。
水深验证点与水深控制点类似,是预先选定的位于岛礁浅海区内的几个用于无人船实测的验证点,主要构成验证集,用于对构建的模型进行验证和校正。水深验证点的实际水深值的获取方法与水深控制点的实际水深值相同。
本申请实施例可以根据反演精度与实际水深值的关系模型明确光学遥感水深反演在不同水色条件下的精度及最大深度,还可以根据反演精度与实际水深值的关系模型对所述随机森林模型进行模型校正。
在本申请实施例的技术方案中,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型,再将岛礁浅海区的多光谱反射率应用于该随机森林模型即可以反演预测水深,只需实测数量较少的水深控制点的水深值,即可以构建随机森林模型,再由随机森林模型高效快速地反演获得整个岛礁浅海区的不同点的水深值;并且由于考虑到悬浮泥沙含量引起水面反射率的变化,在构建模型时,将悬浮泥沙含量也作为水深的影响因素,使得水深预测值精确可靠。由于子集的随机性和使用的特征分量进行回归树训练的随机性使得随机森林可以在一定程度上消除过拟合。并且相较于单棵决策树模型的输出而言,随机森林模型使用多棵回归树联合进行预测可以有效降低模型的方差。
请参阅图5,本申请实施例还提供一种基于随机森林的岛礁浅海水深预测装置,包括:
第一数据获取模块1,用于获取岛礁浅海区的多光谱反射率;
第二数据获取模块2,用于获取岛礁浅海区的水深控制点的实际水深值;
悬浮泥沙含量预测模块3,用于根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;
随机森林构建模块4,用于以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型;
水深预测模块5,用于将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值。
基于相同的发明构思,本申请实施例的基于随机森林的岛礁浅海水深预测装置具有与基于随机森林的岛礁浅海水深预测方法相同的有益效果。
第三方面,本申请实施例还提供一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如上任一项的基于随机森林的岛礁浅海水深预测方法的步骤。
第四方面,请参阅图6,本申请实施例还提供一种计算机设备,包括:
处理器10以及存储器20;
其中,所述存储器20存储有计算机程序;所述计算机程序适于由所述处理器10加载并执行如上任一所述的基于随机森林的岛礁浅海水深预测方法的步骤。
在本实施例中,处理器10和存储器20通过总线连接,存储器20可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可读储存介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
处理器10可以是一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件。在本实施例中,所述处理器10还可以为多个,或者处理器10可以包括一个或者多个处理核心。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。
单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。

Claims (9)

1.一种基于随机森林的岛礁浅海水深预测方法,其特征在于,包括如下步骤:
获取岛礁浅海区的多光谱反射率;
获取岛礁浅海区的水深控制点的实际水深值;
根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;
以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型;
将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值;
所述在每个子集内,随机抽取部分特征分量训练一棵回归树的步骤包括:
在训练样本所在的输入空间中,递归地选择最优变量St和对应最优值S*将所述回归树t节点分裂为tL和tR两棵子树,并使每棵子树之间的样本具有最大差异性;
衡量分裂的误差指标为分裂之前的回归误差减去分裂之后两棵子树的回归误差;当误差指标最大化时,每棵子树之间的样本具有最大差异性;所述误差指标具体为:
Δi(s,t)=i(t)-pLi(tL)-pRi(tR)
Figure FDA0002716352430000011
其中,
Figure FDA0002716352430000012
分别是两个子树tL、tR的样本数量,i(t)是回归误差:
Figure FDA0002716352430000013
Nt是节点t包含的样本数,yi是节点t中训练样本i的岛礁浅海区的实际水深值,y是yi集合算术平均值:
Figure FDA0002716352430000014
2.根据权利要求1所述的基于随机森林的岛礁浅海水深预测方法,其特征在于:所述将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得岛礁浅海水深的步骤之后,还包括:
获取岛礁浅海区的水深验证点的实际水深值;
根据所述水深验证点的实际水深值与通过时空序列连续反演获得的水深验证点的水深预测值计算反演精度,并建立反演精度与实际水深值的关系模型。
3.根据权利要求1或2所述的基于随机森林的岛礁浅海水深预测方法,其特征在于:所述实际水深值根据所述多光谱遥感数据的来源卫星的过境时间,对岛礁浅海区的水深控制点或水深验证点进行实测和潮汐校正而获得。
4.根据权利要求1所述的基于随机森林的岛礁浅海水深预测方法,其特征在于:所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤,具体通过如下关系模型进行计算:
Figure FDA0002716352430000021
式中,Rnir和Rred分别为近红外波段和红光波段的反射率,TSS为悬浮泥沙浓度,单位为mg/L,a,b,c为回归系数。
5.根据权利要求4所述的基于随机森林的岛礁浅海水深预测方法,其特征在于:所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤之后,还包括:
获取水深控制点的悬浮泥沙含量实测值;
根据所述悬浮泥沙含量实测值对悬浮泥沙含量预测值进行精度验证和对所述关系模型进行校准。
6.根据权利要求1所述的基于随机森林的岛礁浅海水深预测方法,其特征在于:所述以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型的步骤中,按照以下方式计算每一个特征分量参与所述随机森林模型的权重值:
Figure FDA0002716352430000022
其中,p(t)是样本到达节点t的比率,即Nt/N,Nt是节点t包含的样本数,N是样本数据的样本数,v(st)是用于分割st的变量,p(t)Δi(st,t)为节点t的加权精度减少比率。
7.一种基于随机森林的岛礁浅海水深预测装置,其特征在于,包括:
第一数据获取模块,用于获取岛礁浅海区的多光谱反射率;
第二数据获取模块,用于获取岛礁浅海区的水深控制点的实际水深值;
悬浮泥沙含量预测模块,用于根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;
随机森林构建模块,以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型;
水深预测模块,用于将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值;
所述随机森林构建模块在训练样本所在的输入空间中,递归地选择最优变量St和对应最优值S*将所述回归树t节点分裂为tL和tR两棵子树,并使每棵子树之间的样本具有最大差异性;
衡量分裂的误差指标为分裂之前的回归误差减去分裂之后两棵子树的回归误差;当误差指标最大化时,每棵子树之间的样本具有最大差异性;所述误差指标具体为:
Δi(s,t)=i(t)-pLi(tL)-pRi(tR)
Figure FDA0002716352430000031
其中,
Figure FDA0002716352430000032
分别是两个子树tL、tR的样本数量,i(t)是回归误差:
Figure FDA0002716352430000033
Nt是节点t包含的样本数,yi是节点t中训练样本i的岛礁浅海区的实际水深值,y是yi集合算术平均值:
Figure FDA0002716352430000034
8.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1-6任一项的基于随机森林的岛礁浅海水深预测方法的步骤。
9.一种计算机设备,其特征在于,包括:
处理器以及存储器;
其中,所述存储器存储有计算机程序;所述计算机程序适于由所述处理器加载并执行如权利要求1-6中任一所述的基于随机森林的岛礁浅海水深预测方法的步骤。
CN201910943217.9A 2019-09-30 2019-09-30 基于随机森林的岛礁浅海水深预测方法 Active CN110823190B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910943217.9A CN110823190B (zh) 2019-09-30 2019-09-30 基于随机森林的岛礁浅海水深预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910943217.9A CN110823190B (zh) 2019-09-30 2019-09-30 基于随机森林的岛礁浅海水深预测方法

Publications (2)

Publication Number Publication Date
CN110823190A CN110823190A (zh) 2020-02-21
CN110823190B true CN110823190B (zh) 2020-12-08

Family

ID=69548938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910943217.9A Active CN110823190B (zh) 2019-09-30 2019-09-30 基于随机森林的岛礁浅海水深预测方法

Country Status (1)

Country Link
CN (1) CN110823190B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428419A (zh) * 2020-02-29 2020-07-17 中山大学 悬浮泥沙浓度预测方法、装置、计算机设备和存储介质
CN112881353B (zh) * 2021-01-11 2022-11-15 江西师范大学 一种测定水体中溶解性有机碳浓度的方法和装置
CN114758218A (zh) * 2022-04-25 2022-07-15 中交上海航道勘察设计研究院有限公司 一种适用于高光谱卫星影像的高浊度水下地形反演方法
CN115908998B (zh) * 2022-11-17 2023-06-09 北京星天科技有限公司 水深数据识别模型的训练方法、水深数据识别方法及装置

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080300790A1 (en) * 2007-05-29 2008-12-04 James Kirunda Kakaire Environmental data delivery - edd
CN103344713A (zh) * 2013-06-18 2013-10-09 湖南中烟工业有限责任公司 一种基于随机森林法分析致香物在烤烟香型分类中的重要性及预测香型的方法
CN104504365A (zh) * 2014-11-24 2015-04-08 闻泰通讯股份有限公司 视频序列中的笑脸识别系统及方法
CN104613944A (zh) * 2015-01-27 2015-05-13 电子科技大学 一种基于gwr和bp神经网络的分布式水深预测方法
CN104613945A (zh) * 2015-02-11 2015-05-13 国家海洋局第二海洋研究所 一种浅海大型复杂沙波区地形重构方法
CN105241428A (zh) * 2015-08-27 2016-01-13 北京市遥感信息研究所 一种利用高光谱进行水深反演的方法
CN105445751A (zh) * 2015-11-18 2016-03-30 国家海洋局第一海洋研究所 一种浅水区域水深比值遥感反演方法
CN105654210A (zh) * 2016-02-26 2016-06-08 中国水产科学研究院东海水产研究所 一种利用海洋遥感多环境要素的集成学习渔场预报方法
CN105844300A (zh) * 2016-03-24 2016-08-10 河南师范大学 一种基于随机森林算法的优化分类方法及装置
CN106153016A (zh) * 2016-07-07 2016-11-23 河海大学 潮间带多点位近底边界层水沙过程同步观测方法
WO2017179344A1 (ja) * 2016-04-11 2017-10-19 古野電気株式会社 波高算出装置、レーダ装置、及び波高算出方法
CN109059796A (zh) * 2018-07-20 2018-12-21 国家海洋局第三海洋研究所 无水深控制点区域的浅海水深多光谱卫星遥感反演方法
CN109657392A (zh) * 2018-12-28 2019-04-19 北京航空航天大学 一种基于深度学习的高光谱遥感水深反演方法
CN109781073A (zh) * 2018-11-12 2019-05-21 国家海洋局第二海洋研究所 一种融合海浪特征和光谱特征的浅海水深遥感提取方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104181515B (zh) * 2013-05-21 2016-03-09 时春雨 一种基于蓝-黄波段高光谱数据的浅海水深反演方法
KR20160068320A (ko) * 2014-12-05 2016-06-15 주식회사 네오텍 레이더 이미지를 이용한 파랑정보 추정방법
CN105865424B (zh) * 2016-04-13 2019-09-17 中测新图(北京)遥感技术有限责任公司 一种基于非线性模型的多光谱遥感水深反演方法及装置
CN107894381B (zh) * 2017-12-29 2024-02-02 广州和时通电子科技有限公司 一种南方河流用测沙装置和方法
CN109283144A (zh) * 2018-10-26 2019-01-29 浙江省水利河口研究院 强潮高浑浊河口悬浮泥沙长历时变化的遥感计算方法
CN109270010A (zh) * 2018-11-15 2019-01-25 广州地理研究所 一种基于随机森林算法的植物滞尘能力检测方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080300790A1 (en) * 2007-05-29 2008-12-04 James Kirunda Kakaire Environmental data delivery - edd
CN103344713A (zh) * 2013-06-18 2013-10-09 湖南中烟工业有限责任公司 一种基于随机森林法分析致香物在烤烟香型分类中的重要性及预测香型的方法
CN104504365A (zh) * 2014-11-24 2015-04-08 闻泰通讯股份有限公司 视频序列中的笑脸识别系统及方法
CN104613944A (zh) * 2015-01-27 2015-05-13 电子科技大学 一种基于gwr和bp神经网络的分布式水深预测方法
CN104613945A (zh) * 2015-02-11 2015-05-13 国家海洋局第二海洋研究所 一种浅海大型复杂沙波区地形重构方法
CN105241428A (zh) * 2015-08-27 2016-01-13 北京市遥感信息研究所 一种利用高光谱进行水深反演的方法
CN105445751A (zh) * 2015-11-18 2016-03-30 国家海洋局第一海洋研究所 一种浅水区域水深比值遥感反演方法
CN105654210A (zh) * 2016-02-26 2016-06-08 中国水产科学研究院东海水产研究所 一种利用海洋遥感多环境要素的集成学习渔场预报方法
CN105844300A (zh) * 2016-03-24 2016-08-10 河南师范大学 一种基于随机森林算法的优化分类方法及装置
WO2017179344A1 (ja) * 2016-04-11 2017-10-19 古野電気株式会社 波高算出装置、レーダ装置、及び波高算出方法
CN106153016A (zh) * 2016-07-07 2016-11-23 河海大学 潮间带多点位近底边界层水沙过程同步观测方法
CN109059796A (zh) * 2018-07-20 2018-12-21 国家海洋局第三海洋研究所 无水深控制点区域的浅海水深多光谱卫星遥感反演方法
CN109781073A (zh) * 2018-11-12 2019-05-21 国家海洋局第二海洋研究所 一种融合海浪特征和光谱特征的浅海水深遥感提取方法
CN109657392A (zh) * 2018-12-28 2019-04-19 北京航空航天大学 一种基于深度学习的高光谱遥感水深反演方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于神经网络的河道浅滩演变预测模型;陈一梅,徐造林;《水利学报》;20020831(第8期);全文 *
长江口水域多光谱遥感水深反演模型研究;徐升,张鹰;《地理与地理信息科学》;20060530(第3期);全文 *
长江河口年代际冲淤演变预测模型的建立及应用;栾华龙;《中国博士学位论文全文数据库基础科学辑》;20190930(第9期);全文 *

Also Published As

Publication number Publication date
CN110823190A (zh) 2020-02-21

Similar Documents

Publication Publication Date Title
CN110823190B (zh) 基于随机森林的岛礁浅海水深预测方法
Garcia et al. World Ocean Atlas 2018, Volume 3: Dissolved Oxygen, Apparent Oxygen Utilization, and Dissolved Oxygen Saturation.
CN110849334B (zh) 基于分类与回归树的岛礁浅海水深预测方法
Pushparaj et al. Estimation of bathymetry along the coast of Mangaluru using Landsat-8 imagery
Platt et al. Operational estimation of primary production at large geographical scales
Carvajal et al. Relationship between atmospheric corrections and training-site strategy with respect to accuracy of greenhouse detection process from very high resolution imagery
Liu et al. A downscaled bathymetric mapping approach combining multitemporal Landsat-8 and high spatial resolution imagery: Demonstrations from clear to turbid waters
CN113050091B (zh) 一种星载合成孔径雷达风速风向联合反演方法及系统
Lucieer et al. Analyzing uncertainty in multibeam bathymetric data and the impact on derived seafloor attributes
Chen et al. Comparison of different methods for spatial downscaling of GPM IMERG V06B satellite precipitation product over a typical arid to semi-arid area
Hu et al. Assessment of the MCC method to estimate sea surface currents in highly turbid coastal waters from GOCI
Chen et al. Applicability evaluation of Landsat-8 for estimating low concentration colored dissolved organic matter in inland water
CN111879915A (zh) 一种滨海湿地高分辨率的逐月土壤盐度监测方法及系统
Steel et al. Comparison of methods for measuring visual water clarity
Kim et al. Predicting chlorophyll-a using Landsat 8 OLI sensor data and the non-linear RANSAC method–a case study of Nakdong River, South Korea
Zhang et al. A semi-analytical model for estimating total suspended matter in highly turbid waters
Wan et al. Shallow water bathymetry mapping of Xinji Island based on multispectral satellite image using deep learning
Masud-Ul-Alam et al. Surface temperature and salinity in the northern Bay of Bengal: in situ measurements compared with satellite observations and model output
Zhang et al. Tracking historical chlorophyll-a change in the guanting reservoir, Northern China, based on landsat series inter-sensor normalization
Mateus et al. Assessment of two techniques to merge ground-based and TRMM rainfall measurements: a case study about Brazilian Amazon Rainforest
Makboul et al. Performance assessment of ANN in estimating remotely sensed extracted bathymetry. Case study: Eastern harbor of alexandria
Chen et al. Improving surface current estimation from Geostationary Ocean Color Imager using tidal ellipse and angular limitation
CN110826764A (zh) 基于随机森林算法的植被指数预测方法、系统及设备
Jalilzadeh et al. Machine learning method for predicting the depth of shallow lakes using multi-band remote sensing images
Guo et al. Multi-resolution satellite images bathymetry inversion of Bangda Co in the western Tibetan Plateau

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 510075 one of the compound No. 100, Xianlie Middle Road, Yuexiu District, Guangzhou City, Guangdong Province

Patentee after: Guangzhou Institute of geography, Guangdong Academy of Sciences

Address before: 510075 one of the compound No. 100, Xianlie Middle Road, Yuexiu District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU INSTITUTE OF GEOGRAPHY