CN114781576B - 一种基于随机森林算法的声速剖面估计方法及装置 - Google Patents

一种基于随机森林算法的声速剖面估计方法及装置 Download PDF

Info

Publication number
CN114781576B
CN114781576B CN202210412550.9A CN202210412550A CN114781576B CN 114781576 B CN114781576 B CN 114781576B CN 202210412550 A CN202210412550 A CN 202210412550A CN 114781576 B CN114781576 B CN 114781576B
Authority
CN
China
Prior art keywords
data
matrix
sound velocity
model
argo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210412550.9A
Other languages
English (en)
Other versions
CN114781576A (zh
Inventor
欧圳翼
屈科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Ocean University
Original Assignee
Guangdong Ocean University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Ocean University filed Critical Guangdong Ocean University
Priority to CN202210412550.9A priority Critical patent/CN114781576B/zh
Publication of CN114781576A publication Critical patent/CN114781576A/zh
Application granted granted Critical
Publication of CN114781576B publication Critical patent/CN114781576B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N29/00Investigating or analysing materials by the use of ultrasonic, sonic or infrasonic waves; Visualisation of the interior of objects by transmitting ultrasonic or sonic waves through the object
    • G01N29/02Analysing fluids
    • G01N29/024Analysing fluids by measuring propagation velocity or propagation time of acoustic waves
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2291/00Indexing codes associated with group G01N29/00
    • G01N2291/01Indexing codes associated with the measuring variable
    • G01N2291/011Velocity or travel time
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2291/00Indexing codes associated with group G01N29/00
    • G01N2291/02Indexing codes associated with the analysed material
    • G01N2291/022Liquids
    • G01N2291/0228Aqueous liquids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Biochemistry (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Acoustics & Sound (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种基于随机森林算法的声速剖面估计方法,包括以下:样本数据获取,所述样本数据包括遥感参数、Argo数据以及WOA13数据;输入数据处理,对所述遥感参数进行数据转换得到输入数据,根据预设条件划分为训练集数据和测试集数据;输出数据处理,对所述Argo数据以及WOA13进行数据转换得到输出数据,根据所述预设条件的同等条件划分为训练集数据和测试集数据;将所述训练集数据输入RF模型进行模型训练得到训练好的RF模型,将所述测试集数据输入训练好的RF模型得到投影系数集;根据所述投影系数集进行剖面重构。本发明拟采用随机森林RF模型基于卫星观测数据SSTA和SSHA,对应经纬度取其余弦值得到经纬度数据,对应测量时间并将日期转化为序号的时间数据,对声速剖面样本进行反演,鲁棒性高且结果更为准确。

Description

一种基于随机森林算法的声速剖面估计方法及装置
技术领域
本发明涉及海域分析技术领域,尤其涉及一种基于随机森林算法的声速剖面估计方法及装置。
背景技术
声速剖面是声速在水体深度的分布变化,是研究海洋声传播的重要环境参数,声速剖面可以直接影响了水下声纳系统应用的效能。由于声速剖面大多数海洋内部过程都有海表特征,通过海表特征可以反映海洋内部的动态现象,如温盐结构,在很大程度上依赖表层的海洋动力学过程。通过对声速剖面进行反演,具有很多实际应用价值,可以快速获取大面积剖面,对区域可以减少测量次数,提高效率根据,节约测量剖面的费用。
因为声速剖面具有重要作用,所以关于如何获取声速剖面的相关问题受到了广泛关注,声速剖面的反演方法也不断发展。以往,人们对于声速剖面的认识主要在于其性质,当时的声速剖面方法主要是现场测量。进入90年代,在剖面反演问题里为了限制声速剖面反演的参数维数,引入了正交函数(Empirical orthogonal function,EOF),LeBlanc发现在描述声速剖面时,以最小均方为标准,EOF是误差最小的基函数。Park等发现,使用前几阶的经验正交函数就可以表示海下信息,并且使用正交函数可以很好的对声速剖面进行反演。Carnes等通过统计得出了温度垂直结构的经验正交函数与动态高度之间的回归关系,通过单经验正交函数回归模型(Single empirical orthogonal function regression,sEOF-r)能精确反演水体剖面参数。在利用EOF对水体建模的同时,许多海面参数与水体的模态函数间的关系的认识不断加深。
21世纪以后,随着遥感技术的发展,实时获取大范围海洋声速剖面的能力越来越强,数据总量不断积累;同时,机器学习、神经网络等人工智能方法的提出,使声速剖面在反演问题上的精度和效率有了重大提升。近年来涌现的几种具有代表性的方法包括:
方法一:基于单经验正交回归的声速剖面反演法
分析大量历史温度和盐度数据剖面图,将海面高度、海面温度、一年中的某一天、纬度和经度与温度和盐度剖面图联系起来,通过单经验正交函数回归模型(Singleempirical orthogonal function regression,sEOF-r)进行声速剖面反演。
[1]Carnes,Michael R.,William J.Teague,and Jim L.Mitchell."Inferenceof Subsurface Thermohaline Structure from Fields Measurable by Satellite"[J].Journal of Atmospheric and Oceanic Technology,1994,11(2):551-566.
方法二:基于自组织神经网络的声速剖面反演方法研究
将声速剖面样本分为不同水层,将不同水层内的梯度作为特征量形成输入数组,然后采用自组织地图(Self-organizing map,SOM)竞争型神经网络进行声速剖面反演。
[2]H.Li,K.Qu and J.Zhou,"Reconstructing Sound Speed Profile FromRemote Sensing Data:Nonlinear Inversion Based on Self-Organizing Map,"in IEEEAccess,vol.9,pp.109754-109762,2021,doi:10.1109/ACCESS.2021.3102608.
方法三:基于Xgboost的遥感参数反演方法研究
提出了一种新的集成学习算法,即极限梯度提升(XGBoost),用于检索全球海洋上部2000米的地下温盐异常,包括地下温度异常和地下盐度异常。为地下温盐估算提供了有效的遥感技术,进一步推动了内部海洋参数的长期遥感重建。
[3]Su,H.;Yang,X.;Lu,W.;Yan,X.-H.Estimating Subsurface ThermohalineStructure of the Global Ocean Using Surface Remote SensingObservations.Remote Sens.2019,11,1598.
当前的技术基本都是线性的sEOF-r方法,普遍的缺点在于:
(1)反演前需要对重构区域进行划分,而对于划分标准常常依据人的主观认识。这种空间和深度网格划分没有统一标准,可能导致不同人处理出现不同分类结果。
(2)参数较少且参数之间采用简单的线性关系,无法准确解释海洋的复杂环境。
发明内容
本发明的目的是为了至少解决现有技术的不足之一,提供一种基于随机森林算法的声速剖面估计方法及装置。
为了实现上述目的,本发明采用以下的技术方案:
具体的,提出一种基于随机森林算法的声速剖面估计方法,包括以下:
样本数据获取,所述样本数据包括遥感参数、Argo数据以及WOA13数据;
输入数据处理,对所述遥感参数进行数据转换得到输入数据,根据预设条件划分为训练集数据和测试集数据;
输出数据处理,对所述Argo数据以及WOA13进行数据转换得到输出数据,后根据所述预设条件的同等条件划分为训练集数据和测试集数据;
将所述训练集数据输入RF模型进行模型训练得到训练好的RF模型,将所述测试集数据输入训练好的RF模型得到投影系数集;
根据所述投影系数集进行剖面重构。
进一步,具体的,所述遥感参数的SSTA获取自美国国家海洋大气管理局数据中心,SSHA获取自AVISO数据集,选用的时间分辨率为1天,空间分辨率为0.25°×0.25°;Argo数据获取自中国Argo资料中心的《全球海洋Argo散点资料集》;WOA13数据为温度盐度多年统计,空间分辨率0.25°的全年平均温盐剖面。
进一步,具体的,所述输入数据处理包括,
将所述遥感参数中SSTA以及SSHA所对应的经纬度取余弦值得到LAT以及LON数据,将Argo数据通过声速经验公式转换得到SSP数据的测量时间按正常年转化为1-365的序号、闰年转化为1-366的序号的方式转化得到数据DATE,将SSHA、SSTA、LAT、LON以及DATE作为模型输入标签。
进一步,具体的,所述输出数据处理包括,
将WOA13数据通过Del Grosso声速经验公式换算成背景稳态剖面;
将Argo数据通过声速经验公式转换得到SSP数据,将所述SSP数据表示为矩阵C,所述矩阵C为D×S阶矩阵,其中D为深度上的采样点数,S为样本数量,将矩阵C减去背景稳态剖面得到声速异常矩阵E,所述声速异常矩阵E为D×S阶矩阵;
计算所述声速异常矩阵E的协方差矩阵R:
R=E×ET
通过以下矩阵计算公式对所述声速异常矩阵E进行主成分提取,
R×K=K×λ;
其中K是一个特征矩阵,它的每一列代表了声速异常矩阵的一个主成分即正交经验函数EOF,而λ则是一个对角矩阵,角线上每一个数字代表了对应列主成分所能表示的扰动方差,选用5阶的EOF作为重构声速扰动的主成分模态以确定基本扰动模态。
进一步,具体的,所述投影系数集通过以下方式进行计算,
通过下式提取基本扰动模态中的每一阶模态的投影系数,
Figure BDA0003604284740000031
其中c代表一条样本,c0为背景稳态剖面,Kn表示五阶的EOF模态,an为五阶模态对应投影系数,再主动对Kn增加一列均为1的常数列,作为常数模态K0,通过回归算法计算到每一个样本的前六阶系数,形成投影系数集A,所述投影系数集为一个6×S阶矩阵,包括投影系数A0-A5,其中A0作为常数系数,A1-A5为选用的主成分总阶数,S为样本数量,将投影系数A0-A5作为模型输出标签。
进一步,具体的,根据所述投影系数集进行剖面重构包括,
将所述投影系数A0-A5代入
Figure BDA0003604284740000032
中,计算得到的剖面即为重构的剖面。
本发明还提出一种基于随机森林算法的声速剖面估计装置,包括以下:
样本数据获取模块,用于获取样本数据,所述样本数据包括遥感参数、Argo数据以及WOA13数据;
输入数据处理模块,用于对所述遥感参数进行数据转换得到输入数据,根据预设条件划分为训练集数据和测试集数据;
输出数据处理模块,用于对所述Argo数据以及WOA13进行数据转换得到输出数据,根据所述预设条件的同等条件划分为训练集数据和测试集数据;
投影数据集计算模块,用于将所述训练集数据输入RF模型进行模型训练得到训练好的RF模型,将所述测试集数据输入训练好的RF模型得到投影系数集;
剖面重构模块,用于根据所述投影系数集进行剖面重构。
本发明的有益效果为:
本发明拟采用随机森林RF模型基于卫星观测数据SSTA和SSHA,对应经纬度取其余弦值得到经纬度数据,对应测量时间并将日期转化为序号的时间数据,对声速剖面样本进行反演。
较之现有技术的缺点,方法的优点体现在:
(1)在反演上不需要预设空间网格,直接训练模型,而竖直方向上采用标准的深度处理网格,避免结果因为人为网格设置产生偏差,增强了模型的鲁棒性。
(2)通过非线性反演摆脱了线性约束,减少了简单线性拟合的局限性,且没有解析式的限制,能够更准确地挖掘参数之间的关系。
(3)参数之间不采取简单的线性关系,还可以引入更多的参数训练模型,比如位置,时间,热流,风速等。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为本发明一种基于随机森林算法的声速剖面估计方法的流程图;
图2所示为本发明一种基于随机森林算法的声速剖面估计装置的结构示意图。
具体实施方式
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。附图中各处使用的相同的附图标记指示相同或相似的部分。
参照图1,实施例1,本发明提出一种基于随机森林算法的声速剖面估计方法,包括以下:
步骤110、样本数据获取,所述样本数据包括遥感参数、Argo数据以及WOA13数据;
步骤120、输入数据处理,对所述遥感参数进行数据转换得到输入数据,根据预设条件划分为训练集数据和测试集数据;
步骤130、输出数据处理,对所述Argo数据以及WOA13进行数据转换得到输出数据,后根据所述预设条件的同等条件划分为训练集数据和测试集数据;
步骤140、将所述训练集数据输入RF模型进行模型训练得到训练好的RF模型,将所述测试集数据输入训练好的RF模型得到投影系数集;
步骤150、根据所述投影系数集进行剖面重构。
本实施例1拟采用随机森林RF模型基于卫星观测数据SSTA和SSHA,对应经纬度取其余弦值得到经纬度数据,对应测量时间并将日期转化为序号的时间数据,对声速剖面样本进行反演。
较之现有技术的缺点,方法的优点体现在:
(1)在反演上不需要预设空间网格,直接训练模型,而竖直方向上采用标准的深度处理网格,避免结果因为人为网格设置产生偏差,增强了模型的鲁棒性。
(2)通过非线性反演摆脱了线性约束,减少了简单线性拟合的局限性,且没有解析式的限制,能够更准确地挖掘参数之间的关系。
(3)参数之间不采取简单的线性关系,还可以引入更多的参数训练模型,比如位置,时间,热流,风速等。
在本实施例1中所采用的RF模型为较为成熟的算法,在matlab、python等编译器都有相关的函数库,可供使用者选用。不同库语法略有不同,但是对结果影响基本可忽略。
作为本发明的优选实施方式,具体的,所述遥感参数的SSTA获取自美国国家海洋大气管理局数据中心,SSHA获取自AVISO数据集,选用的时间分辨率为1天,空间分辨率为0.25°×0.25°;Argo数据获取自中国Argo资料中心的《全球海洋Argo散点资料集》;WOA13数据为温度盐度多年统计,空间分辨率0.25°的全年平均温盐剖面。
作为本发明的优选实施方式,具体的,所述输入数据处理包括,
将所述遥感参数中SSTA以及SSHA所对应的经纬度取余弦值得到LAT以及LON数据,将所述SSP数据的测量时间按正常年转化为1-365的序号、闰年转化为1-366的序号的方式转化得到数据DATE,将SSHA、SSTA、LAT、LON以及DATE作为模型输入标签。
其中SSTA为海面温度异常,SSHA为海面高度异常。
作为本发明的优选实施方式,具体的,所述输出数据处理包括,
将WOA13数据通过Del Grosso声速经验公式换算成背景稳态剖面;
将Argo数据通过声速经验公式转换得到SSP数据,将所述SSP数据表示为矩阵C,所述矩阵C为D×S阶矩阵,其中D为深度上的采样点数,S为样本数量,将矩阵C减去背景稳态剖面得到声速异常矩阵E,所述声速异常矩阵E为D×S阶矩阵;
计算所述声速异常矩阵E的协方差矩阵R:
R=E×ET
通过以下矩阵计算公式对所述声速异常矩阵E进行主成分提取,
R×K=K×λ;
其中K是一个特征矩阵,它的每一列代表了声速异常矩阵的一个主成分即正交经验函数EOF,而λ则是一个对角矩阵,角线上每一个数字代表了对应列主成分所能表示的扰动方差,选用5阶的EOF作为重构声速扰动的主成分模态以确定基本扰动模态。
作为本发明的优选实施方式,具体的,所述投影系数集通过以下方式进行计算,
通过下式提取基本扰动模态中的每一阶模态的系数,
Figure BDA0003604284740000061
其中c代表一条样本,c0为背景稳态剖面,Kn表示五阶的EOF模态,an为五阶模态对应系数,再主动对Kn增加一列均为1的常数列,作为常数模态K0,通过回归算法计算到每一个样本的前六阶系数,形成投影系数集A,所述投影系数集为一个6×S阶矩阵,包括投影系数A0-A5,其中A0作为常数系数,A1-A5为选用的主成分总阶数,S为样本数量。
确定基本扰动模态后,再使用下式提取每一阶模态的系数:
Figure BDA0003604284740000062
其中c代表一条样本,c0为背景稳态剖面,Kn表示五阶EOF模态,an为五阶模态对应系数。再人为给Kn加一列全是1的常数列,作为常数模态K0。通过回归算法可以计算到每一个样本的前六阶系数,成为投影系数集A,它是一个6×S阶矩阵,其中A0作为常数系数,A1-A5为选用的主成分总阶数,S为样本数量。将投影系数A0-A5作为模型输出标签。
在本优选实施方式中,由于选择的阶数越多就能表示更多的扰动方差,但是高阶的扰动模态会引入噪声。所以通常做法是选用5阶的EOF作为重构声速扰动的主成分模态。
作为本发明的优选实施方式,具体的,根据所述投影系数集进行剖面重构包括,
将所述投影系数A0-A5代入
Figure BDA0003604284740000071
中,计算得到的剖面即为重构的剖面。
在本优选实施方式中,进行重构的投影系数A0-A5通过预设条件划分好训练集和测试集后,将训练集导入模型,将模型训练好后,导入测试集,得到模型预测的数据集A,将A导入
Figure BDA0003604284740000072
中,计算出剖面c,并求其均方根误差。对RF模型进行训练并进行剪枝调参直至均方根误差最小。利用学习曲线优化方法对RF模型的参数进行逐个优化,再建立网格搜索单个最优参数周围区域,经过多次筛选得到最优参数组合。基于最优参数组合建立RF模型,将测试集输入得到投影系数A0-A5
在本发明中,一些术语的解释如下,
声速剖面:水体声速在深度上的变化。声速是关于温度、盐度、压力(深度)的函数,声速剖面也反映了此处海域的水文特征,是重要的水体物理特征参数。
随机森林(Random forest,RF)模型:随机森林指的是利用多棵树对样本进行训练并预测的一种分类器,是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支——集成学习方法。
参照图2,实施例2,本发明还提出一种基于随机森林算法的声速剖面估计装置,包括以下:
样本数据获取模块100,用于获取样本数据,所述样本数据包括遥感参数、Argo数据以及WOA13数据;
输入数据处理模块200,用于对所述遥感参数进行数据转换得到输入数据,根据预设条件划分为训练集数据和测试集数据;
输出数据处理模块300,用于对所述Argo数据以及WOA13进行数据转换得到输出数据,根据所述预设条件的同等条件划分为训练集数据和测试集数据;
投影数据集计算模块400,用于将所述训练集数据输入RF模型进行模型训练得到训练好的RF模型,将所述测试集数据输入训练好的RF模型得到投影系数集;
剖面重构模块500,用于根据所述投影系数集进行剖面重构。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例中的方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储的介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包括的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
尽管本发明的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本发明的预定范围。此外,上文以发明人可预见的实施例对本发明进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本发明的非实质性改动仍可代表本发明的等效改动。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。

Claims (2)

1.一种基于随机森林算法的声速剖面估计方法,其特征在于,包括以下:
样本数据获取,所述样本数据包括遥感参数、Argo数据以及WOA13数据;
输入数据处理,对所述遥感参数进行数据转换得到输入数据,根据预设条件划分为训练集数据和测试集数据;
输出数据处理,对所述Argo数据以及WOA13进行数据转换得到输出数据,后根据所述预设条件的同等条件划分为训练集数据和测试集数据;
将所述训练集数据输入RF模型进行模型训练得到训练好的RF模型,将所述测试集数据输入训练好的RF模型得到投影系数集;
根据所述投影系数集进行剖面重构;
具体的,所述遥感参数的SSTA获取自美国国家海洋大气管理局数据中心,SSHA获取自AVISO数据集,选用的时间分辨率为1天,空间分辨率为0.25°×0.25°;Argo数据获取自中国Argo资料中心的《全球海洋Argo散点资料集》;WOA13数据为温度盐度多年统计,空间分辨率0.25°的全年平均温盐剖面;
具体的,所述输入数据处理包括,
将所述遥感参数中SSTA以及SSHA所对应的经纬度取余弦值得到LAT以及LON数据,将Argo数据通过声速经验公式转换得到SSP数据的测量时间按正常年转化为1-365的序号、闰年转化为1-366的序号的方式转化得到数据DATE,将SSHA、SSTA、LAT、LON以及DATE作为模型输入标签;
具体的,所述输出数据处理包括,
将WOA13数据通过Del Grosso声速经验公式换算成背景稳态剖面;
将Argo数据通过声速经验公式转换得到SSP数据,将所述SSP数据表示为矩阵C,所述矩阵C为D×S阶矩阵,其中D为深度上的采样点数,S为样本数量,将矩阵C减去背景稳态剖面得到声速异常矩阵E,所述声速异常矩阵E为D×S阶矩阵;
计算所述声速异常矩阵E的协方差矩阵R:
R=E×ET
通过以下矩阵计算公式对所述声速异常矩阵E进行主成分提取,
R×K=K×λ;
其中K是一个特征矩阵,它的每一列代表了声速异常矩阵的一个主成分即正交经验函数EOF,而λ则是一个对角矩阵,角线上每一个数字代表了对应列主成分所能表示的扰动方差,选用5阶的EOF作为重构声速扰动的主成分模态以确定基本扰动模态;
具体的,所述投影系数集通过以下方式进行计算,
通过下式提取基本扰动模态中的每一阶模态的投影系数,
其中c代表一条样本,c0为背景稳态剖面,Kn表示五阶的EOF模态,an为五阶模态对应投影系数,再主动对Kn增加一列均为1的常数列,作为常数模态K0,通过回归算法计算到每一个样本的前六阶系数,形成投影系数集A,所述投影系数集为一个6×S阶矩阵,包括投影系数A0-A5,其中A0作为常数系数,A1-A5为选用的主成分总阶数,S为样本数量,将投影系数A0-A5作为模型输出标签;
具体的,根据所述投影系数集进行剖面重构包括,
将所述投影系数A0-A5代入中,计算得到的剖面即为重构的剖面。
2.一种基于随机森林算法的声速剖面估计装置,其特征在于,包括以下:
样本数据获取模块,用于获取样本数据,所述样本数据包括遥感参数、Argo数据以及WOA13数据;
输入数据处理模块,用于对所述遥感参数进行数据转换得到输入数据,根据预设条件划分为训练集数据和测试集数据;
输出数据处理模块,用于对所述Argo数据以及WOA13进行数据转换得到输出数据,根据所述预设条件的同等条件划分为训练集数据和测试集数据;
投影数据集计算模块,用于将所述训练集数据输入RF模型进行模型训练得到训练好的RF模型,将所述测试集数据输入训练好的RF模型得到投影系数集;
剖面重构模块,用于根据所述投影系数集进行剖面重构;
具体的,所述遥感参数的SSTA获取自美国国家海洋大气管理局数据中心,SSHA获取自AVISO数据集,选用的时间分辨率为1天,空间分辨率为0.25°×0.25°;Argo数据获取自中国Argo资料中心的《全球海洋Argo散点资料集》;WOA13数据为温度盐度多年统计,空间分辨率0.25°的全年平均温盐剖面;
具体的,所述输入数据处理包括,
将所述遥感参数中SSTA以及SSHA所对应的经纬度取余弦值得到LAT以及LON数据,将Argo数据通过声速经验公式转换得到SSP数据的测量时间按正常年转化为1-365的序号、闰年转化为1-366的序号的方式转化得到数据DATE,将SSHA、SSTA、LAT、LON以及DATE作为模型输入标签;
具体的,所述输出数据处理包括,
将WOA13数据通过Del Grosso声速经验公式换算成背景稳态剖面;
将Argo数据通过声速经验公式转换得到SSP数据,将所述SSP数据表示为矩阵C,所述矩阵C为D×S阶矩阵,其中D为深度上的采样点数,S为样本数量,将矩阵C减去背景稳态剖面得到声速异常矩阵E,所述声速异常矩阵E为D×S阶矩阵;
计算所述声速异常矩阵E的协方差矩阵R:
R=E×ET
通过以下矩阵计算公式对所述声速异常矩阵E进行主成分提取,
R×K=K×λ;
其中K是一个特征矩阵,它的每一列代表了声速异常矩阵的一个主成分即正交经验函数EOF,而λ则是一个对角矩阵,角线上每一个数字代表了对应列主成分所能表示的扰动方差,选用5阶的EOF作为重构声速扰动的主成分模态以确定基本扰动模态;
具体的,所述投影系数集通过以下方式进行计算,
通过下式提取基本扰动模态中的每一阶模态的投影系数,
其中c代表一条样本,c0为背景稳态剖面,Kn表示五阶的EOF模态,an为五阶模态对应投影系数,再主动对Kn增加一列均为1的常数列,作为常数模态K0,通过回归算法计算到每一个样本的前六阶系数,形成投影系数集A,所述投影系数集为一个6×S阶矩阵,包括投影系数A0-A5,其中A0作为常数系数,A1-A5为选用的主成分总阶数,S为样本数量,将投影系数A0-A5作为模型输出标签;
具体的,根据所述投影系数集进行剖面重构包括,
将所述投影系数A0-A5代入中,计算得到的剖面即为重构的剖面。
CN202210412550.9A 2022-04-19 2022-04-19 一种基于随机森林算法的声速剖面估计方法及装置 Active CN114781576B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210412550.9A CN114781576B (zh) 2022-04-19 2022-04-19 一种基于随机森林算法的声速剖面估计方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210412550.9A CN114781576B (zh) 2022-04-19 2022-04-19 一种基于随机森林算法的声速剖面估计方法及装置

Publications (2)

Publication Number Publication Date
CN114781576A CN114781576A (zh) 2022-07-22
CN114781576B true CN114781576B (zh) 2023-04-07

Family

ID=82431846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210412550.9A Active CN114781576B (zh) 2022-04-19 2022-04-19 一种基于随机森林算法的声速剖面估计方法及装置

Country Status (1)

Country Link
CN (1) CN114781576B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114943189B (zh) * 2022-07-26 2023-04-07 广东海洋大学 一种基于XGboost的声速剖面反演方法及系统
CN116341391B (zh) * 2023-05-24 2023-08-04 华东交通大学 基于STPM-XGBoost模型的降水预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019241062A1 (en) * 2018-06-10 2019-12-19 Schlumberger Technology Corporation Seismic data interpretation system
WO2020117321A1 (en) * 2018-12-05 2020-06-11 Halliburton Energy Services, Inc. Detecting and quantifying liquid pools in hydrocarbon fluid pipelines
CN112883564A (zh) * 2021-02-01 2021-06-01 中国海洋大学 一种基于随机森林的水体温度预测方法及预测系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858523B (zh) * 2019-01-03 2022-06-14 武汉大学 一种神经网络和射线理论的浅海声速剖面反演方法
CN110837791B (zh) * 2019-11-02 2023-04-07 山东科技大学 一种基于过完备字典的声速剖面反演方法
CN111709386B (zh) * 2020-06-22 2023-05-12 中国科学院空天信息创新研究院 一种水下浅地层剖面图像底质分类方法及系统
CN112101381B (zh) * 2020-08-30 2022-10-28 西南电子技术研究所(中国电子科技集团公司第十研究所) 张量协作图判别分析遥感图像特征提取方法
CN112598113A (zh) * 2020-12-15 2021-04-02 广东海洋大学 一种基于自组织竞争型神经网络的海洋声速剖面获取方法
CN113486574B (zh) * 2021-06-21 2022-07-01 广东海洋大学 基于历史数据以及机器学习的声速剖面补全方法及装置
CN114238847B (zh) * 2021-10-29 2023-02-10 中国人民解放军61540部队 一种基于海洋实测数据的表层准地转重构方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019241062A1 (en) * 2018-06-10 2019-12-19 Schlumberger Technology Corporation Seismic data interpretation system
WO2020117321A1 (en) * 2018-12-05 2020-06-11 Halliburton Energy Services, Inc. Detecting and quantifying liquid pools in hydrocarbon fluid pipelines
CN112883564A (zh) * 2021-02-01 2021-06-01 中国海洋大学 一种基于随机森林的水体温度预测方法及预测系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Carl R. Hart 等.Comparisons between physics-based, engineering, and statistical learning models for outdoor sound propagation.《The Journal of the Acoustical Society of America》.2016,第139卷(第5期),2640–2655. *
Zhenyi Ou 等.Estimation of Sound Speed Profiles Using a Random Forest Model with Satellite Surface Observations.《Hindawi Shock and Vibration》.2022,1-8. *

Also Published As

Publication number Publication date
CN114781576A (zh) 2022-07-22

Similar Documents

Publication Publication Date Title
Garcia et al. World Ocean Atlas 2018, Volume 3: Dissolved Oxygen, Apparent Oxygen Utilization, and Dissolved Oxygen Saturation.
CN114781576B (zh) 一种基于随机森林算法的声速剖面估计方法及装置
Chatterjee et al. A new atlas of temperature and salinity for the North Indian Ocean
CN107238826B (zh) 利用双偏振多普勒天气雷达回波反演雷暴电荷分布的方法
CN110427654B (zh) 一种基于敏感状态的滑坡预测模型构建方法及系统
Holmlund et al. A re-analysis of the 58 year mass-balance record of Storglaciären, Sweden
CN113486574B (zh) 基于历史数据以及机器学习的声速剖面补全方法及装置
CN106483147B (zh) 基于多源数据的长时间序列被动微波土壤水分精度改进研究方法
CN113063737B (zh) 结合遥感与浮标数据的海洋热含量遥感反演方法
CN109543356A (zh) 考虑空间非平稳性的海洋内部温盐结构遥感反演方法
CN114782745B (zh) 一种基于机器学习的海洋声速剖面分类方法及装置
CN112035448A (zh) 一种综合地基gnss水汽和气象要素的神经网络短临降水预报方法
Feng et al. Wave spectra assimilation in typhoon wave modeling for the East China Sea
Badgeley et al. Greenland temperature and precipitation over the last 20,000 years using data assimilation
CN113901384A (zh) 顾及全局空间自相关性和局部异质性的地面pm2.5浓度建模方法
CN113935249B (zh) 基于压缩和激励网络的上层海洋热结构反演方法
CN113218493A (zh) 一种基于经验正交函数法的声速剖面反演方法
CN114372707A (zh) 一种基于遥感数据的高寒湿地退化程度监测方法
CN115082809A (zh) 一种基于遥感影像大数据的潮滩演变监测新方法
CN114241331B (zh) 以UAV为地面和Sentinel-2中介的湿地芦苇地上生物量遥感建模方法
CN114120137B (zh) 一种基于时序植被遥感影像的湿地要素时空演变监测方法
Benassai et al. Sea wave numerical simulations with COSMO-SkyMed© SAR data
CN111597692B (zh) 一种地表净辐射估算方法、系统、电子设备和存储介质
CN111879915A (zh) 一种滨海湿地高分辨率的逐月土壤盐度监测方法及系统
Ou et al. Estimation of sound speed profiles using a random forest model with satellite surface observations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant