CN114943189A - 一种基于XGboost的声速剖面反演方法及系统 - Google Patents

一种基于XGboost的声速剖面反演方法及系统 Download PDF

Info

Publication number
CN114943189A
CN114943189A CN202210880856.7A CN202210880856A CN114943189A CN 114943189 A CN114943189 A CN 114943189A CN 202210880856 A CN202210880856 A CN 202210880856A CN 114943189 A CN114943189 A CN 114943189A
Authority
CN
China
Prior art keywords
data
basis function
sound velocity
xgboost
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210880856.7A
Other languages
English (en)
Other versions
CN114943189B (zh
Inventor
欧圳翼
屈科
刘琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Ocean University
Original Assignee
Guangdong Ocean University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Ocean University filed Critical Guangdong Ocean University
Priority to CN202210880856.7A priority Critical patent/CN114943189B/zh
Publication of CN114943189A publication Critical patent/CN114943189A/zh
Application granted granted Critical
Publication of CN114943189B publication Critical patent/CN114943189B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H5/00Measuring propagation velocity of ultrasonic, sonic or infrasonic waves, e.g. of pressure waves
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/08Fluids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提供了一种基于XGboost的声速剖面反演方法及系统,属于声速剖面反演技术领域,该方法包括:分别获取遥感数据、Argo数据以及WOA13数据;根据遥感数据得到输入数据,以及根据Argo数据和WOA13数据,计算得到声速基函数系数a0‑an,并将声速基函数系数a0‑an作为标签数据;对标签数据和输入数据进行切分,并根据切分结果,利用N阶声速基函数对XGboost模型进行训练;根据训练好的XGboost模型,反演声速剖面。本发明解决了大范围声速剖面的快速获取问题,并有效的提高了获取的精度。

Description

一种基于XGboost的声速剖面反演方法及系统
技术领域
本发明属于声速剖面反演技术领域,尤其涉及一种基于XGboost的声速剖面反演方法及系统。
背景技术
在海洋里声波与电磁波或光波相比,衰减更小,传播更远,因此声速是研究海洋的重要参数,声速剖面是指声速在深度上的分布。
21世纪以后,卫星获取大范围海洋参数的能力越来越强,数据总量不断积累;同时,随着算力的提升和机器学习、神经网络等人工智能方法的提出,使声速剖面的反演方法更加多样,反演的精度也有了大幅度地提升。几种具有代表性的方法包括:
方法一:基于单经验正交回归的声速剖面反演法:基于大量历史数据,将海面高度、海面温度与声速基函数联系起来,通过单经验正交函数回归模型(Single empiricalorthogonal function regression,sEOF-r)进行声速剖面反演。
方法二:基于神经网络的声速剖面反演方法研究:将声速剖面样本分为不同水层,将不同水层内的梯度作为特征量输入数组,结合海面温度(SST)和海面高度(SSH),通过自组织图(SOM)推导出声速剖面。
方法三:基于随即森林的声速剖面反演方法研究:将海面高度、海面温度、测量时间、纬度和经度数据用于训练模型,得到基函数系数,再基于基函数系数,反演声速剖面。
当前的技术基本都是线性的sEOF-r方法,普遍的缺点在于:
(1)反演前需要确保反演区域内的基函数一致,一般方法是对反演区域切分,而不同的试验人员对于切分标准往往难以达到统一,可能导致不能复现结果。
(2)参数较少且仅采用简单的线性关系,难以精确描述海洋的复杂环境,反演精度大部分情况都比非线性模型低。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于XGboost的声速剖面反演方法及系统,解决了大范围声速剖面的快速获取问题。
为了达到以上目的,本发明采用的技术方案为:
本方案提供一种基于XGboost的声速剖面反演方法,包括以下步骤:
S1、分别获取遥感数据、Argo数据以及WOA13数据;
S2、根据遥感数据得到输入数据,以及根据Argo数据和WOA13数据,计算得到声速基函数系数a0-an,并将声速基函数系数a0-an作为标签数据;
S3、对标签数据和输入数据进行切分,并根据切分结果,利用N阶声速基函数对XGboost模型进行训练;
S4、根据训练好的XGboost模型,反演声速剖面。
本发明的有益效果是:本发明利用声速基函数对XGboost模型进行训练,并对声速剖面进行反演,本发明反演前不需要切分反演网格以保证基函数一致,直接训练XGboost模型,有效避免结果因为切分网格而造成偏差,确保结果可以被复现,同时,本发明基于XGboost模型的非线性反演,符合海洋参数之间的复杂关系,避免了线性拟合的局限和不设解析式对结果的限制,使XGboost模型可以准确地计算参数之间的关系,并且有效的提高反演精度,还可引入更多相关的参数去反演声速剖面,挖掘未知参数与声速的关系。比如位置,时间,热流,风速等。
进一步地,所述步骤S2包括以下步骤:
S201、将遥感数据的经纬度取余弦值得到LAT数据和LON数据,将遥感数据的测量日期转化为序号为1-366的DATE数据,其中,所述遥感数据包括SSTA数据和SSHA数据;
S202、将LAT数据、LON数据、SSTA数据、SSHA数据以及DATE数据作为输入数据;
S203、根据Argo数据以及WOA13数据,利用声速经验公式计算得到背景轮廓剖面和声速剖面;
S204、设声速剖面的样本数量为P,并对声速剖面进行插值处理,得到剖面的离散深度点数Q;
S205、将声速剖面表示为矩阵C,并根据矩阵C和背景轮廓剖面得到声速异常矩阵E,其中,矩阵C为Q×P阶矩阵;
S206、计算声速异常矩阵E的协方差矩阵
Figure 79819DEST_PATH_IMAGE001
,并对协方差矩阵
Figure 155223DEST_PATH_IMAGE001
进行声速基函数的提取,得到声速基函数阶数N;
S207、在第一阶声速基函数前增加一阶全为1的数列K0作为第零阶,并对声速基函数的每一阶模态的基函数系数进行回归分析,得到声速基函数系数a0-an
S208、将声速基函数系数a0-an作为标签数据。
上述进一步方案的有益效果是:本发明通过引入更多的相关参数,可以使XGboost模型更好的学习各参数间的非线性关系,同时,增加第零阶可以有效模拟海洋噪声,提高反演精度。
再进一步地,所述声速基函数的提取的表达式如下:
Figure 883007DEST_PATH_IMAGE002
其中,
Figure 371757DEST_PATH_IMAGE003
表示协方差矩阵,K表示声速基函数矩阵,
Figure 577611DEST_PATH_IMAGE004
表示协方差矩阵
Figure 271635DEST_PATH_IMAGE005
的特征值。
再进一步地,所述进行回归分析的表达式如下:
Figure 435900DEST_PATH_IMAGE006
其中,cs表示样本声速剖面,c0表示背景轮廓剖面,N表示N阶声速基函数,
Figure 880788DEST_PATH_IMAGE007
表示每一阶模态的基函数系数,Kn表示声速基函数,n表示第n阶声速基函数。
上述进一步方案的有益效果是:本发明通过提取到精准的EOF基函数以及每一阶基函数的主成分所占比例,基于此可以更好的确定实验应该选用几阶基函数,同时,通过回归方式,可以计算出声速剖面各阶的基函数系数。
再进一步地,所述步骤S3包括以下步骤:
S301、对标签数据和输入数据进行切分,得到训练输入数据、训练标签数据、测试输入数据和测试标签数据;
S302、根据声速基函数阶数N,利用训练输入数据和训练标签数据训练XGboost模型,并将测试输入数据输入至XGboost模型,得到XGboost模型输出数据A0,并重复N+1次,得到声速基函数系数A0-An,其中,N表示N阶声速基函数,A0表示输入数据为a0时XGboost模型的输出数据,An表示输入数据为an时XGboost模型的输出数据;
S303、将声速基函数系数A0-An与测试标签数据进行对比,并对XGboost模型进行评估,完成对XGboost模型的训练。
再进一步地,所述XGboost模型的损失函数的表达式如下:
Figure 93595DEST_PATH_IMAGE008
其中,
Figure 471486DEST_PATH_IMAGE009
表示XGboost模型的损失函数,T表示树模型的叶节点总数,Gj表示泰勒展开的第一次项,Hj表示泰勒展开的第二次项,a、
Figure 275494DEST_PATH_IMAGE010
Figure 175055DEST_PATH_IMAGE011
均表示超参数,j表示树模型上每个叶子节点的索引。
上述进一步方案的有益效果是:本发明使用XGBoost模型这种非线性模型进行反演计算,符合海洋参数之间的复杂关系,避免了线性拟合的局限和设解析式对结果的限制,利用XGBoost模型的优势,有效的提高反演精度。
再进一步地,所述步骤S4中反演声速剖面的表达式如下:
Figure 722711DEST_PATH_IMAGE012
其中,cr表示反演的声速剖面,c0表示背景轮廓剖面,An表示输入数据为an时XGboost模型的输出数据,Kn表示声速基函数,N表示N阶声速基函数,n表示第n阶声速基函数。
上述进一步方案的有益效果是:本发明通过XGboost模型计算得到的基函数系数An,带入表达式,求得XGboost模型反演所得声速剖面。
本发明还提供了一种基于XGboost的声速剖面反演系统,包括:
数据获取模块,用于分别获取遥感数据、Argo数据以及WOA13数据;
数据处理模块,用于根据遥感数据得到输入数据,以及根据Argo数据和WOA13数据,计算得到声速基函数系数a0-an,并将声速基函数系数a0-an作为标签数据;
模型训练模块,用于对标签数据和输入数据进行切分,并根据切分结果,利用N阶声速基函数对XGboost模型进行训练;
反演模块,用于根据训练好的XGboost模型,反演声速剖面。
本发明的有益效果是:本发明利用声速基函数对XGboost模型进行训练,并对声速剖面进行反演,本发明反演前不需要切分反演网格以保证基函数一致,直接训练XGboost模型,有效避免结果因为切分网格而造成偏差,确保结果可以被复现,同时,本发明基于XGboost模型的非线性反演,符合海洋参数之间的复杂关系,避免了线性拟合的局限和不设解析式对结果的限制,使XGboost模型可以准确地计算参数之间的关系,并且有效的提高反演精度,还可引入更多相关的参数去反演声速剖面,挖掘未知参数与声速的关系。比如位置,时间,热流,风速等。
附图说明
图1为本发明的方法流程图。
图2为本发明的系统结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
对本发明进行说明前,先对以下参数进行说明:
声速剖面:声速值关于深度的函数。
XGboost模型:为一个可扩展的端到端树增强模型,是通过集成学习的思想将多种分类器集成的一种算法。
SSHA:海面高度异常。
SSTA:海面温度异常。
Argo:阿尔戈浮标。
WOA13:世界海洋图集2013。
实施例1
基于大量数据的发现海洋内部活动通常都有海表特征,如温盐剖面,对声速剖面具有很大的应用价值,因为传统的获取方法,费时费力,但是基于遥感数据反演声速剖面可以快速获取大面积声速剖面。本发明提供一种基于遥感数据非线性反演海洋声速剖面的XGboost模型,并通过该XGboost模型可基于遥感数据有效地重构指定区域的声速剖面。如图1所示,本发明提供了一种基于XGboost的声速剖面反演方法,其实现方法如下:
S1、分别获取遥感数据、Argo数据以及WOA13数据;
本实施例中,本发明使用了遥感数据、Argo数据和WOA13数据。
本实施例中,遥感数据的SSTA和SSHA选用的时间分辨率为1天,空间分辨率为0.25°×0.25°的数据;Argo数据选用《全球海洋Argo散点资料集》;WOA13数据选用空间分辨率0.25°的全年平均温盐剖面。
S2、根据遥感数据得到输入数据,以及根据Argo数据和WOA13数据,计算得到声速基函数系数a0-an,并将声速基函数系数a0-an作为标签数据,其实现方法如下:
S201、将遥感数据的经纬度取余弦值得到LAT数据和LON数据,将遥感数据的测量日期转化为序号为1-366的DATE数据,其中,所述遥感数据包括SSTA数据和SSHA数据;
S202、将LAT数据、LON数据、SSTA数据、SSHA数据以及DATE数据作为输入数据;
S203、根据Argo数据以及WOA13数据,利用声速经验公式计算得到背景轮廓剖面和声速剖面;
S204、设声速剖面的样本数量为P,并对声速剖面进行插值处理,得到剖面的离散深度点数Q;
S205、将声速剖面表示为矩阵C,并根据矩阵C和背景轮廓剖面得到声速异常矩阵E,其中,矩阵C为Q×P阶矩阵;
S206、计算声速异常矩阵E的协方差矩阵
Figure 955109DEST_PATH_IMAGE013
,并对协方差矩阵
Figure 133281DEST_PATH_IMAGE014
进行声速基函数的提取,得到声速基函数阶数N;
S207、在第一阶声速基函数前增加一阶全为1的数列K0作为第零阶,并对声速基函数的每一阶模态的基函数系数进行回归分析,得到声速基函数系数a0-an
S208、将声速基函数系数a0-an作为标签数据。
本实施例中,关于输入数据的处理如下:
遥感数据包括SSTA和SSHA数据,将遥感数据的经纬度取余弦值得到的LAT数据以及LON数据,将遥感数据测量日期转化为1-366的序号得到的DATE数据。其中,SSHA数据、SSTA数据、LAT数据、LON数据以及DATE数据作为XGboost模型的输入数据。
本实施例中,关于标签数据的处理如下:
本实施例中,将WOA13数据和Argo数据通过声速经验公式计算得到背景轮廓剖面和声速剖面数声速剖面的样本数量为P,再对声速剖面进行插值处理,得到剖面的离散深度点数Q。
本实施例中,声速经验公式如下:
DCT(i)=5.01109398873*T(i)-5.50946843172*10^(-2)*T(i)^2+2.21535969240*10^(-4)*T(i)^3;
DCS(i)=1.32952290781*S(i)+1.28955756844*10^(-4)*S(i)^2;
DCP(i)=1.56059257041*10^(-1)*P(i)+2.44998688441*10^(-5)*P(i)^2-8.83392332513*10^(-9) *P(i)^3;
DCTSP(i)=-1.27562783426*10^(-2)*T(i)*S(i)+6.35191613389*10^(-3)*T(i)*P(i)+2.65484716608*10^(-8)*T(i)*T(i)*P(i)*P(i)-1.59349479045*10^(-6)*T(i)*P(i)*P(i)+5.22116437235*10^(-10)*T(i)*P(i)^3-4.38031096213*10^(-7)*P(i)*T(i)^3-1.61674495909*10^(-9)*S(i)*S(i)*P(i)*P(i)+9.68403156410*10^(-5)*S(i)*T(i)^2+4.85639620015*10^(-6)*T(i)*P(i)*S(i)^2-3.40597039004*10^(-4)*T(i)*S(i)*P(i);
c(i)=1402.392+DCT(i)+DCS(i)+DCP(i)+DCTSP(i)。
其中,i表示深度,c表示声速剖面,T(i)表示在第i个深度的温度,S(i)表示在第i个深度的盐度,P(i)表示在第i个深度的水柱静压力,DCT(i)、DCS、DCP(i)和DCTSP(i)均表示中间变量,*表示乘法运算,^表示乘方运算。
本实施例中,将声速剖面数据表示为矩阵C,C为Q×P阶矩阵,将矩阵C减去背景轮廓剖面得到声速异常矩阵E,求出声速异常矩阵E的协方差矩阵
Figure 818340DEST_PATH_IMAGE015
,并通过以下公式对所述协方差矩阵
Figure 169687DEST_PATH_IMAGE016
进行声速基函数提取:
Figure 760986DEST_PATH_IMAGE017
其中,
Figure 172376DEST_PATH_IMAGE018
表示协方差矩阵,K表示声速基函数矩阵,声速基函数矩阵的每一列代表了声速异常矩阵的一个主成分,即声速基函数EOF,
Figure 79152DEST_PATH_IMAGE019
表示协方差矩阵
Figure 171873DEST_PATH_IMAGE020
的特征值。
本实施例中,在第一阶声速基函数前增加一阶全为1的数列K0做为第零阶,以此来模拟噪声,并通过下式回归分析声速基函数的每一阶模态的基函数系数an
Figure 113284DEST_PATH_IMAGE021
其中,cs表示样本声速剖面,c0表示背景轮廓剖面,N表示N阶声速基函数,
Figure 695575DEST_PATH_IMAGE022
表示每一阶模态的基函数系数,Kn表示声速基函数,n表示第n阶声速基函数。
得到声速基函数系数a0-an
Figure 89647DEST_PATH_IMAGE023
Figure 484594DEST_PATH_IMAGE024
,将声速基函数系数a0-an作为XGboost模型的标签数据。
S3、对标签数据和输入数据进行切分,并根据切分结果,利用N阶声速基函数对XGboost模型进行训练,其实现方法如下:
S301、对标签数据和输入数据进行切分,得到训练输入数据、训练标签数据、测试输入数据和测试标签数据;
S302、根据声速基函数阶数N,利用训练输入数据和训练标签数据训练XGboost模型,并将测试输入数据输入至XGboost模型,得到XGboost模型输出数据A0,并重复N+1次,得到声速基函数系数A0-An,其中,N表示N阶声速基函数,A0表示输入数据为a0时XGboost模型的输出数据,An表示输入数据为an时XGboost模型的输出数据;
S303、将声速基函数系数A0-An与测试标签数据进行对比,并对XGboost模型进行评估,完成对XGboost模型的训练。
本实施例中,根据预设条件将输入数据和标签数据切分为训练输入数据、训练标签数据、测试输入数据和测试标签数据,其中,测试标签数据用于与模型测试输出数据对比,使用均方根误差评估模型的精度。
本实施例中,根据前N阶主成分所占比例确定实验使用声速基函数的阶数,因为引入较多阶数同时会引入较大的噪声,确定实验使用声速基函数的阶数后,用训练输入数据和训练标签数据a0
Figure 280512DEST_PATH_IMAGE025
训练XGboost模型,再用测试输入数据输入XGboost模型,得到XGboost模型输出数据A0,该过程重复N+1次,得到基函数系数A0-AN,再与测试标签数据对比,计算两者均方根误差来评估XGBoost模型精度。
本实施例中,XGBoost 的损失函数为:
Figure 33704DEST_PATH_IMAGE026
其中,
Figure 180652DEST_PATH_IMAGE027
表示XGboost模型的损失函数,T表示树模型的叶节点总数,Gj表示泰勒展开的第一次项,Hj表示泰勒展开的第二次项,a、
Figure 411913DEST_PATH_IMAGE028
Figure 265600DEST_PATH_IMAGE029
均表示超参数,j表示树模型上每个叶子节点的索引,而T只由树结构决定,因此目标函数
Figure 688228DEST_PATH_IMAGE030
Obj是关于T的函数,XGboost模型的效果与叶子节点的总数,既树的结构有直接联系,目标函数越小,树的结构越好,这便是XGBoost模型的优势。
S4、根据训练好的XGboost模型,反演声速剖面。
本实施例中,反演声速剖面的表达式如下:
Figure 56893DEST_PATH_IMAGE031
其中,cr表示反演的声速剖面,c0表示背景轮廓剖面,An表示输入数据为an时XGboost模型的输出数据,Kn表示声速基函数,N表示N阶声速基函数,n表示第n阶声速基函数。
本实施例中,本发明通过以上设计,反演前不需要切分反演网格以保证基函数一致,直接训练XGboost模型,有效避免结果因为切分网格而造成偏差,确保结果可以被复现,同时,本发明基于XGboost模型的非线性反演,符合海洋参数之间的复杂关系,避免了线性拟合的局限和不设解析式对结果的限制,使XGboost模型可以准确地计算参数之间的关系,并且有效的提高反演精度,还可引入更多相关的参数去反演声速剖面,挖掘未知参数与声速的关系。比如位置,时间,热流,风速等。
实施例2
如图2所示,本发明提供了一种基于XGboost的声速剖面反演系统,包括:
数据获取模块,用于分别获取遥感数据、Argo数据以及WOA13数据;
数据处理模块,用于根据遥感数据得到输入数据,以及根据Argo数据和WOA13数据,计算得到声速基函数系数a0-an,并将声速基函数系数a0-an作为标签数据;
模型训练模块,用于对标签数据和输入数据进行切分,并根据切分结果,利用N阶声速基函数对XGboost模型进行训练;
反演模块,用于根据训练好的XGboost模型,反演声速剖面。
如图2所示实施例提供的基于XGboost的声速剖面反演系统可以执行上述方法实施例基于XGboost的声速剖面反演方法所示的技术方案,其实现原理与有益效果类似,此处不再赘述。
本发明实施例中,本申请可以根据基于XGboost的声速剖面反演方法进行功能单元的划分,例如可以将各个功能划分为各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成单元即可以采用硬件的形式来实现,也可以采用软件功能单元的形式来实现。需要说明的是,本发明中对单元的划分是示意性的,仅仅为一种逻辑划分,实际实现时可以有另外的划分方式。
本发明实施例中,基于XGboost的声速剖面反演系统为了实现基于XGboost的声速剖面反演方法的原理与有益效果,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本发明所公开的实施例描述的各示意单元及算法步骤,本发明能够以硬件和/或硬件和计算机软件结合的形式来实现,某个功能以硬件还是计算机软件驱动的方式来执行,取决于技术方案的特定应用和设计约束条件,可以对每个特定的应用来使用不同的方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本领域的技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (8)

1.一种基于XGboost的声速剖面反演方法,其特征在于,包括以下步骤:
S1、分别获取遥感数据、Argo数据以及WOA13数据;
S2、根据遥感数据得到输入数据,以及根据Argo数据和WOA13数据,计算得到声速基函数系数a0-an,并将声速基函数系数a0-an作为标签数据;
S3、对标签数据和输入数据进行切分,并根据切分结果,利用N阶声速基函数对XGboost模型进行训练;
S4、根据训练好的XGboost模型,反演声速剖面。
2.根据权利要求1所述的基于XGboost的声速剖面反演方法,其特征在于,所述步骤S2包括以下步骤:
S201、将遥感数据的经纬度取余弦值得到LAT数据和LON数据,将遥感数据的测量日期转化为序号为1-366的DATE数据,其中,所述遥感数据包括SSTA数据和SSHA数据;
S202、将LAT数据、LON数据、SSTA数据、SSHA数据以及DATE数据作为输入数据;
S203、根据Argo数据以及WOA13数据,利用声速经验公式计算得到背景轮廓剖面和声速剖面;
S204、设声速剖面的样本数量为P,并对声速剖面进行插值处理,得到剖面的离散深度点数Q;
S205、将声速剖面表示为矩阵C,并根据矩阵C和背景轮廓剖面得到声速异常矩阵E,其中,矩阵C为Q×P阶矩阵;
S206、计算声速异常矩阵E的协方差矩阵
Figure 532656DEST_PATH_IMAGE001
,并对协方差矩阵
Figure 37587DEST_PATH_IMAGE002
进行声速基函数的提取,得到声速基函数阶数N;
S207、在第一阶声速基函数前增加一阶全为1的数列K0作为第零阶,并对声速基函数的每一阶模态的基函数系数进行回归分析,得到声速基函数系数a0-an
S208、将声速基函数系数a0-an作为标签数据。
3.根据权利要求2所述的基于XGboost的声速剖面反演方法,其特征在于,所述声速基函数的提取的表达式如下:
Figure 132582DEST_PATH_IMAGE003
其中,
Figure 988542DEST_PATH_IMAGE004
表示协方差矩阵,K表示声速基函数矩阵,
Figure 54282DEST_PATH_IMAGE005
表示协方差矩阵
Figure 882561DEST_PATH_IMAGE004
的特征值。
4.根据权利要求3所述的基于XGboost的声速剖面反演方法,其特征在于,所述进行回归分析的表达式如下:
Figure 148457DEST_PATH_IMAGE006
其中,cs表示样本声速剖面,c0表示背景轮廓剖面,N表示N阶声速基函数,
Figure 226134DEST_PATH_IMAGE007
表示每一阶模态的基函数系数,Kn表示声速基函数,n表示第n阶声速基函数。
5.根据权利要求4所述的基于XGboost的声速剖面反演方法,其特征在于,所述步骤S3包括以下步骤:
S301、对标签数据和输入数据进行切分,得到训练输入数据、训练标签数据、测试输入数据和测试标签数据;
S302、根据声速基函数阶数N,利用训练输入数据和训练标签数据训练XGboost模型,并将测试输入数据输入至XGboost模型,得到XGboost模型输出数据A0,并重复N+1次,得到声速基函数系数A0-An,其中,N表示N阶声速基函数,A0表示输入数据为a0时XGboost模型的输出数据,An表示输入数据为an时XGboost模型的输出数据;
S303、将声速基函数系数A0-An与测试标签数据进行对比,并对XGboost模型进行评估,完成对XGboost模型的训练。
6.根据权利要求5所述的基于XGboost的声速剖面反演方法,其特征在于,所述XGboost模型的损失函数的表达式如下:
Figure 665206DEST_PATH_IMAGE008
其中,
Figure 347991DEST_PATH_IMAGE009
表示XGboost模型的损失函数,T表示树模型的叶节点总数,Gj表示泰勒展开的第一次项,Hj表示泰勒展开的第二次项,a、
Figure 784789DEST_PATH_IMAGE010
Figure 848297DEST_PATH_IMAGE011
均表示超参数,j表示树模型上每个叶子节点的索引。
7.根据权利要求6所述的基于XGboost的声速剖面反演方法,其特征在于,所述步骤S4中反演声速剖面的表达式如下:
Figure 763164DEST_PATH_IMAGE012
其中,cr表示反演的声速剖面,c0表示背景轮廓剖面,An表示输入数据为an时XGboost模型的输出数据,Kn表示声速基函数,N表示N阶声速基函数,n表示第n阶声速基函数。
8.一种基于XGboost的声速剖面反演系统,其特征在于,包括:
数据获取模块,用于分别获取遥感数据、Argo数据以及WOA13数据;
数据处理模块,用于根据遥感数据得到输入数据,以及根据Argo数据和WOA13数据,计算得到声速基函数系数a0-an,并将声速基函数系数a0-an作为标签数据;
模型训练模块,用于对标签数据和输入数据进行切分,并根据切分结果,利用N阶声速基函数对XGboost模型进行训练;
反演模块,用于根据训练好的XGboost模型,反演声速剖面。
CN202210880856.7A 2022-07-26 2022-07-26 一种基于XGboost的声速剖面反演方法及系统 Active CN114943189B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210880856.7A CN114943189B (zh) 2022-07-26 2022-07-26 一种基于XGboost的声速剖面反演方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210880856.7A CN114943189B (zh) 2022-07-26 2022-07-26 一种基于XGboost的声速剖面反演方法及系统

Publications (2)

Publication Number Publication Date
CN114943189A true CN114943189A (zh) 2022-08-26
CN114943189B CN114943189B (zh) 2023-04-07

Family

ID=82911392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210880856.7A Active CN114943189B (zh) 2022-07-26 2022-07-26 一种基于XGboost的声速剖面反演方法及系统

Country Status (1)

Country Link
CN (1) CN114943189B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116202611A (zh) * 2023-05-06 2023-06-02 中国海洋大学 一种基于元学习的小样本声速剖面反演方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598251A (zh) * 2019-08-05 2019-12-20 中国科学院南京地理与湖泊研究所 基于Landsat-8数据和机器学习的湖泊叶绿素a浓度反演方法
CN111307266A (zh) * 2020-02-21 2020-06-19 山东大学 声速获取方法及基于该方法的全球海洋声速场构建方法
CN112348280A (zh) * 2020-11-23 2021-02-09 山东科技大学 一种利用改进型Argo浮标数据进行EOF分析的方法
CN112464996A (zh) * 2020-11-09 2021-03-09 中国科学院沈阳自动化研究所 基于LSTM-XGBoost的智能电网入侵检测方法
CN112598113A (zh) * 2020-12-15 2021-04-02 广东海洋大学 一种基于自组织竞争型神经网络的海洋声速剖面获取方法
CN113269254A (zh) * 2021-05-26 2021-08-17 安徽理工大学 一种粒子群优化XGBoost算法的煤矸识别方法
CN114782745A (zh) * 2022-04-19 2022-07-22 广东海洋大学 一种基于机器学习的海洋声速剖面分类方法及装置
CN114781576A (zh) * 2022-04-19 2022-07-22 广东海洋大学 一种基于随机森林算法的声速剖面估计方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598251A (zh) * 2019-08-05 2019-12-20 中国科学院南京地理与湖泊研究所 基于Landsat-8数据和机器学习的湖泊叶绿素a浓度反演方法
CN111307266A (zh) * 2020-02-21 2020-06-19 山东大学 声速获取方法及基于该方法的全球海洋声速场构建方法
CN112464996A (zh) * 2020-11-09 2021-03-09 中国科学院沈阳自动化研究所 基于LSTM-XGBoost的智能电网入侵检测方法
CN112348280A (zh) * 2020-11-23 2021-02-09 山东科技大学 一种利用改进型Argo浮标数据进行EOF分析的方法
CN112598113A (zh) * 2020-12-15 2021-04-02 广东海洋大学 一种基于自组织竞争型神经网络的海洋声速剖面获取方法
CN113269254A (zh) * 2021-05-26 2021-08-17 安徽理工大学 一种粒子群优化XGBoost算法的煤矸识别方法
CN114782745A (zh) * 2022-04-19 2022-07-22 广东海洋大学 一种基于机器学习的海洋声速剖面分类方法及装置
CN114781576A (zh) * 2022-04-19 2022-07-22 广东海洋大学 一种基于随机森林算法的声速剖面估计方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HAIPENG LI 等: ""Reconstructing Sound Speed Profile From Remote Sensing Data: Nonlinear Inversion Based on Self-Organizing Map"", 《IEEE ACCESS》 *
HUA SU 等: ""Estimating Subsurface Thermohaline Structure of the Global Ocean Using Surface Remote Sensing Observations"", 《REMOTE SENSING 》 *
叶思雨;屈科;马皓天;: "南海北部内波活动下的声速剖面重构方法研究" *
钟玮琪 等: ""基于经验正交函数的剖面重构及其物理意义分析"", 《海洋技术学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116202611A (zh) * 2023-05-06 2023-06-02 中国海洋大学 一种基于元学习的小样本声速剖面反演方法
CN116202611B (zh) * 2023-05-06 2023-07-14 中国海洋大学 一种基于元学习的小样本声速剖面反演方法

Also Published As

Publication number Publication date
CN114943189B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN107909206B (zh) 一种基于深层结构循环神经网络的pm2.5预测方法
CN111967688B (zh) 一种基于卡尔曼滤波器与卷积神经网络的电力负荷预测方法
Zhuo et al. Physics-augmented deep learning to improve tropical cyclone intensity and size estimation from satellite imagery
CN112288193A (zh) 基于注意力机制的gru深度学习的海洋站表层盐度预测方法
CN113935249B (zh) 基于压缩和激励网络的上层海洋热结构反演方法
CN114049545B (zh) 一种基于点云体素的台风定强方法、系统、设备及介质
US20230393304A1 (en) El nino extreme weather early warning method and device based on incremental learning
CN116306318B (zh) 基于深度学习的三维海洋温盐场预报方法、系统及设备
CN114943189B (zh) 一种基于XGboost的声速剖面反演方法及系统
CN115935834A (zh) 一种基于深度自回归网络和持续学习策略的历史拟合方法
Koc et al. Investigation of urban climates and built environment relations by using machine learning
CN115310536A (zh) 基于神经网络和gcn深度学习模型的水库水位预测预警方法
Grönquist et al. Predicting weather uncertainty with deep convnets
CN115859116A (zh) 一种基于径向基函数回归插值法的海洋环境场重建方法
CN110046756B (zh) 基于小波去噪与Catboost的短时天气预报方法
Wang et al. Uncertainty analysis of hydrological processes based on ARMA-GARCH model
CN113609766B (zh) 一种基于深度概率潜隐模型的软测量方法
Shao et al. Ocean reanalysis data‐driven deep learning forecast for sea surface multivariate in the South China Sea
CN106528679A (zh) 基于多线性自回归模型的时间序列分析方法
Leontyev et al. Application of assimilation and filtration methods for satellite water sensing data for plankton population evolution processes predictive modeling
CN113361782A (zh) 基于改进mkpls的光伏发电功率短期滚动预测方法
Yang et al. Predictor selection for CNN-based statistical downscaling of monthly precipitation
Zhang et al. Multifractal analysis of measure representation of flood/drought grade series in the Yangtze Delta, China, during the past millennium and their fractal model simulation
CN116307068A (zh) 基于四维有向gcn-lstm模型的多城市多种大气污染物预测方法
Tran et al. Data reformation–A novel data processing technique enhancing machine learning applicability for predicting streamflow extremes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant