CN114218853A - 基于机器学习空间降尺度提高水储量分辨率和精度的方法 - Google Patents

基于机器学习空间降尺度提高水储量分辨率和精度的方法 Download PDF

Info

Publication number
CN114218853A
CN114218853A CN202111370747.2A CN202111370747A CN114218853A CN 114218853 A CN114218853 A CN 114218853A CN 202111370747 A CN202111370747 A CN 202111370747A CN 114218853 A CN114218853 A CN 114218853A
Authority
CN
China
Prior art keywords
model
downscaling
optimal
resolution
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111370747.2A
Other languages
English (en)
Inventor
郑伟
尹文杰
陈智伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Space Technology CAST
Original Assignee
China Academy of Space Technology CAST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Space Technology CAST filed Critical China Academy of Space Technology CAST
Priority to CN202111370747.2A priority Critical patent/CN114218853A/zh
Publication of CN114218853A publication Critical patent/CN114218853A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明公开了一种基于机器学习空间降尺度提高水储量分辨率和精度的方法和系统,该方法包括:基于建模窗口,建立陆地水储量变化异常与多种水文变量之间的初始降尺度模型;采用于采用N种不同的机器学习算法,对初始降尺度模型进行学习,并结合M种不同的优化选择器,筛选得到最优地水储量变化异常求解模型和最优建模窗口;根据最优陆地水储量变化解算函数和最优建模窗口,构建得到最优降尺度模型;根据最优降尺度模型,输出陆地水储量变化异常值。本发明对低空间分辨率(如1°和0.5°)的TWSA产品进行优化处理。以获得高空间分辨率(如0.25°、0.1°和0.05°)的TWSA产品,提高了水储量分辨率和精度。

Description

基于机器学习空间降尺度提高水储量分辨率和精度的方法
技术领域
本发明属于卫星重力学、水文学等交叉技术领域,尤其涉及一种基于机器学习空间降尺度提高水储量分辨率和精度的方法。
背景技术
水资源是人类赖以生存和社会发展的不可缺少的物质之一。地下水作为淡水资源的重要组成部分,是工业生产、农业灌溉和生活用水的重要来源。受到气候变化、地下水超采、缺乏有效管理等因素的影响,不少地区的地下水出现严重枯竭,因此准确地估计区域的地下水储量变化情况,对于有效管理水资源、保证粮食安全具有重要意义。利用建立大范围的地下水监测网等传统方法需花费大量人力和物力。且稀疏的、空间分布不均匀的地下水观测数据难以连续地估计大区域的地下水储量变化。因此,部分学者开始探索可分析更高时空分辨率的地下水储量变化的研究方法,例如水文模型、卫星遥感等。
2002年成功发射的GRACE卫星为连续地、大尺度范围地监测陆地水储量变化提供了一种新方式。早期研究已表明在大区域(~20000km2)上,通过GRACE卫星的观测数据可估计1~1.5cm精度等效水柱高的陆地水储量变化。目前GRACE产品在研究全球陆地水储量变化、旱涝灾害、冰川消融、地震和海平面变化等方面都有重要的应用。GRACE数据反演的陆地水储量是土壤水、地下水、雪水等水文变量的总和。根据陆地水储量平衡方程,从陆地水储量中扣除相应的变量,即可获得区域地下水储量(GWS)变化。部分学者利用GRACE观测数据结合水文模型在陆地水和地下水储量变化剧烈的典型区域开展了一系列研究工作,如亚马逊流域、长江流域、印度西北部、华北平原、加利福尼亚中央山谷等。但受到粗糙的空间分辨率限制,GRACE产品并不能满足小区域陆地水储量变化的分析研究,因此,获取高分辨率的GRACE格网产品用于小区域陆地水和地下水储量变化具有重要的研究意义。
发明内容
本发明的技术解决问题:克服现有技术的不足,提供一种基于机器学习空间降尺度提高水储量分辨率和精度的方法,对低空间分辨率(如1°和0.5°)的TWSA产品进行优化处理。以获得高空间分辨率(如0.25°、0.1°和0.05°)的TWSA产品,提高了水储量分辨率和精度。
为了解决上述技术问题,本发明公开了一种基于机器学习空间降尺度提高水储量分辨率和精度的方法,包括:
基于建模窗口,建立陆地水储量变化异常与多种水文变量之间的初始降尺度模型;
采用于采用N种不同的机器学习算法,对初始降尺度模型进行学习,并结合M种不同的优化选择器,筛选得到最优地水储量变化异常求解模型和最优建模窗口;
根据最优陆地水储量变化解算函数和最优建模窗口,构建得到最优降尺度模型;
根据最优降尺度模型,输出陆地水储量变化异常值。
在上述基于机器学习空间降尺度提高水储量分辨率和精度的方法中,初始降尺度模型为低空间分辨率模型,表达式如下:
Figure BDA0003362000350000021
其中,TWSAi表示第i个月的低空间分辨率的地水储量变化异常,i=1,2,3...;vij表示第i个月、第j类低空间分辨率的水文变量,j=1,2,3...;wn表示建模窗口,n=3,5,7,9;fi表示第i个月的低空间分辨率的地水储量变化异常求解模型。
在上述基于机器学习空间降尺度提高水储量分辨率和精度的方法中,w3、w5、w7和w9分别表示3×3、5×5、7×7和9×9格网的建模窗口。
在上述基于机器学习空间降尺度提高水储量分辨率和精度的方法中,N种不同的机器学习算法,包括:RF机器学习算法、ETR机器学习算法、ABR机器学习算法和GBR机器学习算法。
在上述基于机器学习空间降尺度提高水储量分辨率和精度的方法中,M种不同的优化选择器,包括:以均方根误差RMSE、平均绝对误差MAE、纳什效率系数NSE和相关系数CC为评价指标的四种优化选择器。
在上述基于机器学习空间降尺度提高水储量分辨率和精度的方法中,通过如下公式(2)和(3),筛选得到最优地水储量变化异常求解模型fopt和最优建模窗口wopt
Figure BDA0003362000350000031
Figure BDA0003362000350000032
其中,fRF、fETR、fABR和fGBR分别表示以RF、ETR、ABR和GBR机器学习算法作为公式(1)中f的基本模型;
公式(2)和(3)的含义如下:分别使用fRF、fETR、fABR和fGBR作为公式(1)中f的基本模型,并分别代入不同尺寸的建模窗口w3、w5、w7和w9,通过RMSE、MAE、NSE和CC四个评价指标,对基于不同的fRF、fETR、fABR和fGBR与不同尺寸的建模窗口w3、w5、w7和w9的组合输出的结果进行综合评价,筛选得到降尺度结果精度最优的fopt和wopt
在上述基于机器学习空间降尺度提高水储量分辨率和精度的方法中,RMSE和MAE的值越小,表示模型的精度越高;NSE取值为负无穷到1,NSE越接近1,表示模型的质量越好,模型可信度越高;CC的取值为-1到1,CC越接近1,表示模型的质量越好,模型可信度越高。
在上述基于机器学习空间降尺度提高水储量分辨率和精度的方法中,最优降尺度模型为高空间分辨率模型,表达式如下:
Figure BDA0003362000350000041
其中,
Figure BDA0003362000350000042
表示高空间分辨率的地水储量变化异常,
Figure BDA0003362000350000043
表示第j类高空间分辨率的水文变量。
在上述基于机器学习空间降尺度提高水储量分辨率和精度的方法中,还包括:根据
Figure BDA0003362000350000044
通过如下公式(5),解算得到高空间分辨率的地下水储量变化
Figure BDA0003362000350000045
Figure BDA0003362000350000046
其中,
Figure BDA0003362000350000047
表示高空间分辨率的土壤水储量变化。
相应的,本发明还公开了一种基于机器学习空间降尺度提高水储量分辨率和精度的系统,包括:
初始模型构建模块,用于基于建模窗口,建立陆地水储量变化异常与多种水文变量之间的初始降尺度模型;
筛选模块,用于采用N种不同的机器学习算法,对初始降尺度模型进行学习,并结合M种不同的优化选择器,筛选得到最优地水储量变化异常求解模型和最优建模窗口;
最优模型构建模块,用于根据最优陆地水储量变化解算函数和最优建模窗口,构建得到最优降尺度模型;
结果输出模块,用于根据最优降尺度模型,输出陆地水储量变化异常值。
本发明具有以下优点:
本发明公开了一种基于机器学习空间降尺度提高水储量分辨率和精度的方法,在空间维度上以不同尺寸建模窗口联合多种机器学习算法,以均方根误差、平均绝对误差、纳什效率系数和相关系数为指标,分析降尺度前后陆地水储量变化的一致性,将低空间分辨率的TWSA产品转换为高空间分辨率的TWSA产品,提高了水储量分辨率和精度,为区域地下水管理提供参考依据。
附图说明
图1是本发明实施例中一种基于机器学习空间降尺度提高水储量分辨率和精度的方法的步骤流程图;
图2是本发明实施例中一种不同尺寸的建模窗口的示意图;
图3是馆陶县的位置和数字高程模型;
图4是降尺度数据处理流程图;
图5是不同组合降尺度模型的RMSE、MAE、NSE和CC的结果示意图;
图6是TWSA降尺度前后的信号变化趋势的空间分布示意图;其中,6(a)表示CSR-M06的原始信号,6(b)表示6(a)的重采样至0.5°的信号,6(c)~6(f)表示采用4种机器学习算法对6(b)信号进行降尺度处理后的结果(未添加残差),6(g)~6(j)表示6(c)~(f)信号添加残差后的降尺度结果;
图7是0.25°降尺度结果和CSR-M06模型之间的信号空间分布的精度统计示意图;
图8是不同建模窗口的降尺度结果与CSR-M06模型在馆陶县的时间序列示意图;
图9是不同建模窗口的降尺度结果与CSR-M06模型反演馆陶县陆地水储量变化时间序列的回归分析示意图;其中,9(a)表示WS3,9(b)表示WS5,9(c)表示WS7,9(d)表示WS9;
图10是降尺度前后馆陶县的TWSA的空间分布;其中,10(a)表示降尺度前,10(b)表示降尺度后。
图11是降尺度前后馆陶县的TWSA时间序列示意图;
图12是降尺度前后馆陶县的GWSA空间分布示意图;其中,12(a)表示降尺度前,12(b)表示降尺度后。
图13是降尺度前后馆陶县GWSA的时间序列示意图;
图14是馆陶县反演和实测地下水变化时间序列示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明公开的实施方式作进一步详细描述。
本发明公开了一种基于机器学习空间降尺度提高水储量分辨率和精度的方法,通过在空间维度上建立低空间分辨率TWSA与水文变量之间的降尺度模型,并探讨不同建模窗口对降尺度精度的影响,对低空间分辨率(例如1°和0.5°)的TWSA产品进行优化处理,得到高空间分辨率(例如0.25°、0.1°和0.05°)的
Figure BDA0003362000350000061
产品。其中,需要注意的是全文中带有‘Λ’的变量均为高空间分辨率的数据。
如图1,在本实施例中,该基于机器学习空间降尺度提高水储量分辨率和精度的方法,包括:
步骤101,基于建模窗口,建立陆地水储量变化异常与多种水文变量之间的初始降尺度模型。
在本实施例中,初始降尺度模型为低空间分辨率模型,表达式如下:
Figure BDA0003362000350000062
其中,TWSAi表示第i个月的低空间分辨率的地水储量变化异常,i=1,2,3...;vij表示第i个月、第j类低空间分辨率的水文变量,j=1,2,3...;wn表示建模窗口,n=3,5,7,9;fi表示第i个月的低空间分辨率的地水储量变化异常求解模型。
优选的,如图2,w3、w5、w7和w9分别表示3×3、5×5、7×7和9×9格网的建模窗口。
步骤102,采用于采用N种不同的机器学习算法,对初始降尺度模型进行学习,并结合M种不同的优化选择器,筛选得到最优地水储量变化异常求解模型和最优建模窗口。
在本实施例中,N种不同的机器学习算法具体可以指:RF机器学习算法、ETR机器学习算法、ABR机器学习算法和GBR机器学习算法。M种不同的优化选择器具体可以指:以均方根误差RMSE、平均绝对误差MAE、纳什效率系数NSE和相关系数CC为评价指标的四种优化选择器。
优选的,可以通过如下公式(2)和(3),筛选得到最优地水储量变化异常求解模型fopt和最优建模窗口wopt
Figure BDA0003362000350000071
Figure BDA0003362000350000072
其中,fRF、fETR、fABR和fGBR分别表示以RF、ETR、ABR和GBR机器学习算法作为公式(1)中f的基本模型。
需要说明的是,公式(2)和(3)的含义如下:分别使用fRF、fETR、fABR和fGBR作为公式(1)中f的基本模型,并分别代入不同尺寸的建模窗口w3、w5、w7和w9,通过RMSE、MAE、NSE和CC四个评价指标,对基于不同的fRF、fETR、fABR和fGBR与不同尺寸的建模窗口w3、w5、w7和w9的组合输出的结果进行综合评价,筛选得到降尺度结果精度最优的fopt和wopt
一般来说,RMSE和MAE的值越小,表示模型的精度越高;NSE取值为负无穷到1,NSE越接近1,表示模型的质量越好,模型可信度越高;CC的取值为-1到1,CC越接近1,表示模型的质量越好,模型可信度越高。
步骤103,根据最优陆地水储量变化解算函数和最优建模窗口,构建得到最优降尺度模型。
在本实施例中,最优降尺度模型为高空间分辨率模型,表达式如下:
Figure BDA0003362000350000073
其中,
Figure BDA0003362000350000074
表示高空间分辨率的地水储量变化异常,
Figure BDA0003362000350000075
表示第j类高空间分辨率的水文变量。
步骤104,根据最优降尺度模型,输出陆地水储量变化异常值。
步骤105,根据
Figure BDA0003362000350000081
通过如下公式(5),解算得到高空间分辨率的地下水储量变化
Figure BDA0003362000350000082
Figure BDA0003362000350000083
其中,
Figure BDA0003362000350000084
表示高空间分辨率的土壤水储量变化。
在上述实施例的基础上,下面对本发明所述的基于机器学习空间降尺度提高水储量分辨率和精度的方法的验证过程进行说明。
1、研究区域
本发明的研究区域为馆陶县及其周边范围,位于中国河北省南部,总面积为460km2,地处东经115°06′-115°40′,北纬36°27′-36°47′,如图3所示。地势西南高,东北低,总体较为平坦,南部海拔约43m,北部海拔约36m(图3)。馆陶县属于典型的暖温带半湿润大陆性季风气候,日照充足,干湿季节分明。年平均气温14℃,最冷月份(1月)和最热月份(7月)的平均气温分别为-2.5℃和27℃。由于对水资源缺乏的合理利用和有效管理,馆陶县地区的地下水存在严重超采情况。地下水枯竭诱发了地面沉降、地裂缝、土壤盐渍化等一系列生态环境及地质灾害,影响着该地区的经济社会的全面、协调和可持续发展。因此,分析研究馆陶县地区的水资源储量变化非常必要。
2、数据源
本发明所采用的研究数据包括CSR RL06 Mascon、GLDAS、MODIS、TEMP和实测地下水水位资料等。先前的研究表明这些气候变量与陆地水储量变化均有密切关系。
2.1)GRACE数据
由美国航空航天局(National Aeronautics and Space Administration,NASA)和德国航天中心(Deutsches Zentrum für Luft-und Raumfahrt,DLR)合作研发的GRACE卫星于2002年发射成功,在2017年10月结束任务。目前GRACE数据主要分为球谐系数解(Spherical Harmonic Coefficient,SHC)和质量浓度解(Mass Concentrationsolutions,Mascon)两类产品。SHC产品的高阶系数存在高频噪声和南北方向的条带误差,因此在转化成全球陆地水储量变化时,需要对其进行滤波和去条带误差等数据处理过程。由于Mascon产品已经进行了一阶项改正、C20项替换和GIA改正等预处理工作,因此使用时不需要进行任何的后处理过程。此外,与SHC产品相比,Mascon产品增加了相关性约束,具有更高的信噪比。因此,本发明将基于CSR发布的CSR-M06模型分析区域陆地水储量变化。CSR-M06模型的空间分辨率为0.25°×0.25°,时间分辨率为月值,并且已经扣除了2004年1月~2009年12月的平均值。
2.2)GLDAS数据
全球陆面数据同化系统(Global Land Data Assimilation System,GLDAS)由戈达德宇航中心(Goddard Space Flight Center,GSFC)和美国国家环境预报中心(NationalCenters for Environmental Prediction,NCEP)共同开发完成。基于先进陆面模型和数据同化的方法,以卫星和地表观测数据作为基础资料,GLDAS输出全球的地表状态和通量数据。目前GLDAS产品包括了多种类型的陆面模型,分别为Noah、Mosaic、CLM和VIC。本发明采用来自Noah陆面模型的土壤水分量,时空分辨率为0.25°×0.25°和月值,其中包括了4种不同深度的土壤水湿度(即0~10cm、10~40cm、40~100cm和100~200cm)。由于GLDAS模型的空间分辨率不能满足需求,将该数据重采样至0.05°。
2.3)MODIS数据
搭载在Terra和Aqua两颗卫星上的中分辨率成像光谱仪(Moderate-resolutionImaging Spectroradiometer,MODIS)是美国地球观测系统(EOS)计划中主要用于观测全球生物和物理过程的重要仪器。基于Penman-Monteith公式和Mu的ET改进算法,MODIS-MOD16数据集是以每日气象再分析数据和MODIS衍生的土地覆盖、反照率、叶面积指数和增强植被指数数据为输入变量,计算的全球陆地表面蒸发量。该数据集包括了地表蒸散发量(globalevapotranspiration,ET)潜热通量、潜在地表蒸散发、潜在热通量,空间分辨率为500m,时间分辨率有8天(MOD16A2)和1年(MOD16A3)两种。本发明从MOD16A2产品中提取ET成分,将8天时间分辨的产品取平均获得月时间分辨率数据。昼夜地表温度(LST_day和LST_night)数据是从第6版的MODIS-MOD11C3产品中获取,其空间分辨率为0.05°×0.05°(~5.6×5.6km),时间分辨率为月。
2.4)TEMP数据
TEMP是发布在国家青藏高原科学数据中心的中国逐月平均温度数据,空间分辨率约1km,时间跨度为1901.01~2017.12。根据CRU发布的全球0.5°气候数据以及WorldClim发布的全球高分辨率气候产品,该数据集是通过Delta空间降尺度方案生成在中国地区的降尺度结果。采用496个独立气象观测站的观测资料对该数据集进行验证,结果可靠。
2.5)实测地下水位数据
为了验证高分辨率的GWSA降尺度结果,本发明共收集了21口馆陶县的地下水井观测数据(来自馆陶县地下水监测管理部门),其中包括浅层地下水井和深层地下水井,点位的空间分布如图2中黑色圆点所示。将地下水井的高程减去地下水的埋深可获得地下水位变化。通过各水井的水位变化值扣除自身的平均值后,与GRACE反演的地下水储量变化进行比较。
3、机器学习算法
集成学习算法是机器学习新的研究趋势,通过整合多个弱学习器的训练结果组成强学习器,可以提高模型的泛化能力,从而提升模型的预测精度。与单一学习模型相比,集成学习模型具有更高的准确性、鲁棒性和灵活性。集成学习算法主要包括bagging和boosting两种类型。bagging算法的思想是通过从训练集中按照指定比例抽取数据组成子训练集,然后分别对子训练集进行处理,最后将所有子训练集获得的结果取平均作为模型最终预测的结果,其代表性算法有Random Forest(RF)和Extra Trees Regressor(ETR)算法。RF算法是Breiman在2001年首次提出一种性能优越的集成机器学习方法。它由多种分类和回归决策树组成,是用于数据的分类和回归任务的流行工具。RF算法中的随机性主要表现为两个方面:一是在原始训练数据中有放回地随机选取等量的数据作为训练样本,二是在建立决策树时,随机选取一部分特征建立决策树。这两种随机性使各个决策树之间的相关性小,从而提高模型的准确性。先前的研究表明基于这两种随机性构建的随机森林非常健壮。ETR算法是一种相对较新的机器学习算法,是在随机森林算法的基础上发展而来。与RF算法相比,ETR算法在节点处描述符的完全随机分裂,且每棵树都是利用整个数据集进行训练。
与bagging算法不同,boosting是一种迭代算法,通过多次对同一个训练集进行训练,后一次训练根据上一次训练的结果调整样本的权重,在符合一定的指标后,输出最终的训练结果。Adaptive Boosting Regressor(ABR)算法是boosting的代表性算法。在开始训练时,ABR算法首先赋予每个样本相等的权重,对样本进行迭代计算,后一轮迭代过程利用前一轮弱学习器的误差来更新样本的权重值。在达到设定的迭代次数或满足设定的精度要求后训练终止。Gradient Boosting Regressor(GBR)算法同样基于boosting思想设计并常用来与ABR算法进行比较。与ABR算法的迭代条件有所不同,GBR算法是在前一次迭代损失函数的梯度下降方向重新建立模型。损失函数可以用于评价模型的性能,损失函数越小,模型性能越好。令损失函数沿着梯度方向下降可以不断提升模型的性能。通过集成学习算法对已有的数据集进行训练获得相关模型,可以利用训练好的模型对新数据进行判断和预测。由于集成学习算法对非线性问题具有非常强的处理能力,被广泛地应用于地球科学领域,并获得了良好效果。在GRACE数据的降尺度研究中,RF和GBR算法有了较多的应用,但关于ETR和ABR算法的讨论较少。本发明将采用RF、ETR、ABR和GBR算法对GRACE格网产品进行降尺度处理,并进行精度分析。这4种机器学习算法均可以在Python的Scikit-learn函数库中进行调用。
4、数据处理流程
本发明的数据处理流程包括设置建模窗口、优选建模窗口和机器学习算法、获取高分辨率的TWSA和GWSA产品、采用地下水井的实测数据对降尺度结果进行验证,具体的降尺度过程如图4所示。图4中虚线箭头代表输入数据,点线箭头代表输出降尺度模型和降尺度结果,绿色点画线箭头代表输入验证数据。
(1)设置建模窗口(图2)。为了分析建模窗口对降尺度结果的影响,以馆陶县为中心,以0.5°格网为基础,建立尺寸分别为3×3、5×5、7×7和9×9格网的窗口,并称之为Window Size3(WS3)、Window Size5(WS5)、Window Size7(WS7)和Window Size9(WS9)。图中绿色格网为总的研究区域,蓝色格网为各个建模窗口所采用的训练数据。
(2)由于研究数据的时空分辨率不一致,需要对数据进行预处理。将TWSA的空间分辨率分为0.5°和0.25°;将ET、SM、LST_day、LST_night和TEMP的空间分辨率分为0.5°、0.25°和0.05°。除了实测地下水资料,其他研究数据的时间分辨率均统一为月值。
(3)通过WS3、WS5、WS7和WS9建模窗口组合RF、ETR、GBR和ABR算法(例如WS3+RF算法,称之为组合模型),逐月建立TWSA和水文变量之间0.5°的回归模型。将0.25°的水文变量输入相应月份的回归模型中,输出0.25°的TWSA降尺度结果。然后在时空信号上对比分析了0.25°的TWSA降尺度产品和CSR-M06模型之间的RMSE、MAE、NSE和CC,确定最优的组合模型。
(4)基获取的最优组合模型,通过输入0.05°的水文变量,获得0.05°空间分辨率的TWSA变化。根据陆地水储量平衡方程,从TWSA中扣除SM变量,可以获得高分辨率的GWSA变化。最后利用馆陶县的实测地下水井观测数据对降尺度后高分辨率的地下水储量变化进行对比验证。
5、评估指标
本发明通过4个统计指标来评估上述设计方案的降尺度精度情况,即均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)、纳什效率系数(Nash Sutcliffe Efficiency coefficient,NSE)和相关系数(CorrelationCoefficient,CC),各指标计算公式如下:
Figure BDA0003362000350000121
Figure BDA0003362000350000131
Figure BDA0003362000350000132
Figure BDA0003362000350000133
其中,Y表示观测值,X表示预测值,
Figure BDA0003362000350000134
Figure BDA0003362000350000135
分别表示Y和X的平均值,n表示数据集的数量。对于模型构建而言,观测值和预测值之间的相关系数NSE和CC越高,模型精度越好。而RMSE和MAE越小,预测值越接近观测值,模型的精度越高。
6、验证
6.1)性能
利用WS3、WS5、WS7和WS9建模窗口组合RF、ETR、ABR和GBR算法逐月建立TWSA和水文变量之间的回归关系,将0.5°的TWSA数据降尺度至0.25°。图5给出了统计各月份组合降尺度模型验证集的RMSE、MAE、NSE和CC平均值。从整体上看,各组合降尺度模型的结果均表现出较好精度,RMSE和MAE的值分别在6.77~13.62mm和3.36~10.21mm之间,而NSE和CC均不小于0.51和0.76。在WS3、WS5、WS7和WS9中,ETR算法的RMSE分别为6.77mm、9.94mm、9.56mm和10.90mm(MAE分别为3.36mm、4.62mm、4.32mm和4.85mm),均优于其他三种算法,且在各建模窗口中,ETR算法的NSE和CC均有最大值。以上讨论表明在模型精度统计中ETR算法要优于RF、ABR和GBR算法。
当采用组合降尺度模型对TWSA格网数据进行降尺度处理时,预测数据与原始数据之间存在差值,称之为残差。先前的研究表明通过克里金内插方法将低分辨TWSA的原始数据和预测数据之间的残差插值至高分辨率,然后添加至高分辨率的降尺度结果,能够在一定程度上提高降尺度模型的精度,因此需要进一步评估各组合降尺度模型。图6给出了2003年1月~2016年12月期间从0.5°降尺度至0.25°的TWSA变化趋势信号的空间分布(以WS9的降尺度结果为例)。图6(a)表示CSR-M06模型反演的陆地水储量变化趋势,空间分辨率为0.25°;图6(b)表示图6(a)重采样至0.5°的陆地水储量变化趋势;图6(c)-(j)分别表示不同组合模型的降尺度结果。从整体上看,降尺度信号与原始信号在空间分布上具有较好的一致性,均表现为TWSA在西南部下降比较严重,在东北部下降比较缓慢。在添加残差后,各组合模型的降尺度信号的空间分布更加接近原始信号(图6(g)-(j))。WS3、WS5和WS7建模窗口的降尺度信号均有相似的表现。
为了进一步分析各组合降尺度模型的精度,在图7中统计了各模型的降尺度信号与CSR-M06模型信号在空间分布的吻合度,其中包括添加残差前后的情况。据图7可知,在添加残差后,各组合模型的降尺度精度均有所提高,RMSE值从1.69~2.55mm/yr下降至1.36~1.89mm/yr;MAE值从1.19~2.10mm/yr下降至1.03~1.53mm/yr;NSE值从0.28~0.69提高至0.51~0.87;CC值从0.73~0.88提高至0.75~0.94。RMSE、MAE、NSE和CC的精度分别提高了20%~26%、13%~27%、20%~82%和3%~7%。在添加残差后,RF算法在各建模窗口的降尺度精度均表现较优。例如在WS5中,RF算法的RMSE和MAE中均为最小,分别为1.36mm/yr和1.12mm/yr,而NSE和CC均为最大,分别为0.82和0.93。由此可见,采用RF算法对GRACE格网数据进行降尺度处理,在空间分布上所获得的降尺度信号与原始信号更为接近。
6.2)降尺度前后馆陶县的陆地水储量变化时间序列分析
据空间信号分析可知,RF算法的降尺度性能表现较优。以下将从时间维度上分析WS3、WS5、WS7和WS9建模窗口结合RF算法的降尺度精度情况。图8为馆陶县所在的两个0.25°格网(图6(c)中小方框:115.0°-115.5°E,36.5°-36.75°N)TWSA时间序列,包括CSR-M06模型和各建模窗口组合RF算法的降尺度结果。由图8可知,除了个别时间节点外(如2004年初、2014年初、2015年底),不同组合模型的降尺度结果与CSR-M06模型反演的馆陶县陆地水储量变化的时间序列均有较好的一致性。为了分析各组合模型的精度,现分别对各建模窗口的降尺度结果与CSR-M06模型的时间序列分别进行回归分析,如图9所示。由图9可知,4种建模窗口结合RF算法的降尺度结果的NSE和CC均大于0.98,说明各建模窗口组合RF算法的降尺度结果精度良好且差异不大。WS5的RMSE、MAE、NSE和CC值分别为9.67mm、6.80mm、0.990和0.997,各指标均优于WS3、WS7和WS9。WS3和WS7建模窗口的统计精度次之,WS9建模窗口的统计精度最差。
7、应用
7.1)高空间分辨率的降尺度结果
7.11)TWSA降尺度信号的时空分布
基于对新型机器学习空间降尺度法的验证结果可知,WS5与RF形成的组合算法可获得较优的降尺度结果。为了满足分析馆陶县的陆地水储量变化的需求,以下将应用WS5结合RF算法获取0.05°空间分辨率的TWSA产品。图10给出了2003年1月~2016年12月期间降尺度前后TWSA变化趋势的空间分布。在WS5建模窗口内,两者的空间分布非常一致,陆地水储量在西南部和中部地区减少较快,而在东北部地区减少较慢,降尺度后的信号更能体现陆地水储量变化的细致特征。利用CSR-M06模型和0.05°的降尺度结果分别计算馆陶县的陆地水储量变化时间序列(图11),两者的NSE和CC值均在0.99以上,并分别以-20.86mm/yr和-21.79mm/yr速度减少。
7.12)GWSA降尺度信号的时空分布
根据陆地水储量平衡方程,从TWSA中扣除SM变量,可以获得区域的地下水储量变化。图12给出了CSR-M06模型和0.05°的降尺度结果反演的扣除相同空间分辨率的SM后获得GWSA的空间分布。由图12可知,降尺度前后的GWSA的空间分布一致性较好,地下水储量在西部地区减少较快,在东部地区减少较慢(图12)。图13给出了馆陶县地下水储量变化的时间序列(图13)。降尺度后的地下水储量与CSR-M06反演地下水储量的NSE和CC分别为0.980和0.994,具有一致性较好。CSR-M06模型和0.05°降尺度结果计算的馆陶县地下水储量变化趋势分别为-14.53mm/yr和-15.46mm/yr。由以上对降尺度前后的TWSA和GWSA在时空信号的讨论结果表明,本发明提出的降尺度方案不仅可以提高GRACE数据的空间分辨率,还有效地保留了原始信号,具有较高的可靠性。
7.2)高分辨率的降尺度结果与实测数据的对比分析
为了分析降尺度后高分辨率(0.05°)GWSA的可靠性,本发明收集了馆陶县共21口地下水井的观测数据对其进行验证,其中浅层水井有11口(编号:1-11),深层水井有10口(编号:12-21)。反演地下水与实测地下水数据的公共时间段为2012-2016年。由于不同地区地下水的给水度具有较大的不确定性,因此本发明主要对反演和实测地下水变化趋势及其相关性进行了分析。图14给出了地下水测井的空间分布情况,其中黑色圆点和红色方点分别代表浅层和深层地下水井。同时也给出了部分地下水井的水位变化与其所在格网反演地下水储量变化的时间序列。由于地下水井的数据观测时间不规律,分别计算了实测时间尺度和年时间尺度上的实测和反演地下水变化的相关系数,如图14中的CC_sy和CC_y所示。大部分的实测数据与GRACE反演的地下水储量变化均呈现为下降趋势(图14)。浅层地下水井观测数据与反演的地下水变化一致性较差,除了观测井1、3、5和6的相关系数为正,其他观测井的相关系数为负。而深层地下水井的地下水变化与反演的地下水变化,除了观测井18、19的相关关系较差外,其他深层地下水井的年相关系数均在0.7以上。通过对比两种不同深度的观测井与反演的地下水储量变化结果,表明馆陶县的地下水亏损可能主要是由于深层地下水超采造成的。
在上述实施例的基础上,本发明还公开了一种基于机器学习空间降尺度提高水储量分辨率和精度的系统,包括:初始模型构建模块,用于基于建模窗口,建立陆地水储量变化异常与多种水文变量之间的初始降尺度模型;筛选模块,用于采用N种不同的机器学习算法,对初始降尺度模型进行学习,并结合M种不同的优化选择器,筛选得到最优地水储量变化异常求解模型和最优建模窗口;最优模型构建模块,用于根据最优陆地水储量变化解算函数和最优建模窗口,构建得到最优降尺度模型;结果输出模块,用于根据最优降尺度模型,输出陆地水储量变化异常值。
对于系统实施例而言,由于其与方法实施例相对应,所以描述的比较简单,相关之处参见方法实施例部分的说明即可。
本发明虽然已以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改,因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰,均属于本发明技术方案的保护范围。
本发明说明书中未作详细描述的内容属于本领域专业技术人员的公知技术。

Claims (10)

1.一种基于机器学习空间降尺度提高水储量分辨率和精度的方法,其特征在于,包括:
基于建模窗口,建立陆地水储量变化异常与多种水文变量之间的初始降尺度模型;
采用于采用N种不同的机器学习算法,对初始降尺度模型进行学习,并结合M种不同的优化选择器,筛选得到最优地水储量变化异常求解模型和最优建模窗口;
根据最优陆地水储量变化解算函数和最优建模窗口,构建得到最优降尺度模型;
根据最优降尺度模型,输出陆地水储量变化异常值。
2.根据权利要求1所述的基于机器学习空间降尺度提高水储量分辨率和精度的方法,其特征在于,初始降尺度模型为低空间分辨率模型,表达式如下:
Figure FDA0003362000340000011
其中,TWSAi表示第i个月的低空间分辨率的地水储量变化异常,i=1,2,3...;vij表示第i个月、第j类低空间分辨率的水文变量,j=1,2,3...;wn表示建模窗口,n=3,5,7,9;fi表示第i个月的低空间分辨率的地水储量变化异常求解模型。
3.根据权利要求2所述的基于机器学习空间降尺度提高水储量分辨率和精度的方法,其特征在于,w3、w5、w7和w9分别表示3×3、5×5、7×7和9×9格网的建模窗口。
4.根据权利要求3所述的基于机器学习空间降尺度提高水储量分辨率和精度的方法,其特征在于,N种不同的机器学习算法,包括:RF机器学习算法、ETR机器学习算法、ABR机器学习算法和GBR机器学习算法。
5.根据权利要求4所述的基于机器学习空间降尺度提高水储量分辨率和精度的方法,其特征在于,M种不同的优化选择器,包括:以均方根误差RMSE、平均绝对误差MAE、纳什效率系数NSE和相关系数CC为评价指标的四种优化选择器。
6.根据权利要求5所述的基于机器学习空间降尺度提高水储量分辨率和精度的方法,其特征在于,通过如下公式(2)和(3),筛选得到最优地水储量变化异常求解模型fopt和最优建模窗口wopt
Figure FDA0003362000340000021
Figure FDA0003362000340000022
其中,fRF、fETR、fABR和fGBR分别表示以RF、ETR、ABR和GBR机器学习算法作为公式(1)中f的基本模型;
公式(2)和(3)的含义如下:分别使用fRF、fETR、fABR和fGBR作为公式(1)中f的基本模型,并分别代入不同尺寸的建模窗口w3、w5、w7和w9,通过RMSE、MAE、NSE和CC四个评价指标,对基于不同的fRF、fETR、fABR和fGBR与不同尺寸的建模窗口w3、w5、w7和w9的组合输出的结果进行综合评价,筛选得到降尺度结果精度最优的fopt和wopt
7.根据权利要求6所述的基于机器学习空间降尺度提高水储量分辨率和精度的方法,其特征在于,RMSE和MAE的值越小,表示模型的精度越高;NSE取值为负无穷到1,NSE越接近1,表示模型的质量越好,模型可信度越高;CC的取值为-1到1,CC越接近1,表示模型的质量越好,模型可信度越高。
8.根据权利要求6所述的基于机器学习空间降尺度提高水储量分辨率和精度的方法,其特征在于,最优降尺度模型为高空间分辨率模型,表达式如下:
Figure FDA0003362000340000031
其中,
Figure FDA0003362000340000032
表示高空间分辨率的地水储量变化异常,
Figure FDA0003362000340000033
表示第j类高空间分辨率的水文变量。
9.根据权利要求8所述的基于机器学习空间降尺度提高水储量分辨率和精度的方法,其特征在于,还包括:根据
Figure FDA0003362000340000034
通过如下公式(5),解算得到高空间分辨率的地下水储量变化
Figure FDA0003362000340000035
Figure FDA0003362000340000036
其中,
Figure FDA0003362000340000037
表示高空间分辨率的土壤水储量变化。
10.一种基于机器学习空间降尺度提高水储量分辨率和精度的系统,其特征在于,包括:
初始模型构建模块,用于基于建模窗口,建立陆地水储量变化异常与多种水文变量之间的初始降尺度模型;
筛选模块,用于采用N种不同的机器学习算法,对初始降尺度模型进行学习,并结合M种不同的优化选择器,筛选得到最优地水储量变化异常求解模型和最优建模窗口;
最优模型构建模块,用于根据最优陆地水储量变化解算函数和最优建模窗口,构建得到最优降尺度模型;
结果输出模块,用于根据最优降尺度模型,输出陆地水储量变化异常值。
CN202111370747.2A 2021-11-18 2021-11-18 基于机器学习空间降尺度提高水储量分辨率和精度的方法 Pending CN114218853A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111370747.2A CN114218853A (zh) 2021-11-18 2021-11-18 基于机器学习空间降尺度提高水储量分辨率和精度的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111370747.2A CN114218853A (zh) 2021-11-18 2021-11-18 基于机器学习空间降尺度提高水储量分辨率和精度的方法

Publications (1)

Publication Number Publication Date
CN114218853A true CN114218853A (zh) 2022-03-22

Family

ID=80697608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111370747.2A Pending CN114218853A (zh) 2021-11-18 2021-11-18 基于机器学习空间降尺度提高水储量分辨率和精度的方法

Country Status (1)

Country Link
CN (1) CN114218853A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115617935A (zh) * 2022-10-18 2023-01-17 中国水利水电科学研究院 一种基于融合模型的地下水储量偏差降尺度方法
CN116089832A (zh) * 2022-12-29 2023-05-09 清华大学 重力卫星地下水储量的降尺度方法、装置和计算机设备
CN116628442A (zh) * 2023-05-12 2023-08-22 中国科学院地理科学与资源研究所 一种基于人工神经网络的地下水储量变化空间降尺度方法
CN117571968A (zh) * 2024-01-12 2024-02-20 山东大学 一种基于gnss-ir的土壤湿度计算方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115617935A (zh) * 2022-10-18 2023-01-17 中国水利水电科学研究院 一种基于融合模型的地下水储量偏差降尺度方法
CN116089832A (zh) * 2022-12-29 2023-05-09 清华大学 重力卫星地下水储量的降尺度方法、装置和计算机设备
CN116628442A (zh) * 2023-05-12 2023-08-22 中国科学院地理科学与资源研究所 一种基于人工神经网络的地下水储量变化空间降尺度方法
CN116628442B (zh) * 2023-05-12 2023-12-22 中国科学院地理科学与资源研究所 一种基于人工神经网络的地下水储量变化空间降尺度方法
CN117571968A (zh) * 2024-01-12 2024-02-20 山东大学 一种基于gnss-ir的土壤湿度计算方法
CN117571968B (zh) * 2024-01-12 2024-04-05 山东大学 一种基于gnss-ir的土壤湿度计算方法

Similar Documents

Publication Publication Date Title
CN114218853A (zh) 基于机器学习空间降尺度提高水储量分辨率和精度的方法
Liu et al. High-resolution and three-dimensional mapping of soil texture of China
Karthikeyan et al. Multi-layer high-resolution soil moisture estimation using machine learning over the United States
Bui et al. Landslide susceptibility assessment in the Hoa Binh province of Vietnam: A comparison of the Levenberg–Marquardt and Bayesian regularized neural networks
Langella et al. High-resolution space–time rainfall analysis using integrated ANN inference systems
CN112016052B (zh) 基于多源数据的近地表日最高气温估算方法、系统及终端
Silatsa et al. Assessing countrywide soil organic carbon stock using hybrid machine learning modelling and legacy soil data in Cameroon
CN112287294B (zh) 一种基于深度学习的时空双向土壤含水量插值方法
Shukla et al. Evaluating hydrological responses to urbanization in a tropical river basin: A water resources management perspective
CN109508476B (zh) 基于深度网络学习的山火预测建模方法
Pham A novel classifier based on composite hyper-cubes on iterated random projections for assessment of landslide susceptibility
Boufala et al. Hydrological modeling of water and soil resources in the basin upstream of the Allal El Fassi dam (Upper Sebou watershed, Morocco)
Adhikari et al. Comparing kriging and regression approaches for mapping soil clay content in a diverse Danish landscape
CN110852472B (zh) 一种基于随机森林算法的陆地水储量预测方法及设备
CN115758270A (zh) 基于随机森林与环境变量的土壤矿物结合态有机碳预测方法及装置
CN105528523A (zh) 一种基于遥感数据的土壤厚度反演方法
Zhang et al. GIS-based evaluation of landslide susceptibility using a novel hybrid computational intelligence model on different mapping units
Ayana et al. Dividends in flow prediction improvement using high-resolution soil database
CN116796799A (zh) 无水文资料地区中小流域洪水降雨量阈值模型创建方法
CN117494419A (zh) 一种多模型耦合的流域水土流失遥感监测方法
Alaboz et al. Computational intelligence applied to the least limiting water range to estimate soil water content using GIS and geostatistical approaches in alluvial lands
CN112508060A (zh) 一种基于图卷积神经网络的滑坡体状态判断方法及系统
Ahmed et al. GIS-based land suitability mapping for rubber cultivation in Seremban, Malaysia
Huqqani et al. Landslide hazard analysis using a multilayered approach based on various input data configurations
Mdee Spatial distribution of runoff in ungauged catchments in Tanzania

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination