CN116579224A - 基于变量筛选重构模型提高陆地水储量重构准确性方法 - Google Patents
基于变量筛选重构模型提高陆地水储量重构准确性方法 Download PDFInfo
- Publication number
- CN116579224A CN116579224A CN202310003863.3A CN202310003863A CN116579224A CN 116579224 A CN116579224 A CN 116579224A CN 202310003863 A CN202310003863 A CN 202310003863A CN 116579224 A CN116579224 A CN 116579224A
- Authority
- CN
- China
- Prior art keywords
- model
- reconstruction
- variable screening
- grace
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012216 screening Methods 0.000 title claims abstract description 48
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000013528 artificial neural network Methods 0.000 claims abstract description 8
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 4
- 238000001556 precipitation Methods 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 6
- 238000003062 neural network model Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 2
- 125000004122 cyclic group Chemical group 0.000 claims description 2
- 238000012417 linear regression Methods 0.000 claims description 2
- 239000002689 soil Substances 0.000 claims description 2
- 239000002352 surface water Substances 0.000 claims description 2
- 238000011160 research Methods 0.000 abstract description 3
- 238000000354 decomposition reaction Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000012544 monitoring process Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 4
- 238000006424 Flood reaction Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000013505 freshwater Substances 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Biophysics (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Geometry (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
Abstract
本发明属于水文学技术领域,具体是一种基于变量筛选重构模型提高陆地水储量重构准确性方法。本发明变量筛选重构模型结合了GT方法和LSTM神经网络的混合算法,包括:变量筛选,模型训练,模型预测。本发明提出的方法,为重建缺失的TWSA提供了有效手段,为间断期的洪涝灾害研究提供了可靠数据支撑。基于变量筛选重构模型的实施,可有效避免无关输入变量对模型精度的影响,提高重构GRACE/GRACE‑FO间断期陆地水储量的准确性。
Description
技术领域
本发明属于水文学技术领域,具体是一种基于变量筛选重构模型提高陆地水储量重构准确性方法。
背景技术
随着全球气候的变化,世界许多地区的极端水文事件日益增多。在过去的几十年里,洪水和干旱是气候变化造成的两个最具破坏性的灾难。水文极端事件严重影响人们的生活,造成了巨大的人类灾难和经济损失。因此,准确监测干旱和洪水事件对于预测灾害的演变和减少潜在危害非常必要。
实际上,干旱和洪水事件由于其时间和空间变化的复杂性而难以表征。监测洪水和干旱事件的常用措施依赖于实地观测,以提供可靠的水文气象参数,例如径流(R)、降水量(P)、温度(T)和蒸散量(ET)。尽管实地观测可以提供准确的信息,但这些方法在空间和时间上都受到限制,因为该方法只覆盖了一个小区域。相应地,遥感技术已被证明具有高效、低成本的优点。早期研究表明,干旱和洪水事件可以通过不同的光学卫星观测手段在区域和全球范围内进行监测,例如Landsat、Sentinel-2、MODIS,以及VIIRS。而上述方法仍存在一定的局限性。具体来说,光学卫星图像容易被云和云影污染,导致时空覆盖不完整。这些缺陷降低了光谱图像数据在极端水文事件中的可用性。
重力恢复和气候实验(Gravity Recovery and Climate Experiment,GRACE)卫星任务的发射为监测陆地水储量变化提供了新的手段。目前,基于GRACE的旱涝指数能够有效捕捉和识别关键信息,已广泛应用于区域和全球极端水文监测应用。例如,Ran等利用GRACE衍生的干旱指数分析了2019年夏秋季长江流域中下游地区的干旱严重程度。Zhao等评估了2002~2014年期间美国大陆的GRACE衍生干旱指数表现,研究结果表明与其他干旱监测方法相比,该方法在空间和时间更具有一致性。在洪水事件监测方面,Sun等基于GRACE和降水计算的洪水潜力指数(flood potential index,FPI)识别长江流域洪水事件,发现FPI可以可靠地评估水文极端事件。Gupta等评估了印度半岛河流流域的洪水潜力,发现FPI可以监测表现出不同水文特征的流域中不同程度的洪水。与光学卫星相比,GRACE观测技术可以避免云层造成的数据缺失。因此,基于GRACE衍生的监测指标可以更全面的识别干旱和洪水事件。
尽管GRACE数据迄今为止取得了许多巨大的成就,但仍然存在一些需要改进的不足之处。具体而言,GRACE卫星与其后续卫星(GRACE-FO)之间的差距导致时间序列的不连续性,从而限制了数据的进一步分析和利用。Sun等使用三种机器学习模型重建了缺失的月度GRACE,证明这三种基于机器学习的模型对于重建GRACE观测值是可靠的。Li等将机器学习与时间序列分解和统计分解技术相结合,重建新的全球长期(1979-2020)TWSA数据。Yang等提出了一种基于时间序列分解方法重建了GRACE和GRACE-FO TWSA之间的间断数据。然而,这些研究并未考虑输入变量对预测模型准确性的影响。在这项工作中,通过使用伽玛测试(Gamma test,GT),可以使用排列组合方法找到最相关的输入变量。这些选定的输入变量在长短期记忆(Long short-term memory,LSTM)预测模型中进行训练。因此,本发明提出结合GT和LSTM来重建GRACE和GRACE-FO间断期的TWSA信号。
鄱阳湖是中国最大的淡水湖,由于区域气候的剧烈变化,鄱阳湖流域已成为受洪涝灾害影响最频繁的地区之一。在这项工作中,结合谷歌地球引擎(Google Earth Engine,GEE)平台和重建的TWSA,分析了干旱和洪水的特征。GEE是一个基于云的全球尺度地理空间分析平台,用于解决多种热点社会问题,包括干旱、洪水、水资源管理和气候监测。以往研究表明,GEE是描述干旱和洪水特征的有效工具。
不同于已有的研究,本发明考虑对输入变量进行选择来提高重构GRACE/GRACE-FO间断期陆地水储量的准确性。
发明内容
为了解决现有技术中的不足,本发明旨在构建新型变量筛选重构模型,该模型利用伽马测试选择最优的输入变量组合,其次将优化后的变量组合输入到长短期神经网络中重构GRACE/GRACE-FO间断期陆地水储量。
本发明基于变量筛选重构模型提高陆地水储量重构准确性方法,变量筛选重构模型结合了GT方法和LSTM神经网络的混合算法,包括:
变量筛选,首先将气候、水文变量代入GT方法,计算输入变量组合的伽马统计量,并根据伽马统计量确定最佳输入变量组合;
模型训练,将变量筛选中得到的筛选变量的80%作为特征,将预设时间周期的GRACE数据作为标签,使用LSTM神经网络通过网格点进行训练,得到训练后的模型参数;
模型预测,根据模型训练中训练得到的模型参数和筛选变量的20%作为测试数据集,通过网格点预测GRACE/GRACE-FO间断期TWSA数据以及比较验证的TWSA数据。
优选地,所述变量筛选中,GT方法的表达式为:
{x1(i),…,xm(i),yi}={(xi,yi):1≤i≤M}
其中,xi是输入向量,仅限于某个封闭的有界集标量yi是输出,M是模式的数量,m是输入参数的数量,输入x与其对应y的输出之间的关系可以表达为:
y=f(x)+r
其中,f是代表系统的某个平滑未知函数,r代表不确定的部分。
优选地,估计噪声变量r的方差Var(r),从最邻近的均方距离δ和统计量γ上的点拟合线性回归线:
γ=Aδ+Γ
其中,A是梯度,并以此回归线的截距估计Var(r),
该截距被称为伽马统计量,用Γ表示。
优选地,所述模型训练中,LSTM神经网络模型的架构包括Hochreiter和Schmidhuber,其表达式为:
It=σ(Wxixt+RiHt-1+bi)
Ft=σ(Wxfxt+RfHt-1+bf)
Ot=σ(Wxoxt+RoHt-1+bo)
Ht=Ottanh(Ct)
其中,It、Ft、Ot、Ct和Ht分别是时间t的输入、遗忘、输出门、候选记忆单元、单元状态向量和单元输出向量,Wxi、Wxf、Wxo和Wxc分别是来自输入、遗忘、输出门和候选记忆单元的输入权重参数,Ri、Rf、Ro和Rc分别是来自输入、遗忘、输出门和候选记忆单元的循环权重参数,bi、bf、bo和bc分别是来自输入、遗忘、输出门和候选记忆单元的偏置向量,σ表示门激活函数,tanh表示双曲正切函数。
优选地,所述LSTM神经网络模型的输入数据分别包括:蒸散量、植物冠层地表水、径流、降水、土壤水和温度。
优选地,所述模型预测中,取60个以上连续月份的GRACE TWSA数据作为训练数据集;取24个以上连续月份的GRACE-FO TWSA数据作为测试数据集。
优选地,所述模型训练中,所述预设时间周期设定为60个以上连续月份。
优选地,所述模型预测中,比较验证的TWSA数据时间周期设定为24个以上连续月份。
本发明提出的方法,为重建缺失的TWSA提供了有效手段,为间断期的洪涝灾害研究提供了可靠数据支撑。基于变量筛选重构模型的实施,可有效避免无关输入变量对模型精度的影响,提高重构GRACE/GRACE-FO间断期陆地水储量准确性。本发明的技术方案适合在相关技术领域推广应用。
附图说明
为了更清楚地说明本申请实施方式的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明变量筛选重构模型流程图;
图2是鄱阳湖流域位置及海拔示意图;
图3是鄱阳湖流域上GRACE/GRAEC-FO、LSTM和变量筛选重构模型的时间序列和散点图,其中(a)GRACE/GRAEC-FO、LSTM和变量筛选重构模型的TWSA时间序列;(b)LSTM重构结果与验证数据GRACE-FO的散点图;(c)变量筛选重构模型重构结果与验证数据GRACE-FO的散点图;
图4是模型预测结果与GRACE-FO数据之间PR、NSE和RMSE的空间分布图,其中(a-c)表示NVFRM和GRACE-FO数据之间的PR、NSE和RMSE,(d-f)表示LSTM和GRACE-FO数据之间的PR、NSE和RMSE;
图5是TWSA数据与降雨数据的关系示意图,其中(a)鄱阳湖流域STL分解的TWSA、降水和年际变化趋势,(b)TWSA线性趋势的空间分布,(c)降水线性趋势的空间分布;
图6是干旱严重程度指数分析示意图,其中(a)鄱阳湖流域DSI和降水异常图,(b)鄱阳湖流域DSI和scPDSI的时间序列图,(c)STL分解的年际趋势时间序列;
图7是鄱阳湖流域DSI的空间分布示意图,其中(a)9月、(b)10月、(c)11月、(d)12月;
图8是鄱阳湖流域洪水潜力指数分析示意图,其中(a)鄱阳湖流域FPI时间序列及STL分解年际变化趋势,(b)2002~2020年研究期间FPI的最大月值;
图9是鄱阳湖流域2016年3—8月FPI空间分布示意图,其中(a)3月、(b)4月、(c)5月、(d)6月、(e)7月、(f)8月;
图10是2017年5—9月鄱阳湖流域水体的空间分布示意图,其中(a)5月、(b)6月、(c)7月、(d)8月、(e)9月;
图11是2017年5—9月PLB水域面积、TWSA、降雨量和FPI的时间序列示意图,其中(a)水域面积、(b)陆地水储量异常、(c)降水、(d)洪水潜力指数。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
为使本申请实施方式的目的、技术方案和优点更加清楚,下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本申请保护的范围。
如图1所示,本发明基于变量筛选重构模型提高陆地水储量重构准确性方法,包括:
变量筛选,首先将气候、水文变量代入GT方法,计算输入变量组合的伽马统计量,并根据伽马统计量确定最佳输入变量组合;
模型训练,将变量筛选中得到的筛选变量的80%作为特征,将预设时间周期的GRACE数据作为标签,使用LSTM神经网络通过网格点进行训练,得到训练后的模型参数;
模型预测,根据模型训练中训练得到的模型参数和筛选变量的20%作为测试数据集,通过网格点预测GRACE/GRACE-FO间断期TWSA数据以及比较验证的TWSA数据。
如图2所示,鄱阳湖流域(Poyang Lake Basin,PLB)位于长江流域(Yangtze RiverBasin,YRB)东南部,流域面积约16.22万km2,占长江流域面积的9%。鄱阳湖位于研究区北部,是我国最大的淡水湖。PLB是一个重要的生态区,对长江流域的防洪和生物多样性保护至关重要。PLB属于亚热带湿润气候,年平均气温17~19°,年平均降水量112~2150mm。雨季为4~6月,占年总降水量的45%~50%。因此,降水的高时空变化导致频繁的洪涝灾害,对当地经济和生态环境造成巨大影响。
具体地,图3(a)展示了鄱阳湖流域上GRACE/GRAEC-FO、LSTM和变量筛选重构模型的TWSA时间序列。由图3(a)可知,LSTM和变量筛选重构模型在训练期的数据与GRACE数据相比是一致的,在测试期间预测的数据与GRACE-FO数据略有差异。
图3(b)和(c)可以得出LSTM和变量筛选重构模型与验证数据之间有相同的PR(0.91),但变量筛选重构模型的NSE(0.81)高于LSTM(0.78),且变量筛选重构模型的RMSE值(4.90cm)低于LSTM的RMSE(5.20cm)。为了更进一步比较LSTM和变量筛选重构模型,本发明使用了模拟和观测值之间的指标距离(Distance between Indices of Simulation andObservation,DISO),用于综合评价不同模型的优劣。根据定义,DISO值越小模型表现越好。经过计算,变量筛选重构模型的DISO值为0.09,LSTM模型的DISO值为1.41,变量筛选重构模型相比LSTM在综合指标DISO方面精度提高93%。这证明GT变量选择算法提高了模型预测精度,输入变量选择是基于数据驱动的TWSA重构模型中的必要步骤。阴影部分的范围描述了GRACE和GRACE-FO之间数据差距的模型预测结果。
模型预测结果和测试数据GRACE-FO之间的PR、NSE和RMSE的空间分布,如图4所示。
LSTM和变量筛选重构模型各项指标均表明鄱阳湖流域西部的预测效果最好(平均PR=0.86、NSE=0.65和RMSE=7.21cm),就整个流域而言,LSTM和变量筛选重构模型也得出了较好的性能(平均PR=0.81、NSE=0.56和RMSE=8.04cm)。
值得注意的是,图4中所标注区域的NVFRM(PR=0.86、NSE=0.67和RMSE=7.09cm)优于LSTM的结果(PR=0.86、NSE=0.64和RMSE=7.34cm)。可以得出在鄱阳湖流域,变量筛选重构模型相比LSTM、NSE和RMSE指标更优。
总体而言,本发明基于变量筛选重构模型数据驱动模型的预测结果具有更好的性能。本发明预测GRACE和GRACE-FO之间的差距的TWSA数据是可靠的。因此,本发明将预测的间断期数据整合到CSR-M数据中,并基于重建连续的TWSA数据分析鄱阳湖流域的旱涝特征。
图5(a)显示了鄱阳湖流域STL分解的TWSA、降水和年际趋势的时间变化。总体来看,2002-2020年降水量与TWSA具有较好的一致性(PR=0.65)。鄱阳湖流域TWSA以0.38cm/y的速度增加,降水增长的速率为0.14cm/y,TWSA增加受到降水增加的部分影响。STL分解年际变化清楚地揭示了TWSA时间序列的波动。如2003年、2011年和2019年出现年际下降趋势的时间序列,说明鄱阳湖流域可能发生干旱。此外,2010年、2012年和2016年出现了较高的年际趋势的时间序列,表明该地区可能发生了洪水。
图5(b)和图5(c)分别描绘了2002-2020年鄱阳湖流域TWSA和降水线性趋势的空间分布。可以明显看出鄱阳湖流域TWSA呈上升趋势,且整个流域的线性趋势均大于0。北部流域增幅较大(~0.59cm/y),而流域南部增幅较低(~0.25cm/y)。其原因可能与降水在空间分布上趋势相关,降水在北部流域呈较大的增长趋势(~0.28cm/y),在南部流域呈较小上升趋势(~0.03cm/y)。因此,降水的强度和持续时间与流域内旱涝的发生密切相关。
鄱阳湖流域DSI和降水异常如图6(a)所示。Liu等将干旱事件定义为DSI值连续三个月小于-0.8为一次干旱事件。灰色阴影表示DSI捕获的研究期间流域中的主要干旱事件。此外,从降水异常可以得出,干旱事件发生前和干旱事件发生时的负异常较多,说明此时的降水量小于同期,且很容易引发干旱。
图6(b)和图6(c)分别比较了鄱阳湖流域2002~2020年DSI和scPDSI的时间序列。除了2004~2010年期间,DSI和scPDSI之间的时间序列基本一致。DSI和scPDSI的时间序列(图6(b))和STL分解(图6(c))的年际趋势,相关系数分别为0.76和0.90。值得一提的是,DSI和scPDSI的年际变化趋势显示出较高的相关系数,这可能是由于STL分解排除了季节性和残差因素的影响。总体而言,DSI和scPDSI的干旱指数之间确定了很强的相关性,进一步证明了DSI指数的可靠性。
图6(b)2002-2020年鄱阳湖流域DSI从-2到2波动。根据DS I干旱事件的定义,确认了鄱阳湖流域2002~2020年4次干旱事件,确定的干旱事件与干旱新闻报道和中国政府发布的气候公报中的干旱记录一致(http://www.cma.gov.cn/)。2003年8月~2004年4月是该地区旱情持续时间最长的干旱,持续时间为11个月。2004年2月旱情最为严重,DSI为-2.2,达到极端干旱程度(D4)。在研究期间,DSI监测的最近干旱发生在2019年9月~2019年12月,2019年11月达到DSI峰值-1.7,发生极端干旱(D4)。
图7揭示干旱在空间上的变化过程。可以得出,鄱阳湖流域11月干旱最为严重。9~11月干旱逐渐加剧,北部流域由中度干旱(D2)转为极端干旱(D4)。12月,旱情减弱,流域大部分转为中重度干旱,但北部流域仍有极端干旱(D4)。
鄱阳湖流域FPI时间序列和STL分解的年际变化趋势如图8(a)所示,其特点是流域尺度季节性周期大,年际变化显著。图8(b)显示了2002~2020年研究期间FPI的最大月值。鄱阳湖流域6、7月份的FPI值分别为0.58和0.52,发生洪水的可能性较大。在此期间,有关部门要及时开展水资源管理,预防和减轻灾害带来的负面影响。为了更深入地了解FPI捕捉洪水事件的能力。本发明统计了研究期间每年FPI的最大值和发生时间。夏季(6~8月)的结果与图8(b)结果一致。
值得注意的是,鄱阳湖流域2016~2020年的FPI为0.58、0.51、-0.50、0.52和0.31,除了2018年,其他年份均发生了较大洪水,洪水发生频率显著增加。
通常,TWSA和降水是决定洪水发生的关键因素。由于较高的TWSA不能进一步储存额外的水,这可能导致雨季具有发生洪水的巨大潜力。本发明将重点关注最近一次2016年洪水的空间格局。
如图9所示,2016年3月~2016年8月FPI每月空间变化。3~4月,该地区大部分地区的FPI值较低,但该流域南部的洪水风险较高,FPI值平均约0.8。5月,中部FPI值最高约为0.9,高洪水潜力风险区向鄱阳湖流域中部移动。6月进入雨季后,高洪水风险蔓延至全区,大部分地区FPI均在0.5以上。最终,鄱阳湖流域除北部地区外,7~8月FPI逐渐降低到0.2以下,洪水强度开始下降。
本发明重点关注重建的间断期TWSA监测PLB的洪水事件。中国气候公报报道描述了2017年8月的洪水。因此,本发明基于GEE平台sentinel-1提取了2017年5月~2017年9月鄱阳湖流域水体的空间分布,如图10所示。结合图11(a)可以看出,5~7月,水体面积不断扩大,7月达到峰值为12188km2。随后,7~9月,鄱阳湖水域面积不断缩小。
图11显示了2017年5月~2017年9月PLB的水域、TWSA、降雨量和FPI的时间序列。从图11(d)可以看出,2017年8月FPI指数的幅度较大(0.32),这意味着该地区被洪水淹没。6月的过量降雨导致水体面积和TWSA在7月达到峰值,而由于该地区无法储存过多的水,8月较小的降雨过程导致洪水泛滥。这也有力地证明了本发明中重建的TWSA可以监测地区的洪水事件。
本发明的方法,考虑对输入变量进行选择来提高重构GRACE/GRACE-FO间断期陆地水储量的准确性。本发明旨在构建新型变量筛选重构模型,该模型利用伽马测试选择最优的输入变量组合,其次将优化后的变量组合输入到长短期神经网络中重构GRACE/GRACE-FO间断期陆地水储量。该模型的实施,可有效避免无关输入变量对模型精度的影响,提高重构GRACE/GRACE-FO间断期陆地水储量的准确性。
对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明实施例的精神或范围的情况下,在其他实施例中实现。因此,本发明实施例将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上仅为本发明实施例的较佳实施例而已,并不用以限制本发明实施例,凡在本发明实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (8)
1.基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,变量筛选重构模型结合了GT方法和LSTM神经网络的混合算法,包括:
变量筛选,首先将气候、水文变量代入GT方法,计算输入变量组合的伽马统计量,并根据伽马统计量确定最佳输入变量组合;
模型训练,将变量筛选中得到的筛选变量的80%作为特征,将预设时间周期的GRACE数据作为标签,使用LSTM神经网络通过网格点进行训练,得到训练后的模型参数;
模型预测,根据模型训练中训练得到的模型参数和筛选变量的20%作为测试数据集,通过网格点预测GRACE/GRACE-FO间断期TWSA数据以及比较验证的TWSA数据。
2.根据权利要求1所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述变量筛选中,GT方法的表达式为:
{x1(i),...,xm(i),yi}={(xi,yi):1≤i≤M}
其中,xi是输入向量,仅限于某个封闭的有界集标量yi是输出,M是模式的数量,m是输入参数的数量,输入x与其对应y的输出之间的关系可以表达为:
y=f(x)+r
其中,f是代表系统的某个平滑未知函数,r代表不确定的部分。
3.根据权利要求2所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,估计噪声变量r的方差Var(r),从最邻近的均方距离δ和统计量γ上的点拟合线性回归线:
γ=Aδ+Γ
其中,A是梯度,并以此回归线的截距估计Var(r),
该截距被称为伽马统计量,用Γ表示。
4.根据权利要求1所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述模型训练中,LSTM神经网络模型的架构包括Hochreiter和Schmidhuber,其表达式为:
It=σ(Wxixt+RiHt-1+bi)
Ft=σ(Wxfxt+RfHt-1+bf)
Ot=σ(Wxoxt+RoHt-1+bo)
Ht=Ottanh(Ct)
其中,It、Ft、Ot、Ct和Ht分别是时间t的输入、遗忘、输出门、候选记忆单元、单元状态向量和单元输出向量,Wxi、Wxf、Wxo和Wxc分别是来自输入、遗忘、输出门和候选记忆单元的输入权重参数,Ri、Rf、Ro和Rc分别是来自输入、遗忘、输出门和候选记忆单元的循环权重参数,bi、bf、bo和bc分别是来自输入、遗忘、输出门和候选记忆单元的偏置向量,σ表示门激活函数,tanh表示双曲正切函数。
5.根据权利要求4所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述LSTM神经网络模型的输入数据分别包括:蒸散量、植物冠层地表水、径流、降水、土壤水和温度。
6.根据权利要求1所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述模型预测中,取60个以上连续月份的GRACE TWSA数据作为训练数据集;取24个以上连续月份的GRACE-FO TWSA数据作为测试数据集。
7.根据权利要求1所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述模型训练中,所述预设时间周期设定为60个以上连续月份。
8.根据权利要求1所述的基于变量筛选重构模型提高陆地水储量重构准确性方法,其特征在于,所述模型预测中,比较验证的TWSA数据时间周期设定为24个以上连续月份。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310003863.3A CN116579224A (zh) | 2023-01-03 | 2023-01-03 | 基于变量筛选重构模型提高陆地水储量重构准确性方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310003863.3A CN116579224A (zh) | 2023-01-03 | 2023-01-03 | 基于变量筛选重构模型提高陆地水储量重构准确性方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116579224A true CN116579224A (zh) | 2023-08-11 |
Family
ID=87541872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310003863.3A Pending CN116579224A (zh) | 2023-01-03 | 2023-01-03 | 基于变量筛选重构模型提高陆地水储量重构准确性方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116579224A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117132023A (zh) * | 2023-10-23 | 2023-11-28 | 南京大学 | 基于可解释深度学习的区域陆地水储量变化归因分析方法 |
CN117610434A (zh) * | 2024-01-19 | 2024-02-27 | 武汉大学 | 一种融合人工智能的干旱指数重构方法及计算机可读介质 |
-
2023
- 2023-01-03 CN CN202310003863.3A patent/CN116579224A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117132023A (zh) * | 2023-10-23 | 2023-11-28 | 南京大学 | 基于可解释深度学习的区域陆地水储量变化归因分析方法 |
CN117132023B (zh) * | 2023-10-23 | 2024-02-02 | 南京大学 | 基于可解释深度学习的区域陆地水储量变化归因分析方法 |
CN117610434A (zh) * | 2024-01-19 | 2024-02-27 | 武汉大学 | 一种融合人工智能的干旱指数重构方法及计算机可读介质 |
CN117610434B (zh) * | 2024-01-19 | 2024-04-16 | 武汉大学 | 一种融合人工智能的干旱指数重构方法及计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Air quality predictions with a semi-supervised bidirectional LSTM neural network | |
CN116579224A (zh) | 基于变量筛选重构模型提高陆地水储量重构准确性方法 | |
Razmi et al. | Non-stationary frequency analysis of extreme water level: application of annual maximum series and peak-over threshold approaches | |
Zhang et al. | Impact of tropical cyclones on flood risk in southeastern China: Spatial patterns, causes and implications | |
Zhang et al. | Topography-based spatial patterns of precipitation extremes in the Poyang Lake basin, China: changing properties and causes | |
Liu et al. | A new statistical downscaling model for autumn precipitation in China | |
Wu et al. | The characteristics of regional heavy precipitation events over eastern monsoon China during 1960–2013 | |
Agilan et al. | Influence of threshold selection in modeling peaks over threshold based nonstationary extreme rainfall series | |
Cui et al. | Algorithm for identifying wind power ramp events via novel improved dynamic swinging door | |
CN111090934B (zh) | 基于雨量和空间划分的降水-径流-淹没模拟方法 | |
Zhang et al. | Estimating the grade of storm surge disaster loss in coastal areas of China via machine learning algorithms | |
CN117494586A (zh) | 一种基于深度学习的山洪时空预测方法 | |
Li et al. | A stepwise clustered hydrological model for addressing the temporal autocorrelation of daily streamflows in irrigated watersheds | |
Zhu et al. | Modeling the multiple time scale response of hydrological drought to climate change in the data-scarce inland river basin of Northwest China | |
Wu et al. | Increasing flood risk under climate change and social development in the Second Songhua River basin in Northeast China | |
Xu et al. | Two-stage hybrid model for hydrological series prediction based on a new method of partitioning datasets | |
Sun et al. | Flooding in the Yellow River Basin, China: Spatiotemporal patterns, drivers and future tendency | |
Liu et al. | Research on runoff process vectorization and integration of deep learning algorithms for flood forecasting | |
Ni et al. | Monthly precipitation prediction at regional scale using deep convolutional neural networks | |
Wang et al. | A Hybrid Model for Significant Wave Height Prediction Based on an Improved Empirical Wavelet Transform Decomposition and Long-short Term Memory Network | |
Cheng et al. | Rainfall frequency analysis using event-maximum rainfalls–An event-based mixture distribution modeling approach | |
Koirala et al. | SWAT and Wavelet analysis for understanding the climate change impact on hydrologic response | |
Chen et al. | A WaveNet-based convolutional neural network for river water level prediction | |
Han et al. | Shift in the migration trajectory of the green biomass loss barycenter in Central Asia | |
Upadhyay et al. | Translating the internal climate variability from climate variables to hydropower production |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |