CN117556695B - 一种基于深度学习的作物根层土壤含水量模拟方法 - Google Patents
一种基于深度学习的作物根层土壤含水量模拟方法 Download PDFInfo
- Publication number
- CN117556695B CN117556695B CN202311503095.4A CN202311503095A CN117556695B CN 117556695 B CN117556695 B CN 117556695B CN 202311503095 A CN202311503095 A CN 202311503095A CN 117556695 B CN117556695 B CN 117556695B
- Authority
- CN
- China
- Prior art keywords
- soil
- water content
- root
- data
- soil water
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000002689 soil Substances 0.000 title claims abstract description 255
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 184
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004088 simulation Methods 0.000 title claims abstract description 39
- 238000013135 deep learning Methods 0.000 title claims abstract description 21
- 238000011160 research Methods 0.000 claims abstract description 23
- 238000010219 correlation analysis Methods 0.000 claims abstract description 14
- 230000000694 effects Effects 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims description 31
- 238000001556 precipitation Methods 0.000 claims description 29
- 238000012544 monitoring process Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 11
- 230000003068 static effect Effects 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 9
- 239000004576 sand Substances 0.000 claims description 7
- 239000000843 powder Substances 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 239000004927 clay Substances 0.000 claims description 4
- 238000007637 random forest analysis Methods 0.000 claims description 4
- 101100305901 Mus musculus Rnase2b gene Proteins 0.000 claims description 3
- 238000004457 water analysis Methods 0.000 claims description 3
- 230000007547 defect Effects 0.000 abstract description 6
- 238000009826 distribution Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 238000005259 measurement Methods 0.000 description 6
- 238000012876 topography Methods 0.000 description 6
- 230000001186 cumulative effect Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013439 planning Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 230000002262 irrigation Effects 0.000 description 2
- 238000003973 irrigation Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 101000794020 Homo sapiens Bromodomain-containing protein 8 Proteins 0.000 description 1
- 101001006782 Homo sapiens Kinesin-associated protein 3 Proteins 0.000 description 1
- 101000615355 Homo sapiens Small acidic protein Proteins 0.000 description 1
- WGKGADVPRVLHHZ-ZHRMCQFGSA-N N-[(1R,2R,3S)-2-hydroxy-3-phenoxazin-10-ylcyclohexyl]-4-(trifluoromethoxy)benzenesulfonamide Chemical compound O[C@H]1[C@@H](CCC[C@@H]1N1C2=CC=CC=C2OC2=C1C=CC=C2)NS(=O)(=O)C1=CC=C(OC(F)(F)F)C=C1 WGKGADVPRVLHHZ-ZHRMCQFGSA-N 0.000 description 1
- 102100021255 Small acidic protein Human genes 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000004836 empirical method Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000002352 surface water Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Geometry (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度学习的作物根层土壤含水量模拟方法,包括收集研究区的影响因子;将各影响因子和根层土壤含水量进行时间和空间上的相关性分析,计算各影响因子对根层土壤含水量模拟的重要度,确定模型最终的输入因子;构建区域根层土壤含水量模型;将ERA5原始数据集浅层土壤含水量数据和对应的气候、下垫面影响因子资料输入到区域根层土壤含水量模型中逐栅格进行模拟,模拟获得研究区ERA5根层土壤含水量数据集。本发明针对站点实测根层土壤含水量数据非实时不连续且成本高、遥感反演产品精度较低的不足,将高精度的站点数据和ERA5实时连续的反演数据的优势相结合模拟根层土壤含水量,获取精度较高且实时连续的区域根层土壤含水量信息。
Description
技术领域
本发明属于地球物理下遥感水文应用技术领域,具体涉及一种基于深度学习的作物根层土壤含水量模拟方法。
背景技术
土壤水影响着从区域到全球范围的水循环过程,获取实时准确的土壤水时空分布信息在干旱监测、农业灌溉和水资源管理等方面具有重要意义。传统的站点监测土壤水数据精度高,但获取成本大且不连续,而卫星遥感技术虽然可以获取连续实时的数据,但只能提供0-10cm深度的土壤水信息,阻碍了其在现代农业中的应用和推广。研究浅层与根层土壤含水量之间的关系,结合地面监测和遥感土壤水信息模拟实时连续的根层土壤含水量资料是完善土壤水信息的关键技术手段。
目前主要利用统计分析、物理模型和数据同化等方法由浅层土壤含水量推求根层土壤含水量数据。Pan FF等在文献Application of a soil moisture diagnosticequation for estimating root-zone soil moisture in arid and semi-arid regions[J].Journal of Hydrology,2015,524:296-310(该文献SCI的doi号为10.1016/j.jhydrol.2015.02.044)中提出的干旱和半干旱土壤水分诊断方程受限于参数的区域代表性。Clark MP等在文献Hydrological data assimilation with the ensemble Kalmanfilter:Use of streamflow observations to update states in a distributedhydrological model[J].Advances In Water Resources,2008,31(10):1309-1324(该文献SCI的doi号为10.1016/j.advwatres.2008.06.005)中提出的卡尔曼滤波同化算法无法很好地提取和分析浅层土壤含水量和根层土壤含水量之间的非线性关系。Baldwin D等在文献Estimating Root Zone Soil Moisture Across the Eastern United States withPassive Microwave Satellite Data and a Simple Hydrologic Model[J].RemoteSensing,2019,11(17)(该文献SCI的doi号为10.3390/rs11172013)提出的物理模型在估算根层土壤含水量时只考虑了土壤特性,而缺少对根层土壤含水量有着显著影响的气候、下垫面等因素的考虑。
为此,亟需发展不受参数区域限制、实时连续,且综合考虑多种影响因素作用并准确反应其非线性关系的根层土壤含水量模拟方法,为现代化农业水资源管理和维系生态系统良性循环提供数据支撑。
发明内容
本发明的目的在于克服现有技术受限于参数的区域代表性、站点实测土壤水数据不适用于大范围研究、遥感反演产品精度较低等不足,而提供一种将实时连续的全球尺度产品、高精度的站点观测数据以及气候、下垫面因子时空变化特征结合起来,利用LSTM深度学习算法构建区域模型推求根层土壤含水量数据的方法。
本发明采用如下技术方案:
一种基于深度学习的作物根层土壤含水量模拟方法,包括以下步骤:
步骤一:收集研究区土壤水监测站点土壤水含量数据、气候和下垫面资料作为影响因子,土壤水含量数据包括0-10cm浅层土壤含水量和30-40cm根层土壤含水量,站点数据按时间序列整理,空间数据按研究区矢量边界裁剪;
步骤二:将步骤一收集的浅层土壤含水量、气候和下垫面影响因子按是否随时间显著变化分为动态因子和静态因子,动态因子、静态因子都和根层土壤含水量分别进行时间和空间上的相关性分析,并计算各影响因子对根层土壤含水量模拟的重要度,确定模型最终的输入因子;
步骤三:构建区域根层土壤含水量模型,在步骤一的土壤水监测站点随机抽取一部分作为训练集,一部分作为测试集,将训练集中经步骤2确定的输入因子作为LSTM深度学习算法的输入,对应的30-40cm根层土壤含水量作为输出,训练LSTM深度学习算法,训练时是采用统计指标来定量评价模型对根层土壤水模拟的精度;测试时,将测试集中经步骤2确定的输入因子作为LSTM深度学习算法的输入,输出30-40cm根层土壤含水量的模拟值,将输出的根层土壤含水量模拟值与测试站点的实测数据进行对比,采用统计指标来定量评价模型对根层土壤含水量模拟的精度;
对不同的研究区域,模型的输入因子会不同,需要先进行重要度和相关性分析进行筛选。
步骤四:获取研究区逐日ERA5全球土壤水再分析数据集,根据土壤层深度比例将ERA5再分析数据集转化为0-10cm的土壤水数据作为ERA5原始数据集;
步骤五:将步骤四ERA5原始数据集0-10cm浅层土壤含水量数据和对应的气候、下垫面影响因子资料输入到步骤三的区域根层土壤含水量模型中逐栅格进行模拟,模拟获得研究区ERA5 30-40cm根层土壤含水量数据集。
卡尔曼滤波虽然在推求根层土壤水研究中应用较多,但在非线性系统和高计算需求中存在缺陷,申请号为202111548225.7的发明专利主要是针对卡尔曼滤波法计算量较大、处理更新慢的缺陷,通过ERA5率定参数T,根据实时更新的SMAP L3表层水数据模拟得到根层土壤水,参数T物理含义不明确,需要通过经验法获取,而且地形、植被和土壤空间异质性的体现不够明显和确切,本发明将地形、植被和土壤的影响量化,量化各影响因子对根层土壤水的影响,并在构建模型时考虑了这些因子,本发明构建的深度学习模型可以有效处理非线性关系。
站点尺度上的实测数据在时间和空间上都是不连续的,只靠站点监测无法获取面上的土壤水分布信息,因此需要借助遥感产品。在站点尺度上建立根层土壤水和浅层土壤水之间的联系,再由遥感再分析产品的浅层土壤水去模拟推求区域尺度上的根层土壤水,可以获取精度相对较高的根层土壤水数据。本发明实施例通过利用反距离加权法IDW,将步骤四ERA5原始根层土壤含水量数据和步骤五ERA5模拟根层土壤含水量数据插值到步骤三的测试站点上,将插值到测试站点的ERA5原始根层土壤含水量数据和ERA5模拟根层土壤含水量数据与测试站点实测数据序列进行对比,验证了本方法的模拟精度。
优选地,步骤一中影响因子包括:土壤水监测站点0-10cm土壤含水量、降水、气温、相对湿度、风速、日照时数、大气压、土壤容重、砂粒含量、粘粒含量、粉粒含量、数字高程、坡度、坡向、纬度、植被指数和土地利用/土地覆盖类型,降水包括当日降水量和多日累积降水量。
本发明充分考虑区域气候变化特征和下垫面空间异质性,利用浅层土壤含水量和构建的区域模型反演根层土壤含水量信息,得到区域实时连续的高精度根层土壤含水量序列。
进一步地,步骤一中地面监测站土壤水数据的单位是重量含水率(g/g),为了和ERA5再分析产品的体积含水率单位(cm3/cm3)保持一致,因此需要进行单位转换,计算公式如下:
SMv=SMg×ρ
其中,SMv为体积含水率(cm3/cm3),SMg为重量含水率(g/g);ρ为土壤容重(g/cm3)。
进一步地,步骤二中对步骤一收集的浅层土壤含水量(0-10cm)、气候和下垫面影响因子,动态因子和根层土壤含水量进行时间上的相关性分析,静态因子和根层土壤含水量进行空间上的相关性分析,并利用随机森林法计算各影响因子对根层土壤含水量模拟的重要度(Feature Importance,FI),确定模型最终的输入因子。其核心算法是随机对袋外数据(OOB)所有样本的特征X加入噪声干扰,然后计算加入干扰前后的袋外数据误差的差值。特征X的重要性计算公式如下:
FI=(OBB_eer2-OBB_eer1)/n
其中,OBB_eer1和OBB_eer2分别为样本特征加入噪声干扰前后的袋外数据误差,n为树的总棵数。当给某个特征X随机加入噪声后,袋外的准确率大幅度下降,则说明该特征对根层土壤含水量模拟的影响较大,特征重要度较高。
优选地,步骤三中所述统计指标为相关系数(Correlation Coefficient,CC)、平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)和无偏均方根误差(Unbiased Root Mean Square Error,ubRMSE)4个统计指标来定量评价模型对根层土壤水模拟的精度。计算公式分别如下:
其中,yi和分别表示第i时刻观实测和模拟的根层土壤含水量(m3/m3);/>和/>分别表示实测观测和模拟的根层土壤含水量平均值(m3/m3);N为数据序列长度。
进一步地,步骤四中获取逐日ERA5全球土壤水再分析数据集,空间分辨率为10km,根据土壤层深度比例将ERA5再分析数据集0-7cm、7-28cm和28-100cm的土壤湿度数据转化为0-10cm的土壤水数据作为ERA5原始数据集,用于根层土壤含水量模型的输入(0-10cm),ERA5原始数据集0-10cm浅层土壤含水量计算公式如下:
式中,ERA50~10cm为EAR5原始数据集0-10cm土壤含水量(m3/m3),sm0~7cm为ERA5产品的第一层土壤含水量数据(m3/m3),sm7~28cm为ERA5产品的第二层土壤含水量数据(m3/m3),Z1为第一层土壤深度(7cm),Z为待计算土层的最大深度(10cm)。
本发明的有益效果在于:
本发明基于LSTM深度学习算法构建的区域根层土壤含水量模型可以有效捕捉输入序列中的非线性关系,对内部气候、干湿条件、土地利用类型等具有显著差异的地区有很好的适用性,对研究区复杂的气候变化特征和下垫面空间异质性具有很好的包容性,可以灵活地增加自变量,不受限于参数区域代表性的同时可以很好地反应整个研究区的根层土壤含水量运动特征,从而获取精度较高且实时连续的区域根层土壤含水量信息。
本发明方法针对站点实测数据非实时、不连续且成本高、遥感反演产品根层土壤含水量数据精度较低的局限性,将站点监测和遥感反演的优势相结合模拟根层土壤含水量数据,对不同尺度的输入数据具有较好的适应性,保证精度的同时节约了数据获取的成本。利用实时更新的ERA5再分析产品浅层土壤含水量数据作为输入模拟大范围的根层土壤含水量数据,有效解决了根层土壤含水量信息获取慢的不足,提高了数据获取的时效性,同时区域根层土壤含水量模型可用于反演无资料区域的根层土壤含水量数据,克服了传统参数移植法精度下降的局限性,对于农业规划和管理均具有一定的理论价值和实践意义。
附图说明
图1为实施例1的流程图;
图2为实施例1中黄河流域地形和土壤水观测站点位置分布图;
图3为实施例1中站点实测根层土壤含水量和动态影响因子的相关性分析图;
图4为实施例1中站点实测根层土壤含水量和静态影响因子的相关性分析图;
图5为实施例1中不同种类影响因子对根层土壤含水量模拟的重要度;
图6为实施例1中模型训练集和测试集的模拟结果;
图7为实施例1中ERA5原始数据集和ERA5模拟数据集根层土壤含水量(30-40cm)的空间分布对比图;
图8为实施例2中ERA5原始数据集根层土壤含水量和ERA5模拟数据集根层土壤含水量插值到测试站点后和实测数据对比得到的相关系数CC、平均绝对误差MAE、均方根误差RMSE和无偏均方根误差ubRMSE的概率密度曲线图。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案作进一步阐述。
实施例1
本发明实施例选择以黄河流域为例,流域面积79.5万平方公里,土地资源丰富。图2为本发明实施例的黄河流域地形和136个人工土壤水监测站点位置分布,流域内不同地区气候差异显著,季节温差悬殊,降水年内分配不均,主要跨越了半湿润区、半干旱区和干旱区,土地利用涵盖耕地、林地、草地和混合用地四种类型。研究作物根层土壤含水量的模拟对粮食生产、水资源管理以及黄河流域高质量发展均具有重要意义。
本实施例基于水利部信息中心提供的136个人工土壤水监测站点数据,中国气象网提供的逐日气象资料,联合国粮食及农业组织提供的土壤容重数据,中国科学院资源环境科学与数据中心提供的土地利用栅格数据、土壤质地数据等,对影响因子和根层土壤含水量数据分别进行时间和空间上的相关性分析和重要度计算,并划分训练集和测试集对LSTM算法进行训练和测试,构建区域根层土壤含水量模型。在此基础上,利用欧洲中期天气预报中心ECMWF提供的ERA5再分析土壤水数据集,联合率定好的根层土壤含水量模型生成研究区连续实时的高精度根层土壤含水量数据,模拟结果的准确性通过对比土壤水站点实测数据进行评估。
如图1所示,本实施例的具体方法为:
步骤一:收集黄河流域内人工土壤水监测站点0-10cm浅层土壤含水量(SurfaceSM)和30-40cm根层土壤含水量旬数据(2006-2017),下载流域内部及周边气象站点的气象数据(2006-2017),包括当日降水(PRE)、气温(TEM)、相对湿度(RHU)、风速(WIN)、日照时数(SSD)和大气压(PRS),计算3日(PRE3)、5日(PRE5)、7日(PRE7)和10日(PRE10)累积降水量,并统计整理为旬序列;下载植被指数NDVI(2006-2017)数据,按照黄河流域矢量边界剪裁后,统计整理为旬序列;下载土壤质地(砂粒含量、粘粒含量、粉粒含量)、土壤容重数据、2010年土地利用/土地覆盖和高程DEM并计算坡度和坡向,按黄河流域矢量边界剪裁后和土壤水站点对应。
图2为黄河流域地形和土壤水观测站点位置分布图,流域中游和下游站点比上游站点分布更加密集,总体上人工土壤水监测站点的数据在黄河流域具有较好的空间分布。
将地面监测站点土壤水实测数据的单位由重量含水率(g/g)转化为体积含水率单位(cm3/cm3),转化公式为:
SMv=SMg×ρ
其中,SMv为体积含水率(cm3/cm3),SMg为重量含水率(g/g);ρ为土壤容重(g/cm3)。
步骤二:将根层土壤含水量的影响因子按是否随时间显著变化分为动态因子和静态因子,动态因子和根层土壤含水量进行时间上的相关性分析,静态因子和根层土壤含水量进行空间上的相关性分析,利用随机森林法计算各影响因子对根层土壤含水量影响的重要度(Feature Importance,FI),确定模型最终的输入因子。
随机森林法的核心算法是随机对袋外数据(OOB)所有样本的特征X加入噪声干扰,然后计算加入干扰前后的袋外数据误差的差值。特征X的重要性计算公式如下:
FI=(OBB_eer2-OBB_eer1)/n
其中,OBB_eer1和OBB_eer2分别为样本特征加入噪声干扰前后的袋外数据误差,n为树的总棵数。当给某个特征X随机加入噪声后,袋外的准确率大幅度下降,则说明该特征对根层土壤含水量模拟的影响较大,特征重要度较高。
图3为站点实测根层土壤含水量和动态影响因子的相关性分析图,动态影响因子包括浅层土壤含水量、当日降水量、多日累积降水量、气温、相对湿度、风速、日照时数、大气压和NDVI;静态影响因子包括土壤容重、砂粒含量、粘粒含量、粉粒含量、高程、坡度、坡向和纬度。
黄河流域根层土壤含水量(30-40cm)和浅层土壤含水量(0-10cm)的相关性最高,相关系数的平均值达0.70(显著性水平p<0.001)。在所有气候因子中,10天累积降水量(PRE10)的相关系数最高,根层土壤含水量与温度(TEM)、风速(WIN)、日照时数(SSD)均呈现显著的负相关性(显著性水平p<0.001)。图4为站点实测根层土壤含水量和静态影响因子的相关性分析图,黄河流域根层土壤含水量与土壤质地(砂粒含量和粘粒含量)和地形(DEM和纬度)显著相关,相关系数分别为-0.28、0.40、-0.39和-0.52(显著性水平p<0.001)。
图5为不同种类影响因子对根层土壤含水量模拟的重要度,浅层土壤含水量(0-10cm)的重要度最高,达66.8%,气候因子(包括当日降水量和多日累积降水量、气温、相对湿度、风速、日照时数、大气压)在重要度中排名第二,占18.8%,其次是地形(包括数字高程、坡度、坡向、纬度)、植被(包括植被指数、土地利用/土地覆盖)和土壤(包括土壤容重、砂粒含量、粘粒含量、粉粒含量),共占了14.4%。因此,在模拟根层土壤含水量的过程中,需要考虑下垫面(地形、植被和土壤)空间异质性的影响。
基于影响因子的时间和空间相关性分析以及重要度分析,最终确定本实施例的模型输入因子包括:浅层土壤含水量(Surface SM)、5天累积降水量(PRE5)、7天累积降水量(PRE7)、10天累积降水量(PRE10)、气温(TEM)、风速(WIN)、日照时数(SSD)、相对湿度(RHU)、大气压(PRS)、NDVI、土壤质地(砂粒含量、粘粒含量、粉粒含量)、土地利用/土地覆盖、数字高程和纬度。
步骤三:在本实施例的136个土壤水站点中,随机抽取95个站点用于训练(共20118组数据),41个站点用于测试(共9062组数据)。选择LSTM深度学习算法为研究工具进行训练和测试,构建区域根层土壤含水量模型。本发明利用所有训练站点的数据构建区域根层土壤含水量模型,而不是传统参数移植方法,只针对某一站点构建模型再去移植。
训练时,LSTM的输入是训练集中经步骤2确定的输入因子,输出是30-40cm根层土壤含水量。
测试时,LSTM的输入是测试集中经步骤2确定的输入因子,输出是30-40cm根层土壤含水量,将输出的根层土壤含水量与测试站点的实测数据进行对比。
训练和测试时,都采用相关系数(Correlation Coefficient,CC)、平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)和无偏均方根误差(Unbiased Root Mean Square Error,ubRMSE)4个统计指标来定量评价模型对根层土壤含水量模拟的精度。计算公式如下:
其中,yi和分别表示第i时刻实测和模拟的根层土壤含水量(m3/m3);/>和/>分别表示实测和模拟的根层土壤含水量平均值(m3/m3);N为数据序列长度。在统计学里,当CC值越接近1的同时,MAE、RMSE、和ubRMSE越小,表示模拟值和实测值越接近,即精度越高。
图6为实施例中模型训练集和测试集的模拟结果,如图6中(a)、(b)所示,训练集和测试集根层土壤含水量的实测值和模拟值散点都均匀的分布在1-1线两侧,测试集的相关系数CC达到0.84,平均绝对误差MAE、均方根误差RMSE和无偏均方根误差分别为0.028、0.037和0.037。如图6中(c)、(d)所示,小提琴图的左右两边分别代表着实测值和模拟值的分布情况,小提琴图也呈现出很好的镜像对称形状,这意味着模型适用性较高。
步骤四:从ECMWF数据中心下载10km逐日的ERA5再分析土壤水数据集(2006-2017),按黄河流域矢量边界裁剪得到研究区的逐日土壤水数据序列。根据土壤层深度比例将ERA5再分析数据集0-7cm、7-28cm和28-100cm的土壤湿度数据转化为0-10cm和30-40cm的土壤水数据作为ERA5原始数据集,分别用于根层土壤含水量模型的输入(0-10cm)和结果对比(30-40cm),ERA5原始数据集0-10cm浅层土壤含水量计算公式如下:
式中,ERA50~10cm为EAR5原始数据集0-10cm土壤含水量(m3/m3),sm0~7cm为ERA5产品的第一层土壤含水量(m3/m3),sm7~28cm为ERA5产品的第二层土壤含水量(m3/m3),Z1为第一层土壤深度(7cm),Z为待计算土层的最大深度(10cm)。在默认情况下,同一土壤层的含水量是恒定的,因此直接将ERA5产品的第三层(28-100cm)土壤含水量作为ERA5原始数据集的根层土壤含水量(30-40cm)。
步骤五:将ERA5原始数据集0-10cm浅层土壤含水量数据和对应的气候、下垫面(包括植被、土壤和地形)因子资料输入到步骤三的区域根层土壤含水量模型中逐栅格进行模拟,模拟获得研究区ERA5根层土壤含水量数据集(30-40cm)。
图7为实施例中ERA5原始根层土壤含水量(图中(a)所示)和步骤五得到的ERA5模拟根层土壤含水量(图中(b)所示)空间分布的对比图,模型模拟得到的ERA5根层土壤含水量的空间分布与ERA5原始数据总体一致,表明模拟结果能够有效反映黄河流域根层土壤含水量的空间分布规律。
实施例2
本实施例利用反距离加权法IDW(Inverse Distance Weighed),将步骤四ERA5原始根层土壤含水量数据和步骤五ERA5模拟根层土壤含水量数据插值到步骤三的41个测试站点上。计算公式如下:
其中,表示临近栅格点插值到测试站点后的土壤含水量(m3/m3),Z(xi,yi)表示各临近栅格点的土壤含水量(m3/m3),n为选取的临近栅格点个数,λi表示栅格i的权重,计算公式如下:
其中,di表示栅格i的中心(xi,yi)到测试站点(x0,y0)的距离。
将插值到测试站点的ERA5原始根层土壤含水量数据和ERA5模拟根层土壤含水量数据与测试站点实测数据序列进行对比,验证模拟结果的精度。
为了逻辑上更清晰的展示以上实施例的做法和目的,实施例2的方法流程画在实施例1的方法流程图上。
图8为实施例中ERA5原始根层土壤含水量和ERA5模拟根层土壤含水量数据插值到测试站点后,和测试站点实测根层土壤含水量数据序列对比得到的统计指标概率密度曲线图。与ERA5原始根层土壤含水量数据相比,ERA5模拟的黄河流域根层土壤含水量数据的CC均值(图中(a)所示)提高了16.5%,误差指标MAE(图中(b)所示)、RMSE(图中(c)所示)和ubRMSE(图中(d)所示)的均值分别降低了20.0%、26.3%和31.4%,表明区域模型模拟的数据集可以更好地捕捉研究区根层土壤含水量的变化,精度提升效果显著。
图8中ERA5-provided是ERA5原始的30-40cm根层土壤含水量数据,ERA5-derived是模拟生成的30-40cm根层土壤含水量数据,这两套数据都是连续大范围的数据集,实测根层土壤水数据是不连续的,只是用来对比精度。
本发明提出的方法并不仅限于某个特定的区域,构建的区域模型可以较好地适应研究区内多变的气候特征和下垫面条件,因为传统的参数移植方法是在有资料的站点进行参数率定,再依据距离相近或物理相似的原则移植到无资料区域进行模拟,由于收集的有资料站点特征无法保证和移植对象完全一样,移植过程多少都会造成精度的降低,比如参数是在湿润区率定的,当到干旱区研究时就不再适用,而本方法构建的区域模型避免了这种缺陷,相当于构建了一个适用于整个研究区的模型,可以模拟研究区内任何无资料子区间的数据。如实施例中的黄河流域涵盖了不同气候类型(温带大陆性气候、温带季风气候等),和土地利用类型(耕地、草地、林地等),但依然可以取得很好的模拟效果。因此,本方法构建的区域根层土壤含水量模型对气候和下垫面条件较为复杂的区域具有很好的包容性,可有效减少传统参数移植法产生的误差,解决参数区域代表性问题。
本方法基于具有记忆单元的LSTM深度学习算法,可以有效捕捉输入序列中的非线性关系,同时构建的区域模型将浅层土壤含水量、气候变化特征和下垫面空间异质性均考虑进去,可以准确获取根层土壤含水量的动态变化。本方法利用ERA5再分析产品的浅层土壤含水量反演根层土壤含水量数据,为获取实时连续的高精度根层土壤含水量信息提供了可行的思路。在当前现代化农业的发展过程中,本发明提出的方法可为遥感反演根层土壤含水量数据在区域农业规划、播种和灌溉等一系列活动中的应用提供技术和数据支撑,为区域农业水资源规划和管理提供理论依据。
需要说明的是,以上具体实施方式及实施例是对本发明提出的优选实施方式,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在本技术方案基础上所做的任何等同变化或等效的改动,均仍属于本发明技术方案保护的范围。
Claims (6)
1.一种基于深度学习的作物根层土壤含水量模拟方法,其特征在于,包括以下步骤:
步骤一:收集研究区土壤水监测站点土壤水含量数据、气候和下垫面资料作为影响因子,土壤水含量数据包括0-10cm浅层土壤含水量和30-40cm根层土壤含水量,站点数据按时间序列整理,空间数据按研究区矢量边界裁剪;
步骤二:将步骤一收集的浅层土壤含水量、气候和下垫面影响因子按是否随时间显著变化分为动态因子和静态因子,动态因子和根层土壤含水量进行时间上的相关性分析,静态因子和根层土壤含水量进行空间上的相关性分析,并计算各影响因子对根层土壤含水量模拟的重要度,确定模型最终的输入因子;
步骤三:构建区域根层土壤含水量模型,在步骤一的土壤水监测站点中随机抽取70%作为训练集,其余30%作为测试集,将训练集中经步骤2确定的输入因子作为LSTM深度学习算法的输入,对应的30-40cm根层土壤含水量作为输出,训练LSTM深度学习算法,训练时是采用统计指标来定量评价模型对根层土壤水模拟的精度;测试时,将测试集中经步骤2确定的输入因子作为LSTM深度学习算法的输入,输出30-40cm根层土壤含水量的模拟值,将输出的根层土壤含水量模拟值与测试站点的实测数据进行对比,采用统计指标来定量评价模型对根层土壤含水量模拟的精度;
步骤四:获取研究区逐日ERA5全球土壤水再分析数据集,根据土壤层深度比例将ERA5再分析数据集转化为0-10cm的土壤水数据作为ERA5原始数据集;
步骤五:将步骤四ERA5原始数据集0-10cm浅层土壤含水量数据和对应的气候、下垫面影响因子资料输入到步骤三的区域根层土壤含水量模型中逐栅格进行模拟,模拟获得研究区ERA5 30-40cm根层土壤含水量数据集。
2.根据权利要求1所述的一种基于深度学习的作物根层土壤含水量模拟方法,其特征在于,步骤三中所述统计指标为相关系数CC、平均绝对误差MAE、均方根误差RMSE和无偏均方根误差ubRMSE。
3.根据权利要求1所述的一种基于深度学习的作物根层土壤含水量模拟方法,其特征在于,步骤四:将ERA5再分析数据集转化为0-10cm的土壤水数据的转换公式为:
式中,ERA50~10cm为EAR5原始数据集0-10cm的土壤含水量,sm0~7cm为ERA5产品的第一层土壤含水量,sm7~28cm为ERA5产品的第二层土壤含水量,Z1为第一层土壤深度,即7cm,Z为待计算土层的最大深度,即10cm。
4.根据权利要求1所述的一种基于深度学习的作物根层土壤含水量模拟方法,其特征在于,在步骤一中,需将地面监测站点数据的重量含水率单位,转化成体积含水率单位,转化公式如下:
SMv=SMg×ρ
其中,SMv为体积含水率,单位为cm3/cm3,SMg为重量含水率,单位为g/g;ρ为土壤容重,单位为g/cm3。
5.根据权利要求1所述的一种基于深度学习的作物根层土壤含水量模拟方法,其特征在于,在步骤二中,选用随机森林法计算影响因子对根层土壤含水量模拟的重要度。
6.根据权利要求1所述的一种基于深度学习的作物根层土壤含水量模拟方法,其特征在于,步骤一中影响因子包括:
土壤水监测站点0-10cm土壤含水量、降水、气温、相对湿度、风速、日照时数、大气压、土壤容重、砂粒含量、粘粒含量、粉粒含量、数字高程、坡度、坡向、纬度、植被指数和土地利用/土地覆盖类型,降水包括当日降水量和多日累积降水量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311503095.4A CN117556695B (zh) | 2023-11-11 | 2023-11-11 | 一种基于深度学习的作物根层土壤含水量模拟方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311503095.4A CN117556695B (zh) | 2023-11-11 | 2023-11-11 | 一种基于深度学习的作物根层土壤含水量模拟方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117556695A CN117556695A (zh) | 2024-02-13 |
CN117556695B true CN117556695B (zh) | 2024-05-14 |
Family
ID=89815874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311503095.4A Active CN117556695B (zh) | 2023-11-11 | 2023-11-11 | 一种基于深度学习的作物根层土壤含水量模拟方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117556695B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111307643A (zh) * | 2019-04-04 | 2020-06-19 | 西北大学 | 一种基于机器学习算法的土壤水分预测方法 |
CN112287294A (zh) * | 2020-09-10 | 2021-01-29 | 河海大学 | 一种基于深度学习的时空双向土壤含水量插值方法 |
CN112529315A (zh) * | 2020-12-17 | 2021-03-19 | 杭州鲁尔物联科技有限公司 | 一种滑坡的预测方法、装置、设备和存储介质 |
CN113866391A (zh) * | 2021-09-29 | 2021-12-31 | 天津师范大学 | 深度学习模型预测因素解释方法及其在土壤含水量预测中的应用 |
CN114239274A (zh) * | 2021-12-17 | 2022-03-25 | 水利部交通运输部国家能源局南京水利科学研究院 | 多源遥感数据驱动指数滤波模型推求根层土壤水的方法 |
CN116542428A (zh) * | 2023-07-05 | 2023-08-04 | 中国科学院地理科学与资源研究所 | 一种区域灌溉需水量估算方法及装置 |
-
2023
- 2023-11-11 CN CN202311503095.4A patent/CN117556695B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111307643A (zh) * | 2019-04-04 | 2020-06-19 | 西北大学 | 一种基于机器学习算法的土壤水分预测方法 |
CN112287294A (zh) * | 2020-09-10 | 2021-01-29 | 河海大学 | 一种基于深度学习的时空双向土壤含水量插值方法 |
CN112529315A (zh) * | 2020-12-17 | 2021-03-19 | 杭州鲁尔物联科技有限公司 | 一种滑坡的预测方法、装置、设备和存储介质 |
CN113866391A (zh) * | 2021-09-29 | 2021-12-31 | 天津师范大学 | 深度学习模型预测因素解释方法及其在土壤含水量预测中的应用 |
CN114239274A (zh) * | 2021-12-17 | 2022-03-25 | 水利部交通运输部国家能源局南京水利科学研究院 | 多源遥感数据驱动指数滤波模型推求根层土壤水的方法 |
CN116542428A (zh) * | 2023-07-05 | 2023-08-04 | 中国科学院地理科学与资源研究所 | 一种区域灌溉需水量估算方法及装置 |
Non-Patent Citations (2)
Title |
---|
长短期记忆神经网络在多时次土壤水分动态预测中的应用;范嘉智 等;《土壤》;20201215;209-216 * |
集合卡尔曼滤波数据同化方法改进土壤水分模拟效果;陈鹤;杨大文;刘钰;张宝忠;;农业工程学报;20160123(第02期);107-112 * |
Also Published As
Publication number | Publication date |
---|---|
CN117556695A (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111651885B (zh) | 一种智慧型海绵城市洪涝预报方法 | |
CN111727443B (zh) | 一种基于深度神经网络的土壤速效养分反演方法 | |
CN110751094B (zh) | 一种基于gee综合遥感影像和深度学习方法的作物估产方法 | |
Abushandi et al. | Modelling rainfall runoff relations using HEC-HMS and IHACRES for a single rain event in an arid region of Jordan | |
Jain et al. | Simulation of runoff and sediment yield for a Himalayan watershed using SWAT model | |
CN105912836B (zh) | 一种纯遥感数据驱动的流域水循环模拟方法 | |
Zhang et al. | Accessible remote sensing data based reference evapotranspiration estimation modelling | |
Hassan | Climate change impact on groundwater recharge of Umm er Radhuma unconfined aquifer Western Desert, Iraq | |
CN114462518B (zh) | 考虑多要素空间依赖性的区域蒸散发变化归因分析方法 | |
Bonumá et al. | Hydrology evaluation of the Soil and Water Assessment Tool considering measurement uncertainty for a small watershed in Southern Brazil | |
CN109657988B (zh) | 基于hasm和欧氏距离算法的烟叶品质分区方法 | |
CN104361523A (zh) | 一种基于gis的分布式稻田氮素径流流失负荷估算方法 | |
JEMBERIE et al. | Evaluation of land use land cover change on stream flow: a case study ofdedissa sub basin, abay basin, South Western Ethiopia | |
Khan et al. | Catchment scale simulations of soil moisture dynamics using an equivalent cross-section based hydrological modelling approach | |
CN113011993A (zh) | 基于标准数据的农业污染源入水体负荷量测算方法 | |
Rains et al. | SMOS brightness temperature assimilation into the Community Land Model | |
Yassin et al. | Hydrologic-Land Surface Modelling of a Complex System under Precipitation Uncertainty: A Case Study of the Saskatchewan River Basin, Canada | |
CN117494419A (zh) | 一种多模型耦合的流域水土流失遥感监测方法 | |
CN117571626A (zh) | Modis ndvi对草地生物量遥感估测饱和性评估方法及系统 | |
CN117493476A (zh) | 一种融合物理机制和人工智能的径流回溯模拟方法及系统 | |
CN117556695B (zh) | 一种基于深度学习的作物根层土壤含水量模拟方法 | |
CN116757357A (zh) | 一种耦合多源遥感信息的土地生态状况评估方法 | |
CN117010546A (zh) | 一种云南省次季节尺度温度异常的预测方法和装置 | |
CN114239274A (zh) | 多源遥感数据驱动指数滤波模型推求根层土壤水的方法 | |
Farias et al. | Calibration of SWAT Model in the Pernambuco State Watersheds to Support the SUPer System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |