CN117216643B - 一种通过分区建模的土壤容重缺失值插补方法 - Google Patents
一种通过分区建模的土壤容重缺失值插补方法 Download PDFInfo
- Publication number
- CN117216643B CN117216643B CN202311260459.0A CN202311260459A CN117216643B CN 117216643 B CN117216643 B CN 117216643B CN 202311260459 A CN202311260459 A CN 202311260459A CN 117216643 B CN117216643 B CN 117216643B
- Authority
- CN
- China
- Prior art keywords
- soil
- volume weight
- model
- prediction model
- factors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000002689 soil Substances 0.000 title claims abstract description 445
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000005192 partition Methods 0.000 title claims abstract description 39
- 230000004580 weight loss Effects 0.000 title claims abstract description 17
- 238000012876 topography Methods 0.000 claims abstract description 25
- 238000003062 neural network model Methods 0.000 claims abstract description 14
- 238000010219 correlation analysis Methods 0.000 claims abstract description 8
- 238000000611 regression analysis Methods 0.000 claims abstract description 6
- 230000008569 process Effects 0.000 claims description 26
- 238000007637 random forest analysis Methods 0.000 claims description 23
- 238000011160 research Methods 0.000 claims description 12
- 238000012546 transfer Methods 0.000 claims description 12
- 238000012417 linear regression Methods 0.000 claims description 10
- 239000005416 organic matter Substances 0.000 claims description 9
- 241000894007 species Species 0.000 claims description 9
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 239000011435 rock Substances 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 239000000463 material Substances 0.000 claims description 6
- 244000005700 microbiome Species 0.000 claims description 6
- 239000002245 particle Substances 0.000 claims description 6
- 239000004016 soil organic matter Substances 0.000 claims description 6
- 235000008733 Citrus aurantifolia Nutrition 0.000 claims description 5
- 235000011941 Tilia x europaea Nutrition 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 5
- 239000004571 lime Substances 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000003066 decision tree Methods 0.000 claims description 4
- 238000011161 development Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 4
- 108020001568 subdomains Proteins 0.000 claims description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 3
- 229910052799 carbon Inorganic materials 0.000 claims description 3
- 239000004927 clay Substances 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000001556 precipitation Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 235000019738 Limestone Nutrition 0.000 claims description 2
- 239000006028 limestone Substances 0.000 claims description 2
- 239000002609 medium Substances 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 22
- 238000005755 formation reaction Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 239000010410 layer Substances 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- -1 hydrogen ions Chemical class 0.000 description 2
- 238000012067 mathematical method Methods 0.000 description 2
- 239000002344 surface layer Substances 0.000 description 2
- 241000045966 Lagena Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 238000010669 acid-base reaction Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 238000011545 laboratory measurement Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000003971 tillage Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种通过分区建模的土壤容重缺失值插补方法,包括以下步骤:S1、采用RBF神经网络模型构建分流域的土壤容重预测模型;选取径向基函数神经网络模型RBFNN构建土壤容重预测模型;S2、土壤容重预测模型参数的影响因素分析,利用相关分析和回归分析方法分析土壤容重与地质地层、土壤类型、耕地利用类型、质地类型、土壤pH、有机质、地形因子以及气候因子间的关系,并采用RF模型揭示不同影响因素对土壤容重的相对重要性,从而确定建立模型所需输入的影响因子;S3、土壤容重预测模型的构建与计算;本发明根据分区建模方法解决了土壤容重与各影响因素的非线性关系以及这种关系的空间非平稳性,有效提高了壤容重缺失值的填补精度。
Description
技术领域
本发明提供一种通过分区建模的土壤容重缺失值插补方法,属于土壤理化分析技术领域;
背景技术
了解土壤容重状况是研究土壤理化性质的基础;传统的土壤容重测定方法为环刀法,该方法原理简单、测定精度高,但存在野外采样环节多、操作过程难度大以及人力物力成本高等问题,这导致全球范围内土壤属性数据库均存在容重数据大面积缺失的情况;补全土壤容重缺失数据是健全区域土壤属性数据库和全面掌握土壤理化性质演变信息所必须的环节;因此,通过少量样点数据实现对土壤容重低成本且高精度的预测成为了土壤科学的一个研究重点;
国内外学者根据容重与土壤属性间的关系构建数学模型以实现对土壤容重的预测,该方法被称为土壤传递函数(pedotransfer functions,PTFs);我国多地使用PTFs对土壤容重进行了预测并取得了不错的效果;研究发现,PTFs虽然操作简单快速,但存在较差的区域适用性;这是因为气候、地形、地质地层、耕地利用类型、土壤类型以及土壤性质等因素对土壤容重均有影响,且在不同区域或同一区域不同亚区的影响程度明显不同;而基于回归模型构建的土壤容重预测模型很难准确揭示土壤容重与各影响因素间的复杂关系,导致现有模型的预测精度普遍不高;因此,准确表达土壤容重与各影响因素间的复杂映射关系进而构建适合特定区域的高精度土壤容重预测模型亟待解决;
近年来,人工神经网络(Artificial Neural Network,ANN)模型和随机森林(Random Forest,RF)模型等机器学习方法凭借计算快速准确、学习能力强且对多元共线性不敏感等特点在预测土壤容重上受到了研究人员的青睐;研究表明,运用机器学习方法构建的土壤容重预测模型在小区域范围内预测精度优于传统的PTFs,但在较大的研究尺度下其预测精度还有待进一步提高;
发明内容
针对上述技术问题,本发明提供一种通过分区建模的土壤容重缺失值插补方法,准确表达土壤容重与各影响因素间的复杂映射关系,通过少量样点数据实现对土壤容重低成本且高精度的预测,以期为更好地补全区域土壤属性数据库和准确掌握耕地土壤质量演变提供方法参考;
具体技术方案为:
一种通过分区建模的土壤容重缺失值插补方法,具体包括以下步骤:
S1、土壤容重缺失值插补方法的选择及分类方式
S1.1分类方式
分区建模,即在具有相似的地理环境范围内分别构建小区域土壤容重预测模型,最后合并得到整个研究区域的土壤容重预测模型;
采用分流域构建土壤容重预测模型,分流域是指按照地形和水系将研究区分为多个亚流域,然后在不同亚流域构建土壤容重预测模型;
分土类则是指根据收集到的土种志资料,将土壤样点按照土壤亚类分为几种土壤类型,分别在每种土壤类型下分别构建土壤容重预测模型;
采用RBF神经网络模型构建分流域的土壤容重预测模型;
S1.2具体插补方法
选取径向基函数神经网络模型RBFNN构建土壤容重预测模型;
S2、土壤容重预测模型参数的影响因素分析
S2.1影响因素的选择与处理
从五大成土因素中选取影响土壤容重变化的因素,包括地质地层、土壤类型、耕地利用类型、质地类型、土壤pH、有机质、地形以及气候;具体处理方法如下:
(1)质地层
地质地层是一切成层岩石的总称,根据各区县土种志记载资料,对所有土壤样点的地质地层进行整理合并,最后将地层划分为第四系全新统和更新统;
(2)壤类型
土壤类型是相同成土母质在不同成土条件下的具体体现;根据各区县土种志记载资料,对收集到的所有土壤样点按照土壤类型进行整理,最后得到紫色土、水稻土、黄壤、新积土、灰潮土以及石灰/石灰岩6种主要土壤类型;
(3)地利用类型
耕地利用类型指的是土壤样点所在地块的种植制度;将收集到的土壤样点按照其所在地块的种植制度进行整理,最后得到旱地、水旱轮作地以及水田3种主要耕地利用类型;
(4)质地类型
土壤质地指的是粗细不同的土粒组合,根据土壤颗粒组成的百分比进行分类即为土壤质地分类;将收集到的土壤样点进行整理,最后得到6种主要质地类型,分别为砂壤、轻壤、粘土、中壤、重壤和砂土;
(5)土壤pH
土壤pH是土壤酸度和碱度的总称;
(6)有机质
土壤有机质是指各种形态存在于土壤中的所有含碳的有机物质,包括土壤中的各种动、植物残体,微生物及其分解和合成的各种有机物质;
(7)地形
地形是物质在地表上呈现的高低起伏的各种状态;首先通过Arc GIS10.6软件计算得到高程、坡度、坡向、平面曲率、剖面曲率以及地形湿度指数,然后根据土壤样点位置提取得到其地形因子;
(8)气候
气候通过温度和降水影响土壤的发育与形成,改变土壤的理化性质,进而实现对土壤容重的差异性影响;首先利用气象数据计算得到各气象站点年和四个季节的气温均值和降雨量均值,然后在Arc GIS10.6软件中采用普通克里格法分别对其进行插值,从而得到四川盆地年和四个季节的气温均值和降雨量均值空间分布栅格数据;最后,根据土壤样点位置提取得到各样点气候因子;
S2.2土壤容重预测模型参数与影响因素间相关关系分析
利用相关分析和回归分析方法分析土壤容重与地质地层、土壤类型、耕地利用类型、质地类型、土壤pH、有机质、地形因子以及气候因子间的关系,并采用RF模型揭示不同影响因素对土壤容重的相对重要性,从而确定建立模型所需输入的影响因子;
S3、土壤容重预测模型的构建与计算过程
S3.1径向基函数神经网络模型
利用RBFNN模型建立了影响因子与土壤容重间的映射关系预测模型,具体建模过程如下:
(1)将土壤样点按其所在的亚流域分为6组,采用相关分析确定各亚流域中与土壤容重具有显著相关关系的影响因子;所述具有显著相关关系的影响因子,为P<0.05的的影响因子;
(2)在不同亚流域中,将与土壤容重具有显著相关性的影响因子作为RBFNN模型的输入变量,土壤容重值作为输出变量,建立土壤容重与影响因素间关系的预测模型;
(3)通过编程搜索,获得各亚流域RBFNN预测模型的最优扩展常数和隐含层节点数;即在0.01至3.00范围内以0.01作为间隔,隐含层节点数以1为间隔,逐步搜索将验证点预测结果均方根误差最小的最优参数组合,进而确定各亚流域土壤容重的最优RBFNN预测模型,记为RBFNN_分流域;
为对比分流域建模与不分区建模和分土类建模的预测效果,根据上述过程依次建立不分区的RBFNN预测模型和分土类的RBFNN预测模型,分别记为RBFNN_不分区和RBFNN_分土类;
其中,潮土和新积土在分土类建模时将这两个土类进行合并;上述方法建模过程均在MATLAB 2022软件中完成;
S3.2随机森林模型
采用与RBFNN模型相同的建模过程,按不分区、分流域和分土类3种方式建立基于随机森林模型的土壤容重预测模型,分别记为RF_不分区、RF_分流域和RF_分土类;为获得不同方式下构建的RF模型最优参数,以验证点预测结果均方根误差最小作为评价指标,采用迭代法编程搜索决策树数ntree和最佳分裂次数mtry的最优组合;RF模型的建模过程在软件R中完成;
S3.3多元线性回归模型
采用多元逐步回归方法按不分区、分流域和分土类建立土壤容重的回归预测模型,分别记为MLR_不分区、MLR_分流域和MLR_分土类;MLR模型的建模过程在软件SPSS27中完成;
S3.4土壤传递函数
选用的传统土壤传递函数为土壤容重与土壤有机质间的非线性模型,具体表达式如下:
式(1)中,a和b为常数项,BD为土壤容重值,·cm-3;SOM为土壤有机质含量,g·g-1);根据上式按不分区、分流域和分土类建立土壤容重与土壤有机质间的非线性模型,分别记为PTFs_不分区、PTFs_分流域和PTFs_分土类;模型中的参数a和b通过MATLAB 2022软件拟合获得;
本发明根据分区建模方法解决了土壤容重与各影响因素的非线性关系以及这种关系的空间非平稳性,有效提高了壤容重缺失值的填补精度;
附图说明
图1a是本实施例中的四川盆地位置和;
图1b是本实施例中的四川盆地土壤样点分布图;
图2a是本实施例中耕地表层土壤容重与土壤pH的相关关系;
图2b是本实施例中b耕地表层土壤容重与有机质的相关关系;
图3a是本实施例中四川盆地容重影响因素的相对重要性;
图3b是本实施例中新积土和灰潮土土壤类型下表层土壤容重影响因素的相对重要性;
图3c是本实施例中石灰(岩)土壤类型下表层土壤容重影响因素的相对重要性;
图3d是本实施例中水稻土土壤类型下表层土壤容重影响因素的相对重要性;
图3e是本实施例中黄壤土壤类型下表层土壤容重影响因素的相对重要性;
图3f是本实施例中紫色土土壤类型下表层土壤容重影响因素的相对重要性;
图3g是本实施例中涪江流域土壤容重影响因素的相对重要性;
图3h是本实施例中嘉陵江流域土壤容重影响因素的相对重要性;
图3i是本实施例中岷江流域土壤容重影响因素的相对重要性;
图3j是本实施例中渠江流域土壤容重影响因素的相对重要性;
图3k是本实施例中沱江流域土壤容重影响因素的相对重要性;
图3l是本实施例中长江干流区土壤容重影响因素的相对重要性;
图4a是本实施例中BFNN_分流域预测方法下表层土壤容重预测结果;
图4b是本实施例中RBFNN_分土类预测方法下表层土壤容重预测结果;
图4c是本实施例中RBFNN_不分区预测方法下表层土壤容重预测结果;
图4d是本实施例中RF_分流域预测方法下表层土壤容重预测结果;
图4e是本实施例中RF_分土类预测方法下表层土壤容重预测结果;
图4f是本实施例中RF_不分区预测方法下表层土壤容重预测结果;
图4g是本实施例中MLR_分流域预测方法下表层土壤容重预测结果;
图4h是本实施例中MLR_分土类预测方法下表层土壤容重预测结果;
图4i是本实施例中MLR_不分区预测方法下表层土壤容重预测结果;
图4j是本实施例中PTFs_分流域预测方法下表层土壤容重预测结果;
图4k是本实施例中PTFs_分土类预测方法下表层土壤容重预测结果;
图4l是本实施例中PTFs_不分区预测方法下表层土壤容重预测结果;
具体实施方式
作为我国四大盆地之一,四川盆地耕地面积广阔,农业历史悠久,是我国重要的粮食产区之一;全国第二次土壤普查资料中,该区域耕地土壤容重数据缺失情况严重,制约了对该区域耕地土壤理化性质演变规律的准确把握;因此,如图1a和图1b所示,本实施例在收集整理四川盆地全国第二次土壤普查典型土壤样点数据的基础上,运用方差分析、回归分析和随机森林模型分析了气候、地形、地质、耕地利用类型、土壤类型以及土壤性质(质地类型、pH和有机质)等因素对土壤容重的影响,采用径向基函数神经网络模型构建该区域土壤容重预测模型,并与传统土壤传递函数、多元线性回归模型和随机森林模型进行对比,以期提高较大研究尺度下耕地土壤容重缺失值的预测精度,为更好地补全区域土壤属性数据库和准确掌握耕地土壤质量演变提供方法参考;
具体包括以下步骤:
S1、土壤容重缺失值插补方法的选择及分类方式
S.1.1分类方式
为提高土壤容重缺失值插补方法精度,本发明提出了分区建模,即在具有相似的地理环境范围内分别构建小区域土壤容重预测模型,最后合并得到整个研究区域的土壤容重预测模型;本发明中,采用分流域构建土壤容重预测模型,与传统的不分区和分土类建模方式进行比较;其中,分流域是指按照地形和水系将研究区分为岷江流域、沱江流域、涪江流域、嘉陵江流域、渠江流域以及长江干流区6个亚流域,然后在不同亚流域构建土壤容重预测模型;分土类则是指根据收集到的土种志资料,将土壤样点按照土壤亚类分为紫色土、水稻土、黄壤、新积土、灰潮土以及石灰(岩)6种主要土壤类型;其中,潮土和新积土合并后能更好找到影响这两个土类容重的影响因子,故在建模时将这两个土类进行合并;最后,分别在5种土壤类型下分别构建土壤容重预测模型;同时,为准确捕捉土壤容重与各影响因素间复杂的非线性关系,采用RBF神经网络模型构建分流域的土壤容重预测模型;
S1.2具体插补方法
为构建区域最佳土壤容重缺失值插补方法,选取了径向基函数神经网络模型(Radial Basis Function Neural Network,RBFNN)构建土壤容重预测模型,并与传统土壤传递函数(Pedotransfer Functions,PTFs)、多元线性回归模型(Multiple LinearRegression,MLR)和随机森林模型(Random Forest,RF)进行对比;
(1)径向基函数神经网络模型
径向基函数神经网络(Radial Basis Function Neural Network,RBFNN)模型是一种以函数逼近为基础,具有单隐层的3层前馈人工神经网络,结构简单、参数调节方便且学习速度快[30];该方法可以准确揭示多元环境变量与目标变量间的非线性映射关系,被广泛运用到土壤性质的预测研究中;
(2)随机森林模型
随机森林(Random Forest,RF)模型是一种基于决策树延伸出的机器学习算法,对多元共线性不敏感,不仅可以通过减少模型过拟合提高预测精度,更能对缺失数据和非平衡数据实现稳健估计;
(3)多元线性回归模型
多元线性回归(Multiple Linear Regression,MLR)模型是一种通过多个自变量的最优组合对因变量进行预测的数学方法,建模过程简单快捷;
(4)土壤传递函数
土壤传递函数(Pedotransfer Functions,PTFs)是一种以根据已有土壤理化性质间对未知理化性质构建关系,进行模拟的数学方法;
S2、土壤容重预测模型参数的影响因素分析
S2.1影响因素的选择与处理
基于土壤发生学原理,从五大成土因素中选取影响土壤容重变化的因素,包括地质地层、土壤类型、耕地利用类型、质地类型、土壤pH、有机质、地形以及气候;具体处理方法如下:(1)地质地层
地质地层是一切成层岩石的总称,不同地层之间岩性、矿物组成存在明显差异;作为土壤物质形成的基础,不同地层的容重明显不同;根据各区县土种志记载资料,对所有土壤样点的地质地层进行整理合并,最后将地层主要划分为第四系全新统和更新统,白垩系城墙岩群、嘉定群、灌口组和夹关组,侏罗系蓬莱镇组、沙溪庙组、遂宁组和自流井组以及三叠系须家河组等10余个群组;
表1不同地质地层发育土壤的容重统计特征
注:小写字母表示不同地层之间的表层土壤容重均值存在显著差异(P<0.05).
(2)土壤类型
土壤类型是相同成土母质在不同成土条件下的具体体现;由于成土过程不同,不同土壤类型的容重之间存在明显差异;根据各区县土种志记载资料,对收集到的所有土壤样点按照土壤类型进行整理,最后得到紫色土、水稻土、黄壤、新积土、灰潮土以及石灰(岩)6种主要土壤类型;
表2不同土壤类型表层土壤容重统计特征
注:大写字母表示不同土类之间的容重均值存在显著差异(P<0.05);小写字母表示不同亚类之间的容重均值存在显著差异(P<0.05).
(3)耕地利用类型
耕地利用类型指的是土壤样点所在地块的种植制度,不同的种植制度会引起土壤水分等理化性质的改变,进而影响土壤容重;本发明中,将收集到的土壤样点按照其所在地块的种植制度进行整理,最后得到旱地、水旱轮作地以及水田3种主要耕地利用类型;
表3不同耕地利用类型的表层土壤容重统计特征
注:小写字母表示不同耕地利用类型之间的表层土壤容重均值存在显著差异(P<0.05).
(4)质地类型
土壤质地指的是粗细不同的土粒组合,根据土壤颗粒组成的百分比进行分类即为土壤质地分类;不同质地类型的土壤容重明显不同;按照土壤质地分类标准,将收集到的土壤样点进行整理,最后得到6种主要质地类型,分别为砂壤、轻壤、粘土、中壤、重壤和砂土;
表4不同质地类型的表层土壤容重统计特征
注:小写字母表示不同质地之间的表层土壤容重均值存在显著差异(P<0.05).
(5)土壤pH
土壤pH是土壤酸度和碱度的总称,通常用以衡量土壤酸碱反应的强弱;主要由氢离子和氢氧根离子在土壤溶液中的浓度决定,以pH表示;土壤pH可以通过改变土壤理化性质引起容重变化,本发明中各土壤样点的pH值整理自各区县土种志资料;
(6)有机质
土壤有机质是指各种形态存在于土壤中的所有含碳的有机物质,包括土壤中的各种动、植物残体,微生物及其分解和合成的各种有机物质;由于有机质与土壤的结构性、通气性、渗透性和吸附性、缓冲性有密切的关系,因此会引起容重变化,如图2a和图2b;本发明中各土壤样点的有机质数据整理自各区县土种志资料;
(7)地形
地形是物质在地表上呈现的高低起伏的各种状态,多偏向于局部结构;地形通过海拔、坡向等条件实现区域环境内的水热再分配,从而造成土壤容重差异;本发明中地形数据为ALOS12.5m DEM,来源于中国科学院资源环境科学与数据中心(https://www.resdc.cn/);首先通过Arc GIS10.6软件计算得到高程、坡度、坡向、平面曲率、剖面曲率以及地形湿度指数,然后根据土壤样点位置提取得到其地形因子;
表5表层土壤容重与地形因子的相关系数
注:**,***分别表示显著水平(P<0.01)和极显著水平(P<0.001).
(8)气候
气候主要通过温度和降水影响土壤的发育与形成,改变土壤的理化性质,进而实现对土壤容重的差异性影响;本发明中气象数据为研究区及其周边144个县级气象站点1961~1980年的逐日气温数据和降雨量数据;首先利用气象数据计算得到各气象站点年和四个季节的气温均值和降雨量均值,然后在Arc GIS10.6软件中采用普通克里格法分别对其进行插值,从而得到四川盆地年和四个季节的气温均值和降雨量均值空间分布栅格数据;最后,根据土壤样点位置提取得到各样点气候因子;
表6表层土壤容重与气候的相关系数
注:**,***分别表示显著水平(P<0.01)和极显著水平(P<0.001).
S2.2土壤容重预测模型参数与影响因素间相关关系分析
如图3a到图3l,利用相关分析和回归分析方法分析土壤容重与地质地层、土壤类型、耕地利用类型、质地类型、土壤pH、有机质、地形因子以及气候因子间的关系,并采用RF模型揭示不同影响因素对土壤容重的相对重要性,从而确定建立模型所需输入的影响因子;
S3、土壤容重预测模型的构建与计算过程
S3.1径向基函数神经网络模型
本发明利用RBFNN模型建立了影响因子与土壤容重间的映射关系预测模型,具体建模过程如下:
(1)将土壤样点按其所在的亚流域分为6组,采用相关分析确定各亚流域中与土壤容重具有显著相关关系(P<0.05)的影响因子;
(2)在不同亚流域中,将与土壤容重具有显著相关性的影响因子作为RBFNN模型的输入变量,土壤容重值作为输出变量,建立土壤容重与影响因素间关系的预测模型;
(3)通过编程搜索,获得各亚流域RBFNN预测模型的最优扩展常数和隐含层节点数;即在0.01至3.00范围内以0.01作为间隔,隐含层节点数以1为间隔,逐步搜索将验证点预测结果均方根误差最小的最优参数组合,进而确定各亚流域土壤容重的最优RBFNN预测模型,记为RBFNN_分流域;
为对比分流域建模与不分区建模和分土类建模的预测效果,根据上述过程依次建立不分区的RBFNN预测模型(记为RBFNN_不分区)和分土类的RBFNN预测模型(记为RBFNN_分土类);其中,潮土和新积土合并后能更好找到影响这两个土类容重的影响因子,故在分土类建模时将这两个土类进行合并;上述方法建模过程均在MATLAB 2022软件中完成;
S3.2随机森林模型
本发明中采用与RBFNN模型相同的建模过程,按不分区、分流域和分土类3种方式建立基于随机森林模型的土壤容重预测模型,分别记为RF_不分区、RF_分流域和RF_分土类;为获得不同方式下构建的RF模型最优参数,本发明以验证点预测结果均方根误差最小作为评价指标,采用迭代法编程搜索决策树数(ntree)和最佳分裂次数(mtry)的最优组合;RF模型的建模过程在软件R中完成;
S3.3多元线性回归模型
本发明中,与RBFNN模型的建模过程相同,采用多元逐步回归方法按不分区、分流域和分土类建立土壤容重的回归预测模型,分别记为MLR_不分区、MLR_分流域和MLR_分土类;MLR模型的建模过程在软件SPSS27中完成;
S3.4土壤传递函数
由于土壤有机质与土壤容重的相关性最为密切,且历史土壤数据库中的土壤有机质数据一般均被较完整的记录,因此本发明选用的传统土壤传递函数为土壤容重与土壤有机质间的非线性模型,具体表达式如下:
式(1)中,a和b为常数项,BD为土壤容重值(g·cm-3),SOM为土壤有机质含量(g·g-1);本发明中,根据上式按不分区、分流域和分土类建立土壤容重与土壤有机质间的非线性模型,分别记为PTFs_不分区、PTFs_分流域和PTFs_分土类;模型中的参数a和b通过MATLAB2022软件拟合获得;
土壤是多种因素共同作用下的产物,其性质受到多种因素的共同影响,仅以一两个因子作为自变量很难揭示土壤性质的变异性;其次,土壤性质与各影响因素间的关系存在着空间非平稳性,即不同土壤类型、不同地区或同一区域的不同亚区各因素对土壤性质的影响程度不同,大区域尺度下只建立一个模型很难准确捕捉这种空间非平稳性;再次,土壤性质与各种影响因素间的关系多表现为复杂的非线性关系;本实施例分流域构建的RBFNN预测模型能较好地捕捉土壤容重与各影响因素的非线性关系以及这种关系的空间非平稳性,432个独立验证样点的预测结果决定系数(R2)和均方根误差(RMSE)分别为0.519和0.095g·cm-3,相对误差为6.036%,非常接近实验室实测过程中5%的平行误差要求,如图4a到图4l所示;该方法对验证样点的预测能力达到甚至超过了已经研究中各方法对建模样点的拟合能力;因此,分流域构建的RBFNN预测模型有助于提高四川盆地耕地表层土壤容重缺失值的填补精度,同时也为其他区域土壤性质缺失值的填补提供了方法借鉴。
Claims (4)
1.一种通过分区建模的土壤容重缺失值插补方法,其特征在于,具体包括以下步骤:
S1、土壤容重缺失值插补方法的选择及分类方式
S1.1分类方式
分区建模,即在具有相似的地理环境范围内分别构建小区域土壤容重预测模型,最后合并得到整个研究区域的土壤容重预测模型;
采用RBF神经网络模型构建分流域的土壤容重预测模型;
S1.2具体插补方法
选取径向基函数神经网络模型RBFNN构建土壤容重预测模型;
S2、土壤容重预测模型参数的影响因素分析
S2.1影响因素的选择与处理
从五大成土因素中选取影响土壤容重变化的因素,包括地质地层、土壤类型、耕地利用类型、质地类型、土壤pH、有机质、地形以及气候;
S2.2土壤容重预测模型参数与影响因素间相关关系分析
利用相关分析和回归分析方法分析土壤容重与地质地层、土壤类型、耕地利用类型、质地类型、土壤pH、有机质、地形因子以及气候因子间的关系,并采用RF模型揭示不同影响因素对土壤容重的相对重要性,从而确定建立模型所需输入的影响因子;
S3、土壤容重预测模型的构建与计算过程
S3.1径向基函数神经网络模型
利用RBFNN模型建立了影响因子与土壤容重间的映射关系预测模型;
S3.2随机森林模型
采用与RBFNN模型相同的建模过程,按不分区、分流域和分土类3种方式建立基于随机森林模型的土壤容重预测模型;
S3.3多元线性回归模型
采用多元逐步回归方法按不分区、分流域和分土类建立土壤容重的回归预测模型;
S3.4土壤传递函数
选用的传统土壤传递函数为土壤容重与土壤有机质间的非线性模型。
2.根据权利要求1所述的一种通过分区建模的土壤容重缺失值插补方法,其特征在于,S1.1分类方式中,采用分流域构建土壤容重预测模型,分流域是指按照地形和水系将研究区分为多个亚流域,然后在不同亚流域构建土壤容重预测模型;
分土类则是指根据收集到的土种志资料,将土壤样点按照土壤亚类分为几种土壤类型,分别在每种土壤类型下分别构建土壤容重预测模型。
3.根据权利要求1所述的一种通过分区建模的土壤容重缺失值插补方法,其特征在于,S2.1影响因素的具体处理方法为:
(1)质地层
地质地层是一切成层岩石的总称,根据各区县土种志记载资料,对所有土壤样点的地质地层进行整理合并,最后将地层划分为第四系全新统和更新统;
(2)壤类型
土壤类型是相同成土母质在不同成土条件下的具体体现;根据各区县土种志记载资料,对收集到的所有土壤样点按照土壤类型进行整理,最后得到紫色土、水稻土、黄壤、新积土、灰潮土以及石灰/石灰岩6种主要土壤类型;
(3)地利用类型
耕地利用类型指的是土壤样点所在地块的种植制度;将收集到的土壤样点按照其所在地块的种植制度进行整理,最后得到旱地、水旱轮作地以及水田3种主要耕地利用类型;
(4)质地类型
土壤质地指的是粗细不同的土粒组合,根据土壤颗粒组成的百分比进行分类即为土壤质地分类;将收集到的土壤样点进行整理,最后得到6种主要质地类型,分别为砂壤、轻壤、粘土、中壤、重壤和砂土;
(5)土壤pH
土壤pH是土壤酸度和碱度的总称;
(6)有机质
土壤有机质是指各种形态存在于土壤中的所有含碳的有机物质,包括土壤中的各种动、植物残体,微生物及其分解和合成的各种有机物质;
(7)地形
地形是物质在地表上呈现的高低起伏的各种状态;首先通过Arc GIS10.6软件计算得到高程、坡度、坡向、平面曲率、剖面曲率以及地形湿度指数,然后根据土壤样点位置提取得到其地形因子;
(8)气候
气候通过温度和降水影响土壤的发育与形成,改变土壤的理化性质,进而实现对土壤容重的差异性影响;首先利用气象数据计算得到各气象站点年和四个季节的气温均值和降雨量均值,然后在Arc GIS10.6软件中采用普通克里格法分别对其进行插值,从而得到四川盆地年和四个季节的气温均值和降雨量均值空间分布栅格数据;最后,根据土壤样点位置提取得到各样点气候因子;
S2.2土壤容重预测模型参数与影响因素间相关关系分析
利用相关分析和回归分析方法分析土壤容重与地质地层、土壤类型、耕地利用类型、质地类型、土壤pH、有机质、地形因子以及气候因子间的关系,并采用RF模型揭示不同影响因素对土壤容重的相对重要性,从而确定建立模型所需输入的影响因子。
4.根据权利要求1所述的一种通过分区建模的土壤容重缺失值插补方法,其特征在于:
S3.1径向基函数神经网络模型,具体建模过程如下:
(1)将土壤样点按其所在的亚流域分为6组,采用相关分析确定各亚流域中与土壤容重具有显著相关关系的影响因子;所述具有显著相关关系的影响因子,为P<0.05的的影响因子;
(2)在不同亚流域中,将与土壤容重具有显著相关性的影响因子作为RBFNN模型的输入变量,土壤容重值作为输出变量,建立土壤容重与影响因素间关系的预测模型;
(3)通过编程搜索,获得各亚流域RBFNN预测模型的最优扩展常数和隐含层节点数;即在0.01至3.00范围内以0.01作为间隔,隐含层节点数以1为间隔,逐步搜索将验证点预测结果均方根误差最小的最优参数组合,进而确定各亚流域土壤容重的最优RBFNN预测模型,记为RBFNN_分流域;
为对比分流域建模与不分区建模和分土类建模的预测效果,根据上述过程依次建立不分区的RBFNN预测模型和分土类的RBFNN预测模型,分别记为RBFNN_不分区和RBFNN_分土类;
其中,潮土和新积土在分土类建模时将这两个土类进行合并;上述方法建模过程均在MATLAB 2022软件中完成;
S3.2随机森林模型,按不分区、分流域和分土类3种方式建立基于随机森林模型的土壤容重预测模型,分别记为RF_不分区、RF_分流域和RF_分土类;为获得不同方式下构建的RF模型最优参数,以验证点预测结果均方根误差最小作为评价指标,采用迭代法编程搜索决策树数ntree和最佳分裂次数mtry的最优组合;RF模型的建模过程在软件R中完成;
S3.3多元线性回归模型,采用多元逐步回归方法按不分区、分流域和分土类建立土壤容重的回归预测模型,分别记为MLR_不分区、MLR_分流域和MLR_分土类;MLR模型的建模过程在软件SPSS27中完成;
S3.4土壤传递函数
具体表达式如下:
式(1)中,a和b为常数项,BD为土壤容重值,·cm-3;SOM为土壤有机质含量,g·g-1;
根据上式按不分区、分流域和分土类建立土壤容重与土壤有机质间的非线性模型,分别记为PTFs_不分区、PTFs_分流域和PTFs_分土类;模型中的参数a和b通过MATLAB 2022软件拟合获得。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311260459.0A CN117216643B (zh) | 2023-09-27 | 2023-09-27 | 一种通过分区建模的土壤容重缺失值插补方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311260459.0A CN117216643B (zh) | 2023-09-27 | 2023-09-27 | 一种通过分区建模的土壤容重缺失值插补方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117216643A CN117216643A (zh) | 2023-12-12 |
CN117216643B true CN117216643B (zh) | 2024-02-06 |
Family
ID=89042314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311260459.0A Active CN117216643B (zh) | 2023-09-27 | 2023-09-27 | 一种通过分区建模的土壤容重缺失值插补方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117216643B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408258A (zh) * | 2014-12-01 | 2015-03-11 | 四川农业大学 | 融合环境因素的大尺度土壤有机碳空间分布模拟方法 |
CN106779061A (zh) * | 2016-11-11 | 2017-05-31 | 四川农业大学 | 一种地形平缓区土壤重金属镉空间分布预测方法 |
-
2023
- 2023-09-27 CN CN202311260459.0A patent/CN117216643B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408258A (zh) * | 2014-12-01 | 2015-03-11 | 四川农业大学 | 融合环境因素的大尺度土壤有机碳空间分布模拟方法 |
CN106779061A (zh) * | 2016-11-11 | 2017-05-31 | 四川农业大学 | 一种地形平缓区土壤重金属镉空间分布预测方法 |
Non-Patent Citations (1)
Title |
---|
基于RBF神经网络的土壤属性信息空间插值方法研究;李启权;《中国优秀博硕士学位论文全文数据库 (硕士) 农业科技辑》;正文第1-52页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117216643A (zh) | 2023-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fathizad et al. | Investigation of the spatial and temporal variation of soil salinity using random forests in the central desert of Iran | |
Dobermann et al. | Fuzzy mapping of soil fertility—a case study on irrigated riceland in the Philippines | |
Greve et al. | Quantifying the ability of environmental parameters to predict soil texture fractions using regression-tree model with GIS and LIDAR data: The case study of Denmark | |
Greve et al. | Generating a Danish raster-based topsoil property map combining choropleth maps and point information | |
Bhatti et al. | Estimates of soil organic carbon stocks in central Canada using three different approaches | |
Hounkpatin et al. | Assessment of the soil fertility status in Benin (West Africa)–Digital soil mapping using machine learning | |
Sevastas et al. | Predicting bulk density using pedotransfer functions for soils in the Upper Anthemountas basin, Greece | |
Rajasekhar et al. | Multi-criteria land suitability analysis for agriculture in semi-arid region of Kadapa District, Southern India: Geospatial approaches | |
Yan et al. | Spatial variability of soil physical properties based on GIS and geo-statistical methods in the red beds of the Nanxiong Basin, China | |
CN114218853A (zh) | 基于机器学习空间降尺度提高水储量分辨率和精度的方法 | |
More et al. | Machine learning-based modeling of saturated hydraulic conductivity in soils of tropical semi-arid zone of India | |
Martin et al. | Capturing spatial variability of soil and litter properties in a forest stand by landform segmentation procedures | |
Park et al. | Estimation of soil organic carbon (SOC) stock in South Korea using digital soil mapping technique | |
Liess et al. | Digital soil mapping in southern Ecuador | |
Panagos et al. | Soil bulk density assessment in Europe | |
CN117494419A (zh) | 一种多模型耦合的流域水土流失遥感监测方法 | |
CN117216643B (zh) | 一种通过分区建模的土壤容重缺失值插补方法 | |
Odusanya et al. | Using a regionalisation approach to evaluate streamflow simulated by an ecohydrological model calibrated with global land surface evaporation from remote sensing | |
Naitam et al. | Field-scale spatial variability of physical properties of black soils of Purna Valley, India, using Geostatistical Approach | |
Daniels et al. | Soil variability and productivity: future developments | |
Abutaleb et al. | Geomatics-Based Mapping of Hydraulic Soil Properties for Agricultural Management | |
Malan | Investigating the suitability of land type information for hydrological modelling in the mountain regions of Hessequa, South Africa | |
Singh et al. | Soil fertility manning and its validation using spatial prediction techniques | |
Reza et al. | Soil properties-landform relationship in Purvanchal range of Tripura, Northeastern India: An implication of pedogenesis | |
Aguilera et al. | Building inexpensive topsoil saturated hydraulic conductivity maps for land planning based on machine learning and geostatistics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |