CN106980750B

CN106980750B - 一种基于典型对应分析的土壤氮储量估算方法

Info

Publication number: CN106980750B
Application number: CN201710099020.2A
Authority: CN
Inventors: 宋效东; 吴华勇; 刘峰; 元野; 张甘霖; 李德成; 杨金玲; 赵玉国
Original assignee: Institute of Soil Science of CAS
Current assignee: Institute of Soil Science of CAS
Priority date: 2017-02-23
Filing date: 2017-02-23
Publication date: 2019-10-29
Anticipated expiration: 2037-02-23
Also published as: CN106980750A

Abstract

本发明涉及一种基于典型对应分析的土壤氮储量估算方法，属于面向计量土壤学与空间分析中土壤氮储量估算方法，涉及一米土体土壤氮密度计算与土壤氮密度在不同景观特征下呈现的空间变异特征模拟，能够通过多种降维技术对自变量进行高效的信息预处理，使用典型对应分析分析不同深度氮储量的综合影响变量，特别是在不同性质、不同深度的土壤属性影响因素分析方面，构建多种土壤属性与环境变量典型特征的综合拟合关系。

Description

一种基于典型对应分析的土壤氮储量估算方法

技术领域

本发明涉及一种基于典型对应分析的土壤氮储量估算方法，属于土壤属性预测技术领域。

背景技术

土壤中氮的90％是有机态的，10％是无机态的。土壤中的无机氮主要包括NO^3-、NO^2-、交换性NH⁴⁺、非交换型NH⁴⁺。绝大部分土壤中的有机态氮是与无机矿物结合在一起的。土壤氮含量与土壤有机质含量的变化是一致的。氮在自然界中活动比较活跃，能够在大气、土壤与生物有机体之间互相交换。区域土壤氮储量估算是全球气候变化的重要组成部分。准确估算区域氮储量可以有效减少国家尺度氮循环模拟中的不确定性。

传统的氮储量估算方法主要有生命带类型法、植被类型法、气候参数法、土壤类型法。由于基于图斑的方法，例如土壤类型法、植被类型法原理简单且数据易于获取，诸多技术人员往往采用该类型方法进行氮储量估算。然而，这种方法往往忽略了土壤发展受自然条件综合影响这一问题。随着3S技术与土壤调查的迅速发展，土壤形成的环境变量的地理数据，如年均降雨、日照辐射模拟、高精度数字高程模型等数据的精度与质量都有了较大提升。

国内外学者经过大量的土壤制图实践已证明，基于环境变量的数字土壤制图方法具有更高的预测精度。常规的数字土壤制图方法已日趋成熟，不同领域的空间预测方法已广泛地被改进并应用到土壤属性的预测，例如地统计、多元回归、机器学习与深度学习等。据不完全统计，至少有上百种预测方法能够基于土壤数据与环境变量(自变量)来有效地预测区域级的土壤属性空间分布。数字土壤制图的主要目标是进行土壤属性的空间预测，其理论与技术基础是已观测到的土壤样点数据与成土因素(气候、地形、母质等)间的耦合关系。大量的应用实践已证明应用合适的环境变量来构建土壤属性预测模型能够获取较高的预测精度。然而，环境变量数据种类众多且不同数据误差迥异，会导致预测模型在训练过程中出现过拟合现象，进而降低了预测模型的泛化能力。同时，环境变量的高维数也会显著提升模型的运行时间，降低预测模型的运行效率。因此，部分较为高效的预测技术往往采用降维的预处理技术，来将合理的环境变量信息映射到一个低维的空间中，不仅可以降低预测模型的复杂度与计算复杂度，还可以减少过拟合和增加模型的泛化能力。

作为主成分分析的拓展，对应分析可以逐步地展现降维的分析过程，进而直观、明了地观察和分析目标数据与自变量的相关系。典型对应分析(CCA，CanonicalCorrespondence Analysis)是基于对应分析衍生的一种较为先进的数学排序方法。CCA主要的技术原理是在对应分析迭代分析的过程中，将每次得到的样方排序坐标与自变量进行多元线性回归，使用单峰线性排序并结合诸多环境变量，进而分析环境因子排序与样方排序，计算到最终的排序结果。根据环境变量和排序轴可以确定环境变量的相关系数，进而在排序图上得到代表该环境变量的点。因此，通过这种排序方式能够同时显示采样点、多种土壤类型和环境变量的关系，进而综合地反映土壤演化的最核心变量，能够更科学、更准确地构建地表生态模拟方程，创造更高的生态、环境、生产价值。

然而，由于土壤属性的高度空间异质性及环境变量的多源特征，系列的预处理技术尚难以直接地应用在计量土壤学中，归纳起来，主要有以下几个方面的技术问题：

(1)基于图斑的传统氮储量估算方法及区域级野外调查工作方式已较难适应快速发展的精准农业、环境管理等部门的需求。更多的应用领域对高精度的土壤氮储量估算及其空间分布提出了更高的要求，尤其是土壤氮密度的空间部分图分辨率及总氮储量估算。

(2)从本质上分析，降维技术将原始信息维度空间映射到一个新的维度空间。环境变量(自变量)特征种类的总数没有发生改变，然而在映射的过程中特征值会发生部分的变化。部分特征的特征值发生的改变会潜在导致预测模型往往只能面向单一的预测目标，而在计量土壤学中，往往是相同的环境变量(如气候、母质等)对应了多种土壤属性(如土壤有效氮含量、土壤有机碳含量等)。因此，传统的降维预处理技术在使用相同环境变量预测多种土壤属性的过程中存在先天不足。

(3)在空间上，土壤属性具有高度的空间变异特征。土壤属性与环境变量具有非常复杂的非线性关系。典型对应分析理论上能够反映土壤属性与环境变量以及土壤属性内部的协同关系。然而，不同土壤属性的最优环境变量集合可能并不完全相同。如何选择具有相似环境变量的土壤属性群是解决对应关系分析的挑战。

(4)数字土壤图的主要优点是能集成有效的环境变量并提供制图结果的可信度。传统的逐步线性回归方法所筛选的环境变量集合难以适应机器学习等复杂模型。面向多种土壤属性，如何根据相同的最优环境变量集合独立训练预测模型，并评估环境变量本身与预测结果的不确定性，是土壤图应用所必须提供的定量信息。如何对数字土壤图进行客观科学地验证直接关系到数字土壤制图技术的工业应用。

综上所述，对于上述分析出的不足之处，同样出现在土壤氮储量的其他分析应用方面。

发明内容

本发明所要解决的技术问题是提供一种基于典型对应分析的土壤氮储量估算方法，能够解决任意深度土壤氮密度预测模型的输入参数选择问题，进而预测不同地理尺度的土壤氮储量。

本发明为了解决上述技术问题采用以下技术方案：本发明设计了一种基于典型对应分析的土壤氮储量估算方法，包括如下步骤：

步骤A.分别针对土壤区域中的各个采样点，构建采样点下的预设K个固定深度层次，并进入步骤B；

步骤B.分别针对土壤区域中的各个采样点，获得采样点下各个固定深度层次分别所对应的土壤氮含量，并进一步获得采样点下各个固定深度层次分别所对应的土壤氮密度，然后进入步骤C；

步骤C.分别针对土壤区域中的各个采样点，获得采样点所对应预设总环境变量集合X中的各个环境变量，然后将各个采样点下各个固定深度层次分别所对应的土壤氮密度，以及各个采样点分别所对应预设总环境变量集合X中的各个环境变量构成预测数据集Pred，然后进入步骤D；

步骤D.使用多元线性回归方法与随机森林方法，根据预测数据集Pred，分别针对各个固定深度层次，剔除固定深度层次相对各个采样点不显著的环境变量，进而分别更新获得各个固定深度层次分别相对应各个采样点的第一优化环境变量集合X_MLR_k，最后进入步骤E，其中，1≤k≤K；

步骤E.使用典型对应分析，根据预测数据集Pred，针对预设总环境变量集合X中各个环境变量进行典型对应分析，选择综合作用显著的环境变量，构成第二优化环境变量集合X_CCA，然后进入步骤F；

步骤F.根据各个固定深度层次分别相对各个采样点的第一优化环境变量集合X_MLR_k，以及第二优化环境变量集合X_CCA，构建综合环境变量集合，并针对综合环境变量集合与土壤属性的拟合，进行多种主成分分析测试，选择最优主成分分析方法，然后进入步骤G；

步骤G.采用最优主成分分析方法针对综合环境变量集合进行分析，获得环境变量分析结果，并根据环境变量分析结果和各个采样点下各个固定深度层次分别所对应的土壤氮密度，构建多种预测模型，接着使用留一法交叉验证评估预测模型，获得最优预测模型，最后，根据最优预测模型预测土壤区域中未采样区域的土壤氮储量。

作为本发明的一种优选技术方案：所述步骤A中，分别针对土壤区域中的各个采样点，按如下步骤进行操作，构建采样点下的预设K个固定深度层次；

步骤A01.判断采样点至其下基岩层的深度是否小于预设深度，是则进入步骤A02，否则直接将采样点下的预设深度划分为预设K个固定深度层次，构建采样点下的预设K个固定深度层次，该采样点的处理结束；

步骤A02.将采样点至其下基岩层的深度划分为预设K个层次，并针对该各个层次深度，按该各个层次深度与预设深度划分为预设K个固定深度之间的比例进行拉伸，统一为预设K个固定深度层次，构建采样点下的预设K个固定深度层次，该采样点的处理结束。

作为本发明的一种优选技术方案：所述步骤B包括如下步骤：

步骤B01.针对土壤区域中的各个采样点，获得各个采样点下各个固定深度层次分别所对应的土壤氮含量TN_ik，1≤i≤n，TN_ik表示第i个采样点下第k个固定深度层次所对应的土壤氮含量，然后进入步骤B02；

步骤B02.根据如下公式：

分别获得各个采样点下各个固定深度层次分别所对应的土壤氮密度TND_ik，其中，TND_ik表示第i个采样点下第k个固定深度层次所对应的土壤氮密度；TN_ik表示第i个采样点下第k个固定深度层次所对应的土壤氮含量，BD_ik表示第i个采样点下第k个固定深度层次所对应的土壤容重；Gr_ik表示第i个采样点下第k个固定深度层次所对应的土壤砾石含量；T_k表示第k个固定深度层次所对应的深度。

作为本发明的一种优选技术方案：所述预设总环境变量集合X中包括气候、地形因子、土地利用类型、成土母质类型、植被类型，其中，气候包括年均降水、年均降雨变量；地形因子包括坡度、坡向、高程、地形湿度指数因子、地表曲率。

作为本发明的一种优选技术方案：所述步骤D包括如下步骤：

步骤D01.根据各个采样点下各个固定深度层次分别所对应的土壤氮密度，分别针对各个固定深度层次，针对预设总环境变量集合X，使用逐步回归方法，剔除固定深度层次相对各个采样点不显著的环境变量，选择线性回归模型中自变量集合，即各个固定深度层次分别相对各个采样点的第一优化环境变量集合X_MLR_k，X_MLR_k表示第k个固定深度层次相对各个采样点的第一优化环境变量集合，然后进入步骤D02；

步骤D02.根据各个采样点下各个固定深度层次分别所对应的土壤氮密度，分别针对各个固定深度层次，使用随机森林模型计算固定深度层次相对各个采样点所对应预设总环境变量集合X中各个环境变量的重要性，构成固定深度层次相对各个采样点所对应环境变量重要性集合，即各个固定深度层次相对各个采样点所对应环境变量重要性集合RF_k，RF_k表示第k个固定深度层次相对各个采样点所对应环境变量重要性集合，然后进入步骤D03；

步骤D03.分别针对各个固定深度层次相对各个采样点所对应环境变量重要性集合RF_k，针对RF_k中各个环境变量，按重要性进行降序排序，并选择前预设比例数量的环境变量，构成集合RF_k'，然后进入步骤D04；

步骤D04.分别针对各个固定深度层次分别相对各个采样点的第一优化环境变量集合X_MLR_k，将存在于X_MLR_k中、且不存在于RF_k'中的环境变量，由X_MLR_k中删除，更新X_MLR_k，进而分别更新获得各个固定深度层次分别相对各个采样点的第一优化环境变量集合X_MLR_k。

作为本发明的一种优选技术方案：所述步骤E包括如下步骤：

步骤E01.以预测数据集Pred为分析对象，分别针对各个采样点，初始化采样点分数A_i，以及初始化λ＝1，1≤i≤n，n表示采样点的数量；

步骤E02.使用特征值λ，按如下公式：

计算所有采样点对应预设总环境变量集合X中各环境变量的分数W_m，1≤m≤M，M表示预设总环境变量集合X中环境变量的数量，W_m表示所有采样点对应预设总环境变量集合X中第m个环境变量的分数W_m，B_im表示第i个采样点所对应预设总环境变量集合X中的第m个环境变量，B_0m表示所有采样点分别对应预设总环境变量集合X中第m个环境变量之和；

步骤E03.分别针对各个采样点，根据如下公式：

计算获得采样点对应预设总环境变量集合X中各个环境变量平均加权后样点分数进而分别获得各个采样点对应预设总环境变量集合X中各个环境变量平均加权后的样点分数然后，获得所有采样点对应预设总环境变量集合X中各个环境变量平均加权后的样点分数之和其中，B_i0表示第i个采样点对应预设总环境变量集合X中各个环境变量之和；

步骤E04.根据如下公式：

获得方程的回归系数E，式中，A表示所有采样点分数集合，X表示预设总环境变量集合；

步骤E05.根据如下公式：

计算获得所有采样点所构样点图的质心c，并进一步根据如下公式：

计算获得分散度f，其中，

步骤E06.以步骤E02至步骤E05为单次迭代，判断当前样点分数之和与上次迭代中样点分数之和的差值是否小于预设阈值，是则结束迭代，并进入步骤E07；否则将特征值λ的值更新为所有样点分数的平方和，并返回步骤E02；

步骤E07.分析典型对应分析的结果，根据样点图中各个环境变量与中心之间的距离，针对各个环境变量按距离由近至远的顺序进行排序，并按序选取预设总环境变量集合X中预设比例数量的环境变量，构成第二优化环境变量集合X_CCA。

作为本发明的一种优选技术方案：所述步骤F包括如下步骤：

步骤F01.分别针对第二优化环境变量集合X_CCA中的各个环境变量，判断环境变量是否位于第一优化环境变量集合X_MLR_k中，是则不做任何处理；否则将该环境变量加入至第一优化环境变量集合X_MLR_k中；进而针对第二优化环境变量集合X_CCA中各个环境变量进行如上处理，更新获得第一优化环境变量集合X_MLR_k，作为综合环境变量集合；

步骤F02.采用预设各类主成分分析法，针对综合环境变量集合与土壤属性的拟合进行主成分分析测试，并根据预设方差解释阈值，选择最优主成分分析方法。

作为本发明的一种优选技术方案：所述步骤F02中的预设各类主成分分析法包括：PCA主成分分析、核主成分分析KPCA、稀疏主成分分析SPCA和奇异值分解SVD。

作为本发明的一种优选技术方案：所述步骤G包括如下步骤：

步骤G01.采用最优主成分分析方法针对综合环境变量集合进行分析，获得环境变量分析结果,并根据环境变量分析结果和各个采样点下各个固定深度层次分别所对应的土壤氮密度，采用预设各类构建方法，构建对应各种预测模型；

步骤G02.采用留一法交叉验证方法评估各个预测模型，分别针对各种预测模型，获得对应预测结果，并分别根据各个采样点下各个固定深度层次分别所对应的土壤氮密度与各种预测模型所对应的预测结果，分别计算获得各个预测模型的预测误差，然后进一步分别获得各个预测模型所对应的均方根误差，最后选择最小均方根误差所对应的预测模型作为最优预测模型；

步骤G03.根据最优预测模型和综合环境变量集合，预测获得土壤区域中未采样区域中各个未采样点的土壤氮密度TND_r，然后采用如下公式：

获得土壤区域中未采样区域的土壤氮储量，其中，1≤r≤R，R表示土壤区域中未采样区域中未采样点的数量，Area表示土壤区域中未采样样点所代表的面积。

作为本发明的一种优选技术方案：所述步骤G01中，所述预设各类构建方法包括多元线性回归方法、随机森林方法、外部漂移克里格方法。

本发明所述一种基于典型对应分析的土壤氮储量估算方法采用以上技术方案与现有技术相比，具有以下技术效果：

(1)本发明设计的一种基于典型对应分析的土壤氮储量估算方法，能够合理融合不同重要性分析方法的分析结果，集成了传统的降维技术与重要性分析技术(多元回归、随机森林)，进而防止了模型过拟合或环境变量数据集信息特征的缺失。在未来环境变量日益丰富的条件下，能够充分挖掘变量的有效特征，进而最大程度地提升预测模型的泛化能力；

(2)本发明设计的一种基于典型对应分析的土壤氮储量估算方法中，创新地采用了典型对应分析计算综合作用显著的环境变量，该方法能够充分体现多变量直接梯度分析方法的优势，将土壤视为一个有机的整体，分析不同土壤属性与环境变量的综合耦合关系，进而筛选综合作用最为显著的环境变量集合，有效提升制图分辨率并扩大制图范围，进而显著地提高土壤信息的服务功能和质量；

(3)本发明设计的一种基于典型对应分析的土壤氮储量估算方法中，提出了提出的综合预处理与重要性分析机制，具有一定的普适性，并且所提出的技术方案不仅面向土壤氮储量估算，也可以与土壤有机碳估算相结合，构成土壤碳氮比预测的技术流程，不仅如此，本发明设计技术方案还具有较好的鲁棒性，通过多种技术筛选的综合环境变量集合可望在保证预测精度的同时，也降低其他土壤属性预测过程的误差。

附图说明

图1是土壤采样点数据与环境变量集合构建主要流程图；

图2是基于多元线性回归与随机森林模型的环境变量选择流程示意图；

图3是基于最优预测模型与综合环境变量估算研究区土壤氮储量的分析流程图；

图4是本发明实施例中0-30cm土壤氮密度与环境变量的回归系数直方图；

图5是本发明实施例中0-30cm土壤氮密度与环境变量的典型对应分析散点图；

图6是本发明实施例中0-30cm土壤氮密度空间分布图。

具体实施方式

下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。

本发明所设计基于典型对应分析的土壤氮储量估算方法，属于面向计量土壤学与空间分析中土壤氮储量估算技术领域，涉及一米土体土壤氮密度计算与土壤氮密度在不同景观特征下呈现的空间变异特征模拟，能够通过多种降维技术对自变量进行高效的信息预处理，使用典型对应分析分析不同深度氮储量的综合影响变量。特别是在不同性质、不同深度的土壤属性影响因素分析方面，构建多种土壤属性与环境变量典型特征的综合拟合关系。

本发明设计技术方案的基本思想是在建立空间预测模型前，通过环境变量的重要性分析、主成分分析与典型对应分析对环境变量的信息量进行分析。通过多种主成分分析技术的对比试验，选择一种最高效的主成分分析方法。通过构建多种土壤属性与尽可能多的环境变量进行典型对应分析，遴选综合作用较为显著的环境变量，在保证高维环境变量集合的特征能够充分保留的情况下，基于数字土壤制图方法与交叉验证机制，提升空间预测精度。

为实现上述目的，本发明设计了一种基于典型对应分析的土壤氮储量估算方法，实际应用过程当中，具体包括如下步骤：

步骤A.分别针对土壤区域中的各个采样点，构建采样点下的预设K个固定深度层次，并进入步骤B。如图1所示，具体分别针对土壤区域中的各个采样点，按如下步骤进行操作，构建采样点下的预设K个固定深度层次。

步骤A01.判断采样点至其下基岩层的深度是否小于预设深度，是则进入步骤A02，否则直接将采样点下的预设深度划分为预设K个固定深度层次，构建采样点下的预设K个固定深度层次，该采样点的处理结束。

步骤A02.将采样点至其下基岩层的深度划分为预设K个层次，并针对该各个层次深度，按该各个层次深度与预设深度划分为预设K个固定深度之间的比例进行拉伸，统一为预设K个固定深度层次，构建采样点下的预设K个固定深度层次，该采样点的处理结束，实际应用中，可以设置第一个固定深度层次的厚度为0-5cm，第二个固定深度层次的厚度为5-15cm，第三个固定深度层次的厚度为15-30cm，第四个固定深度层次的厚度为30-60cm，第五个固定深度层次的厚度为60-100cm。

步骤B.分别针对土壤区域中的各个采样点，获得采样点下各个固定深度层次分别所对应的土壤氮含量，并进一步获得采样点下各个固定深度层次分别所对应的土壤氮密度，然后进入步骤C。

上述步骤B具体包括如下步骤：

步骤B01.按照GSM国际土壤制图标准(GlobalSoilMap)，使用等积样条函数(equal-area spline)，针对土壤区域中的各个采样点，获得各个采样点下各个固定深度层次分别所对应的土壤氮含量TN_ik，1≤i≤n，TN_ik表示第i个采样点下第k个固定深度层次所对应的土壤氮含量，然后进入步骤B02。

步骤B02.根据如下公式：

步骤C.分别针对土壤区域中的各个采样点，获得采样点所对应预设总环境变量集合X中的各个环境变量，然后将各个采样点下各个固定深度层次分别所对应的土壤氮密度，以及各个采样点分别所对应预设总环境变量集合X中的各个环境变量构成预测数据集Pred，然后进入步骤D。其中，预设总环境变量集合X中包括气候、地形因子、土地利用类型、成土母质类型、植被类型，其中，气候包括年均降水、年均降雨变量；地形因子包括坡度、坡向、高程、地形湿度指数因子、地表曲率。

步骤D.使用多元线性回归方法与随机森林方法，根据预测数据集Pred，分别针对各个固定深度层次，剔除固定深度层次相对各个采样点不显著的环境变量，进而分别更新获得各个固定深度层次分别相对应各个采样点的第一优化环境变量集合X_MLR_k，最后进入步骤E，其中，1≤k≤K。

如图2所示，上述步骤D具体包括如下步骤：

步骤D01.根据各个采样点下各个固定深度层次分别所对应的土壤氮密度，分别针对各个固定深度层次，针对预设总环境变量集合X，使用逐步回归方法，剔除固定深度层次相对各个采样点不显著的环境变量，选择线性回归模型中自变量集合，即各个固定深度层次分别相对各个采样点的第一优化环境变量集合X_MLR_k，X_MLR_k表示第k个固定深度层次相对各个采样点的第一优化环境变量集合，然后进入步骤D02。

由于环境变量已经进行归一化操作，因此环境变量的量纲对回归方程的构建不会造成影响。因此，对土壤氮密度与环境变量的回归方程拟合可以得到每个环境变量的回归系数，回归系数的大小代表了该变量的在回归模型的重要性。

有别于多元回归模型，随机森林模型能够通过构建众多的决策树，通过袋外数据误差(out of bag)机制计算模型的预测错误率，进而计算每个特征的重要性，并按照降序排序。该方法已被证明为无偏估计，因此随机森林模型不需要再进行交叉验证。

步骤D02.根据各个采样点下各个固定深度层次分别所对应的土壤氮密度，分别针对各个固定深度层次，使用随机森林模型计算固定深度层次相对各个采样点所对应预设总环境变量集合X中各个环境变量的重要性，构成固定深度层次相对各个采样点所对应环境变量重要性集合，即各个固定深度层次相对各个采样点所对应环境变量重要性集合RF_k，RF_k表示第k个固定深度层次相对各个采样点所对应环境变量重要性集合，然后进入步骤D03。

步骤D03.分别针对各个固定深度层次相对各个采样点所对应环境变量重要性集合RF_k，针对RF_k中各个环境变量，按重要性进行降序排序，并选择前预设比例数量的环境变量，构成集合RF_k'，然后进入步骤D04。实际应用中，选择前80％数量的环境变量，构成集合RF_k'。

步骤E.使用典型对应分析，根据预测数据集Pred，针对预设总环境变量集合X中各个环境变量进行典型对应分析，选择综合作用显著的环境变量，构成第二优化环境变量集合X_CCA，然后进入步骤F。

上述步骤E具体包括如下步骤：

步骤E01.以预测数据集Pred为分析对象，分别针对各个采样点，初始化采样点分数A_i，以及初始化λ＝1，1≤i≤n，n表示采样点的数量。

步骤E02.使用特征值λ，按如下公式：

计算所有采样点对应预设总环境变量集合X中各环境变量的分数W_m，1≤m≤M，M表示预设总环境变量集合X中环境变量的数量，W_m表示所有采样点对应预设总环境变量集合X中第m个环境变量的分数W_m，B_im表示第i个采样点所对应预设总环境变量集合X中的第m个环境变量，B_0m表示所有采样点分别对应预设总环境变量集合X中第m个环境变量之和。

步骤E03.分别针对各个采样点，根据如下公式：

计算获得采样点对应预设总环境变量集合X中各个环境变量平均加权后样点分数进而分别获得各个采样点对应预设总环境变量集合X中各个环境变量平均加权后的样点分数然后，获得所有采样点对应预设总环境变量集合X中各个环境变量平均加权后的样点分数之和其中，B_i0表示第i个采样点对应预设总环境变量集合X中各个环境变量之和。

步骤E04.根据如下公式：

获得方程的回归系数E，式中，A表示所有采样点分数集合，X表示预设总环境变量集合。

步骤E05.根据如下公式：

计算获得分散度f，其中，

步骤E06.以步骤E02至步骤E05为单次迭代，判断当前样点分数之和与上次迭代中样点分数之和的差值是否小于预设阈值，是则结束迭代，并进入步骤E07；否则将特征值λ的值更新为所有样点分数的平方和，并返回步骤E02。

分析典型对应分析的结果，从距离中的位置看：越靠近中心，越没有特征，越远离中心，说明特征越明显。因此，距离图的中心最远的环境变量对于不同深度的土壤氮密度变量越具有统计意义。

步骤F.根据各个固定深度层次分别相对各个采样点的第一优化环境变量集合X_MLR_k，以及第二优化环境变量集合X_CCA，构建综合环境变量集合，并针对综合环境变量集合与土壤属性的拟合，进行多种主成分分析测试，选择最优主成分分析方法，然后进入步骤G。

上述步骤F具体包括如下步骤：

步骤F02.采用预设各类主成分分析法，针对综合环境变量集合与土壤属性的拟合进行主成分分析测试，并根据预设方差解释阈值，选择最优主成分分析方法，其中，预设各类主成分分析法包括：PCA主成分分析(principal component analysis，PCA)、核主成分分析KPCA(kernel principal component analysis，KPCA)、稀疏主成分分析SPCA(sparseprincipal component analysis，SPCA)和奇异值分解SVD(singular valuedecomposition，SVD)。

如图3所示，上述步骤G具体包括如下步骤：

步骤G01.采用最优主成分分析方法针对综合环境变量集合进行分析，获得环境变量分析结果,并根据环境变量分析结果和各个采样点下各个固定深度层次分别所对应的土壤氮密度，采用预设各类构建方法，构建对应各种预测模型，其中，预设各类构建方法包括多元线性回归方法(MLR)、随机森林方法(RF)、外部漂移克里格方法(KED)。

步骤G02.采用留一法交叉验证方法评估各个预测模型，分别针对各种预测模型，获得对应预测结果，并分别根据各个采样点下各个固定深度层次分别所对应的土壤氮密度与各种预测模型所对应的预测结果，分别计算获得各个预测模型的预测误差，然后进一步分别获得各个预测模型所对应的均方根误差，最后选择最小均方根误差所对应的预测模型作为最优预测模型。

将上述本发明所设计基于典型对应分析的土壤氮储量估算方法，应用于吉林省德惠市与榆树市的土壤氮储量的估算。

土壤氮密度在不同的土壤层次中变化较大。在土壤表层，土壤氮密度受地表植被影响较大，氮库含量往往较高。然而，表下层土壤氮密度仍然不可忽略。为了更准确地分析不同气候、成土条件下各种生态系统氮库特点，技术人员往往需要计算不同深度的土壤氮密度及区域的氮储量，以研究区土壤表层(0-30cm)与表下层(0-100cm)的土壤氮储量估算为例，其中，设置第一个固定深度层次的厚度为0-5cm，第二个固定深度层次的厚度为5-15cm，第三个固定深度层次的厚度为15-30cm，第四个固定深度层次的厚度为30-60cm，第五个固定深度层次的厚度为60-100cm。

经过上述步骤A-至步骤F进行操作后，其中，步骤D01中，0-30cm深度土壤对应环境变量回归系数的直方图如图4所示，所述步骤E06中，当结束迭代时，0-30cm深度土壤所典型对应分析结果如图5所示；后进入步骤G，执行步骤G的操作，并且步骤G02中选在外部漂移克里格方法(KED)所建立的预测模型作为最优预测模型，则采用最优预测模型获得土壤区域中未采样区域中各个未采样点的土壤氮密度，其中，0-30cm土壤氮密度的预测结果如图6所示，最后进一步获得土壤区域中未采样区域的土壤氮储量。

基于以上分析，示例案例的预测结果如图6所示。本发明采用的典型对应分析方法能够综合不同环境变量对不同深度土壤属性的影响，进而提取其最显著的数据特征。这些特征能够将土壤视为一个有机的整体，进而显著提升土壤信息的挖掘质量。该发明提出的综合处理与重要性分析机制具有较高的普适性，不仅能够计算土壤氮储量，还可以计算其他土壤属性不同深度的储量(如土壤碳、土壤磷等)。此方法有待于在更多的领域内应用，以检验其性能。

上面结合附图对本发明的实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims

1.一种基于典型对应分析的土壤氮储量估算方法，其特征在于，包括如下步骤：

2.根据权利要求1所述一种基于典型对应分析的土壤氮储量估算方法，其特征在于：所述步骤A中，分别针对土壤区域中的各个采样点，按如下步骤进行操作，构建采样点下的预设K个固定深度层次；

步骤A02.将采样点至其下基岩层的深度划分为预设K个层次，获得K个层次深度，并针对该各个层次深度，按该各个层次深度与预设深度划分为预设K个固定深度之间的比例进行拉伸，统一为预设K个固定深度层次，构建采样点下的预设K个固定深度层次，该采样点的处理结束。

3.根据权利要求1所述一种基于典型对应分析的土壤氮储量估算方法，其特征在于：所述步骤B包括如下步骤：

步骤B01.针对土壤区域中的各个采样点，获得各个采样点下各个固定深度层次分别所对应的土壤氮含量TN_ik，1≤i≤n，n表示采样点的数量，TN_ik表示第i个采样点下第k个固定深度层次所对应的土壤氮含量，然后进入步骤B02；

步骤B02.根据如下公式：

4.根据权利要求1所述一种基于典型对应分析的土壤氮储量估算方法，其特征在于：所述预设总环境变量集合X中包括气候、地形因子、土地利用类型、成土母质类型、植被类型，其中，气候包括年均降水、年均降雨变量；地形因子包括坡度、坡向、高程、地形湿度指数因子、地表曲率。

5.根据权利要求1所述一种基于典型对应分析的土壤氮储量估算方法，其特征在于：所述步骤D包括如下步骤：

6.根据权利要求1所述一种基于典型对应分析的土壤氮储量估算方法，其特征在于：所述步骤E包括如下步骤：

步骤E02.使用特征值λ，按如下公式：

计算所有采样点对应预设总环境变量集合X中各环境变量的分数W_m，1≤m≤M，M表示预设总环境变量集合X中环境变量的数量，W_m表示所有采样点对应预设总环境变量集合X中第m个环境变量的分数，B_im表示第i个采样点所对应预设总环境变量集合X中的第m个环境变量，B_0m表示所有采样点分别对应预设总环境变量集合X中第m个环境变量之和；

步骤E03.分别针对各个采样点，根据如下公式：

步骤E04.根据如下公式：

获得方程的回归系数E，式中，A表示所有采样点分数集合，X表示预设总环境变量集合；步骤E05.根据如下公式：

计算获得分散度f，其中，

7.根据权利要求1所述一种基于典型对应分析的土壤氮储量估算方法，其特征在于：所述步骤F包括如下步骤：

步骤F01.分别针对第二优化环境变量集合X_CCA中的各个环境变量，判断环境变量是否位于第一优化环境变量集合X_MLR_k中，是则不做任何处理；否则将该环境变量加入至第一优化环境变量集合X_MLR_k中；进而针对第二优化环境变量集合X_CCA中各个环境变量进行如上处理，更新获得第一优化环境变量集合X_MLR_k，作为综合环境变量集合；步骤F02.采用预设各类主成分分析法，针对综合环境变量集合与土壤属性的拟合进行主成分分析测试，并根据预设方差解释阈值，选择最优主成分分析方法。

8.根据权利要求7所述一种基于典型对应分析的土壤氮储量估算方法，其特征在于：所述步骤F02中的预设各类主成分分析法包括：PCA主成分分析、核主成分分析KPCA、稀疏主成分分析SPCA和奇异值分解SVD。

9.根据权利要求1所述一种基于典型对应分析的土壤氮储量估算方法，其特征在于：所述步骤G包括如下步骤：

10.根据权利要求9所述一种基于典型对应分析的土壤氮储量估算方法，其特征在于：所述步骤G01中，所述预设各类构建方法包括多元线性回归方法、随机森林方法、外部漂移克里格方法。