CN115293024A

CN115293024A - 整合多源协同变量的场地土壤污染物浓度三维空间插值方法

Info

Publication number: CN115293024A
Application number: CN202210760436.5A
Authority: CN
Inventors: 赵永存; 陈剑; 彭雨璇; 谢恩泽
Original assignee: Institute of Soil Science of CAS
Current assignee: Institute of Soil Science of CAS
Priority date: 2022-06-29
Filing date: 2022-06-29
Publication date: 2022-11-04

Abstract

本发明涉及整合多源协同变量的场地土壤污染物浓度三维空间插值方法，包括：1、钻孔土壤污染物浓度数据与多源协同变量数据收集；2、协同变量主成分提取；3、协同变量主成分筛选；4、计算待插值三维栅格与土壤采样点处协同变量间的马氏距离以及其三维坐标位置间的欧式距离；5、将协同变量间马氏距离的p次幂与三维坐标位置间欧式距离的p次幂按一定权重比例α求和，再取倒数作为插值权重，构建整合多源协同变量的三维插值模型；6、利用模拟退火优化参数α和p，采用参数优化后的插值模型进行三维插值；整个设计方案能显著提升稀疏钻孔土壤污染数据的三维插值精度和空间分布刻画细节，应用前景广阔。

Description

整合多源协同变量的场地土壤污染物浓度三维空间插值方法

技术领域

本发明涉及整合多源协同变量的场地土壤污染物浓度三维空间插值方法，属于土壤污染预测技术领域。

背景技术

准确刻画场地土壤污染物浓度的三维空间分布是场地污染风险评估以及污染修复的迫切需求。目前的场地调查与污染风险制图实践工作中，主要采用基于“距离越近越相似”原则的空间插值法对土壤污染物浓度的三维空间分布进行插值预测。其中，应用最为广泛的三维空间插值方法主要包括三维反距离加权插值法(Inverse Distance Weighting，IDW)和三维普通克里格插值法(Ordinary Kriging，OK)等。然而，目前的空间插值方法在场地土壤污染物浓度空间预测中还存在以下不足之处：

(1)场地土壤污染物的空间分布模式极为复杂，“两点距离很近，但其污染物浓度差异极其显著”的情况普遍存在，使得IDW和OK插值法“距离越近越相似”的原则难以全部满足，从而导致土壤污染物浓度插值结果的误差较大。

(2)由于钻孔取样与样品实验室分析的经济与时间成本制约，污染场地调查的钻孔数量可能较为稀疏。IDW插值法仅考虑了地理空间中样点欧式距离对空间插值权重的影响，从而导致其插值结果的平滑效应较强，难以反映污染物浓度局部空间变异的细节特征。同时，在钻孔数量稀疏的条件下，由于不同间距的土壤样点对数较少，土壤污染物浓度的半方差函数推断存在极大的不确定性，从而导致OK插值法的插值结果可靠性变差、难以应用。

(3)场地调查中，尽管钻孔数量可能较为稀疏，但依然可以获取许多与污染物浓度相关的协同变量数据，比如场地功能区布局图，地层结构、地球物理探测的电导率和电阻率分布图等多种来源数据，然而，在稀疏钻孔条件下，现有空间插值方法还难以整合这些多源协同变量数据，从而制约了空间插值精度的提升。

发明内容

本发明所要解决的技术问题是提供整合多源协同变量的场地土壤污染物浓度三维空间插值方法，采用全新设计策略，能够有效提高土壤污染物浓度空间预测效率。

本发明为了解决上述技术问题采用以下技术方案：本发明设计了整合多源协同变量的场地土壤污染物浓度三维空间插值方法，通过步骤A至步骤G，获得目标区域的土壤污染物浓度三维插值模型，通过步骤i，应用土壤污染物浓度三维插值模型，实现目标区域地下空间的土壤污染物浓度三维分布预测；

步骤A.获得目标区域内预设各钻孔位置下各预设深度土壤样点的土壤污染物浓度实测值，以及目标区域对应包含预设各数据类型的多源协同变量数据集，然后进入步骤B；

步骤B.基于目标区域预设的三维栅格化地下空间，获得目标区域地下空间各栅格分别对应的多源协同变量数据集，并利用主成分分析法，获得多源协同变量数据集中的各协同变量主成分的得分，进而根据土壤样点位置，获得各土壤样点分别对应的各协同变量主成分的得分，然后进入步骤C；

步骤C.基于各土壤样点，以土壤样点所对应各协同变量主成分的得分为自变量、土壤污染物浓度实测值为因变量进行逐步回归分析，对各协同变量主成分数据进行筛选，获得其中与土壤污染物浓度显著相关的各个主成分，构成各个协同变量，然后进入步骤D；

步骤D.基于各个协同变量，获得各栅格分别所对应各协同变量数据组成的协同变量向量，以及获得各土壤样点分别所对应各协同变量数据组成的协同变量向量，然后进入步骤E；

步骤E.获得各栅格所对应协同变量向量分别与各土壤样点所对应协同变量向量之间的马氏距离，以及获得各栅格分别与各土壤样点之间的三维欧氏距离，然后进入步骤F；

步骤F.根据各个马氏距离、各个三维欧氏距离，以及权重比例参数α、距离幂次参数p，构建土壤污染物浓度三维插值模型，然后进入步骤G；

步骤G.利用模拟退火算法，优化获得土壤污染物浓度三维插值模型中权重比例参数α的值和距离幂次参数p的值，即获得目标区域所对应的土壤污染物浓度三维插值模型；

步骤i，分别针对目标区域地下空间的各个栅格，应用土壤污染物浓度三维插值模型，获得栅格的土壤污染物浓度预测值，即实现对目标区域地下空间的土壤污染物浓度三维预测。

作为本发明的一种优选技术方案：还包括步骤H如下，执行完步骤G之后，进入步骤H；

步骤H.应用交叉验证方法，计算基于土壤污染物浓度三维插值模型所获土壤样点土壤污染物浓度预测值与其对应土壤污染物浓度实测值之间的均方根误差，即获得土壤污染物浓度三维插值模型的插值精度。

作为本发明的一种优选技术方案：所述多源协同变量数据集包含的预设各数据类型为场地功能区类型分布、地球物理探测反演的土壤电阻率分布、地球物理探测反演的土壤电导率分布。

作为本发明的一种优选技术方案：所述步骤E包括如下步骤E1至步骤E2：

步骤E1.首先分别针对目标区域地下空间的各个栅格，按如下公式：

获得各栅格所对应协同变量向量分别与各土壤样点所对应协同变量向量之间的马氏距离(MD_ij)_I×J，其中，i＝1、2、...、I，I表示目标区域地下空间中栅格的数量，j＝1、2、...、J，J表示目标区域中土壤样点的数量，cov_i表示目标区域地下空间第i个栅格所对应的协同变量向量，cov_j表示目标区域第j个土壤样点所对应的协同变量向量，∑表示协方差矩阵，(·)^T表示转置，MD_ij表示目标区域地下空间第i个栅格所对应协同变量向量与目标区域第j个土壤样点所对应协同变量向量之间的马氏距离；

同时，分别针对目标区域地下空间的各个栅格，按如下公式：

获得各栅格分别与各土壤样点之间的三维欧氏距离(ED_ij)_I×J，其中，(x_1，i，x_2，i，x_3，i)表示目标区域地下空间第i个栅格的三维坐标，(y_1，j，y_2，j，y_3，j)表示目标区域第j个土壤样点的三维坐标；然后进入步骤E2；

步骤E2.将各马氏距离(MD_ij)_I×J、各欧氏距离(ED_ij)_I×J归一化至同一尺度，更新各马氏距离(MD_ij)_I×J、各欧氏距离(ED_ij)_I×J，然后进入步骤F。

作为本发明的一种优选技术方案：所述步骤F中，根据各个马氏距离(MD_ij)_I×J、各个欧氏距离(ED_ij)_I×J，以及权重比例参数α、距离幂次参数p，构建土壤污染物浓度三维插值模型如下：

然后进入步骤G，其中，P_i表示目标区域地下空间第i个栅格的土壤污染物浓度预测值，V_j表示目标区域第j个土壤样点的土壤污染物浓度实测值。

作为本发明的一种优选技术方案：所述步骤G中，基于距离幂次参数p的先验取值范围[1，3]、以及权重比例参数α的先验取值范围[0，1]，利用模拟退火算法，优化获得土壤污染物浓度三维插值模型中权重比例参数α的值和距离幂次参数p的值。

作为本发明的一种优选技术方案：所述步骤i中，应用土壤污染物浓度三维插值模型，实现对目标区域地下空间的土壤污染物浓度预测的过程中，若栅格与距离其最近土壤样点之间欧氏距离及协同变量间马氏距离均小于或分别等于预设对应阈值，则定义该土壤样点的土壤污染物浓度实测值即为该栅格的土壤污染物浓度预测值。

本发明所述整合多源协同变量的场地土壤污染物浓度三维空间插值方法，采用以上技术方案与现有技术相比，具有以下技术效果：

本发明所设计整合多源协同变量的场地土壤污染物浓度三维空间插值方法，采用全新设计策略，通过多源协同变量在属性空间中的马氏距离，校正三维反距离加权插值法在待插值三维栅格位置的插值权重比例，从而在空间插值方法中实现多源协同变量数据的整合，在场地稀疏钻孔的条件下，能够获得更高精度的土壤物污染浓度三维空间分布插值结果，有助于降低场地污染风险制图成本；并且关于所设计空间插值方法的参数，采用模拟退火算法进行优化，能够有效降低插值参数人为设定对插值精度的影响。

附图说明

图1是本发明三维插值方法具体实现过程的流程图

图2是模拟退火算法优化三维插值模型参数α和p的流程图；

图3是某场地污染地块土壤钻孔空间分布图；

图4是某场地污染地块电导率空间分布图；

图5是某场地污染地块电阻率空间分布图；

图6是被接受参数值对应的插值模型均方根误差随模拟退火迭代次数的变化曲线；

图7a是采用本发明的三维插值方法预测的某污染地块土壤Cr⁶⁺浓度三维空间分布图；

图7b是采用传统IDW插值方法预测的某污染地块土壤Cr⁶⁺浓度三维空间分布图。

具体实施方式

下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。

本发明设计了整合多源协同变量的场地土壤污染物浓度三维空间插值方法，实际应用当中，如图1所示，通过如下步骤A至步骤G，获得目标区域的土壤污染物浓度三维插值模型。

步骤A.获得目标区域内预设各钻孔位置下各预设深度土壤样点的土壤污染物浓度实测值，以及目标区域对应包含预设各数据类型的多源协同变量数据集，然后进入步骤B。

应用中，关于多源协同变量数据集包含的预设各数据类型，设计包括场地功能区类型分布、地球物理探测反演的土壤电阻率分布、地球物理探测反演的土壤电导率分布，多种来源的协同变量数据，有助于从不同的角度来反映土壤污染物浓度的空间变异特征信息。

步骤B.基于目标区域预设的三维栅格化地下空间，获得目标区域地下空间各栅格分别对应的多源协同变量数据集，并利用主成分分析法，获得多源协同变量数据集中的各协同变量主成分的得分，进而根据土壤样点位置，获得各土壤样点分别对应的各协同变量主成分的得分，然后进入步骤C。

由于各协同变量的原始数据之间可能具有相关性(即可能存在信息冗余的情况)，主成分分析方法提取的协同变量主成分之间，能够保证彼此相互独立，从而降低信息冗余。

步骤C.基于各土壤样点，以土壤样点所对应各协同变量主成分的得分为自变量、土壤污染物浓度实测值为因变量进行逐步回归分析，对各协同变量主成分数据进行筛选，获得其中与土壤污染物浓度显著相关的各个主成分，构成各个协同变量，然后进入步骤D。

步骤D.基于各个协同变量，获得各栅格分别所对应各协同变量数据组成的协同变量向量，以及获得各土壤样点分别所对应各协同变量数据组成的协同变量向量，然后进入步骤E。

步骤E.获得各栅格所对应协同变量向量分别与各土壤样点所对应协同变量向量之间的马氏距离，以及获得各栅格分别与各土壤样点之间的三维欧氏距离，然后进入步骤F。

实际应用中，上述步骤E包括如下步骤E1至步骤E2。

获得各栅格所对应协同变量向量分别与各土壤样点所对应协同变量向量之间的马氏距离(MD_ij)_I×J，其中，i＝1、2、...、I，I表示目标区域地下空间中栅格的数量，j＝1、2、...、J，J表示目标区域中土壤样点的数量，cov_i表示目标区域地下空间第i个栅格所对应的协同变量向量，cov_j表示目标区域第j个土壤样点所对应的协同变量向量，∑表示协方差矩阵，(·)^T表示转置，MD_ij表示目标区域地下空间第i个栅格所对应协同变量向量与目标区域第j个土壤样点所对应协同变量向量之间的马氏距离。

马氏距离反映了待插值三维栅格与土壤样点的协同变量向量之间的相似程度，即，两点协同变量向量之间的马氏距离越小，其协同变量向量越相似。由于筛选出的协同变量与土壤污染物浓度之间具有一定的相关性，因此，两点的协同变量向量越相似，其土壤污染物浓度也越相近，从而体现了协同变量向量中所包含的土壤污染物浓度空间分布差异性先验信息。

获得各栅格分别与各土壤样点之间的三维欧氏距离(ED_ij)_I×J，其中，(x_1，i，x_2，i，x_3，i)表示目标区域地下空间第i个栅格的三维坐标，(y_1，j，y_2，j，y_3，j)表示目标区域第j个土壤样点的三维坐标；然后进入步骤E2。

步骤E2.将各马氏距离(MD_ij)_I×J、各欧氏距离(ED_ij)_I×J归一化至同一尺度，更新各马氏距离(MD_ij)_I×J、各欧氏距离(ED_ij)_I×J，然后进入步骤F，应用中设计均归一化到[0，1]之间，以保证马氏距离和欧氏距离为同一尺度。

本发明构建整合多源协同变量的三维插值模型的核心思想在于，通过多源协同变量在属性空间中的马氏距离，来校正IDW插值在待插值三维栅格位置的插值权重比例，从而在空间插值方法中实现多源协同变量数据的整合。

步骤F.根据各个马氏距离(MD_ij)_I×J、各个欧氏距离(ED_ij)_I×J，以及权重比例参数α、距离幂次参数p，构建土壤污染物浓度三维插值模型如下：

从本发明整合多源协同变量的土壤污染物浓度三维插值模型可以看出，本发明的优势在于可以通过控制协同变量马氏距离与三维欧氏距离的比例，来调节其对空间插值权重的影响程度，从而充分利用场地污染多源协同变量信息，来提高稀疏钻孔的污染物浓度数据空间插值精度。

步骤G.如图2所示，基于距离幂次参数p的先验取值范围[1，3]、以及权重比例参数α的先验取值范围[0，1]，利用模拟退火算法，优化获得土壤污染物浓度三维插值模型中权重比例参数α的值和距离幂次参数p的值，即获得目标区域所对应的土壤污染物浓度三维插值模型，然后进入步骤H。

步骤H.应用诸如十折交叉验证或留一交叉验证等的交叉验证方法，计算基于土壤污染物浓度三维插值模型所获土壤样点土壤污染物浓度预测值与其对应土壤污染物浓度实测值之间的均方根误差，即获得土壤污染物浓度三维插值模型的插值精度。

基于上述所获土壤污染物浓度三维插值模型，通过步骤i，实现目标区域地下空间的土壤污染物浓度三维分布预测。

其中，应用土壤污染物浓度三维插值模型，实现对目标区域地下空间的土壤污染物浓度预测的过程中，若栅格与距离其最近土壤样点之间欧氏距离及协同变量间马氏距离均小于或分别等于预设对应阈值，则定义该土壤样点的土壤污染物浓度实测值即为该栅格的土壤污染物浓度预测值。

实际应用中，以某化工厂铬污染地块的土壤Cr⁶⁺浓度三维空间插值为例进行实例说明，应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

实施例为某化工厂的铬污染地块，特征污染物为Cr⁶⁺，采用本发明的三维插值方法对土壤Cr⁶⁺浓度进行三维空间插值，具体过程为：

(1)土壤污染物浓度实测值收集：本实例中，共收集到10个钻孔位置下各预设深度共34个土壤样点的Cr⁶⁺浓度实测数据。钻孔位置下最大采样深度为19.5m，钻孔数量较为稀疏，其中，各钻孔位置下各预设深度土壤样点的分布如图3所示；

(2)多源协同变量数据集收集：收集到的协同变量数据包括地下三维格网到铬盐生产车间的距离、感应电磁法(EM)不同探测频率获得的5个地下电导率分布图，如图4所示、以及如图5所示高密度电阻率法(ERT)探测反演获得的地下电阻率分布图，共7个协同变量。

(1)根据该污染地块的边界范围及大小，将地块的地下空间划分成为1m×1m×1m(长度、宽度、深度)栅格大小的三维格网，共计划分出720,500个三维栅格，用于后续的数据处理、分析和空间插值。

(2)利用空间提取分析，获取每个三维栅格对应的协同变量数值，构成待插值栅格处的多源协同变量数据集，其中，共720,500个三维栅格，每个栅格对应7个协同变量数值。

(3)利用主成分分析方法，对720,500个栅格的7个协同变量数据进行主成分分析，共提取特征值≥1的协同变量主成分5个。

(1)利用空间提取分析，获取34个土壤样点对应的5个协同变量主成分的得分；

(2)以34个土壤采样点的Cr⁶⁺浓度为因变量，以5个协同变量主成分的得分为自变量，进行逐步回归分析，在显著性p值为0.05的条件下，共筛选出2个与Cr⁶⁺浓度显著相关的主成分，这个2个主成分将作为后续三维空间插值模型构建的协同变量。

(1)针对1m×1m×1m的污染地块地下空间三维格网，以筛选出的2个主成分的协同变量构建协同变量向量，计算720,500个待插值三维栅格位置的协同变量与34个土壤采样点位置协同变量间的马氏距离矩阵(MD_ij)_720500×34(i＝1,2,3,…,720500；j＝1,2,3,…,34)

(2)针对1m×1m×1m栅格大小的污染地块地下空间三维格网，计算720,500个待插值三维栅格与34个土壤采样点三维坐标位置间的欧氏距离矩阵(ED_ij)_720500×34(i＝1,2,3,…,720500；j＝1,2,3,…,34)。

(3)将协同变量间马氏距离矩阵和三维坐标位置间欧氏距离矩阵中的元素数分别看作一个总体，并分别归一化到[0,1]之间，以保证马氏距离和欧氏距离为同一尺度。

步骤F.根据各个马氏距离(MD_ij)_I×J、各个欧氏距离(ED_ij)_I×J，以及权重比例参数α、距离幂次参数p，构建土壤污染物浓度三维插值模型，然后进入步骤G。

步骤G.利用模拟退火算法，优化获得土壤污染物浓度三维插值模型中权重比例参数α的值和距离幂次参数p的值，即获得目标区域所对应的土壤污染物浓度三维插值模型。

(1)以[1，3]为距离幂次参数p的先验范围，[0，1]为权重比例参数α的先验范围，基于10折交叉验证，采用模拟退火算法优化对三维插值模型中的参数α和p进行优化。

本实例中，模拟退火的温度初始值设置为10℃，迭代次数设置为2000次。模拟退火迭代过程中，对于被接受的模型参数值，整合多源协同变量三维插值模型预测的Cr⁶⁺浓度10折交叉验证的均方根误差(RMSE)变化过程如图6所示。通过模拟退火确定的权重比例参数α最优值为0.928，距离幂次p的最优值为1.91。基于优化参数值，整合多源协同变量三维空间插值方法预测的Cr⁶⁺浓度三维分布如图7a所示。作为对比，在本示例中也采用了传统三维IDW插值预测了该污染地块内的土壤Cr⁶⁺三维空间分布(其中，基于相同交叉验证数据确定的IDW插值反距离幂次的最优值为1.4)，其结果如图7b所示。

从图7a和图7b可以看出，尽管两种三维插值方法预测的Cr⁶⁺浓度空间分布总体分布模式相似，但相较传统IDW插值方法的平滑插值结果而言，本发明提供的整合多源协同变量三维插值方法能够体现出更多的Cr⁶⁺浓度局部空间变异细节特征。

(2)采用10折交叉验证计算的RMSE对三维插值精度进行评价。本实例中，整合多源协同变量三维空间插值方法的Cr⁶⁺浓度10折交叉RMSE为815.9mg/kg，基于相同交叉验证数据，传统IDW插值模型预测的RMSE为911.5mg/kg。相较于传统IDW插值方法，本发明提出的整合多源协同变量三维插值方法预测误差降低了10.5％，因此，具有更高的空间插值精度。

本发明提供的整合多源协同变量三维空间插值方法有效地克服了钻孔数据稀疏的条件下，传统IDW三维插值方法精度偏低和污染物浓度局部空间变异细节刻画不充分等技术瓶颈问题。本发明提供的整合多源协同变量三维插值方法充分利用了易于获取且相对廉价的多源协同变量数据中所包含的污染物空间分布先验信息，并通过多源协同变量在属性空间中的马氏距离来校正IDW插值在待插值三维栅格位置的插值权重比例，从而实现了污染物浓度空间插值精度提升和空间分布细节准确刻画。这对于钻孔稀疏的场地污染风险评估与制图具有广阔的应用前景。

上面结合附图对本发明的实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims

1.整合多源协同变量的场地土壤污染物浓度三维空间插值方法，其特征在于：通过步骤A至步骤G，获得目标区域的土壤污染物浓度三维插值模型，通过步骤i，应用土壤污染物浓度三维插值模型，实现目标区域地下空间的土壤污染物浓度三维分布预测；

2.根据权利要求1所述整合多源协同变量的场地土壤污染物浓度三维空间插值方法，其特征在于：还包括步骤H如下，执行完步骤G之后，进入步骤H；

3.根据权利要求1所述整合多源协同变量的场地土壤污染物浓度三维空间插值方法，其特征在于：所述多源协同变量数据集包含的预设各数据类型为场地功能区类型分布、地球物理探测反演的土壤电阻率分布、地球物理探测反演的土壤电导率分布。

4.根据权利要求1所述整合多源协同变量的场地土壤污染物浓度三维空间插值方法，其特征在于：所述步骤E包括如下步骤E1至步骤E2：

5.根据权利要求1所述整合多源协同变量的场地土壤污染物浓度三维空间插值方法，其特征在于：所述步骤F中，根据各个马氏距离(MD_ij)_I×J、各个欧氏距离(ED_ij)_I×J，以及权重比例参数α、距离幂次参数p，构建土壤污染物浓度三维插值模型如下：

6.根据权利要求1所述整合多源协同变量的场地土壤污染物浓度三维空间插值方法，其特征在于：所述步骤G中，基于距离幂次参数p的先验取值范围[1，3]、以及权重比例参数α的先验取值范围[0，1]，利用模拟退火算法，优化获得土壤污染物浓度三维插值模型中权重比例参数α的值和距离幂次参数p的值。

7.根据权利要求1所述整合多源协同变量的场地土壤污染物浓度三维空间插值方法，其特征在于：所述步骤i中，应用土壤污染物浓度三维插值模型，实现对目标区域地下空间的土壤污染物浓度预测的过程中，若栅格与距离其最近土壤样点之间欧氏距离及协同变量间马氏距离均小于或分别等于预设对应阈值，则定义该土壤样点的土壤污染物浓度实测值即为该栅格的土壤污染物浓度预测值。