CN112149353B

CN112149353B - 基于卷积神经网络识别dnapl污染物在地下含水层分布的方法

Info

Publication number: CN112149353B
Application number: CN202011014665.XA
Authority: CN
Inventors: 施小清; 康学远; 莫绍星; 吴吉春; 徐红霞
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2020-09-24
Filing date: 2020-09-24
Publication date: 2024-03-22
Anticipated expiration: 2040-09-24
Also published as: CN112149353A

Abstract

本发明公开一种基于卷积神经网络识别DNAPL污染物在地下含水层分布的方法，首先，使用CVAE神经网络对非平稳DNAPL饱和度和有效渗透系数场进行参数化；其次，训练CVAE神经网络生成具有物理意义的污染源区结构样本；最好，将CVAE与ESMDA结合，同时考虑多源观测数据，在观测数据有限的前提下，实现DNAPL污染源区的精细识别。本发明在利用同等数据量的情况下，大大提高污染物识别精度，为后期的污染物修复提供有益指导，降低修复成本；并以较低的成本实现较高的污染物识别精度。

Description

基于卷积神经网络识别DNAPL污染物在地下含水层分布的方法

技术领域

本发明属于污染水文地质领域，具体涉及一种结合机器学习与数据同化的识别DNAPL污染物在地下含水层分布的方法。

背景技术

重非水相液体(Dense Non-Aqueous Phase Liquids,DNAPL)污染在世界各地普遍存在。一旦泄漏到地下，DNAPL的高密度、低界面张力和低粘度的特性使其难以清除，形成长期的地下水污染源。当DNAPL被释放到地下时，DNAPL仍会被困在孔隙中形成不连续的离散DNAPL或在低渗透区域上方形成池状DNAPL。且DNAPL在地下介质中的空间分布受到渗透系数非均质性的影响。为此，欲有效修复DNAPL污染，须精细刻画DNAPL污染物的空间分布特征(也称，污染源区结构，Source Zone Architecture,SZA)与含水层渗透系数的空间分布。

许多研究已经使用地统计学反演方法来表征DNAPL SZA，然而，对SZA的常规地统计学描述并不适用于复杂的DNAPL饱和度场。由于高度不规则的DNAPL入渗模式受多相流支配，因此DNAPL的入渗行为非常不稳定，即DNAPL饱和度场(Saturation，简称Sn)的平均值和协方差在整个空间中变化很大。传统地统计学方法通常以平稳性假设为基础，其结果倾向于推估出过度平滑的DNAPL饱和度结果。

为了处理Sn场的非平稳性并为反演提供具有物理意义的约束条件，一些研究人员应用了随机多相流模型来生成可能的SZA样本；然后，以钻孔测量为条件，他们通过拒绝采样策略成功地估计了Sn分布和水文地质参数。然而，拒绝采样所需的大量实现仍然是计算瓶颈。为了减轻计算量，结合判别性随机场模型和蒙特卡洛采样方法，基于钻孔测量值生成基于物理意义的SZA样本。尽管结果表明他们的插值方法表现出令人鼓舞的性能，但他们仅考虑了直接观测数据(例如渗透率，NAPL饱和度)。在实际条件下，可用直接数据的数量有限于，而这可能会导致DNAPL推估不准确。

即使有了这些考虑了多相流模型并融合直接钻孔数据来产生具有物理意义的SZA样本的方法，DNAPL SZA的刻画问题仍需进一步研究两个主要问题：(1)如何解决SZA的非平稳性并提供具有物理意义的约束；(2)如何克服稀疏和有限的直接测量带来的困难，并提供不确定性量化以指导进一步的数据收集工作。

对于第一个问题，只有很少的研究利用了多相流模型并未DNAPL SZA识别问题提供了物理约束。但是他们的方法是专为插值问题而设计的(即基于直接钻孔测量数据，例如DNAPL饱和度和渗透率)，不适用于间接数据集(例如水力层析oscillated hydraulictomography,OHT和电阻率成像electrical resistivity tomography,ERT)。关于第二个问题，一些研究已经将水文地质测量结果和地球物理数据结合在一起以刻画SZA。但是，它们的反演结果无法反映受多相流控制的DNAPL入渗特征。因此，有必要开发一个联合反演框架，该框架可以整合多源直接/间接数据，同时可以反映出DNAPL的复杂入渗模式。

发明内容

发明目的：本发明提供一种基于卷积神经网络识别DNAPL污染物在地下含水层分布的方法，实现DNAPL污染源区的精细识别，一方面保证刻画精度，另一方面，降低观测成本。

发明内容：本发明所述的一种基于卷积神经网络识别DNAPL污染物在地下含水层分布的方法，包括以下步骤：

(1)使用CVAE神经网络对非平稳DNAPL饱和度和有效渗透系数场进行参数化；

(2)训练CVAE神经网络生成具有物理意义的污染源区结构样本；

(3)将CVAE与数据同化方法ESMDA结合，同时考虑多源观测数据，在观测数据有限的前提下，实现DNAPL污染源区的精细识别。

进一步地，所述步骤(1)实现过程如下：

基于场地调查获取的场地渗透系数的均值、方差、相关长度，DNAPL渗漏点的范围，DNAPL泄漏量的范围，DNAPL的渗漏速率的范围，并将其输入随机逾流模型生成饱和度和有效渗透系数样本。

进一步地，所述步骤(2)包括以下步骤：

(21)基于饱和度和有效渗透系数样本，训练神经网络，所述神经网络为卷积变分自编码器包括编码器和解码器；其中编码器由三个卷积层与三个全连接层组成，第一、二、三个卷积层分别含有16、32、64个滤波器，激活函数都为ReLU；第一个全连接层中有1600个神经元，激活函数为ReLU；第2个全连接层中有400个神经元，激活函数为线性函数；第3个全连接层中有400个神经元，激活函数为线性函数；

(22)经过编码器后，饱和度和有效渗透系数的图像将被转化为潜变量，该潜变量服从标准正态分布；

(23)将随机潜变量作为输入参数，输入解码器中，生成一组相应的有效渗透系数与DNAPL饱和度具有DNAPL源区的空间结构特征图像；所述解码器由2个全连接层与4个反卷积层构成，第四个全连接层有1600个神经元，激活函数为ReLU；第5个全连接层有12800个神经元，激活函数为ReLU；其后连接4个反卷积层，分别含有64、32、16、2个滤波器。

进一步地，所述步骤(3)包括以下步骤：

(31)从标准正态分布N(0，I)采样获得潜在矢量z的初始集合；

(32)基于训练后的CVAE解码器生成相应的SN和Keff场；

(33)运行水文地球物理正演模型以获得每个实现相应的模拟观测值：h-来自谐波水力层析OHT的水头，c-下游DNAPL溶解相浓度和V-ERT的电势；

(34)使用ESMDA更新潜向量z，进行Na次迭代；迭代结束之后，使用最后一次迭代的潜在矢量作为输入通过解码器获得后验Sn和Keff场。

进一步地，步骤(3)所述观测数据包括OHT、ERT和下游DNAPL溶解相浓度。

有益效果：与现有技术相比，本发明的有益效果：1、在利用同等数据量的情况下，大大提高污染物识别精度，从而为后期的污染物修复提供有益指导，并降低修复成本；2、传统方法依赖于昂贵的钻孔侵入式采样，而本发明联合地球物理数据与传统调查数据，可以较低的成本实现较高的污染物识别精度。

附图说明

图1为CVAE-ESMDA联合反演框架图；

图2为自编码器框架图；

图3为变分自编码器框架图；

图4为参照有效渗透系数场图；

图5为参照DNAPL饱和度场图；

图6为概念模型示意图；

图7为进行ERT测量的电极分布示意图；

图8为五个算例的渗透系数和DNAPL饱和度的估计集合均值和集合标准偏差图。

具体实施方式

下面结合附图对本发明作进一步详细说明。

本发明提供一种基于卷积神经网络识别DNAPL污染物在地下含水层分布的方法，将神经网络(对复杂的SZA进行参数化)与ESMDA反演方法相结合，以共同表征非平稳DNAPL饱和度和相应的有效渗透系数场，如图1所示。首先，基于由SIP算法生成的一组饱和度(Sn)和有效渗透系数(Keff)样本训练CVAE网络。由于希望神经网络(CVAE)学习到SZA与Keff的空间分布特征，网络训练的输入图像与输出图像均为Sn和Keff的空间分布图。一旦建立了受过训练的CVAE网络它将在反演过程中使用，以生成基于物理的SN和Keff实现。具体包括以下步骤：

步骤1：使用CVAE(convolutional variational autoencoder)神经网络对非平稳DNAPL饱和度和有效渗透系数场进行参数化。

基于由SIP(随机逾流模型)算法生成的一系列具有真实DNAPL源区结构特性的饱和度(Sn)和有效渗透系数(Keff)样本。输入参数为：基于场地调查获取的场地渗透系数的均值、方差、相关长度，DNAPL渗漏点的可能范围，DNAPL泄漏量的范围，DNAPL的渗漏速率的范围。基于上述输入参数，经SIP算法可生成一系列Sn,Keff样本。

CVAE属于机器学习中生成模型的一类，该模型在高维空间中生成具有复杂概率分布的实现。生成模型可以将饱和度和渗透系数高维图像进行低秩化。

假定x∈X代表一个属于X空间(Keff与Sn场所在空间)的向量，即其中ln(K_eff)为有效渗透系数的自然对数。x的每个实现都服从某个特定的概率密度函数p(x)，然而，直接从p(x)中采样来获得新的实现是困难的，因为Sn场的非平稳特性。此处，要构建一个生成模型，以间接生成类似于p(x)样本的Sn和Keff场的新实现。在不失一般性的情况下，考虑一个函数x＝f(z；w)：F→X，该函数将从已知且易处理的分布p(z)采样的低维向量F的随机实现作为输入。向量z表示特征空间F(也称为潜在空间，latent space)中的潜在变量，表示空间X中Keff与Sn的生成实现。给定潜在变量z，可以完全确定f(z；w)。一旦知道了权重向量，就可以通过从p(z)采样并将潜在变量z转换为f(z；w)来轻松生成新的实现。CVAE神经网络取代了可以从训练样本中“学习”(确定权重w)的f(z；w)函数。

步骤2：训练CVAE神经网络生成具有物理意义的污染源区结构样本。

基于上述SIP生成的Sn,Keff样本，训练神经网络。本发明中使用的神经网络为卷积变分自编码器(CVAE)，网络结构详见表2.由于我们希望神经网络(CVAE)学习到Sn与Keff的空间分布特征，网络训练的输入图像与输出图像均为Sn和Keff的二维空间分布图。本发明中所使用的CVAE包含两部分：1编码器部分(encoder)2解码器部分(decoder)。编码器部分由三个卷积层(convolutional layer)与三个全连接层(fully connected layer)组成，其中第一个卷积层含有16个滤波器，每个滤波器可处理的Sn/Keff图片像素的大小为(3*3)，步长值为2，激活函数为ReLU.第二个卷积层有32个滤波器，每个滤波器可处理的Sn/Keff图片像素的大小为(3*3)，步长值为2，激活函数为ReLU.第3个卷积层有64个滤波器，每个滤波器可处理的Sn/Keff图片像素的大小为(3*3)，步长值为1，激活函数为ReLU.其后为三个全连接层：第一个全连接层中有1600个神经元，激活函数为ReLU；第2个全连接层中有400个神经元，激活函数为线性函数；第3个全连接层中有400个神经元，激活函数为线性函数。

经过编码器后，Sn与Keff的图像将被转化为潜变量(latent variable)，该潜变量服从标准正态分布。

而解码器部分是编码器部分的镜像。解码器由2个全连接层与4个反卷积层构成：第四个全连接层有1600个神经元，激活函数为ReLU；第5个全连接层有12800个神经元，激活函数为ReLU。其后连接4个反卷积层，第一个反卷积层有64个滤波器，每个滤波器可处理的Sn/Keff图片像素的大小为(3*3)，步长值为1，激活函数为ReLU。第2个反卷积层有32个滤波器，每个滤波器可处理的Sn/Keff图片像素的大小为(3*3)，步长值为2，激活函数为ReLU。第3个反卷积层有16个滤波器，每个滤波器可处理的Sn/Keff图片像素的大小为(3*3)，步长值为2，激活函数为ReLU。第4个反卷积层有2个滤波器，每个滤波器可处理的Sn/Keff图片像素的大小为(3*3)，步长值为1，激活函数为线性函数与softmax函数。

上述网络的训练过程可方便地在python环境下的Keras包中实现。神经网络中的权重参数均经由训练自动获得。

经此训练过程，CVAE网络可对Sn Keff场进行参数化，即学习到了针对某个具体场地的Sn与Keff场的空间分布特征。

自动编码器(autoencoder,AE)是用于复杂数据表示的无监督机器学习方法。直观地，编码器-解码器体系结构为数据创建了一个“瓶颈”结构，以确保只有最重要的特征才能通过并得以重构。图2示出了自动编码器的示意性架构。编码器将输入x向量映射到潜在变量z，即f_e(x；w_e)。解码器从z，即f_d(z；w_d)重建x。通过在网络权重w上的梯度下降来完成将x和重构x之间的差异最小化的编码器和解码器的搜索。但是，该方法仅对自动编码器进行训练，以使其重建损失尽可能小，无论潜在空间的组织方式如何。因此，特征空间的点一旦被解码，其产生的样本通常是没有物理意义的。

变分自动编码器(variational autoencoder,VAE)与自编码器类似，不同之处在于，VAE对网络的训练进行了正则化，以避免过拟合并确保连续且易于内插的潜在空间(latent space)。如图3所示，VAE具有对应于对潜在变量z进行采样的额外一层。VAE的损失函数可写为：

L(x)＝L_re(x)+D_KL(p(z|x)||p(z)) (1)

其中，L_re(x)为重构误差，D_KL(p(z|x)||p(z))为Kulback-Leibler(KL)误差。KL项可以解释为正则项，迫使潜在分布p(z|x)接近于我们预期的分布p(z)，比如标准正太分布。

在VAE训练过程中，并不直接对潜在变量z进行编码，而是总以μ为均值，以σ2为方差的概率分布p(z)中编码。一个随机向量从标准正太分布N(0,I)中采样得到，其中⊙表示元素之间相乘，KL项可以写为如下形式：

其中μi与σi为第i个组分的均值和标准差，Nz为潜在空间的维度。

传统的VAE由完全连接的层组成，这限制了其对高维输入图像的处理能力。本发明使用了VAE的卷积版本(即CVAE)，以利用卷积网络在处理类似图像数据方面的强大功能。由于要重建Sn和Keff场，因此在这里我们使用以下组合的重建损失误差：

L_re(x)＝L_MSE(lnK_eff)+L_BCE(S_N) (3)

其中L_MSE(·)和L_BCE(·)分别为均方误差(MSE)和二元交叉熵(BCE)损失函数，其可以写为：

其中，lnK_eff与为参照与重构出的Keff场；N_K与N_S表示向量Keff和SN维度。

步骤3：将CVAE与数据同化方法ESMDA(Ensemble Smoother with MultipleDataAssimilation)结合，同时考虑多源观测数据，在观测数据有限的前提下，实现DNAPL污染源区的精细识别。

在CVAE参数化之后，要估计的参数属于潜在矢量z。使用以下过程估计SN和Keff场：

(1)从标准正太分布N(0，I)采样获得潜在矢量z的初始集合。

(2)基于训练后的CVAE解码器生成相应的SN和Keff场。

(3)运行水文地球物理正演模型以获得每个实现相应的模拟观测值，即h-来自谐波水力层析OHT(oscillated hydraulic tomography)的水头，c-下游DNAPL溶解相浓度和V-ERT(Electrical resistivity tomography)的电势。

(4)使用ESMDA更新潜向量z(进行Na次迭代)。迭代结束之后，我们就可以使用最后一次迭代的潜在矢量作为输入通过解码器获得后验SN和Keff场。

用复杂的DNAPL SZA举例说明了提出的反演框架在二维承压含水层(40m×20m)中的性能，如图4至图7。将研究区域离散为80×40＝3200个网格块，每个块的长度为0.5m，即长与高均为0.5m。使用表1中的地统计参数生成的固有渗透系数(Ki)场。生成的参考Ki值在3.35×10-4和8.32×10-7m/s之间。这样的Ki值代表了砂质冲积含水层。参考Ki场的均值，方差和相关长度的选择与萨凡纳河站点的水文地质参数相似。基于参考Ki场，使用随机逾流模型SIP获得SN和Keff分布。所产生的参考Keff和DNAPL饱和度场如图图4至图7所示。请注意，在这项工作中，DNAPL由单组分DNAPL三氯乙烯(TCE)组成。

表1参数设置

此处训练集由SIP模型生成的60,000对SN和Keff实现组成。此外，我们还生成了另外6,000个测试样本实现来评估网络的性能。使用20个CPU并行获得66,000个实现需要7个小时。在大多数场地条件下，DNAPL释放点(x0)，释放速率(v0)和总释放质量(M0)的位置是未知的。因此，我们在生成训练样本时将它们视为随机变量，即x₀∈(10，30)m，v₀∈(3×10^-6，7×10^-6)m³/s,M₀∈(3，7)吨。

在网络训练时，使用Adam优化器在NVIDIA Tesla V100 GPU上对CVAE网络进行了200个epochs的训练，学习速率为1×10^-3，批处理大小为32。

为了收集探测Keff和SN所需要的监测数据，在含水层中考虑了四个完全穿透的钻孔(x＝0、13.3、26.6、40m)，如图6所示。每个钻孔都有20个压力水头采样端口，其间隔为1m(z＝1、2，...，20m)。在这些钻孔中设置了六个OHT注/抽水点。

首先，从井下钻孔的不同深度(x＝40m，z＝1，2，...，20m，)收集了20个DNAPL溶解相浓度测量值。为了记录由DNAPL的存在引起的电势异常，在钻孔中设置了80个ERT电极，并在顶部含水层设置了41个电极，如图7所示。这些电极在钻孔和水平线上都相距1m。使用偶极-偶极配置记录电势测量值。共进行了八次电流注入，共获得944个ERT观测数据。最后，我们通过六个注/抽水点之一实施了OHT测试，周期为40s，峰值流速为0.4L/s。在除注/抽水点之外的所有80个压力水头采样端口上测量了瞬变压头。为简单起见，仅以0.2Hz的采样频率模拟了40s的周期性含水层响应。进行了OHT测试，并收集了所有六个注/抽水点的测量值，从而共收集了3792个瞬态液压头。

使用参考Keff，SN和已知的水文地球物理设置，可以通过正演模型获得参考c，V和h数据。将标准偏差分别为0.001g/L，1V和0.01m的高斯噪声分别添加到参考c，V和h数据中，即可获得嘈杂的测量结果。V的噪声相当于最大电势变化的2.5％，这是理想算例研究中使用的典型噪声水平。

表2总结了为验证本发明效果而设置的5个算例。从算例1到算例4，在反演中使用了不同类型的数据，最后一种情况(算例4)旨在显示联合使用水文地质数据和地球物理数据的优势。SN和Keff场在算例1中仅使用压力水头数据估算，在算例2中同时使用压力水头和DNAPL浓度数据估算，在算例3中仅使用ERT数据，在算例4中使用所有三个数据集(压力水头，DNAPL溶解相浓度，ERT)进行估算。

表2五个理想算例的参数设置

图8展示了表2中所示的5种情况的估计Keff和SN场的集合均值和标准差。表3列出了反演结果和计算时间的相应RMSE。在算例1中，仅使用来自OHT(谐波水力层析)的水头数据。集合均值Keff可以成功反映渗透系数场非均质性的主要空间结构。但是，仅使用OHT不能捕获SZA，因为DNAPL仅通过Keff-SN关系(即Brooks-Corey模型)对水头响应产生间接影响。在算例2中，结合了水头和下游DNAPL浓度数据来估计Keff和SN场。与算例1的结果相比，算例2估计所得的SN可以更好地描绘DNAPL在垂直方向上的扩散。但是，算例2中的SN估算值仍与参考SN差距较大，因为下游DNAPL浓度数据只能提供有限的信息(即SN的垂向分布)。

表3各个算例所得推估Keff与Sn场的RMSE与计算时间

其中，RMSES与RMSEK分别代表推估所得SN，ln Keff场的RMSE。

在算例3中，基于ERT数据来推估Keff和SN场。估计所得的样本平均SN可以恢复SZ的主要形态和高度饱和的DNAPL池。这是由于两个因素造成的：(1)作为一种低成本的地球物理方法，ERT可以提供比水文地质调查更多的数据，(2)在本例中，ERT测量对DNAPL高度敏感。然而，算例3估算出的SN缺少真实SZA的某些重要特征，例如，右下角附近存在的残留DNAPL。换句话说，ERT方法由于分辨率较低而无法单独捕获SZA的所有空间特征。此外，根据我们的岩石物理假设，ERT测量无法为Keff的的推估提供较多有用信息。因此，估计出的Keff无法完全反映出Keff的空间变异性。这一点也可以通过较高的Keff标准偏差值来验证。

在算例4中，我们整合了所有三种类型的数据集(h，c和V)以进行反演。结果表明，与算例1、2和3相比，联合反演可以更高分辨率再现参考SN场。合并了下游DNAPL浓度和ERT测量的信息内容后，残留状与池状DNAPL都能在推估结果中很好地反映出来。SN估计值的RMSE也显示了这种联合反演带来的改进，参见表3。说明了联合水文地球物理数据与传统的水文地质调查数据，可以更好地刻画DNAPL污染源区结构。

在算例5中，我们使用标准的ESMDA方法(即，不使用CVAE参数化)，融合所有三个数据集(水头，下游DNAPL浓度和ERT数据)，以推估Keff和SN场。估计得到的SN场可以大致反映出两个DNAPL池所在位置，但无法给出真实源区结构。算例5的结果无法反映出真实SN场中的较为剧烈的空间变化。这是因为非平稳的SN分布与标准ESMDA中使用的先验假设之间的偏差。另外，案例5的结果未能捕获Keff和SN之间的相互关系。这是因为在ESMDA中，Keff和SN场是被分别推估出来的(即并非联合反演)。对于诸如ESMDA的传统反演方法，考虑Keff-SN关系将提高估计精度，但将需要运行多相流模型并显着增加计算成本。相比之下，本发明所提出的CVAE-ESMDA框架，即算例4结果，可以成功地重现SN场的空间结构，因为(1)CVAE的解码器迫使每个实现(样本)都遵循DNAPL渗透模式。(2)CVAE可以为ESMDA反演提供服从正态分布的潜在变量(latent space)，从而满足ESMDA的平稳性假设。此外，CVAE-ESMDA可以在反演期间无需运行多相流模型的情况下反映出Keff与SN之间的相关关系。

Claims

1.一种基于卷积神经网络识别DNAPL污染物在地下含水层分布的方法，其特征在于，包括以下步骤：

(2)训练CVAE神经网络生成具有物理意义的污染源区结构样本；

(3)将CVAE与数据同化方法ESMDA结合，同时考虑多源观测数据，在观测数据有限的前提下，实现DNAPL污染源区的精细识别；

所述步骤(2)包括以下步骤：

(23)将随机潜变量作为输入参数，输入解码器中，生成一组相应的有效渗透系数与DNAPL饱和度具有DNAPL源区的空间结构特征图像；所述解码器由2个全连接层与4个反卷积层构成，第四个全连接层有1600个神经元，激活函数为ReLU；第5个全连接层有12800个神经元，激活函数为ReLU；其后连接4个反卷积层，分别含有64、32、16、2个滤波器；

所述步骤(3)包括以下步骤：

(31)从标准正态分布N(0，I)采样获得潜在矢量z的初始集合；

(32)基于训练后的CVAE解码器生成相应的Sn和Keff场；其中，Sn为Sn为重非水相液体饱和度，Keff为有效渗透系数；

(34)使用ESMDA更新潜向量z，进行Na次迭代；迭代结束之后，使用最后一次迭代的潜在矢量作为输入通过解码器获得后验Sn场和Keff场。

2.根据权利要求1所述的基于卷积神经网络识别DNAPL污染物在地下含水层分布的方法，其特征在于，所述步骤(1)实现过程如下：

3.根据权利要求1所述的基于卷积神经网络识别DNAPL污染物在地下含水层分布的方法，其特征在于，步骤(3)所述观测数据包括OHT、ERT和下游DNAPL溶解相浓度。