CN115828072B

CN115828072B - 不可通约测井曲线缺失段重构方法及存储介质

Info

Publication number: CN115828072B
Application number: CN202211565103.3A
Authority: CN
Inventors: 吕文君; 康宇; 张文婷; 李鲲
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2022-12-07
Filing date: 2022-12-07
Publication date: 2023-11-17
Anticipated expiration: 2042-12-07
Also published as: CN115828072A

Abstract

本发明的一种不可通约测井曲线缺失段重构方法及存储介质，其方法包括S1、准备测井数据，并重构测井样本原始矩阵；S2、将重构的测井样本原始矩阵映射测井样本到高维空间；S3、重构测井样本映射矩阵；S4、重构测井样本原始矩阵；S5、重复步骤S2至S4，如达到某一预设次数，则停止输出重构的测井样本原始矩阵，得到测井缺失段重构结果。本发明从矩阵补全的角度提出一个全新思路，能够利用所有井的测井数据中蕴含的信息同时实现所有井的缺失测井补全；本发明重构的测井曲线需要保留其地质可解释性，能够符合地质学家或测井学家对该曲线的一般认识，具有与已有测井曲线相一致的解释结果、或符合实际的录井分析结论。

Description

不可通约测井曲线缺失段重构方法及存储介质

技术领域

本发明涉及测井方法技术领域，具体涉及一种不可通约测井曲线缺失段重构方法及存储介质。

背景技术

地球物理测井作为油气勘探的关键技术手段，被誉为地质学家的“眼睛”，目的是把深埋地下的油气储层“看准”、“看清”和“看全”。地球物理测井是利用专门的仪器设备，沿井眼探测地层电磁、声波、放射性、热、力等物理特性随深度变化的过程，主要用于石油、天然气、煤、金属矿等地下矿藏的勘探。随着油气勘探开发技术的发展，油田总体规模变小，储集层条件变差、类型增多、岩性复杂，非均质性严重，物性变化范围大；薄互层及低孔、低渗储层普遍存在；另外，由于长期注水，导致岩性、物性、电性等发生了较大变化。为了应对这些问题，测井仪器的种类及测量信息不断丰富，井眼覆盖率、垂直分辨率不断提高，径向探测范围逐步扩大。然而，传统的测井分析技术在海量、高维、异构的测井数据处理和强非线性解释模型的构建上显示出效率低下、性能不足、依赖经验等问题。随着人工智能(AI)技术的不断发展，如何将其运用到海量测井数据的挖掘和利用当中，实现测井资料的“增值”，升级油气勘探与开发服务，成为新时代测井研究的重要内容。

由于地下情况复杂，且在实际钻井过程中往往存在井径垮塌、仪器故障等各种难以预料且不可避免的问题，导致整段甚至整条测井数据缺失，这给油气田开发和评价工作带来了巨大挑战。测井成本也是导致某些测井数据缺失的一个主要原因^[1]。重新测井成本高昂，特别是对于许多已经经过固井的油气井来说，工程难度极大。

在已有的工作中，Yu等^[2]使用七种常规的测井曲线，包括井径、中子孔隙度、伽马射线、深部电阻率、介质电阻率、光电系数、体积密度，同时生成横波与纵波的传播时间测井曲线，并且在实验中对五种常见的机器学习模型进行了深入比较。金永吉等^[3]使用遗传算法对传统神经网络的拓扑结构、权值和阈值进行优化，提出了基于遗传神经网络优化方法的测井曲线重构技术，可克服传统神经网络方法易陷入局部最小值的缺点。实验对声波曲线、电阻率曲线和自然伽马曲线进行了重构，并达到了一定重构效果。考虑到地层沉积的时序渐变性，张海涛等^[4]提出了一种基于增强双向长短时记忆神经网络(BiLSTM)的测井数据重构方法，在不增加额外测量成本的情况下，充分考虑缺失数据点的前趋和后继之间的双向关联性，并通过增加BiLSTM深度来增强模型表达能力。Pham等^[5]利用双向卷积长短期记忆网络与全连接神经网络级联的方法来估计缺失的测井曲线，该方法在声波测井预测中得到了验证，可以从伽马测井、密度测井和中子孔隙度测井中准确预测声波测井，并且该模型能够有效地反映测井曲线的深度变化趋势与局部细节特征。类似的工作中采用了集成长短时记忆网络^[6]、级联长短时记忆网络^[7]和门控循环单元神经网络^[8]。进一步地，Chen等^[9][10]将地质力学参数背后的物理机制作为先验信息，提出了一种物理约束的长短时记忆神经网络。该模型能够基于容易获得的数据重构地质力学测井曲线，领域知识的引入显著提升了预测精度。另外，测井曲线的重构也可以使用机械钻井参数，Gowida等^[11]利用了包括力矩、钻头旋转速度、泵送压力、钻进速度、钻压等水平井钻进参数实现了碳酸盐岩横波、纵波传播时间的准确预测。

近三年，每年涌现出大量的关于测井曲线重构的工作，他们主要关注点依然在模型本身的应用或者改进，例如随机森林^[12]、极限学习机^[13]等。但是这些工作忽略了一个重要问题，即训练数据与测试数据不满足独立同分布假设。比如，自然电位测井属于常规测井，可以作为测井曲线重构的输入。正如上文所说，自然电位曲线形态与井眼条件密切相关。因此，如果不考虑数据的概率分布差异问题，直接使用基于某口或某些井训练得到的重构模型去重构目标井的缺失测井曲线，而不对模型加以调整，则会导致精度下降甚至模型失效的后果。采用错误重构的测井曲线进行后续分析将产生不可想象的后果。另外，不同井的测井缺失情况不一样，丢失的测井曲线往往富含较大信息量，如果仅仅采用共有的测井曲线作为输入，将丢失掉大量的有用信息，难以达到最好的重构效果。

[1]Anemangely M,Ramezanzadeh A,Amiri H,et al.Machine learningtechnique for the prediction of shear wave velocity using petrophysical logs[J].Journal of Petroleum Science and Engineering,2019,174:306-327.

[2]Yu Y,Xu C,Misra S,et al.Synthetic sonic log generation withmachine learning:A contest summary from five methods[J].Petrophysics,2021,62(04):393-406.

[3]金永吉,张强,王毛毛.基于遗传神经网络算法的测井曲线重构技术[J].地球物理学进展,2021,36(03):1082-1087.

[4]张海涛,杨小明,陈阵,等.基于增强双向长短时记忆神经网络的测井数据重构[J/OL].地球物理学进展:1-12[2022-02-03].http://kns.cnki.net/kcms/detail/11.2982.P.20211110.1310.012.html；

[5]Pham N,Wu X,Naeini E Z.Missing well log prediction usingconvolutional long short-term memory networkMissing log prediction usingConvLSTM[J].Geophysics,2020,85(4):WA159-WA171.

[6]Chen Y,Zhang D.Well log generation via ensemble long short-termmemory(EnLSTM)network[J].Geophysical Research Letters,2020,47(23):e2020GL087685.

[7]Zhang D,Chen Y,Meng J.Synthetic well logs generation via RecurrentNeural Networks[J].Petroleum Exploration and Development,2018,45(4):629-639.

[8]王俊,曹俊兴,尤加春.基于GRU神经网络的测井曲线重构[J].石油地球物理勘探,2020,55(03):510-520+468.

[9]Chen Y,Zhang D.Physics-constrained deep learning of geomechanicallogs[J].IEEE Transactions on Geoscience and Remote Sensing,2020,58(8):5932-5943.

[10]陈云天.基于机器学习的测井曲线补全与生成研究[D].北京大学,2020.

[11]Gowida A,Elkatatny S.Prediction of sonic wave transit times fromdrilling parameters while horizontal drilling in carbonate rocks using neuralnetworks[J].Petrophysics,2020,61(05):482-494.

[12]Feng R,Grana D,Balling N.Imputation of missing well log data byrandom forest and its uncertainty analysis[J].Computers&Geosciences,2021,152:104763.

[13]Wang P,Peng S.On a new method of estimating shear wave velocityfromconventional well logs[J].Journal of Petroleum Science and Engineering,2019,180:105-123。

发明内容

本发明提出的一种不可通约测井曲线缺失段重构方法，可至少解决上述技术问题之一。

为实现上述目的，本发明采用了以下技术方案：

一种不可通约测井曲线缺失段重构方法，包括以下步骤，

包括以下步骤，

S1、准备测井数据，并重构测井样本原始矩阵；

S2、将重构的测井样本原始矩阵映射测井样本到高维空间；

将重构的测井样本原始矩阵X^*映射到再生核希尔伯特空间，如下：对于样本x∈X^*，采用随机傅里叶特征变换对无穷维的RKHS进行k维近似，得到测井样本映射矩阵/>

S3、重构测井样本映射矩阵；

定义如下优化问题：

其中，表示全1向量，γ₁,γ₂,…,γ₅为用以平衡不同约束项的系数，其中为Φ的潜在表达矩阵，/>为测井字典矩阵，/>为词汇量，‖·‖_F表示F范数，‖·‖₁表示1范数，tr(·)为迹范数，c_i为C的第i行向量，n为全体样本数量，d为全体测井种类数量，/>为输出权重矩阵，/>为对应到Φ的标签矩阵，如果样本没有标签，则Y对应行向量置零；/>为样本加权对角阵，对于没有标签的样本，其对应的W的对角元素为0，否则为正实数，其值根据全体数据中的标签比例决定；

图拉普拉斯矩阵是具有n_i个样本的第i口井的图拉普拉斯矩阵，由相似矩阵/>计算得到；/>用以约束学习得到的A与预设的相似矩阵/>的差异，/> 第i口井的图拉普拉斯矩阵/>的第p行第q列元素为：

其中，表示/>的κ个最近邻集合，/>表示第i口井的第p和q测井样本；

S4、重构测井样本原始矩阵；

S5、重复步骤S2至S4，如达到某一预设次数，则停止输出重构的测井样本原始矩阵，得到测井缺失段重构结果。

由上述技术方案可知，本发明的不可通约测井曲线缺失段重构方法具有以下

有益效果：

本发明不同于建立“共有测井-缺失测井”回归模型进行缺失测井预测的路线，从矩阵补全的角度提出一个全新思路，能够利用所有井的测井数据中蕴含的信息同时实现所有井的缺失测井补全；

本发明录井分析等方式获取的岩性、孔隙度等标签是对井眼地质的客观描述，可以作为不同井(即不同域)之间的连接纽带，需要充分利用测井数据的标签使信息在不同域之间充分传递共享；

本发明重构的测井曲线需要保留其地质可解释性，能够符合地质学家或测井学家对该曲线的一般认识，具有与已有测井曲线相一致的解释结果、或符合实际的录井分析结论。

附图说明

图1是本发明的方法原理图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。

常用的地球物理测井包括：电法测井中的自然电位测井(SP)、电阻率测井(RT)、感应测井(COND)等，声波测井中的声波时差测井(AC)等，放射性测井中的自然伽马测井(GR)、密度测井(DEN)、补偿中子测井(CNL)，以及其他辅助测井的井径测井(CAL)等。一般来说，得到的一口井的测井曲线是等采样间隔且同步，因此可以在每个深度上得到一个样本，该样本包含当前深度上的所有测井值。测井可以看作机器学习中的“输入”或“样本”。

录井资料采集工作的主要任务是根据井的设计要求，取全、取准地采集能够反映地下情况的各项资料，以判断井下地质和含油气情况。常规录井资料采集的方法主要有岩芯录井、岩屑录井等。录井是油气勘探开发活动中最基本的技术，是发现、评估井下地质和油气藏最及时、最直接的手段，具有获取地下信息及时、多样，分析解释快捷的特点。录井可以看作机器学习中的“标签”，其地质含义为预测目标，即“输出”。

得到了一口井的测井曲线后，往往需要对其进行处理，包括滤波、环境校正、缺失补全，然后将其解释为地质信息，包括骨架岩性成分、泥质含量、孔隙度、渗透率、含水饱和度等。测井解释工作可视为分类或回归任务，其核心在于建立“解释模型”，即机器学习中的“预测模型”。这种模型可以是精确的或模糊的，亦或是数学可表达的或人工经验的。解释的过程，往往需要借助于录井资料，这类比于机器学习中利用标签进行模型“训练”的过程。

当然，最为原始的测井、录井资料还要经过深度确定与校正、测井曲线的基本修正与无效值剔除、录井资料的分析化验等，这些前期工作往往由测、录井公司完成，因此本发明实施例不再考虑这些问题。

测井过程中存在井径扩大、仪器故障等各种难以预料且不可避免的问题，加之操作失误和预算限制等因素，实际中经常出现部分井段测井数据失真或者缺失的情况，甚至出于成本考虑而放弃获取某些测井曲线(如AC测井曲线)。地质学家和工程师们在利用测井数据解读地下情况并进行决策时，这些缺失的整段甚至整条测井信息会给工作带来极大挑战。重新测井具有极其高昂的成本，其次对于许多已经经过固井的油气井而言，在工程上很难实现重新测井。因此，在不增加额外测量成本的条件下，重构失真或缺失的测井曲线尤为重要。针对上述分析，本发明实施例具体在于：

不同于建立“共有测井-缺失测井”回归模型进行缺失测井预测的路线，从矩阵补全的角度提出一个全新思路，能够利用所有井的测井数据中蕴含的信息同时实现所有井的缺失测井补全；

录井分析等方式获取的岩性、孔隙度等标签是对井眼地质的客观描述，可以作为不同井(即不同域)之间的连接纽带，需要充分利用测井数据的标签使信息在不同域之间充分传递共享；

重构的测井曲线需要保留其地质可解释性，能够符合地质学家或测井学家对该曲线的一般认识，具有与已有测井曲线相一致的解释结果、或符合实际的录井分析结论。

以下具体说明本发明实施例所述的不可通约测井曲线缺失段重构方法，包括以下：

S1、准备测井数据；

整理N口井的测井与标签数据，第i井的数据集为表示测井样本空间，/>表示输出空间，/>表示第i口井数据的联合概率分布，(x,y)为有标签样本，其中测井样本x按深度提取，表示某深度上各测井值组成的向量，为实数空间，/>为所用测井种类总数，/>并采用独热编码，/>为测井解释目标类别总数；第i口井的测井样本矩阵/>和测井标签矩阵/>n_i为第i口井的测井样本数量；所有测井样本矩阵合并得到全体井的测井样本原始矩阵/>所有测井标签矩阵合并得到全体井的测井标签矩阵/>

将测井样本原始矩阵缺失处补零，得到重构的测井样本原始矩阵X^*，U为指示矩阵，其维度与X相同，当X某元素为真实观测(即没有缺失)，则U对应位置的元素为1，否则为0。

S2、映射测井样本到高维空间；

将重构的测井样本原始矩阵X^*映射到再生核希尔伯特空间(RKHS)，具体如下：对于样本x∈X^*，采用随机傅里叶特征变换对无穷维的RKHS进行k维近似，得到测井样本映射矩阵/>

S3、重构测井样本映射矩阵；

定义如下优化问题：

其中，表示全1向量，γ₁,γ₂,…,γ₅为用以平衡不同约束项的系数，其中为Φ的潜在表达矩阵，/>为测井字典矩阵，/>为词汇量，‖·‖_F表示F范数，‖·‖₁表示1范数，tr(·)为迹范数，c_i为C的第i行向量，n为全体样本数量，d为全体测井种类数量，/>为输出权重矩阵，/>为对应到Φ的标签矩阵，如果样本没有标签，则Y对应行向量置零；/>为样本加权对角阵，对于没有标签的样本，其对应的W的对角元素为0，否则为正实数，其值根据全体数据中的标签比例决定。例如，第i个有标签的测井样本对应标签为砂岩，第j个有标签的测井样本对应标签为泥岩，而砂岩数量少于泥岩，则标签为砂岩的训练样本应当具有更大的权重，即W_ii>W_jj，以避免类别不平衡导致的过拟合问题。图拉普拉斯矩阵/>是具有n_i个样本的第i口井的图拉普拉斯矩阵，由相似矩阵/>计算得到；/>用以约束学习得到的A与预设的相似矩阵/>的差异，/> 第i口井的图拉普拉斯矩阵/>的第p行第q列元素为：

其中，表示/>的κ个最近邻集合，/>表示第i口井的第p和q测井样本。

问题的求解过程如下：首先，固定D,Ω,A以求解C＝[c₁；…；c_n]，这里对C采用按行更新的方式，即更新c_i时固定{c_j；≠i}，由于涉及到L1范数，所以需要采用近端梯度下降法(Proximal Gradient Descent,PGD)或者特征符号搜索法(Feature-Sign Search,FSS)求解C；然后，固定C,D,A以求解Ω，令/>等于0可以得到Ω的解析解；接着，固定C,Ω,A以求解D，令/>等于0可以得到D的解析解；最后，固定C,Ω,D以求解A，该问题可以采用自适应近邻聚类(Clustering with Adaptive Neighbors,CAN)中的图构造算法进行求解。多次迭代直到/>收敛即可实现对C,D,Ω,A的求解。

S4、重构测井样本原始矩阵；

得到重构的测井样本映射矩阵Φ^*＝C^*D^*T之后，定义如下优化问题：

其中，为平衡系数，Ψ为解码权重矩阵；采用梯度下降法求解Ψ得到Ψ^*，进而得到重构的测井样本原始矩阵X^*＝^*Ψ^*，上标*表示当前最优。

以下具体说明：

首先给出如下符号定义：

领域是学习的主体，由数据和生成这些数据的分布构成，由于每口井使用测井设备、地质条件等因素相互具有一定差异，因此一口井的数据可以视为一个领域。领域的一个样例由样本/>和对应的标签/>构成；对于分类问题，y为独热编码，c为类别数量，对于回归问题，c＝1。样例的联合概率分布记为/>即/>本发明用/>和表示数据的特征空间和标签空间，则对于任意一个样例(x,y)，具有/>和/>因此，一个领域可以表示为/>

假设训练数据来自N个具有不同但相似数据分布的井位(领域)，即且/>两两之间可能不相等，这意味着不同井之间可能存在分布偏差；另外，测井过程中存在的井径扩大、仪器故障等问题导致部分井段测井数据失真或者缺失的情况，甚至出于成本考虑而放弃获取某些测井曲线(如AC测井曲线)，因此可用的数据x实际存在缺失属性的情况。因此，本研究内容的目标在于：基于存在属性缺失的/> 重构出全体完整样本/>即对所有领域中的缺失特征进行补全。

结合图1展示的示意图，本发明给出优化问题的设计过程：

首先，本发明希望将测井样本从原始特征空间映射到再生核希尔伯特空间(RKHS)，并通过解码权重矩阵重构出带有缺失属性的测井样本矩阵，因此可以定义以下优化问题：

其中，为测井样本原始矩阵的重构误差，/>为测井样本映射矩阵，/>为全体测井样本矩阵，其列表示某种测井，如果某些井段缺失某种测井，则对应位置补零，n为全体样本数量，d为全体测井种类数量，U为指示矩阵，其维度与X相同，当X某元素为真实观测(即没有缺失)，则U对应位置的元素为1，否则为0；/>为测井样本映射矩阵的重构误差，其中/>为Φ的潜在表达矩阵，为字典矩阵，/>为词汇量；/>和/>用以约束C和D以及Ψ的复杂度。

说明1：目标函数中，本发明将补全的测井样本x映射到RKHS，映射函数为其中/>是具有高斯核的RKHS；事实上，由于/>映射后的样本具有无穷维度，因此本发明使用随机傅里叶特征变换/>对ψ(x)进行k-维近似，将X映射到Φ，而φ(x)依然可以保持RKHS中ψ(x)的特性。

说明2：目标函数中，本发明引入了矩阵Φ的低秩假设，即最小化rank(Φ)；由于秩范数是非凸函数，在优化问题中很难求解，因此可以采用它的凸近似核范数，即‖Φ‖_*；进而，对Φ进行分解得到Φ＝CD^T，根据‖C‖_F+‖D‖_F是2‖CD^T‖_*的一个上界，对‖CD^T‖_*进行了替换；考虑到D为字典矩阵，最终本发明采用了形如/>的低秩约束。

然后，本发明希望引入标签进一步加强领域之间的联系，并且使潜在表达具有一定的可区分性，因此可以定义以下优化问题：

其中，为全体数据的预测误差，/>为输出权重矩阵，为对应到Φ的标签矩阵，如果样本没有标签，则Y对应行向量置零；/>为样本加权对角阵，对于没有标签的样本，其对应的W的对角元素为0，否则为正实数，其值根据全体数据中的标签比例决定。例如，第i个有标签的测井样本对应标签为砂岩，第j个有标签的测井样本对应标签为泥岩，而砂岩数量少于泥岩，则标签为砂岩的训练样本应当具有更大的权重，即W_ii>W_jj，以避免类别不平衡导致的过拟合问题；/>用以约束Ω的复杂度。

说明1：由于领域之间没有显式的连接关系，这样会一定程度上影响矩阵补全的有效性。事实上，多数井位存在少量从录井分析中得到标签，这些标签是对地质信息的客观描述，可以作为跨域连接的桥梁。

说明2：目标函数中，由于引入了字典学习，潜在表达C需要具有一定的稀疏性以使大多数问题变得线性可分，因此引入线性分类器Ω即可；同时，该损失项可以保证学习得到潜在表达具有一定的区分性。

最后，本发明希望对潜在表达进一步约束，使其具有与测井原始样本相似的几何结构，因此可以定义以下优化问题：

其中，表示全1向量，tr(C^TLC)度量了学习得到的潜在表达的局部一致性，图拉普拉斯矩阵/>是具有n_i个样本的第i口井的图拉普拉斯矩阵，由相似矩阵/>计算得到；/>用以约束学习得到的A与预设的相似矩阵/>的差异，/>

说明1：由于补全的测井样本存在属性缺失，因此用其构建相似矩阵存在一定的风险，因此本发明采用学习的方式得到相似矩阵A；同时，采用补零的测井样本构建的相似矩阵可以一定程度上反映数据几何结构，因此可以在/>基础上进行调节；第i口井的图拉普拉斯矩阵/>的第p行第q列元素为：

融合目标函数并去掉涉及Ψ的约束项，得到：

其中，γ₁,γ₂,…,γ₅用以平衡不同约束项。其求解过程如下：首先，固定D,Ω,A以求解C＝[c₁；…；c_n]，这里对C采用按行更新的方式，即更新c_i时固定{c_j；j≠i}，由于涉及到L1范数，所以需要采用近端梯度下降法(Proximal Gradient Descent,PGD)或者特征符号搜索法(Feature-Sign Search,FSS)求解C；然后，固定C,D,A以求解Ω，令等于0可以得到Ω的解析解；接着，固定C,Ω,A以求解D，令/>等于0可以得到D的解析解；最后，固定C,Ω,D以求解A，该问题可以采用自适应近邻聚类(Clustering with Adaptive Neighbors,CAN)中的图构造算法进行求解。多次迭代直到/>收敛即可实现对C,D,Ω,A的求解。

得到了重构的测井样本映射矩阵Φ^*＝C^*D^*T之后，求解目标函数中涉及Ψ的优化问题，即：

其中，Ψ可以通过梯度下降法进行求解，进而得到重构的测井样本原始矩阵，为平衡系数。

由于中Φ的构建基于补零的测井样本原始矩阵，因此需要利用重构的测井样本原始矩阵重新生成Φ，并再次进行上述/>和/>优化问题的依次求解，多次迭代后即可得到最终的重构的测井样本原始矩阵，实现矩阵中缺失项的补全。

又一方面，本发明还公开一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如上述任一方法的步骤。

再一方面，本发明还公开一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如上述任一方法的步骤。

在本申请提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一方法的步骤。

可理解的是，本发明实施例提供的系统与本发明实施例提供的方法相对应，相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种不可通约测井曲线缺失段重构方法，其特征在于，包括以下步骤，

S1、准备测井数据，并重构测井样本原始矩阵；

S2、将重构的测井样本原始矩阵映射测井样本到高维空间；

将重构的测井样本原始矩阵X^*映射到再生核希尔伯特空间，如下：对于样本x∈X^*，采用随机傅里叶特征变换对无穷维的RKHS进行k维近似，得到测井样本映射矩阵n为全体样本数量；

S3、重构测井样本映射矩阵；

定义如下优化问题：

其中，表示全1向量，γ₁,γ₂,…,γ₅为用以平衡不同约束项的系数，其中/>为Ф的潜在表达矩阵，/>为测井字典矩阵，/>为词汇量，‖·‖_F表示F范数，‖·‖₁表示1范数，tr(·)为迹范数，c_i为C的第i行向量，n为全体样本数量，/>为输出权重矩阵，为对应到/>的标签矩阵，如果样本没有标签，则Y对应行向量置零；/>为样本加权对角阵，对于没有标签的样本，其对应的W的对角元素为0，否则为正实数，其值根据全体数据中的标签比例决定；

图拉普拉斯矩阵是具有n_i个样本的第i口井的图拉普拉斯矩阵，由相似矩阵/>计算得到；/>用以约束学习得到的A与预设的相似矩阵/>的差异，/>第i口井的图拉普拉斯矩阵/>的第p行第q列元素为：

S4、重构测井样本原始矩阵，具体包括：

得到重构的测井样本映射矩阵Ф^*＝C^*D^*T之后，定义如下优化问题：

其中，为平衡系数，U为指示矩阵，其维度与X相同，当X某元素为真实观测，则U对应位置的元素为1，否则为0，Ψ为解码权重矩阵；采用梯度下降法求解Ψ得到Ψ，进而得到重构的测井样本原始矩阵X^*＝Φ^*Ψ^*，上标*表示当前最优；

2.根据权利要求1所述的不可通约测井曲线缺失段重构方法，其特征在于：步骤S3中还包括问题的求解过程如下：

首先，固定D,Ω,A以求解C＝[c₁；…；c_n]，这里对C采用按行更新的方式，即更新c_i时固定{c_j；j≠i}，由于涉及到L1范数，采用近端梯度下降法或者特征符号搜索法求解C；然后，固定C,D,A以求解Ω，令等于0得到Ω的解析解；接着，固定C,Ω,A以求解D，令/>等于0得到D的解析解；最后，固定C,Ω,D以求解A，采用自适应近邻聚类中的图构造算法进行求解；

多次迭代直到收敛即可实现对C,D,Ω,A的求解。

3.根据权利要求2所述的不可通约测井曲线缺失段重构方法，其特征在于：所述步骤S1、准备测井数据作为测井数据，具体包括，

整理N口井的测井与标签数据，第i井的数据集为表示测井样本空间，/>表示输出空间，/>表示第i口井数据的联合概率分布，(x,y)为有标签样本，其中测井样本x按深度提取，表示某深度上各测井值组成的向量，/> 为实数空间，/>为所用测井种类总数，/>并采用独热编码，/>为测井解释目标类别总数；第i口井的测井样本矩阵/>和测井标签矩阵n_i为第i口井的测井样本数量；所有测井样本矩阵合并得到全体井的测井样本原始矩阵/>所有测井标签矩阵合并得到全体井的测井标签矩阵/>

将测井样本原始矩阵缺失处补零，得到重构的测井样本原始矩阵X^*，U为指示矩阵，其维度与X相同，当X某元素为真实观测即没有缺失，则U对应位置的元素为1，否则为0。

4.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至3中任一项所述方法的步骤。