CN117473305A

CN117473305A - 一种近邻信息增强的储层参数预测方法及系统

Info

Publication number: CN117473305A
Application number: CN202311813911.1A
Authority: CN
Inventors: 王欣; 蒋涛; 赵祥东; 周幂; 高国海; 蒋薇; 屈海洲
Original assignee: Southwest Petroleum University
Current assignee: Southwest Petroleum University
Priority date: 2023-12-27
Filing date: 2023-12-27
Publication date: 2024-01-30

Abstract

本发明涉及一种近邻信息增强的储层参数预测方法及系统，属于储层参数动态预测技术领域；该方法包括：基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线，对预处理后的测井曲线进行主成分分析，降低数据维度，提取出主成分特征，利用K均值聚类算法对提取出的主成分进行无监督聚类，划分井群组，构建MLSTM预测模型，使用井群组中每类井群进行训练，并利用训练后的MLSTM预测模型进行储层参数的预测；本发明基于相邻井之间存在着多变的测井数据信息，对测井数据进行处理，解决储层参数预测不精的问题，能够实现井群的优化划分，实现对储层参数的预测。

Description

一种近邻信息增强的储层参数预测方法及系统

技术领域

本发明涉及储层参数预测技术领域，尤其涉及一种近邻信息增强的储层参数预测方法及系统。

背景技术

储层参数预测是油气勘探和生产中的重要任务之一，它涉及到确定地下储层中各种属性和特性的数值，以帮助石油工程师和地质学家更好地理解储层的潜力和行为；预测储层参数通常需要结合多种数据源，包括测井数据、地质实验室测试、地球物理勘探、数值模拟等方法。

孔隙度、渗透率和含水饱和度的准确预测是储层参数预测的重要基础，要想为储层参数预测提供可靠的参考依据，就必须对它们进行准确的估算，目前在油田勘探开发领域中，确定储层物性参数的方法主要有两种：一种是直接法，另一种是间接法，但这两种方法所构成的经验公式、统计模型可移植性差，且未充分考虑到非均质碳酸盐储层参数与测井数据之间复杂的非线性映射关系及空间的连续性。

近年来机器学习不断发展成熟，有很多学者对此进行深入研究，并利用其强大的学习能力对储层参数预测开展了一系列研究应用，如针对孔隙度预测不精等问题，利用网格搜索法和遗传算法对极限梯度提升进行优化；如将具有树形结构的高效集成学习模型应用于含水饱和度的预测，并证明了其在此任务上有一定的预测潜力；然而这些方法并未充分考虑到由于气候地理条件的不同，导致地下环境复杂多变，以至于各种测井数据之间存在着明显差异。

基于上述情况，亟需一种针对碳酸盐岩储层之间非均质性强、岩性和成岩作用复杂、数据具有时间序列等特性的预测方法。

发明内容

针对现有技术存在的问题，本发明提供了一种近邻信息增强的储层参数预测方法及系统，基于碳酸盐区块中相邻井之间存在着多变的测井曲线信息等，对测井曲线进行进一步处理划分，以解决储层参数预测不精等问题。

一种近邻信息增强的储层参数预测方法，包括：

基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线；

使用主成分分析对预处理后的测井曲线进行数据降维，提取主成分特征数据；

采用K均值聚类算法对主成分特征数据进行无监督聚类，得到具有相似属性的H类井群组；

构建MLSTM预测模型，使用井群组中每一类井群分别进行训练，得到与每类井群对应的MLSTM预测模型，并利用每类井群对应的MLSTM预测模型进行储层参数预测。

优选地，所述的基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线，具体包括：

对原始测井曲线进行初步筛选与清洗，并结合 Pearson 相关性分析方法对初步筛选与清洗后的测井曲线进行相关性分析，得到与储层孔隙度、渗透率和含水饱和度参数关联性达到设定阈值的测井曲线，即预处理后的测井曲线，测井曲线包括声波时差、井径、补偿中子、地层密度、自然伽马、校正声波时差、校正伽马中子、校正中子、校正密度、伽马中子、目的层真电阻率、冲洗带地层电阻率测井曲线。

优选地，所述的使用主成分分析对预处理后的测井曲线进行数据降维，提取主成分特征数据，具体包括：

利用主成分分析对预处理后的测井曲线进行降维重构，降低预处理后的测井曲线之间的多重共线性，提取预处理后的测井曲线内部的本质结构，得到相互独立的主成分特征数据；

根据相互独立的主成分特征数据，对于任意D维预处理后的测井曲线S,计算测井曲线的协方差矩阵R：式中，E为求期望，U为S的均值，/>，/>为每一维测井曲线，/>为第D维的测井曲线，T为转置；

对的测井曲线的协方差矩阵R进行特征值分解，得到特征向量：式中，/>和/>分别为预处理后的测井曲线协方差矩阵的特征值和特征向量；

将代表预设阈值信息的特征值个数作为主分量K：式中，argmin为主分量K取得最小值时的自变量的取值，i为第i个特征；

将预处理后的测井曲线投影到K个主成分组成的空间中：式中， />为主成分特征数据。

优选地，所述的采用K均值聚类算法对主成分特征数据进行无监督聚类，得到具有相似属性的H类井群组，具体包括：

给定主成分特征数据，从中随机选取k个样本点作为初始聚类中心，设簇集合/>，其中/>为簇C的聚类中心，/>为隶属于簇的样本，/>为每一个样本点，m为样本个数；

将每个样本点指派到与它距离最近的簇/>，其表达式为：/>式中；

根据下列公式更新每个聚类簇的聚类中心：并计算目标函数L的值其表达式如下：/>式中：/>为聚类簇，/>为/>的聚类中心，/> 为样本点；

经过t次迭代，当L的值达到设定阈值时，获得最优聚类结果，得到具有相似属性的H类井群组。

优选地，构建MLSTM预测模型，使用井群组中每一类井群分别进行训练，得到与每类井群对应的MLSTM预测模型，并利用每类井群对应的MLSTM预测模型进行储层参数预测，具体包括；

使用井群组中每一类井群分别进行训练，得到与每类井群对应的MLSTM预测模型，其中，井群组中每一类井群具有相似的近邻信息，并利用近邻信息搭建MLSTM预测模型；

MLSTM预测模型的损失函数为均方误差MSE，均方误差MSE公式为：

式中：/> 为MLSTM预测模型样本的数量，/>为MLSTM预测模型真实数据值，/> 为MLSTM预测模型数据的预测值；

MLSTM预测模型包含输入层、隐藏层和输出层；

输入层，用于接收近邻信息，并将近邻信息转化为固定输入向量；

隐藏层采用五层 LSTM单元网络，每层使用100个神经元，将固定输入向量映射为100维的隐藏向量，使用tanh激活函数，每层LSTM单元网络在传递的时候采用随机失活dropout技术按预设比例随机删除每一层LSTM网络中的神经元信息；

输出层采用Dense全连接层，使用3个神经元，将隐藏层的隐藏向量映射为储层孔隙度、渗透率和含水饱和度参数，作为储层参数预测结果。

一种近邻信息增强的储层参数预测系统，包括：

测井曲线筛选模块，用于对原始测井曲线进行相关性分析；

测井曲线特征提取模块，用于对预处理后的测井曲线进行特征提取；

井群划分模块，用于对与处理后的测井曲线进行聚类，对井群进行划分归类；

储层参数预测模块，用于采用MLSTM预测模型对储层参数进行预测。

优选地，所述的测井曲线筛选模块包括：

相关性分析单元，对原始测井曲线进行初步筛选与清洗，并结合 Pearson 相关性分析方法对初步筛选与清洗后的测井曲线进行相关性分析，得到与储层孔隙度、渗透率和含水饱和度参数关联性达到设定阈值的测井曲线，即预处理后的测井曲线，测井曲线包括声波时差、井径、补偿中子、地层密度、自然伽马、校正声波时差、校正伽马中子、校正中子、校正密度、伽马中子、目的层真电阻率、冲洗带地层电阻率测井曲线。

优选地，所述的测井曲线特征提取模块包括：

主成分特征分析单元，利用主成分分析对预处理后的测井曲线进行降维重构，降低预处理后的测井曲线之间的多重共线性，提取预处理后的测井曲线内部的本质结构，得到相互独立的主成分特征数据；

根据相互独立的主成分特征数据，对于任意D维测井曲线S,计算测井曲线的协方差矩阵R：

式中，E为求期望，U为S的均值，，/>为每一维测井曲线，/>为第D维的测井曲线，T为转置；

对测井曲线的协方差矩阵R进行特征值分解，得到特征向量：式中，和/>分别为预处理后的测井曲线协方差矩阵的特征值和特征向量；

优选地，所述的井群划分模块包括：

井群划分单元，用于对提取出的主成分特征数据进行聚类分析，融合邻域测井信息并划分井群类别，通过聚类算法对提取的主成分特征数据进行无监督聚类，将具有相似特征属性的测井划为一类；

该算具体流程为，给定主成分特征数据，从中随机选取k个样本点作为初始聚类中心，设簇集合/>，其中/>为簇C的聚类中心，/>为隶属于簇的样本，/>为每一个样本点，m为样本个数；

将每个样本点指派到与它距离最近的簇/>，其表达式为：/>式中/>，j为样本点/>所属簇的索引；

优选地，所述的储层参数预测模块包括：

预测模型构建单元，使用井群组中每一类井群分别进行训练，得到与每类井群对应的MLSTM预测模型，其中，井群组中每一类井群具有相似的近邻信息，并利用近邻信息搭建MLSTM预测模型；

模型预测单元，MLSTM预测模型包含输入层、隐藏层和输出层；

输入层，负用于收近邻信息，并将近邻信息转化为固定输入向量；

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单介绍，显而易见，下面描述中的附图说明仅仅是本发明的一些实施例，对于本领域普通技术人员来说，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种近邻信息增强的储层参数预测方法实施例的方法流程图。

图2为本发明一种近邻信息增强的储层参数预测系统实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供了一种近邻信息增强的储层参数预测方法及系统，基于碳酸盐区块中邻井之间存在着多变的测井数据信息等，对测井数据进行进一步处理划分，以解决储层参数预测不精等问题。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

参考图1，为本发明一种近邻信息增强的储层参数预测方法实施例的方法流程图，所述方法包括以下步骤：序号前去掉步骤，以下均同，并根据权要的修改重新修改实施例

S101，基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线，具体步骤包括：

S102，使用主成分分析对预处理后的测井曲线进行数据降维，提取主成分特征数据，具体步骤包括：

根据相互独立的主成分特征数据，对于任意D维预处理后的测井曲线S,计算测井曲线的协方差矩阵R：

式中，E为求期望，U为S的均值，/>，/>为每一维测井曲线，为第D维的测井曲线，T为转置；

对测井曲线的协方差矩阵R进行特征值分解，得到特征向量：式中，/>和/>分别为预处理后的测井曲线协方差矩阵的特征值和特征向量；

将代表预设阈值信息的特征值个数作为主分量K，即：式中，argmin为主分量K取得最小值时的自变量的取值，i为第i个特征；

S103，采用K均值聚类算法对主成分特征数据进行无监督聚类，得到具有相似属性的H类井群组，具体步骤包括：

将每个样本点指派到与它距离最近的簇/>，其表达式为：/>式中，j为样本点/>所属簇的索引；

根据下列公式更新每个聚类簇的聚类中心：计算目标函数L的值其表达式如下：/>式中：/>为聚类簇，/>为/>的聚类中心，/> 为样本点；

S104，构建MLSTM预测模型，使用井群组中每一类井群分别进行训练，得到与每类井群对应的MLSTM预测模型，并利用每类井群对应的MLSTM预测模型进行储层参数预测，具体步骤包括：

MLSTM预测模型的损失函数为均方误差MSE，均方误差MSE公式为：式中：/> 为MLSTM预测模型样本的数量，/>为MLSTM预测模型真实数据值，/> 为MLSTM预测模型数据的预测值；

MLSTM预测模型包含输入层、隐藏层和输出层；

参考图2，为本发明一种近邻信息增强的储层参数预测系统实施例的结构示意图，所述系统包括一下模块：

测井曲线筛选模块，用于对原始测井曲线进行相关性分析，具体包括：

测井曲线特征提取模块，用于对预处理后测井曲线进行特征提取，具体包括：

井群划分模块，用于对提取出的测井曲线进行聚类，对井群进行划分归类，具体包括：

井群划分单元，用于对提取出主成分特征数据进行聚类分析，融合邻域测井信息并划分井群类别，通过聚类算法对提取的主成分特征数据进行无监督聚类，将具有相似特征属性的测井划为一类；该算具体流程为：

储层参数预测及模型评价模块S204，用于采用MLSTM预测模型对储层参数进行预测，具体包括：

输入层负用于收近邻信息，并将近邻信息转化为固定输入向量；

综上所述，与现有技术相比本发明公开的一种近邻信息增强的储层参数预测方法及系统，具有以下有益效果：（1）本发明通过相关性分析和主成分分析提取出与储层参数高度相关的主成分特征，作为预测模型的输入特征，有利于提高模型的准确度；（2）碳酸盐岩储层非均质性强、岩性和成岩作用复杂，孔隙度、渗透率和含水饱和度分布范围广；本方法对储层参数数据进行聚类分析，融合邻域测井信息并划分井群组，将具有相似特征属性的储层参数划为一类，基于每一类测井数据，分别构建储层参数预测模型；（3）本发明基于机器学习方法，利用多层长短期记忆神经网络对长期序列进行建模，深度挖掘储层参数数据的序列特征，并建储层参数之间的复杂非线性特征关系；

本发明应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种近邻信息增强的储层参数预测方法，其特征在于，包括以下步骤：

S101、基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线；

S102、使用主成分分析对预处理后的测井曲线进行数据降维，提取主成分特征数据；

S103、采用K均值聚类算法对主成分特征数据进行无监督聚类，得到具有相似属性的H类井群组；

S104、构建MLSTM预测模型，使用井群组中每一类井群分别进行训练，得到与每类井群对应的MLSTM预测模型，并利用每类井群对应的MLSTM预测模型进行储层参数预测。

2.根据权利要求1所述的近邻信息增强的储层参数预测方法，其特征在于，所述基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线，具体包括：

3.根据权利要求1所述的近邻信息增强的储层参数预测方法，其特征在于，所述的使用主成分分析对预处理后的测井曲线进行数据降维，提取主成分特征数据，具体包括：

利用主成分分析对预处理后的测井曲线进行降维重构，得到相互独立的主成分特征数据；

根据相互独立的主成分特征数据，对于任意D维预处理后的测井曲线S,计算测井曲线的协方差矩阵R：式中，E为求期望，U为S的均值，/>，为每一维的测井曲线,/>为第D维测井曲线，T为转置；

将预处理后的测井曲线投影到K个主成分量组成的空间中：式中， />为主成分特征数据。

4.根据权利要求1所述的近邻信息增强的储层参数预测方法，其特征在于，采用K均值聚类算法对主成分特征数据进行无监督聚类，得到H类井群组，具体包括：

给定主成分特征数据，从中随机选取k个样本点作为初始聚类中心，设簇集合，/>其中，/>为簇C的聚类中心，/>为隶属于簇的样本，/>为每一个样本点，m为样本个数；

将每个样本点指派到与它距离最近的簇/>，其表达式为：/>式中，j为样本点/>所属簇的索引；根据下列公式更新每个聚类簇的聚类中心： />计算目标函数L的值其表达式如下：/>式中：/>为聚类簇，/>为/>的聚类中心，/> 为样本点；

经过t次迭代，当目标函数L的值达到设定阈值时，获得最优聚类结果，得到具有相似属性的H类井群组。

5.根据权利要求1所述的近邻信息增强的储层参数预测方法，其特征在于，构建MLSTM预测模型，使用井群组中每一类井群分别进行训练，得到与每类井群对应的MLSTM预测模型，并利用每类井群对应的MLSTM预测模型进行储层参数预测，具体包括：

使用井群组中每一类井群分别进行训练，得到与每类井群对应的MLSTM预测模型，其中，井群组中每一类井群具有相似的近邻信息，并利用近邻信息搭建MLSTM预测摸模型；

利用每类井群对应的MLSTM预测模型进行储层参数预测。

6.根据权利要求5所述的近邻信息增强的储层参数预测方法，其特征在于，MLSTM预测模型的损失函数为均方误差MSE，均方误差MSE公式为：式中：/> 为MLSTM预测模型样本的数量，/>为MLSTM预测模型真实数据值，/> 为MLSTM预测模型数据的预测值。

7.根据权利要求6所述的近邻信息增强的储层参数预测方法，其特征在于，

MLSTM预测模型包括输入层、隐藏层和输出层；

隐藏层采用五层 LSTM单元网络，每层使用100个神经元，将固定输入向量映射为100维的隐藏向量，使用tanh激活函数，每层LSTM单元网络在传递的时候采用随机失活 dropout按预设比例随机删除每一层LSTM网络中的神经元信息；

8.一种执行权利要求1-7任一所述的近邻信息增强的储层参数预测方法的储层参数预测系统，其特征在于，包括以下模块：

测井曲线筛选模块，用于对原始测井曲线进行相关性分析；

测井曲线征提取模块，用于对预处理后的测井曲线进行特征提取；

井群划分模块，用于对提取出的测井曲线进行聚类，对井群进行划分归类；