CN117473305A - 一种近邻信息增强的储层参数预测方法及系统 - Google Patents
一种近邻信息增强的储层参数预测方法及系统 Download PDFInfo
- Publication number
- CN117473305A CN117473305A CN202311813911.1A CN202311813911A CN117473305A CN 117473305 A CN117473305 A CN 117473305A CN 202311813911 A CN202311813911 A CN 202311813911A CN 117473305 A CN117473305 A CN 117473305A
- Authority
- CN
- China
- Prior art keywords
- mlstm
- logging curve
- reservoir
- prediction model
- well group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012216 screening Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000010220 Pearson correlation analysis Methods 0.000 claims abstract description 10
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 9
- 238000000513 principal component analysis Methods 0.000 claims abstract description 8
- 238000003064 k means clustering Methods 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 25
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 18
- 230000035699 permeability Effects 0.000 claims description 17
- 238000012937 correction Methods 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 15
- 210000002569 neuron Anatomy 0.000 claims description 15
- 238000010219 correlation analysis Methods 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000004140 cleaning Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 238000011010 flushing procedure Methods 0.000 claims description 5
- 230000002779 inactivation Effects 0.000 claims description 5
- 238000012512 characterization method Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 230000002708 enhancing effect Effects 0.000 claims 3
- 238000007781 pre-processing Methods 0.000 claims 1
- 238000005457 optimization Methods 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 6
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000007621 cluster analysis Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V9/00—Prospecting or detecting by methods not provided for in groups G01V1/00 - G01V8/00
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/061—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/30—Assessment of water resources
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Neurology (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Geophysics (AREA)
- Probability & Statistics with Applications (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种近邻信息增强的储层参数预测方法及系统,属于储层参数动态预测技术领域;该方法包括:基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线,对预处理后的测井曲线进行主成分分析,降低数据维度,提取出主成分特征,利用K均值聚类算法对提取出的主成分进行无监督聚类,划分井群组,构建MLSTM预测模型,使用井群组中每类井群进行训练,并利用训练后的MLSTM预测模型进行储层参数的预测;本发明基于相邻井之间存在着多变的测井数据信息,对测井数据进行处理,解决储层参数预测不精的问题,能够实现井群的优化划分,实现对储层参数的预测。
Description
技术领域
本发明涉及储层参数预测技术领域,尤其涉及一种近邻信息增强的储层参数预测方法及系统。
背景技术
储层参数预测是油气勘探和生产中的重要任务之一,它涉及到确定地下储层中各种属性和特性的数值,以帮助石油工程师和地质学家更好地理解储层的潜力和行为;预测储层参数通常需要结合多种数据源,包括测井数据、地质实验室测试、地球物理勘探、数值模拟等方法。
孔隙度、渗透率和含水饱和度的准确预测是储层参数预测的重要基础,要想为储层参数预测提供可靠的参考依据,就必须对它们进行准确的估算,目前在油田勘探开发领域中,确定储层物性参数的方法主要有两种:一种是直接法,另一种是间接法,但这两种方法所构成的经验公式、统计模型可移植性差,且未充分考虑到非均质碳酸盐储层参数与测井数据之间复杂的非线性映射关系及空间的连续性。
近年来机器学习不断发展成熟,有很多学者对此进行深入研究,并利用其强大的学习能力对储层参数预测开展了一系列研究应用,如针对孔隙度预测不精等问题,利用网格搜索法和遗传算法对极限梯度提升进行优化;如将具有树形结构的高效集成学习模型应用于含水饱和度的预测,并证明了其在此任务上有一定的预测潜力;然而这些方法并未充分考虑到由于气候地理条件的不同,导致地下环境复杂多变,以至于各种测井数据之间存在着明显差异。
基于上述情况,亟需一种针对碳酸盐岩储层之间非均质性强、岩性和成岩作用复杂、数据具有时间序列等特性的预测方法。
发明内容
针对现有技术存在的问题,本发明提供了一种近邻信息增强的储层参数预测方法及系统,基于碳酸盐区块中相邻井之间存在着多变的测井曲线信息等,对测井曲线进行进一步处理划分,以解决储层参数预测不精等问题。
一种近邻信息增强的储层参数预测方法,包括:
基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线;
使用主成分分析对预处理后的测井曲线进行数据降维,提取主成分特征数据;
采用K均值聚类算法对主成分特征数据进行无监督聚类,得到具有相似属性的H类井群组;
构建MLSTM预测模型,使用井群组中每一类井群分别进行训练,得到与每类井群对应的MLSTM预测模型,并利用每类井群对应的MLSTM预测模型进行储层参数预测。
优选地,所述的基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线,具体包括:
对原始测井曲线进行初步筛选与清洗,并结合 Pearson 相关性分析方法对初步筛选与清洗后的测井曲线进行相关性分析,得到与储层孔隙度、渗透率和含水饱和度参数关联性达到设定阈值的测井曲线,即预处理后的测井曲线,测井曲线包括声波时差、井径、补偿中子、地层密度、自然伽马、校正声波时差、校正伽马中子、校正中子、校正密度、伽马中子、目的层真电阻率、冲洗带地层电阻率测井曲线。
优选地,所述的使用主成分分析对预处理后的测井曲线进行数据降维,提取主成分特征数据,具体包括:
利用主成分分析对预处理后的测井曲线进行降维重构,降低预处理后的测井曲线之间的多重共线性,提取预处理后的测井曲线内部的本质结构,得到相互独立的主成分特征数据;
根据相互独立的主成分特征数据,对于任意D维预处理后的测井曲线S,计算测井曲线的协方差矩阵R:式中,E为求期望,U为S的均值,/>,/>为每一维测井曲线,/>为第D维的测井曲线,T为转置;
对的测井曲线的协方差矩阵R进行特征值分解,得到特征向量:式中,/>和/>分别为预处理后的测井曲线协方差矩阵的特征值和特征向量;
将代表预设阈值信息的特征值个数作为主分量K:式中,argmin为主分量K取得最小值时的自变量的取值,i为第i个特征;
将预处理后的测井曲线投影到K个主成分组成的空间中:式中, />为主成分特征数据。
优选地,所述的采用K均值聚类算法对主成分特征数据进行无监督聚类,得到具有相似属性的H类井群组,具体包括:
给定主成分特征数据,从中随机选取k个样本点作为初始聚类中心,设簇集合/>,其中/>为簇C的聚类中心,/>为隶属于簇的样本,/>为每一个样本点,m为样本个数;
将每个样本点指派到与它距离最近的簇/>,其表达式为:/>式中;
根据下列公式更新每个聚类簇的聚类中心:并计算目标函数L的值其表达式如下:/>式中:/>为聚类簇,/>为/>的聚类中心,/> 为样本点;
经过t次迭代,当L的值达到设定阈值时,获得最优聚类结果,得到具有相似属性的H类井群组。
优选地,构建MLSTM预测模型,使用井群组中每一类井群分别进行训练,得到与每类井群对应的MLSTM预测模型,并利用每类井群对应的MLSTM预测模型进行储层参数预测,具体包括;
使用井群组中每一类井群分别进行训练,得到与每类井群对应的MLSTM预测模型,其中,井群组中每一类井群具有相似的近邻信息,并利用近邻信息搭建MLSTM预测模型;
MLSTM预测模型的损失函数为均方误差MSE,均方误差MSE公式为:
式中:/> 为MLSTM预测模型样本的数量,/>为MLSTM预测模型真实数据值,/> 为MLSTM预测模型数据的预测值;
MLSTM预测模型包含输入层、隐藏层和输出层;
输入层,用于接收近邻信息,并将近邻信息转化为固定输入向量;
隐藏层采用五层 LSTM单元网络,每层使用100个神经元,将固定输入向量映射为100维的隐藏向量,使用tanh激活函数,每层LSTM单元网络在传递的时候采用随机失活dropout技术按预设比例随机删除每一层LSTM网络中的神经元信息;
输出层采用Dense全连接层,使用3个神经元,将隐藏层的隐藏向量映射为储层孔隙度、渗透率和含水饱和度参数,作为储层参数预测结果。
一种近邻信息增强的储层参数预测系统,包括:
测井曲线筛选模块,用于对原始测井曲线进行相关性分析;
测井曲线特征提取模块,用于对预处理后的测井曲线进行特征提取;
井群划分模块,用于对与处理后的测井曲线进行聚类,对井群进行划分归类;
储层参数预测模块,用于采用MLSTM预测模型对储层参数进行预测。
优选地,所述的测井曲线筛选模块包括:
相关性分析单元,对原始测井曲线进行初步筛选与清洗,并结合 Pearson 相关性分析方法对初步筛选与清洗后的测井曲线进行相关性分析,得到与储层孔隙度、渗透率和含水饱和度参数关联性达到设定阈值的测井曲线,即预处理后的测井曲线,测井曲线包括声波时差、井径、补偿中子、地层密度、自然伽马、校正声波时差、校正伽马中子、校正中子、校正密度、伽马中子、目的层真电阻率、冲洗带地层电阻率测井曲线。
优选地,所述的测井曲线特征提取模块包括:
主成分特征分析单元,利用主成分分析对预处理后的测井曲线进行降维重构,降低预处理后的测井曲线之间的多重共线性,提取预处理后的测井曲线内部的本质结构,得到相互独立的主成分特征数据;
根据相互独立的主成分特征数据,对于任意D维测井曲线S,计算测井曲线的协方差矩阵R:
式中,E为求期望,U为S的均值,,/>为每一维测井曲线,/>为第D维的测井曲线,T为转置;
对测井曲线的协方差矩阵R进行特征值分解,得到特征向量:式中,和/>分别为预处理后的测井曲线协方差矩阵的特征值和特征向量;
将代表预设阈值信息的特征值个数作为主分量K:式中,argmin为主分量K取得最小值时的自变量的取值,i为第i个特征;
将预处理后的测井曲线投影到K个主成分组成的空间中:式中, />为主成分特征数据。
优选地,所述的井群划分模块包括:
井群划分单元,用于对提取出的主成分特征数据进行聚类分析,融合邻域测井信息并划分井群类别,通过聚类算法对提取的主成分特征数据进行无监督聚类,将具有相似特征属性的测井划为一类;
该算具体流程为,给定主成分特征数据,从中随机选取k个样本点作为初始聚类中心,设簇集合/>,其中/>为簇C的聚类中心,/>为隶属于簇的样本,/>为每一个样本点,m为样本个数;
将每个样本点指派到与它距离最近的簇/>,其表达式为:/>式中/>,j为样本点/>所属簇的索引;
根据下列公式更新每个聚类簇的聚类中心: 并计算目标函数L的值其表达式如下:/>式中:/>为聚类簇,/>为/>的聚类中心,/> 为样本点;
经过t次迭代,当L的值达到设定阈值时,获得最优聚类结果,得到具有相似属性的H类井群组。
优选地,所述的储层参数预测模块包括:
预测模型构建单元,使用井群组中每一类井群分别进行训练,得到与每类井群对应的MLSTM预测模型,其中,井群组中每一类井群具有相似的近邻信息,并利用近邻信息搭建MLSTM预测模型;
MLSTM预测模型的损失函数为均方误差MSE,均方误差MSE公式为:
式中:/> 为MLSTM预测模型样本的数量,/>为MLSTM预测模型真实数据值,/> 为MLSTM预测模型数据的预测值;
模型预测单元,MLSTM预测模型包含输入层、隐藏层和输出层;
输入层,负用于收近邻信息,并将近邻信息转化为固定输入向量;
隐藏层采用五层 LSTM单元网络,每层使用100个神经元,将固定输入向量映射为100维的隐藏向量,使用tanh激活函数,每层LSTM单元网络在传递的时候采用随机失活dropout技术按预设比例随机删除每一层LSTM网络中的神经元信息;
输出层采用Dense全连接层,使用3个神经元,将隐藏层的隐藏向量映射为储层孔隙度、渗透率和含水饱和度参数,作为储层参数预测结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍,显而易见,下面描述中的附图说明仅仅是本发明的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种近邻信息增强的储层参数预测方法实施例的方法流程图。
图2为本发明一种近邻信息增强的储层参数预测系统实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种近邻信息增强的储层参数预测方法及系统,基于碳酸盐区块中邻井之间存在着多变的测井数据信息等,对测井数据进行进一步处理划分,以解决储层参数预测不精等问题。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参考图1,为本发明一种近邻信息增强的储层参数预测方法实施例的方法流程图,所述方法包括以下步骤:序号前去掉步骤,以下均同,并根据权要的修改重新修改实施例
S101,基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线,具体步骤包括:
对原始测井曲线进行初步筛选与清洗,并结合 Pearson 相关性分析方法对初步筛选与清洗后的测井曲线进行相关性分析,得到与储层孔隙度、渗透率和含水饱和度参数关联性达到设定阈值的测井曲线,即预处理后的测井曲线,测井曲线包括声波时差、井径、补偿中子、地层密度、自然伽马、校正声波时差、校正伽马中子、校正中子、校正密度、伽马中子、目的层真电阻率、冲洗带地层电阻率测井曲线。
S102,使用主成分分析对预处理后的测井曲线进行数据降维,提取主成分特征数据,具体步骤包括:
利用主成分分析对预处理后的测井曲线进行降维重构,降低预处理后的测井曲线之间的多重共线性,提取预处理后的测井曲线内部的本质结构,得到相互独立的主成分特征数据;
根据相互独立的主成分特征数据,对于任意D维预处理后的测井曲线S,计算测井曲线的协方差矩阵R:
式中,E为求期望,U为S的均值,/>,/>为每一维测井曲线,为第D维的测井曲线,T为转置;
对测井曲线的协方差矩阵R进行特征值分解,得到特征向量:式中,/>和/>分别为预处理后的测井曲线协方差矩阵的特征值和特征向量;
将代表预设阈值信息的特征值个数作为主分量K,即:式中,argmin为主分量K取得最小值时的自变量的取值,i为第i个特征;
将预处理后的测井曲线投影到K个主成分组成的空间中:式中, />为主成分特征数据。
S103,采用K均值聚类算法对主成分特征数据进行无监督聚类,得到具有相似属性的H类井群组,具体步骤包括:
给定主成分特征数据,从中随机选取k个样本点作为初始聚类中心,设簇集合/>,其中/>为簇C的聚类中心,/>为隶属于簇的样本,/>为每一个样本点,m为样本个数;
将每个样本点指派到与它距离最近的簇/>,其表达式为:/>式中,j为样本点/>所属簇的索引;
根据下列公式更新每个聚类簇的聚类中心:计算目标函数L的值其表达式如下:/>式中:/>为聚类簇,/>为/>的聚类中心,/> 为样本点;
经过t次迭代,当L的值达到设定阈值时,获得最优聚类结果,得到具有相似属性的H类井群组。
S104,构建MLSTM预测模型,使用井群组中每一类井群分别进行训练,得到与每类井群对应的MLSTM预测模型,并利用每类井群对应的MLSTM预测模型进行储层参数预测,具体步骤包括:
使用井群组中每一类井群分别进行训练,得到与每类井群对应的MLSTM预测模型,其中,井群组中每一类井群具有相似的近邻信息,并利用近邻信息搭建MLSTM预测模型;
MLSTM预测模型的损失函数为均方误差MSE,均方误差MSE公式为:式中:/> 为MLSTM预测模型样本的数量,/>为MLSTM预测模型真实数据值,/> 为MLSTM预测模型数据的预测值;
MLSTM预测模型包含输入层、隐藏层和输出层;
输入层,用于接收近邻信息,并将近邻信息转化为固定输入向量;
隐藏层采用五层 LSTM单元网络,每层使用100个神经元,将固定输入向量映射为100维的隐藏向量,使用tanh激活函数,每层LSTM单元网络在传递的时候采用 随机失活dropout技术按预设比例随机删除每一层LSTM网络中的神经元信息;
输出层采用Dense全连接层,使用3个神经元,将隐藏层的隐藏向量映射为储层孔隙度、渗透率和含水饱和度参数,作为储层参数预测结果。
参考图2,为本发明一种近邻信息增强的储层参数预测系统实施例的结构示意图,所述系统包括一下模块:
测井曲线筛选模块,用于对原始测井曲线进行相关性分析,具体包括:
相关性分析单元,对原始测井曲线进行初步筛选与清洗,并结合 Pearson 相关性分析方法对初步筛选与清洗后的测井曲线进行相关性分析,得到与储层孔隙度、渗透率和含水饱和度参数关联性达到设定阈值的测井曲线,即预处理后的测井曲线,测井曲线包括声波时差、井径、补偿中子、地层密度、自然伽马、校正声波时差、校正伽马中子、校正中子、校正密度、伽马中子、目的层真电阻率、冲洗带地层电阻率测井曲线。
测井曲线特征提取模块,用于对预处理后测井曲线进行特征提取,具体包括:
主成分特征分析单元,利用主成分分析对预处理后的测井曲线进行降维重构,降低预处理后的测井曲线之间的多重共线性,提取预处理后的测井曲线内部的本质结构,得到相互独立的主成分特征数据;
根据相互独立的主成分特征数据,对于任意D维预处理后的测井曲线S,计算测井曲线的协方差矩阵R:式中,E为求期望,U为S的均值,/>,/>为每一维测井曲线,/>为第D维的测井曲线,T为转置;
对测井曲线的协方差矩阵R进行特征值分解,得到特征向量:式中,和/>分别为预处理后的测井曲线协方差矩阵的特征值和特征向量;
将代表预设阈值信息的特征值个数作为主分量K:式中,argmin为主分量K取得最小值时的自变量的取值,i为第i个特征;
将预处理后的测井曲线投影到K个主成分组成的空间中:式中, />为主成分特征数据。
井群划分模块,用于对提取出的测井曲线进行聚类,对井群进行划分归类,具体包括:
井群划分单元,用于对提取出主成分特征数据进行聚类分析,融合邻域测井信息并划分井群类别,通过聚类算法对提取的主成分特征数据进行无监督聚类,将具有相似特征属性的测井划为一类;该算具体流程为:
给定主成分特征数据,从中随机选取k个样本点作为初始聚类中心,设簇集合/>,其中/>为簇C的聚类中心,/>为隶属于簇的样本,/>为每一个样本点,m为样本个数;
将每个样本点指派到与它距离最近的簇/>,其表达式为:/>式中,j为样本点/>所属簇的索引;
根据下列公式更新每个聚类簇的聚类中心:计算目标函数L的值其表达式如下:/>式中:/>为聚类簇,/>为/>的聚类中心,/> 为样本点;
经过t次迭代,当L的值达到设定阈值时,获得最优聚类结果,得到具有相似属性的H类井群组。
储层参数预测及模型评价模块S204,用于采用MLSTM预测模型对储层参数进行预测,具体包括:
预测模型构建单元,使用井群组中每一类井群分别进行训练,得到与每类井群对应的MLSTM预测模型,其中,井群组中每一类井群具有相似的近邻信息,并利用近邻信息搭建MLSTM预测模型;
MLSTM预测模型的损失函数为均方误差MSE,均方误差MSE公式为:式中:/> 为MLSTM预测模型样本的数量,/>为MLSTM预测模型真实数据值,/> 为MLSTM预测模型数据的预测值;
模型预测单元,MLSTM预测模型包含输入层、隐藏层和输出层;
输入层负用于收近邻信息,并将近邻信息转化为固定输入向量;
隐藏层采用五层 LSTM单元网络,每层使用100个神经元,将固定输入向量映射为100维的隐藏向量,使用tanh激活函数,每层LSTM单元网络在传递的时候采用 随机失活dropout技术按预设比例随机删除每一层LSTM网络中的神经元信息;
输出层采用Dense全连接层,使用3个神经元,将隐藏层的隐藏向量映射为储层孔隙度、渗透率和含水饱和度参数,作为储层参数预测结果。
综上所述,与现有技术相比本发明公开的一种近邻信息增强的储层参数预测方法及系统,具有以下有益效果:(1)本发明通过相关性分析和主成分分析提取出与储层参数高度相关的主成分特征,作为预测模型的输入特征,有利于提高模型的准确度;(2)碳酸盐岩储层非均质性强、岩性和成岩作用复杂,孔隙度、渗透率和含水饱和度分布范围广;本方法对储层参数数据进行聚类分析,融合邻域测井信息并划分井群组,将具有相似特征属性的储层参数划为一类,基于每一类测井数据,分别构建储层参数预测模型;(3)本发明基于机器学习方法,利用多层长短期记忆神经网络对长期序列进行建模,深度挖掘储层参数数据的序列特征,并建储层参数之间的复杂非线性特征关系;
本发明应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种近邻信息增强的储层参数预测方法,其特征在于,包括以下步骤:
S101、基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线;
S102、使用主成分分析对预处理后的测井曲线进行数据降维,提取主成分特征数据;
S103、采用K均值聚类算法对主成分特征数据进行无监督聚类,得到具有相似属性的H类井群组;
S104、构建MLSTM预测模型,使用井群组中每一类井群分别进行训练,得到与每类井群对应的MLSTM预测模型,并利用每类井群对应的MLSTM预测模型进行储层参数预测。
2.根据权利要求1所述的近邻信息增强的储层参数预测方法,其特征在于,所述基于Pearson相关性分析方法从原始测井曲线中筛选出与储层参数关联性达到设定阈值的预处理后的测井曲线,具体包括:
对原始测井曲线进行初步筛选与清洗,并结合 Pearson 相关性分析方法对初步筛选与清洗后的测井曲线进行相关性分析,得到与储层孔隙度、渗透率和含水饱和度参数关联性达到设定阈值的测井曲线,即预处理后的测井曲线,测井曲线包括声波时差、井径、补偿中子、地层密度、自然伽马、校正声波时差、校正伽马中子、校正中子、校正密度、伽马中子、目的层真电阻率、冲洗带地层电阻率测井曲线。
3.根据权利要求1所述的近邻信息增强的储层参数预测方法,其特征在于,所述的使用主成分分析对预处理后的测井曲线进行数据降维,提取主成分特征数据,具体包括:
利用主成分分析对预处理后的测井曲线进行降维重构,得到相互独立的主成分特征数据;
根据相互独立的主成分特征数据,对于任意D维预处理后的测井曲线S,计算测井曲线的协方差矩阵R: 式中,E为求期望,U为S的均值,/>,为每一维的测井曲线,/>为第D维测井曲线,T为转置;
对测井曲线的协方差矩阵R进行特征值分解,得到特征向量:式中,/>和/>分别为预处理后的测井曲线协方差矩阵的特征值和特征向量;
将代表预设阈值信息的特征值个数作为主分量K:式中,argmin为主分量K取得最小值时的自变量的取值,i为第i个特征;
将预处理后的测井曲线投影到K个主成分量组成的空间中:式中, />为主成分特征数据。
4.根据权利要求1所述的近邻信息增强的储层参数预测方法,其特征在于,采用K均值聚类算法对主成分特征数据进行无监督聚类,得到H类井群组,具体包括:
给定主成分特征数据,从中随机选取k个样本点作为初始聚类中心,设簇集合,/>其中,/>为簇C的聚类中心,/>为隶属于簇的样本,/>为每一个样本点,m为样本个数;
将每个样本点指派到与它距离最近的簇/>,其表达式为:/>式中,j为样本点/>所属簇的索引;根据下列公式更新每个聚类簇的聚类中心: />计算目标函数L的值其表达式如下:/>式中:/>为聚类簇,/>为/>的聚类中心,/> 为样本点;
经过t次迭代,当目标函数L的值达到设定阈值时,获得最优聚类结果,得到具有相似属性的H类井群组。
5.根据权利要求1所述的近邻信息增强的储层参数预测方法,其特征在于,构建MLSTM预测模型,使用井群组中每一类井群分别进行训练,得到与每类井群对应的MLSTM预测模型,并利用每类井群对应的MLSTM预测模型进行储层参数预测,具体包括:
使用井群组中每一类井群分别进行训练,得到与每类井群对应的MLSTM预测模型,其中,井群组中每一类井群具有相似的近邻信息,并利用近邻信息搭建MLSTM预测摸模型;
利用每类井群对应的MLSTM预测模型进行储层参数预测。
6.根据权利要求5所述的近邻信息增强的储层参数预测方法,其特征在于,MLSTM预测模型的损失函数为均方误差MSE,均方误差MSE公式为:式中:/> 为MLSTM预测模型样本的数量,/>为MLSTM预测模型真实数据值,/> 为MLSTM预测模型数据的预测值。
7.根据权利要求6所述的近邻信息增强的储层参数预测方法,其特征在于,
MLSTM预测模型包括输入层、隐藏层和输出层;
输入层,用于接收近邻信息,并将近邻信息转化为固定输入向量;
隐藏层采用五层 LSTM单元网络,每层使用100个神经元,将固定输入向量映射为100维的隐藏向量,使用tanh激活函数,每层LSTM单元网络在传递的时候采用随机失活 dropout按预设比例随机删除每一层LSTM网络中的神经元信息;
输出层采用Dense全连接层,使用3个神经元,将隐藏层的隐藏向量映射为储层孔隙度、渗透率和含水饱和度参数,作为储层参数预测结果。
8.一种执行权利要求1-7任一所述的近邻信息增强的储层参数预测方法的储层参数预测系统,其特征在于,包括以下模块:
测井曲线筛选模块,用于对原始测井曲线进行相关性分析;
测井曲线征提取模块,用于对预处理后的测井曲线进行特征提取;
井群划分模块,用于对提取出的测井曲线进行聚类,对井群进行划分归类;
储层参数预测模块,用于采用MLSTM预测模型对储层参数进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311813911.1A CN117473305A (zh) | 2023-12-27 | 2023-12-27 | 一种近邻信息增强的储层参数预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311813911.1A CN117473305A (zh) | 2023-12-27 | 2023-12-27 | 一种近邻信息增强的储层参数预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117473305A true CN117473305A (zh) | 2024-01-30 |
Family
ID=89640010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311813911.1A Pending CN117473305A (zh) | 2023-12-27 | 2023-12-27 | 一种近邻信息增强的储层参数预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117473305A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117952658A (zh) * | 2024-03-26 | 2024-04-30 | 江西省科技事务中心 | 基于大数据的城市资源配置和产业特色分析方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110674841A (zh) * | 2019-08-22 | 2020-01-10 | 中国石油天然气集团有限公司 | 一种基于聚类算法的测井曲线识别方法 |
CN110852527A (zh) * | 2019-11-20 | 2020-02-28 | 成都理工大学 | 一种结合深度学习的储层物性参数预测方法 |
CN113947198A (zh) * | 2021-12-21 | 2022-01-18 | 西南石油大学 | 一种基于非线性自回归神经网络模型的测井曲线重构方法 |
CN117251802A (zh) * | 2023-11-14 | 2023-12-19 | 西南石油大学 | 一种基于迁移学习的非均质储层参数预测方法及系统 |
-
2023
- 2023-12-27 CN CN202311813911.1A patent/CN117473305A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110674841A (zh) * | 2019-08-22 | 2020-01-10 | 中国石油天然气集团有限公司 | 一种基于聚类算法的测井曲线识别方法 |
CN110852527A (zh) * | 2019-11-20 | 2020-02-28 | 成都理工大学 | 一种结合深度学习的储层物性参数预测方法 |
CN113947198A (zh) * | 2021-12-21 | 2022-01-18 | 西南石油大学 | 一种基于非线性自回归神经网络模型的测井曲线重构方法 |
CN117251802A (zh) * | 2023-11-14 | 2023-12-19 | 西南石油大学 | 一种基于迁移学习的非均质储层参数预测方法及系统 |
Non-Patent Citations (1)
Title |
---|
王欣等: "邻域信息增强的MLSTM 在储层参数预测中的应用研究——以非均质性碳酸盐岩为例", 《地球物理学进展》, 6 November 2023 (2023-11-06), pages 1 - 14 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117952658A (zh) * | 2024-03-26 | 2024-04-30 | 江西省科技事务中心 | 基于大数据的城市资源配置和产业特色分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109611087B (zh) | 一种火山岩油藏储层参数智能预测方法及系统 | |
Sun et al. | Optimization of models for a rapid identification of lithology while drilling-A win-win strategy based on machine learning | |
CN111783825B (zh) | 一种基于卷积神经网络学习的测井岩性识别方法 | |
CN110674841B (zh) | 一种基于聚类算法的测井曲线识别方法 | |
CN112989708B (zh) | 一种基于lstm神经网络的测井岩性识别方法及系统 | |
Kaydani et al. | Permeability prediction based on reservoir zonation by a hybrid neural genetic algorithm in one of the Iranian heterogeneous oil reservoirs | |
CN117473305A (zh) | 一种近邻信息增强的储层参数预测方法及系统 | |
CN110619353A (zh) | 一种基于深度学习的多尺度测井曲线自动识别方法 | |
CN112712025A (zh) | 一种基于长短期记忆神经网络的复杂岩性识别方法 | |
CN111048163B (zh) | 一种基于高阶神经网络的页岩油滞留烃量(s1)评价方法 | |
CN117272841B (zh) | 一种基于混合神经网络的页岩气甜点预测方法 | |
CN111914478A (zh) | 一种综合地质钻孔测井岩性识别方法 | |
CN115267935B (zh) | 数据与物理模型联合驱动的测井储层评价方法及装置 | |
Sun et al. | Identification of porosity and permeability while drilling based on machine learning | |
CN117593653B (zh) | 基于遥感监测的地质灾害预警方法 | |
Chang et al. | SegLog: Geophysical logging segmentation network for lithofacies identification | |
CN114638300A (zh) | 一种识别页岩油气藏“甜点”的方法、装置及存储介质 | |
CN116911216B (zh) | 一种储层油井产能因素评估与预测方法 | |
EP4430434A1 (en) | Systems and methods of modeling geological facies for well development | |
Wang et al. | A Novel Multi‐Input AlexNet Prediction Model for Oil and Gas Production | |
CN115204277A (zh) | 一种基于多阈值量化输出观测的渐近最优岩性预测方法 | |
Yu et al. | Training image optimization method based on convolutional neural network and its application in discrete fracture network model selection | |
CN117633658B (zh) | 岩石储层岩性识别方法及系统 | |
Hou et al. | Identification of carbonate sedimentary facies from well logs with machine learning | |
CN117235628B (zh) | 一种基于混合贝叶斯深度网络测井曲线预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |