CN115204277A - 一种基于多阈值量化输出观测的渐近最优岩性预测方法 - Google Patents
一种基于多阈值量化输出观测的渐近最优岩性预测方法 Download PDFInfo
- Publication number
- CN115204277A CN115204277A CN202210736022.9A CN202210736022A CN115204277A CN 115204277 A CN115204277 A CN 115204277A CN 202210736022 A CN202210736022 A CN 202210736022A CN 115204277 A CN115204277 A CN 115204277A
- Authority
- CN
- China
- Prior art keywords
- lithology
- sample
- weighted
- logging
- quasi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 51
- 239000011159 matrix material Substances 0.000 claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000012360 testing method Methods 0.000 claims abstract description 21
- 230000000694 effects Effects 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 11
- 238000013139 quantization Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 238000005315 distribution function Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims description 2
- 239000000463 material Substances 0.000 abstract description 2
- 238000011161 development Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000934806 Krameria Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 239000003209 petroleum derivative Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21B—EARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B49/00—Testing the nature of borehole walls; Formation testing; Methods or apparatus for obtaining samples of soil or well fluids, specially adapted to earth drilling or wells
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mining & Mineral Resources (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Geology (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Fluid Mechanics (AREA)
- Environmental & Geological Engineering (AREA)
- Evolutionary Computation (AREA)
- Geochemistry & Mineralogy (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Complex Calculations (AREA)
Abstract
本发明提出一种基于多阈值量化输出观测的渐近最优岩性预测方法,包括如下步骤:1、根据测井曲线数据及对应岩性信息,构建模型的输入样本,并将总样本分为训练集和测试集;2、基于训练集中的输入样本及对应岩性类别信息,构造并执行多阈值量化岩性识别模型的渐近最优辨识算法;3、根据基于信息矩阵的加权拟牛顿型算法所给出的参数估计值,利用岩性识别模型对岩性进行预测,判断测试集中某样本属于哪个岩性类别。本发明首次提出多阈值量化岩性识别模型以实现测井岩性识别的问题,在节省人力物力的基础上,实现了岩性识别模型的可解释性。本发明提出的基于信息矩阵的加权拟牛顿型算法具有渐近最优性,即其收敛效果优于以往量化辨识算法。
Description
技术领域
本发明涉及地球物理勘探中岩性识别的相关问题,具体涉及一种基于多阈值量化输出观测的渐近最优岩性预测方法。
背景技术
随着我国经济的飞速发展,石油供需关系持续紧张且新巨型油田发现急剧减少,能否解决能源问题成为国家经济发展的关键因素之一,这对油田地质勘探提出了更高的要求。准确的岩性识别结果可以为油田的勘探和开发提供可靠的依据,在寻找石油天然气资源和评估资源储量等方面发挥着巨大的作用。
一般情况下,获取地下岩性信息的数据源主要包括两类:岩芯数据和测井曲线。其中,岩芯数据是在钻井过程中直接采集,由地质学专家进行分析并获取较准确的岩性信息,但高昂的成本导致该方法很难在油田的实际开发中得到广泛的应用。测井曲线具有垂向分辨率高、连续性好、数据采集方便等优点,常常被应用于岩性识别的研究。传统的测井岩性识别方法[1]准确度低、速度慢、人为因素影响大,因此,利用计算机更快速和准确地进行岩性识别成为国内外测井研究工作者研究的热点[2-3]。然而现有的基于机器学习的岩性识别方法更加追求高识别精度,忽略了对岩性识别模型的可解释性研究,对于风险意识很强的实际工业生产模型来说可解释性是很有必要的。因此,本发明基于多阈值量化岩性识别模型来给出岩性预测方法。
参考文献如下:
[1]Honarkhah M,and Caers J,Direct pattern-based simulation of non-stationary geostatistical models,Mathematical Geosciences,2012,44(6):651-672。
[2]康乾坤,路来君,随机森林算法在测井岩性分类中的应用,世界地质,2020,39(02):398-405。
[3]马陇飞,萧汉敏,陶敬伟,张帆,罗永成,张海琴,基于深度学习岩性分类的研究与应用,科学技术与工程,2022,22(07):2609-2617。
发明内容
为解决上述问题,本发明提供一种基于多阈值量化输出观测的渐近最优岩性预测方法,能够有效地预测岩性类别。为解决上述问题,本发明采用如下技术方案:
一种基于多阈值量化输出观测的渐近最优岩性预测方法,包括如下步骤:
步骤1、根据测井曲线数据及对应岩性信息,构建模型的输入样本;具体包括,根据测井曲线数据及对应岩性信息,构建模型输入样本:将深度、声波测井、井径测井、补偿中子测井、伽马测井、自然电位测井、2.5m底梯度电阻率测井和密度测井等数据组成8维样本特征向量,并将总样本分为训练集和测试集。
步骤2、基于训练集中的输入样本及对应岩性类别信息,构造并执行多阈值量化岩性识别模型的渐近最优辨识算法。具体包括:首先根据训练集中的输入样本及对应岩性信息构建岩性识别模型,再设计基于信息矩阵的加权拟牛顿型算法来辨识岩性识别模型中的未知参数,并评估算法的收敛特性和最优性。
步骤3、根据基于信息矩阵的加权拟牛顿型算法所给出的参数估计值,利用岩性识别模型对岩性进行预测,判断测试集中某样本属于哪个岩性类别。
本发明的优点及有益效果:
1.本发明首次提出多阈值量化岩性识别模型以实现测井岩性识别的问题,在节省人力物力的基础上,实现了岩性识别模型的可解释性。
2.与以往的基于量化输出测量的参数辨识算法相比,本发明提出的基于信息矩阵的加权拟牛顿型算法具有渐近最优性,即其收敛效果优于以往量化辨识算法。
附图说明
图1为本发明的方法流程图。
图2为本发明岩性识别模型框图。
图3是本发明中基于信息矩阵的加权拟牛顿型算法的流程图。
图4是本发明岩性预测的模型结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅为本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域的普通技术人员在不付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
为使本发明提出的一种基于多阈值量化输出观测的渐近最优岩性预测方法的技术方案更加清楚、完整,现将具体步骤(本发明的方法流程图如图1所示)详细描述如下:
步骤1、根据测井曲线数据及对应岩性信息,构建模型的输入样本,并将总样本分为训练集和测试集。
根据测井曲线数据及对应岩性信息,构建模型输入样本:使用深度(DEPTH)、声波测井(AC)、井径测井(CAL)、补偿中子测井(CNL)、伽马测井(GR)、自然电位测井(SP)、2.5m底梯度电阻率测井(R25)和密度测井(DEN)组成8维样本特征向量,记为其中,n=8,代表n维实数域。样本标签q∈{0,1,...,m}为岩性类别,包括:泥岩,粗砂岩,细砂岩,砾岩。假设共有总的样本N条,遵循7∶3的准则分开训练集和测试集,记训练集样本数据有Ns条,测试集样本有Nt条。
步骤2、基于训练集中的输入样本及对应岩性类别信息,构造并执行多阈值量化岩性识别模型的渐近最优辨识算法。
首先,根据训练集中的输入样本及对应岩性信息构建含未知参数的岩性识别模型(本发明的岩性识别模型框图如图2所示),具体如下:
其中,φk是第k个岩性样本的n维样本特征,T代表向量的转置;θ是岩性识别模型的n维未知定常参数向量;dk是第k个岩性样本的白噪声,在数据采集和处理过程中不可避免会出现一些误差,因此随机噪声的加入是必要的,根据中心极限定理,假设噪声服从均值为0方差为σ2的正态分布,其分布函数和密度函数分别为F(·)和f(·);yk是岩性识别模型的输出,其仅能根据m个岩性分类阈值划分为m+1个岩性类别,岩性分类阈值分别是C1,C2,…,Cm,且阈值满足-∞<C1<C2<…<Cm<∞。此岩性识别模型输出的量化过程可如下表示:
实际上,qk代表第k个岩性样本的岩性类别。
此岩性识别模型的渐近最优辨识问题需要基于量化模型(1)-(2),根据训练集中的输入样本及对应岩性类别信息设计渐近最优辨识算法——基于信息矩阵的加权拟牛顿型算法,并评估算法的收敛特性和最优性。
如图3所示,构造基于信息矩阵的加权拟牛顿型算法:
其中,对i=1,…,m+1,和是分别是所预估的第k个样本为第i个岩性类别的概率密度和概率,和可根据噪声的密度函数f(·)、噪声的分布函数F(·)、岩性分类阈值Ci、第k个岩性样本的样本特征φk和第k-1个样本所对应的参数估计值进行计算,具体如下:
其中,C0=-∞,Cm+1=+∞。
公式(4)的目的是用于调整量化输出权重,使得算法达到更好的辨识效果。
公式(5)的作用是利用第k个岩性样本的样本特征φk、第k-1个岩性样本所给出的参数估计值由前k-1个岩性样本的样本特征所计算的协方差阵第k个岩性样本对应的量化输出的加权转换sk和由步骤a)给出的权重系数和预估概率所计算的加权转换估计值来计算对岩性识别模型中未知参数的估计值
d)评估基于信息矩阵的加权拟牛顿型算法的收敛特性和最优性:
实际上,基于信息矩阵的加权拟牛顿型算法(如公式(3)-(6)所示)可实现如下性质:若岩性样本的特征序列{φk}是有界持续激励的,即且存在正整数h使得对所有的k都有(In指n维单位矩阵)。那么,基于信息矩阵的加权拟牛顿型算法(3)-(6)是几乎处处收敛、均方收敛的和高阶矩阵收敛的,且算法的均方收敛速度为
进一步地,基于信息矩阵的加权拟牛顿型算法(3)-(6)也是渐近最优的,即算法估计误差的协方差矩阵渐近趋于岩性识别模型的克拉美罗下界,即:
实际上,克拉美罗下界代表了参数估计误差协方差的下确界,故可达到此下界的基于信息矩阵的加权拟牛顿型算法就是渐近最优辨识算法。
步骤3、根据基于信息矩阵的加权拟牛顿型算法所给出的参数估计值,利用岩性识别模型对岩性进行预测,判断测试集中某样本属于哪个岩性类别。
计算测试集中所有样本数据对应的岩性类别。如图4所示,是本发明岩性预测模型的结构图。
根据本发明的一个应用实施例,利用本发明的岩性识别方法对某油田的某一钻井展开岩性识别工作。结果表明,在不平衡数据集上,本发明的岩性识别方法有着优秀的预测结果,各岩性类别预测的召回率均大于85%,具体如下:
1、数据准备和预处理:
使用测井岩性样本共10110条样本,其中泥岩、粗砂岩、细砂岩、砾岩四种岩性所对应样本数分别为:4800、2900、1300、1110条,将10110条样本按照7∶3的规则分为训练集和测试集,且训练集和测试集中四种岩性所占比例一致,以确保岩性类别的均衡性,此时训练集包含样本数据Ns=7077条,测试集样本数据Nt=3033条。样本的每一个特征都具有特定的物理意义,且有着不同的数量级,为了避免数据形式对岩性模型建立的影响,将所有样本的同一种特征进行归一化处理,将值归一化到[0,1]之间,完成所有8维样本特征值的归一化处理。除此之外,根据岩性类别设置样本数据的类别标签,其中,泥岩设置为0,粗砂岩为1,细砂岩为2,砾岩为3。
2、利用基于信息矩阵的加权拟牛顿算法辨识岩性识别模型中的未知参数:
根据训练集的样本特征和岩性样本类别信息,如下构建量化岩性识别模型
其中φk是训练集的第k(k=1,…,7077)个岩性样本的8维样本特征,θ是岩性识别模型的8维未知参数向量,dk是第k个岩性样本的噪声,服从均值为0,方差为0.35的正态分布。qk∈{0,1,2,3}代表了第k个岩性样本的岩性类别。
随后根据多阈值量化岩性识别模型的渐近最优辨识算法——基于信息矩阵的加权拟牛顿算法(3)-(6),利用训练集中样本信息(即样本特征向量φk和样本岩性类别qk(k=1,…,7077)),选取参数估计初值和8维正定矩阵
如公式(3)-(6)所示迭代执行基于信息矩阵的加权拟牛顿型算法,得到对岩性识别模型中未知参数的估计:
表1
Claims (3)
1.一种基于多阈值量化输出观测的渐近最优岩性预测方法,其特征在于:包括如下步骤:
步骤1、根据测井曲线数据及对应岩性信息,构建模型的输入样本;具体包括,根据测井曲线数据及对应岩性信息,构建模型输入样本:将深度、声波测井、井径测井、补偿中子测井、伽马测井、自然电位测井、2.5m底梯度电阻率测井和密度测井组成8维样本特征向量,并将总样本分为训练集和测试集;
步骤2、基于训练集中的输入样本及对应岩性类别信息,构造并执行多阈值量化岩性识别模型的渐近最优辨识算法;具体包括:首先根据训练集中的输入样本及对应岩性类别信息构建岩性识别模型,再设计基于信息矩阵的加权拟牛顿型算法来辨识岩性识别模型中的未知参数,并评估算法的收敛特性和最优性;
步骤3、根据基于信息矩阵的加权拟牛顿型算法所给出的参数估计值,利用岩性识别模型对岩性进行预测,判断测试集中某样本属于哪个岩性类别;
其中,在步骤1中:使用深度DEPTH、声波测井AC、井径测井CAL、补偿中子测井CNL、伽马测井GR、自然电位测井SP、2.5m底梯度电阻率测井R25和密度测井DEN组成8维样本特征向量,记为其中,n=8,代表n维实数域;样本标签q∈{0,1,...,m}为岩性类别,包括:泥岩,粗砂岩,细砂岩及砾岩;设共有总的样本N条,遵循7∶3的准则分开训练集和测试集,记训练集样本数据有Ns条,测试集样本有Nt条;
其中,在步骤2中:首先,根据训练集中的输入样本及对应岩性类别信息构建含未知参数的岩性识别模型,具体如下:
其中,φk是第k个岩性样本的n维样本特征,T代表向量的转置;θ是岩性识别模型的n维未知定常参数向量;dk是第k个岩性样本的白噪声,设噪声服从均值为0方差为σ2的正态分布,其分布函数和密度函数分别为F(·)和f(·);yk是岩性识别模型的输出,能根据m个岩性分类阈值划分为m+1个岩性类别,岩性分类阈值分别是C1,C2,…,Cm,且阈值满足-∞<C1<C2<…<Cm<∞;此岩性识别模型输出的量化过程如下表示:
qk代表第k个岩性样本的岩性类别。
2.根据权利要求1所述的一种基于多阈值量化输出观测的渐近最优岩性预测方法,其特征在于:多阈值量化岩性识别模型的渐近最优辨识算法需要基于公式(1)-(2),根据训练集中的输入样本及对应岩性类别信息设计渐近最优辨识算法——基于信息矩阵的加权拟牛顿型算法,并评估此算法的收敛特性和最优性;
构造基于信息矩阵的加权拟牛顿型算法:
其中,对i=1,…,m+1,和是分别是所预估的第k个样本为第i个岩性类别的概率密度和概率,和根据噪声的密度函数f(·)、噪声的分布函数F(·)、岩性分类阈值Ci、第k个岩性样本的样本特征φk和第k-1个样本所对应的参数估计值进行计算,具体如下:
其中,C0=-∞,Cm+1=+∞;
公式(5)是利用第k个岩性样本的样本特征φk、第k-1个岩性样本所给出的参数估计值由前k-1个岩性样本的样本特征所计算的协方差阵第k个岩性样本对应的量化输出的加权转换sk和由步骤a)给出的和所计算的加权转换估计值来计算对岩性识别模型中未知参数的估计值
d)评估基于信息矩阵的加权拟牛顿型算法的收敛特性和最优性:
基于信息矩阵的加权拟牛顿型算法是渐近最优的,即:
克拉美罗下界代表了参数估计误差协方差的下界,达到克拉美罗下界的基于信息矩阵的加权拟牛顿型算法就是渐近最优辨识算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210736022.9A CN115204277A (zh) | 2022-06-27 | 2022-06-27 | 一种基于多阈值量化输出观测的渐近最优岩性预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210736022.9A CN115204277A (zh) | 2022-06-27 | 2022-06-27 | 一种基于多阈值量化输出观测的渐近最优岩性预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115204277A true CN115204277A (zh) | 2022-10-18 |
Family
ID=83577674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210736022.9A Pending CN115204277A (zh) | 2022-06-27 | 2022-06-27 | 一种基于多阈值量化输出观测的渐近最优岩性预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115204277A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117166996A (zh) * | 2023-07-27 | 2023-12-05 | 中国地质大学(北京) | 地质参数门槛值的确定方法、装置、设备及存储介质 |
-
2022
- 2022-06-27 CN CN202210736022.9A patent/CN115204277A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117166996A (zh) * | 2023-07-27 | 2023-12-05 | 中国地质大学(北京) | 地质参数门槛值的确定方法、装置、设备及存储介质 |
CN117166996B (zh) * | 2023-07-27 | 2024-03-22 | 中国地质大学(北京) | 地质参数门槛值的确定方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109611087B (zh) | 一种火山岩油藏储层参数智能预测方法及系统 | |
CN112989708B (zh) | 一种基于lstm神经网络的测井岩性识别方法及系统 | |
CN110674841B (zh) | 一种基于聚类算法的测井曲线识别方法 | |
CN108897975B (zh) | 基于深度信念网络的煤层气测井含气量预测方法 | |
CN109345007B (zh) | 一种基于XGBoost特征选择的有利储层发育区预测方法 | |
Zhu et al. | Rapid identification of high-quality marine shale gas reservoirs based on the oversampling method and random forest algorithm | |
CN113687433A (zh) | 一种基于Bi-LSTM的大地电磁信号去噪方法及系统 | |
CN114723095A (zh) | 缺失测井曲线预测方法及装置 | |
CN111767674A (zh) | 一种基于主动域适应的测井岩性识别方法 | |
CN116305850B (zh) | 一种基于随机森林模型的地层热导率预测方法 | |
CN114638255A (zh) | 一种结合深度学习的致密砂岩裂缝测井综合识别方法 | |
CN111027249B (zh) | 一种基于机器学习的井间连通性评价方法 | |
CN115204277A (zh) | 一种基于多阈值量化输出观测的渐近最优岩性预测方法 | |
Yao-Jun et al. | Unsupervised seismic facies analysis using sparse representation spectral clustering | |
CN114114414A (zh) | 一种页岩储层“甜点”信息人工智能预测方法 | |
CN117473305A (zh) | 一种近邻信息增强的储层参数预测方法及系统 | |
CN116401965B (zh) | 基于随钻测试数据的岩土强度参数约束随机场模拟方法 | |
Li et al. | Lithology classification based on set-valued identification method | |
Hong et al. | A novel approach to the automatic classification of wireline log-predicted sedimentary microfacies based on object detection | |
Zhang et al. | Lithology identification of logging data based on improved neighborhood rough set and AdaBoost | |
Barros et al. | Determination of water saturation by angular competitive neural network | |
CN112257789A (zh) | 对围岩等级进行识别的方法 | |
Xu et al. | Subsurface lithofacies identification with meta learning | |
CN117407841B (zh) | 一种基于优化集成算法的页岩层理缝预测方法 | |
CN115506783B (zh) | 一种岩性识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |