CN117852580A - 基于迁移学习tca-lstm模型的地层孔隙压力预测方法 - Google Patents
基于迁移学习tca-lstm模型的地层孔隙压力预测方法 Download PDFInfo
- Publication number
- CN117852580A CN117852580A CN202410256742.4A CN202410256742A CN117852580A CN 117852580 A CN117852580 A CN 117852580A CN 202410256742 A CN202410256742 A CN 202410256742A CN 117852580 A CN117852580 A CN 117852580A
- Authority
- CN
- China
- Prior art keywords
- data
- tca
- lstm model
- logging
- pore pressure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000011148 porous material Substances 0.000 title claims abstract description 39
- 238000013508 migration Methods 0.000 title claims abstract description 21
- 230000005012 migration Effects 0.000 title claims abstract description 21
- 230000002159 abnormal effect Effects 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 8
- 238000010219 correlation analysis Methods 0.000 claims abstract description 7
- 238000012216 screening Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 31
- 230000015572 biosynthetic process Effects 0.000 claims description 26
- 238000013507 mapping Methods 0.000 claims description 18
- 238000009826 distribution Methods 0.000 claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 7
- 238000013526 transfer learning Methods 0.000 claims description 7
- 210000005036 nerve Anatomy 0.000 claims description 6
- 238000005315 distribution function Methods 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 claims description 3
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 claims description 3
- 210000000299 nuclear matrix Anatomy 0.000 claims description 3
- 238000010606 normalization Methods 0.000 abstract description 5
- 238000004364 calculation method Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 102100027611 Rho-related GTP-binding protein RhoB Human genes 0.000 description 4
- 101150054980 Rhob gene Proteins 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005553 drilling Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 239000011435 rock Substances 0.000 description 3
- 241000764238 Isis Species 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 208000019888 Circadian rhythm sleep disease Diseases 0.000 description 1
- 208000001456 Jet Lag Syndrome Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 208000033915 jet lag type circadian rhythm sleep disease Diseases 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Business, Economics & Management (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Animal Husbandry (AREA)
- Agronomy & Crop Science (AREA)
- Mining & Mineral Resources (AREA)
- General Business, Economics & Management (AREA)
- Marine Sciences & Fisheries (AREA)
- Algebra (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于基于特定计算模型的压力预测技术领域,更具体地,涉及基于迁移学习TCA‑LSTM模型的地层孔隙压力预测方法。所述方法包括获取测井数据并进行异常值剔除;对异常值剔除后的测井值数据进行相关性分析及筛选后作为TCA‑LSTM模型的输入参数的特征;对筛选出的测井值数据进行归一化处理;搭建TCA‑LSTM模型对经归一化处理后的测井值数据进行分析。本发明解决了现有技术中对训练样本的数量和质量要求较高,且模型常面临泛化能力不佳、预测精度不高的问题。
Description
技术领域
本发明属于基于特定计算模型的压力预测技术领域,更具体地,涉及基于迁移学习TCA-LSTM模型的地层孔隙压力预测方法。
背景技术
地层孔隙压力始终贯穿整个油气田勘探开发的各个重要环节,因此,精准地预测地层孔隙压力对油气田勘探开发至关重要。已钻井地层孔隙压力预测是钻井完成后利用测井等实钻资料对地层信息的再认识,对于提高区域地层信息的掌握程度、降低待钻井工程方案潜在风险等具有重要意义。随着机器学习、大数据等技术的发展,地层孔隙压力预测正从基于经验系数的传统模型向基于数据驱动的智能模型转变,由于智能模型在捕捉多维数据之间复杂映射关系方面的优势,已成为该领域的研究热点之一。
中国发明专利CN114077867A公开了一种基于可迁移神经网络的航空发动机故障诊断方法,通过结合域自适应思想和RVFL算法,提出了两种故障诊断算法UD-RVFL和UJD-RVFL,使其在保留原始RVFL网络拓扑结构简单这一主要优点的前提下,可通过学习可迁移的数据特征表示,减少源域和目标域数据之间分布差异,同时尽可能保留源域的数据属性和特征结构。
综上,迁移学习作为机器学习的一个重要分支,侧重于将已经学习过的知识迁移应用于新的问题中以增强解决新问题的能力、提高解决新问题的速度,迁移学习已应用在医学领域、视觉分类等领域,成为解决数据驱动训练样本局限性和模型泛化能力不佳问题的有效手段之一。然而,现有技术中对训练样本的数量和质量要求较高,且模型常面临泛化能力不佳、预测精度不高等问题。
发明内容
本发明旨在克服上述现有技术的至少一种缺陷,提供基于迁移学习TCA-LSTM模型的地层孔隙压力预测方法,以解决现有技术在处理海量数据时,出现的识别速度慢、准确率低的问题。
本发明基于测井数据以及钻井参数等实际现场测量值,利用长短期记忆循环神经网络,将TCA迁移学习算法与长短期记忆循环神经网络耦合,采用最大均值差异,将源域与目标域数据领域的分布差异最小化,确保源域和目标域的数据在特征空间上具有相似的分布,建立TCA-LSTM网络模型,对地层孔隙压力进行精准预测。
本发明详细的技术方案如下:
S1、获取测井数据并对测井数据中的单个值即测井值数据进行异常值剔除,其中,测井值数据是测井数据中的单个值,测井数据里面有多个特征参数以及多个值;
所述测井数据包含源域和目标域,源域在本发明指一区块多口井的测井数据,目标域为同一区块一口井且与源域中的井不同的测井数据,具体包括:
S11、测井曲线中出现的毛刺或突变由异常跳动引起或是真实的岩体环境变化导致的,针对异常跳动、毛刺或突变的情况,要将其排除或过滤掉;而对于真实的岩体环境突变,应该予以保留;
然而,简单地剔除异常值或只计算某一段内的平均值可能难以有效地消除异常值的影响;
为了解决这些问题,未确知滤波方法被引入,用于从监测数据序列中检测和剔除粗差,同时保留有用的异常值,未确知滤波将未确知理论与滤波技术相结合,能够更准确地处理测井曲线中的异常值;
使用未确知有理数A表示井深处测井值数据:
公式(1)中,A为未确知有理数,为测井值数据的可信度分布函数,/>为以i测点为中心上下滑窗内的测井值数据,N为滑窗内测点总数量。
S12、把粗差和异常值两种情况进行分析比较发现:如果是异常值,则/>是孤立的,在/>的滑窗内的/>个数为零;若/>是偶然粗差,由于其相邻观测数据的连续性和趋势性,/>的滑窗内的/>个数不为零且会随着监测时间的推进而越来越多,由此通过对/>的特殊定义区别粗差和异常值,本发明将可信度/>小于0.3的作为异常值;
公式(2)中,为测井值数据的可信度分布函数,/>表示/>滑窗内包括/>的个数,/>为/>的滑窗内的测井值数据,/>,/>,λ为判别粗差的阈值参数;
S13、使用有理数A的数学期望表示异常值:;
其中,,实现异常值剔除。
S2、对异常值剔除后的测井数据进行相关性分析筛选后作为TCA-LSTM模型的输入特征参数;
在数据预处理中,特征参数相关性分析即对异常值剔除后的测井数据进行相关性分析是一个不可或缺的环节,本发明使用皮尔森相关系数衡量地层孔隙压力与测井数据之间线性关系强度的指标;
其相关系数的计算公式如下:
公式(3)中,为数据总行数,/>的取值为1到n之间的整数,Xa表示测点a的测井值数据,Ya表示测点a的地层孔隙压力数据,/>表示测井值数据X的平均值,/>表示地层孔隙压力Y的平均值。
所述的大小可根据实际运算的需要进行选择,Pearson相关性显示的是两个变量之间相关性的强弱程度,取值在(-1,1),/>值越大,相关性越强,把称为高度相关,Pearson相关性越高,证明该测井数据与地层孔隙压力的相关性越高,使用算法后的效果越好;
基于Pearson相关性结果分析,选择中等程度相关及以上的特征参数即作为模型输入。
S3、对筛选出的测井相关数据进行归一化处理;
考虑到消除不同特征之间的量纲差异,避免某些特征对模型训练产生过大影响,同时能够较好地保留原始数据的特征,本发明采用最大-最小规范化方法通过对测井值数据的线性变换,如下:
公式(4)中,为归一化后的数据;Xi为输入数据;/>为数据区间最小值;/>为数据区间最大值。
S4、搭建TCA-LSTM模型。
本发明包括双层LSTM神经网络和Dropout层神经网络,所述双层LSTM神经网络门控的神经单元数分别为32个、1个,Dropout层神经网络的神经单元数为0.1,所述TCA-LSTM模型采用Adam优化器进行训练。
搭建TCA-LSTM模型,TCA-LSTM首先对源域和目标域的原始数据通过 TCA 进行分布适配,分布间距离由最大均值差异MMD度量,将TCA映射后的特征,输入双层LSTM网络中进行训练,最终得到TCA-LSTM预测模型。输出为地层孔隙压力预测值。
将归一化处理后的数据用TCA进行特征提取,迁移成分分析法即TCA是一种基于最大均值差异的迁移学习方法,其MMD距离可以被表示为:
公式(5)中,表示映射后源域和目标域的均值之差,/>和/>分别为源域中的第i个样本与目标域的第j个样本,ns与nt分别为源域与目标域的样本数,/>为RKHS。
然而,公式(5)不能直接计算,要通过某种核方法将样本转换到映射空间,为了将源域和目标域的数据映射到共享的低维潜在空间中,TCA引入了核矩阵以及分布差异矩阵Lij;
将公式(5)可以改写为,求解/>的问题转化为如下优化问题:
公式(8)中,最小化分布之间的距离,/>第二项最大化特征空间中的方差,/>为权重参数,/>为矩阵的逆;其中,/>为权重参数,Im是一个大小为/>的单位矩阵,W为比K低维度的矩阵,它的解为/>的前m个特征值;H为中心矩阵,其定义为:
公式(9)中,为全1矩阵,数据经过降维后新的源域和目标域数据。
所述11T表示一个由全为1的列向量所形成的矩阵,即一个列向量与其转置的乘积:
(10);
所述进行TCA迁移学习处理包括:
S41、将源域数据集和目标域数据集/>输入TCA-LSTM模型;
S42、根据源域数据和目标域数据/>,计算分布差异矩阵Lij以及中心矩阵H;
S43、根据需求选择合适的核矩阵进行映射;
S44、通过核矩阵K对进行计算,选择m个特征向量来构造映射矩阵W;
S45、得到经过映射后的源域数据Xsnew和目标域数据集Xtnew。
与现有技术相比,本发明的有益效果为:
(1)本发明提供的一种基于迁移学习TCA-LSTM模型的地层孔隙压力预测方法,该方法结合了TCA方法,将源域和目标域的数据映射到一个特定的特征空间中,并寻找一种度量准则,以使得这两个域的数据特征分布尽可能相似,以提高预测结果的精确度,这种迁移学习方法有助于解决当源域和目标域数据样本分布不同、数据样本缺乏的问题。
(2)本发明提供的一种基于迁移学习TCA-LSTM模型的地层孔隙压力预测方法,将TCA和LSTM结合,使得模型能够同时利用TCA的迁移学习特性和LSTM的序列建模能力,TCA-LSTM通过迁移学习的方式,利用TCA对数据进行特征对齐,有助于缓解不同数据集之间的分布差异,提升模型泛化性能。
附图说明
图1是本发明所述TCA-LSTM模型流程图。
图2是本发明实施例1中特征参数优选图。
图3是本发明实施例1中异常值剔除前后对比图。
图4是本发明实施例1中的预测地层孔隙压力对比图。
具体实施方式
实施例 1
本实施例提供基于迁移学习TCA-LSTM模型的地层孔隙压力预测方法,如图1所示:
川东某区块具有深部地层高温高压、地层情况复杂的特点,传统方法主要依赖于建立正常压实趋势线来预测地层孔隙压力,并忽略了其他异常高压形成机制,如流体运移、化学反应或构造应力等因素。这些因素在某些地区可能导致地层孔隙压力异常,而传统方法无法准确估计非正常压力的影响,因而误差较大。
机器学习通过挖掘测井数据和地层压力之间关联性、从而基于纯数据驱动预测地层压力的方法,较传统方法展现出了较大优势,对于一个地区已有足够数量已钻井的情况,其预测效果显著,但对于新区块,由于地质条件和测井响应之间的差异和新区块测井数据资料的稀少,其模型存在模型泛化能力不足的问题。
根据本文提出的研究方法,基于迁移学习TCA-LSTM的地层孔隙压力预测方法,本实施例包括以下步骤:
S1、获取测井数据并进行异常值剔除;
获取测井数据并对测井数据中的单个值即测井值数据进行异常值剔除,所述测井数据包含源域和目标域,源域在本发明指一区块多口井的测井数据,目标域为同一区块一口井且与源域中的井不同的测井数据,具体包括:
S11、使用未确知有理数A表示井深处测井值数据:
公式(1)中,为测井值数据的可信度分布函数,/>为以测点i为中心上下滑窗内的测井值数据,N为滑窗内测点总数量。
S12、把粗差和异常值两种情况进行分析比较发现:如果是异常值,则/>是孤立的,在/>的滑窗内的/>个数为零;若/>是偶然粗差,由于其相邻观测数据的连续性和趋势性,/>的滑窗内的/>个数不为零且会随着监测时间的推进而越来越多,由此通过对/>的特殊定义区别粗差和异常值,本发明将可信度/>小于0.3的作为异常值;
公式(2)中,为测井值数据的可信度分布函数,/>表示/>滑窗内包括/>的个数,/>为/>的滑窗内的测井值数据,/>,/>,λ为判别粗差的阈值参数,通常取值为整个观测序列的两倍方差。
S13、使用有理数A的数学期望表示异常值:;
其中,,实现异常值剔除。
对相关测井曲线进行异常值剔除,结果如图3所示,其中横坐标为深度(DEPTH),纵坐标分别是自然伽马值(GR)、岩性密度值(RHOB)、井斜方位值(AZIM)、补偿中子值(CNL)、自然电位值(SP)共5个测井特征参数的异常值剔除,original为原始数据,图中为浅色曲线,filtered为剔除后的数据,图中为深色曲线。
S2、对异常值剔除后的测井值数据进行相关性分析筛选后作为TCA-LSTM模型的输入特征参数;
本实施例使用皮尔森相关系数(Pearson correlation coefficient)也叫皮尔森积矩相关系数衡量地层孔隙压力与测井数据之间线性关系强度的指标:
其相关系数的计算公式如下:
公式(3)中,n为数据总行数,a的取值为1到n之间的整数,Xa表示测点a的测井值数据,Ya表示测点a的地层孔隙压力数据,表示测井值数据X的平均值,/>表示地层孔隙压力Y的平均值。
所述的大小可根据实际运算的需要进行选择,Pearson相关性显示的是两个变量之间相关性的强弱程度,取值在(-1,1),/>值越大,相关性越强,把称为高度相关,Pearson相关性越高,证明该测井数据与地层孔隙压力的相关性越高,使用算法后的效果越好;
基于Pearson相关性结果分析,选择中等程度相关及以上的特征参数即作为模型输入。
测井数据包括深度(DEPTH)、钻头直径(BS)、自然伽马(GR)、岩性密度(RHOB)、井斜方位(AZIM)、补偿中子(CNL)、井斜(DEVI)、声波时差(DT)、自然电位(SP)、深侧向电阻率(LLD)、浅侧向电阻率(LLS)。
优选出深度(DEPTH)、自然伽马(GR)、岩性密度(RHOB)、井斜方位(AZIM)、补偿中子(CNL)、自然电位(SP)共6个测井特征参数,结果如图2和表1:
表1
测井参数 | Pearson 相关性 | 排名 |
DEPTH | 0.98 | 1 |
GR | 0.84 | 2 |
RHOB | 0.81 | 3 |
CNL | 0.57 | 4 |
AZIM | 0.52 | 5 |
SP | 0.51 | 6 |
S3、对筛选出的测井相关数据进行归一化处理;
本实施例采用最大-最小规范化方法通过对测井值数据的线性变换,如下:
公式(4)中,为归一化后的数据;Xi为输入数据;Xmin为数据区间最小值;Xmax为数据区间最大值。
S4、搭建TCA-LSTM模型进行分析:搭建TCA-LSTM模型,对经归一化处理后的测井值数据用TCA进行特征提取,输入双层LSTM网络中进行训练输出地层孔隙压力预测值。
本实施例包括双层LSTM神经网络和Dropout层神经网络,所述双层LSTM神经网络门控的神经单元数分别为32个、1个,Dropout层神经网络的神经单元数为0.1。
所述TCA-LSTM模型采用Adam优化器进行训练,训练过程中,使用均方误差(meansquared error)作为损失函数(loss function),用于衡量模型的预测输出与实际输出之间的差异。为了防止网络过拟合,使用了dropout学习策略。
搭建TCA-LSTM模型,输入为经过S1、S2、S3处理的测井值数据,用TCA进行特征提取,输入双层LSTM网络中进行训练输出为地层孔隙压力预测值。均方根误差是预测值与真实值之间差异的平方的平均值的平方根,它衡量了模型的整体预测准确性,数值越小表示模型的拟合程度越好。
将归一化处理后的数据用TCA进行特征提取,迁移成分分析法(TCA)是一种基于最大均值差异(Maximum Mean Discrepancy,MMD)的迁移学习方法,其MMD距离可以被表示为:
公式(5)中,表示映射后源域和目标域的均值之差,/>和/>分别为源域中的第i个样本与目标域的第j个样本,ns与nt分别为源域与目标域的样本数,/>为RKHS。
然而,公式(5)不能直接计算,要通过某种核方法将样本转换到映射空间,为了将源域和目标域的数据映射到共享的低维潜在空间中,TCA引入了核矩阵K以及分布差异矩阵Lij。
其中,是源域和目标域上的核矩阵,/>是跨域的核矩阵,通过公式(7)可以计算分布差异矩阵的所有元素。
利用公式(6)、(7)可以将公式(5)可以改写为,求解的问题转化为如下优化问题。
公式(8)中,最小化分布之间的距离,/>第二项最大化特征空间中的方差,/>为权重参数,/>为矩阵的逆;其中,/>为权重参数,是一个大小为/>的单位矩阵,W为比K低维度的矩阵,它的解为/>的前m个特征值;H为中心矩阵,其定义为:
公式(9)中,为全1矩阵,数据经过降维后新的源域和目标域数据。
所述11T表示一个由全为1的列向量所形成的矩阵,即一个列向量与其转置的乘积:
(10);
所述进行TCA迁移学习处理包括:
S41、将源域数据集和目标域数据集/>输入TCA-LSTM模型;
S42、根据源域数据和目标域数据/>,计算分布差异矩阵Lij以及中心矩阵H;
S43、根据需求选择合适的核矩阵进行映射;
S44、通过核矩阵K对进行计算,选择m个特征向量来构造映射矩阵W;
S45、得到经过映射后的源域数据Xsnew和目标域数据集Xtnew。
所述选择合适的核矩阵进行映射,包括不同的核矩阵类型:‘primal’、‘linear’、‘rbf’;
‘primal’指的是原始特征空间下的特征表示,即不进行显式的特征转换或映射。它直接使用原始特征空间的特征来进行域间的迁移学习,可能通过一些线性变换的方式对源域和目标域进行对齐。
‘linear’指的是线性映射,在TCA中,线性映射通常意味着对源域和目标域数据进行线性变换,将它们映射到一个共享的线性空间。
‘rbf’指径向基函数(RadialBasisFunction),在TCA中,可能会使用RBF核来进行非线性映射。RBF核函数通过将数据映射到一个高维的特征空间,并使用高斯径向基函数来表达样本之间的相似性,以便在更复杂的非线性空间中实现域间特征的对齐或转移。
通过模型评价指标有平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Squared Error,RMSE)对其评价:
公式(11)-(12)中,表示真实样本值,/>表示预测样本值,n表示样本数量;
平均绝对误差是预测值与真实值之间差异的绝对值的平均值,它衡量了模型的平均预测误差大小,数值越小表示模型的拟合程度越好。
构建的TCA-LSTM模型与常见的传统机器学习算法SVM、XGBOOST、LSTM算法进行分析对比其预测效果,其结果如图4(图4中横坐标为地层孔隙压力(Pp),g/cm3是单位,Predicted为预测结果,深色为预测的地层孔隙压力,True为真实结果,浅色为真实孔隙压力)和表2所示:
表2
SVM在MAE和RMSE方面都有较高的值(4.30%和5.11%),表示SVM在预测过程中平均错误较大,它无法捕捉数据中更细微的模式或者在这些指标下的泛化能力相对较低;
XGBoost在MAE和RMSE指标下的表现稍好于SVM,但仍然高于其他算法,其中MAE为4.78%,RMSE为5.69%,XGBoost相对于SVM可能更好地捕捉了数据中的某些模式,但在准确性方面仍有改进空间;
LSTM在MAE和RMSE方面表现得非常出色,MAE仅为0.47%,RMSE为0.70%,这表明LSTM在平均绝对误差和均方根误差方面都有很低的表现,说明它对序列相关性数据的预测有良好的适应性。
本实施例提供的TCA-LSTM在MAE和RMSE方面表现得更好,MAE为0.44%,RMSE为0.66%,这表明相比较于其他算法,TCA-LSTM在预测过程中产生了更小的平均误差和均方根误差,它能在LSTM的基础上更好地处理源领域和目标领域之间的差异,减少不同领域之间的差异性,提高模型的泛化能力。
显然,本发明的上述实施例仅仅是为清楚地说明本发明技术方案所作的举例,而并非是对本发明的具体实施方式的限定。凡在本发明权利要求书的精神和原则之内所做的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (5)
1.基于迁移学习TCA-LSTM模型的地层孔隙压力预测方法,其特征在于,包括;
S1、获取测井数据并对测井数据中的单个值即测井值数据进行异常值剔除;
S2、对异常值剔除后的测井值数据进行相关性分析及筛选后作为TCA-LSTM模型的输入参数的特征;
S3、对筛选出的测井值数据进行归一化处理;
S4、搭建TCA-LSTM模型,对经归一化处理后的测井值数据用TCA进行特征提取,再输入双层LSTM网络中进行训练预测,最终输出地层孔隙压力预测值。
2.根据权利要求1所述的基于迁移学习TCA-LSTM模型的地层孔隙压力预测方法,其特征在于,所述S1具体包括:
S11、获取测井数据,以未确知有理数A表示:
公式(1)中,A为未确知有理数,为测井值数据的可信度分布函数,/>为以i测点为中心上下滑窗内的测井值数据,N为滑窗内测点总数量;
S12、通过对的特殊定义达到区别粗差和异常值,将可信度/>小于0.3的测井值数据作为异常值:
公式(2)中,表示/>滑窗内包含/>的个数,/>为/>的滑窗内的测井值数据,,/>,λ为判别粗差的阈值参数;
S13、使用有理数A的数学期望表示异常值。
3.根据权利要求2所述的基于迁移学习TCA-LSTM模型的地层孔隙压力预测方法,其特征在于,所述对异常值剔除后的测井值数据进行相关性分析包括:
对测井值数据使用皮尔森相关系数筛选:
公式(3)中,n为数据总行数,a的取值为1到n之间的整数,Xa表示测点a的测井值数据,Ya表示测点a的地层孔隙压力数据,表示测井值数据X的平均值,/>表示地层孔隙压力Y的平均值;
选择中等程度相关及以上即的特征参数作为TCA-LSTM模型的输入。
4.根据权利要求1所述的基于迁移学习TCA-LSTM模型的地层孔隙压力预测方法,其特征在于,搭建的TCA-LSTM模型包括双层LSTM神经网络和Dropout层的神经网络;
所述双层LSTM神经网络门控的神经单元数分别为32个、1个,Dropout层神经网络的神经单元数为0.1;
所述TCA-LSTM模型采用Adam优化器进行训练。
5.根据权利要求4所述的基于迁移学习TCA-LSTM模型的地层孔隙压力预测方法,其特征在于,所述搭建TCA-LSTM模型对经归一化处理后的测井值数据进行分析,即将归一化处理后的数据进行迁移学习算法TCA处理:
S41、将源域数据集Xs和目标域数据集Xt输入TCA-LSTM模型;
S42、根据源域数据和目标域数据,计算分布差异矩阵Lij以及中心矩阵H;
S43、根据需求选择合适的核矩阵进行映射;
S44、通过核矩阵K对进行计算,选择m个特征向量来构造映射矩阵W;
S45、输出经过映射后的源域数据Xsnew和目标域数据集Xtnew。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410256742.4A CN117852580A (zh) | 2024-03-07 | 2024-03-07 | 基于迁移学习tca-lstm模型的地层孔隙压力预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410256742.4A CN117852580A (zh) | 2024-03-07 | 2024-03-07 | 基于迁移学习tca-lstm模型的地层孔隙压力预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117852580A true CN117852580A (zh) | 2024-04-09 |
Family
ID=90529367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410256742.4A Pending CN117852580A (zh) | 2024-03-07 | 2024-03-07 | 基于迁移学习tca-lstm模型的地层孔隙压力预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117852580A (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115222019A (zh) * | 2022-06-27 | 2022-10-21 | 西南石油大学 | 基于测井数据的深度Transformer迁移学习储层参数预测方法 |
-
2024
- 2024-03-07 CN CN202410256742.4A patent/CN117852580A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115222019A (zh) * | 2022-06-27 | 2022-10-21 | 西南石油大学 | 基于测井数据的深度Transformer迁移学习储层参数预测方法 |
Non-Patent Citations (3)
Title |
---|
YUQIANG XU ET AL.: "Prediction method for formation pore pressure based on transfer learning", ELSEVIER, 28 February 2024 (2024-02-28), pages 2 - 9 * |
张殿华 等: "钢铁工业协同创新关键共性技术丛书 板带材智能化制备关键技术", 31 May 2021, 冶金工业出版社, pages: 99 - 101 * |
许玉强 等: "深度学习与Eaton法联合驱动的地层孔隙压力预测方法", 中国石油大学学报(自然科学版), vol. 47, no. 6, 31 December 2023 (2023-12-31), pages 50 - 59 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Negash et al. | Artificial neural network based production forecasting for a hydrocarbon reservoir under water injection | |
CN112529341B (zh) | 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 | |
CN109611087B (zh) | 一种火山岩油藏储层参数智能预测方法及系统 | |
CN108388921A (zh) | 一种基于随机森林的溢流漏失实时识别方法 | |
Zhang et al. | Fault diagnosis based on feature clustering of time series data for loss and kick of drilling process | |
WO2012177262A1 (en) | Apparatus and methods of analysis of pipe and annulus in a wellbore | |
Li et al. | Incipient fault detection for geological drilling processes using multivariate generalized Gaussian distributions and Kullback–Leibler divergence | |
Liu et al. | Artificial intelligence method for shear wave travel time prediction considering reservoir geological continuity | |
Romanenkova et al. | Real-time data-driven detection of the rock-type alteration during a directional drilling | |
CN116644284A (zh) | 一种地层分类特征因子确定方法、系统、电子设备及介质 | |
Khoukhi | Hybrid soft computing systems for reservoir PVT properties prediction | |
CN114818076B (zh) | 一种基于机器学习的断层封闭烃柱高度评价方法 | |
CN116384554A (zh) | 机械钻速预测方法、装置、电子设备及计算机存储介质 | |
CN115438823A (zh) | 一种井壁失稳机制分析与预测方法及系统 | |
Fan et al. | Adaptive monitoring for geological drilling process using neighborhood preserving embedding and Jensen–Shannon divergence | |
Hu et al. | A hybrid CNN-LSTM machine learning model for rock mechanical parameters evaluation | |
Feng et al. | Interpretable Lost Circulation Analysis: Labeled, Identified, and Analyzed Lost Circulation in Drilling Operations | |
CN114879628A (zh) | 基于对抗局部最大均值差异的多模态工业过程故障诊断方法 | |
Zhang et al. | Intelligent kick detection using a parameter adaptive neural network | |
Liu et al. | Lithofacies identification of shale formation based on mineral content regression using LightGBM algorithm: A case study in the Luzhou block, South Sichuan Basin, China | |
Xu et al. | Prediction method for formation pore pressure based on transfer learning | |
Liaghat et al. | Ore grade prediction using informative features of MWD data | |
Li et al. | Cross-oilfield reservoir classification via multi-scale sensor knowledge transfer | |
CN110674868A (zh) | 一种基于高维钻进参数信息的地层岩性识别系统及其方法 | |
CN117852580A (zh) | 基于迁移学习tca-lstm模型的地层孔隙压力预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |