CN112819240A - 基于物理约束的lstm模型预测页岩油产量的方法 - Google Patents

基于物理约束的lstm模型预测页岩油产量的方法 Download PDF

Info

Publication number
CN112819240A
CN112819240A CN202110192283.4A CN202110192283A CN112819240A CN 112819240 A CN112819240 A CN 112819240A CN 202110192283 A CN202110192283 A CN 202110192283A CN 112819240 A CN112819240 A CN 112819240A
Authority
CN
China
Prior art keywords
data
model
value
shale oil
lstm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110192283.4A
Other languages
English (en)
Other versions
CN112819240B (zh
Inventor
岳明
宋鹂影
宋洪庆
宋田茹
王九龙
都书一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN202110192283.4A priority Critical patent/CN112819240B/zh
Publication of CN112819240A publication Critical patent/CN112819240A/zh
Application granted granted Critical
Publication of CN112819240B publication Critical patent/CN112819240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Tourism & Hospitality (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于物理约束的LSTM模型预测页岩油产量的方法,属于页岩油产量预测技术领域。该方法首先从油田区块获取实际动态生产数据,然后对样本数据集去噪,消除异常值,进行标准化和归一化处理,再将长短期记忆神经网络模型作为学习模型,并设置LSTM模型的结构,将神经网络模型的损失函数定义为数据项和控制方程之和,在添加物理约束的神经网络基础上对训练集进行训练,然后用测试集得到预测结果。该方法所设计的系统将能表征页岩油产量相关参数关系的物理方程带入到网络模型里,这种物理约束模型预测准确率及适应能力较强,计算速度快,可良好的解决页岩油产量预测问题,还可以校正储层的有效渗透率分布,更好的指导现场开发。

Description

基于物理约束的LSTM模型预测页岩油产量的方法
技术领域
本发明涉及页岩油产量预测技术领域,特别是指一种基于物理约束的LSTM模型预测页岩油产量的方法。
背景技术
页岩油已经成为当今非常规油气藏勘探与开发的热点,但页岩储层非均质性极强,其产量的预测有很大的不确定性。典型的曲线预测方法预测精度较低,因而考虑使用近年来兴起的深度学习模型对页岩油动态产量数据进行预测。深度学习模型是数据驱动的算法,大多数情况下,深度学习算法被认为是一个黑匣子,没有考虑任何先验知识,包括物理方程、经验公式等,然而很多情况下先验知识举足轻重,其所涉及的控制方程等可以快速地将深度学习过程引导到正确的解,并使其能够学习输入和输出之间的全部规则,并且可以有效去掉系统的非真实解。而单单从训练数据中训练出来的模型不能保证与工程问题相关的基本物理定律得到满足。
发明内容
本发明要解决的技术问题是提供一种基于物理约束的LSTM模型预测页岩油产量的方法。
该方法首先从油田区块获取实际动态生产数据,然后对样本数据集去噪,消除异常值,进行标准化和归一化处理,再将长短期记忆神经网络模型作为学习模型,并设置LSTM模型的结构,将神经网络模型的损失函数定义为数据项和控制方程之和,在添加物理约束的神经网络基础上对训练集进行训练,然后用测试集得到预测结果。
具体包括步骤如下:
(1)从油田区块获取实际动态生产数据,包括时间、位置坐标、压力和产量,将获取的实际动态生产数据作为神经网络模型的初始样本数据集;
(2)对步骤(1)中的初始样本数据集去噪,消除异常值;
(3)对步骤(2)中处理后的数据进行标准化和归一化处理,将去噪、标准化和归一化后的数据集定义为
Figure BDA0002944571550000021
(4)对步骤(3)中归一化后的样本数据集划分为训练集和测试集;
(5)将长短期记忆神经网络模型--LSTM模型作为学习模型,并设置LSTM模型的结构,包括模型的层数、每层神经元的数量、优化器类型和激活函数类型;
(6)将神经网络模型的损失函数定义为数据项和控制方程项之和;
(7)在步骤(6)添加物理控制方程约束的神经网络基础上对步骤(4)划分后的训练集进行训练;
(8)使用L2误差和决定系数R2作为评价指标对步骤(7)训练好的模型进行评价,验证模型的有效性;
(9)用步骤(8)验证得到的有效模型对测试集进行预测,从而得到页岩油产量的预测结果。
上述,在步骤(7)训练模型时通过优化器不断减小步骤(6)定义的损失函数直到模型训练结束,得到控制方程项中未知参数渗透率K的反演值,从而校正储层的储层渗透率分布特征。
其中,步骤(1)中获取的是36个月的动态生成数据,产量为36个月的日产量。
步骤(2)中首先根据实际经验和物理背景初步检验数据,删除缺省值,然后绘制数据集的正态分布图,正态分布公式如下:
Figure BDA0002944571550000022
其中,σ为数据集的标准差,μ为数据集的平均值,x为数据集的数据。对于正态分布而言,x落在(μ-3σ,μ+3σ)以外的概率小于千分之三,因而将该范围外的数据作为噪声数据去掉。
步骤(3)中标准化方法为:
Figure BDA0002944571550000031
其中,x为数据集的数据,μ为数据集的平均值,σ为数据集的标准差,x*为经过标准化后的数据值。标准化后的数据满足均值为0,标准差为1的正态分布,即N(0,1);
归一化方法为:
Figure BDA0002944571550000032
其中x为数据集的数据,xmin为该数据在所有样本中的最小值,xmax为该数据在所有样本中的最大值,x′为经过归一化处理后的数据值。
步骤(4)中样本数据集前80%的数据作为训练集,剩下20%作为测试集。
步骤(5)中使用长短期记忆神经网络(LSTM)作为机器学习模型,LSTM由遗忘门、输入门和输出门三部分组成,输出的具体计算过程如下:
δt=φ(Wδxxt+Wδhht-1+bδ)
it=σ(Wxixt+Whihi-1+Wcict-1+bi)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
ot=σ(Woxxt+Wohht-1+bo)
st=δt*it+st-1*ft
ht=st*ot
其中,xt为输入序列;ht为输出序列;ft为遗忘门,决定丢弃之前的哪些信息;it和δt构成输入门,即决定哪些新信息要存放在细胞状态中;ot为输出门,决定输出值;st为新细胞状态;W为权重,b为偏差值;σ(x)为sigmoid单元,用来决定上一步中信息保留或丢弃多少,其表达式为:
Figure BDA0002944571550000033
φ(x)代表激活函数,表达式为:
Figure BDA0002944571550000034
确定好要使用的神经网络模型后,对其相关参数进行设置,具体为:
设置2层LSTM结构,1个全连接层,第一层LSTM结构有50个LSTMCell单元,第二层LSTM结构有10个LSTMCell单元,优化器采用自适应矩估计(Adaptive Moment Estimation,Adam)优化器Adam,Adam利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率,每次迭代学习率都有确定的范围,适用于大多非凸优化问题,参数变化比较平稳。计算方法为:
mi=β*mi-1+(1-β)*gi
Figure BDA0002944571550000047
Figure BDA0002944571550000041
Figure BDA0002944571550000042
Figure BDA0002944571550000043
其中,mi,ni分别为对梯度的一阶矩估计和二阶矩估计;mi和ni分别为对mi和ni的校正,近似为对期望的无偏估计;β和v分别为一阶矩和二阶矩的指数衰减率;gt为梯度,i为时间步,Δθi为参数的改变量;ε是为了维持数值稳定性而添加的常数,η为学习率。可以看出,这种方法可以根据梯度进行动态调整,并且
Figure BDA0002944571550000044
可以动态约束学习率,使其有一个明确的范围。
步骤(6)中数据项为真实数据与预测数据的误差值,使用均方误差(Mean SquaredError,MSE)测量误差的平均大小,记为loss_data=MSE,其计算方法为:
Figure BDA0002944571550000045
其中,yi为预测值,yi为真实值,N为样本个数;
控制方程项为:
Figure BDA0002944571550000046
其中,ρl为地层流体密度,kg/m3;μl为地层流体黏度,Pa·s;q为单位时间内单位体积流入(流出)质量,kg;Cl为地层流体压缩系数,1/Pa;CR为岩石孔隙压缩系数,1/Pa;φ为孔隙度;φ0为参考压力下的岩石孔隙度;p为孔隙压力,Pa;t为时间,s;k为渗透率,m2,其中,针对主裂缝区,k为裂缝渗透率kf;在压裂缝网区时,k为缝网区等效渗透率ke;在基质区,k为基质渗透率km;G为启动压力梯度,Pa/m,其中,针对主裂缝区,不考虑启动压力梯度,即G=0;在压裂缝网区,考虑缝网区启动压力梯度,即G=Ge;在基质区,考虑基质区启动压力梯度,G=Gm
在控制方程的基础上定义控制方程的残差函数为:
Figure BDA0002944571550000051
然后定义误差估计函数:
Figure BDA0002944571550000052
最后将数据项和控制方程项相加,共同构成损失函数:
loss=loss_data+loss_phy。
步骤(8)中采用决定系数R2和L2误差L2_error作为评价指标;当R2值在95%以上时,L2_error值越小,模型的预测效果越好。L2_error计算方法如下:
Figure BDA0002944571550000053
R2的计算方法如下:
Figure BDA0002944571550000054
其中,yi表示真实值,yi表示预测值,
Figure BDA0002944571550000055
表示平均值,m为样本数量。
本发明的上述技术方案的有益效果如下:
(1)该方法设计一种考虑物理约束的LSTM计算框架模型,通过使用现场动态数据对页岩油的日产量进行预测,为页岩油日产量预测提供了一种高效准确的方法。
(2)该方法自定义了损失函数表达式,同时考虑数据本身和实际物理方程两大因素。通过采用自动微分算法解决物理方程的偏微分问题后将物理方程添加到损失函数中,既提高了模型的精度,又使得神经网络模型有实际背景的支撑,更有利于现场指导和分析。
(3)该方法提供了一种反演控制方程未知参数的方法,通过优化器不断减小损失函数,反演出储层渗透率,从而校正储层的有效渗透率分布,更好的指导现场开发。
附图说明
图1为本发明方法的技术路线图;
图2为本发明测试集预测值和真实值对比图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明提供一种基于物理约束的LSTM模型预测页岩油产量的方法。
如图1所示,本方法首先从油田区块获取实际动态生产数据,然后对样本数据集去噪,消除异常值,进行标准化和归一化处理,再将长短期记忆神经网络模型作为学习模型,并设置LSTM模型的结构,将神经网络模型的损失函数定义为数据项和控制方程之和,在添加物理约束的神经网络基础上对训练集进行训练,然后用测试集得到预测结果。
第一步,从油田区块获取一口井的实际动态生产数据日产油量(t/day),然后将其作为初始样本数据集D。
第二步,由于获取的现场数据噪音较大,可能存在很多奇异值,进而影响预测结果,因而需要去噪。首先根据实际经验和物理背景初步检验数据,删除与实际值差异过大的数据。然后绘制数据集的正态分布图,正态分布公式如下:
Figure BDA0002944571550000061
其中,σ为数据集的标准差,μ为数据集的平均值,x为数据集的数据。对于正态分布而言,x落在(μ-3σ,μ+3σ)以外的概率小于千分之三,因而将该范围外的数据作为噪声数据去掉。
第三步,由于样本数据集中有范围不同的数据,为了将其调整到可以类比的范围,需要对数据集进行标准化。
标准化方法为:
Figure BDA0002944571550000071
其中,x为数据集的数据,μ为该数据集的平均值,σ为数据集的标准差,x*为经过标准化后的特征值。标准化后的数据满足均值为0,标准差为1的正态分布,即N(0,1)。
为了消除量纲对最终结果的影响,同时防止神经网络出现梯度消失或梯度爆炸问题以及提升模型的收敛速度,步骤(3)还对数据进行归一化。归一化方法为:
Figure BDA0002944571550000072
其中x为数据集的数据,xmin为该数据在所有样本中的最小值,xmax为该数据在所有样本中的最大值,x′为经过归一化处理后的数据值。
将去噪、标准化和归一化后的数据集定义为
Figure BDA0002944571550000073
第四步,为了方便后续神经网络模型使用数据,将第三步归一化后的时间序列数据通过pandas库中DataFrame的shift函数转换为监督学习样本,并对处理后的数据集进行切割,数据集的前80%作为训练集Train_set,后20%作为测试集Test_set。
DataFrame是一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame既有行索引也有列索引,DataFrame.shift()函数可以把数据移动指定的位数,通过该函数便可以将单个时间数据列转换为多个相关的时间数据列。
第五步,由于采用的数据集是时间相关数据,因而模型不仅需要学习当前时刻的信息,也依赖于之前的序列信息,针对这个问题,采用循环神经网络(RNN)保存信息,但RNN存在梯度消失或梯度爆炸的问题,更重要的是存在长期依赖问题,即当相关信息和当前预测位置之前的间隔不断增大时,RNN会丧失学习能力。针对这些问题,使用长短期记忆神经网络(LSTM)作为机器学习模型。LSTM由遗忘门、输入门和输出门三部分组成,输出的具体计算过程如下:
gt=φ(Wgxxt+Wghht-1+bg)
it=σ(Wxixt+Whihi-1+Wcict-1+bi)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
ot=σ(Woxxt+Wohht-1+bo)
st=gt*it+st-1*ft
ht=st*ot
其中,xt为输入序列,ht为输出序列,ft为遗忘门,决定丢弃之前的哪些信息。it和gt构成输入门,即决定哪些新信息要存放在细胞状态中;ot为输出门,决定输出值;st为新细胞状态;W为权重,b为偏差值;σ(x)为sigmoid单元,用来决定上一步中信息保留或丢弃多少,其表达式为:
Figure BDA0002944571550000081
代表激活函数,表达式为:
Figure BDA0002944571550000082
确定好要使用的神经网络模型后,对其相关参数进行设置,具体为:
设置2层LSTM结构,1个全连接层,第一层LSTM结构有50个LSTMCell单元,第二层LSTM结构有10个LSTMCell单元,优化器采用自适应矩估计(Adaptive Moment Estimation,Adam)优化器Adam,Adam利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率,每次迭代学习率都有确定的范围,适用于大多非凸优化问题,参数变化比较平稳。计算方法为:
mi=β*mi-1+(1-β)*gi
Figure BDA0002944571550000085
Figure BDA0002944571550000083
Figure BDA0002944571550000084
Figure BDA0002944571550000091
其中,mi,ni分别为对梯度的一阶矩估计和二阶矩估计;mi和ni分别为对mi,ni的校正,近似为对期望的无偏估计。β和v分别为一阶矩和二阶矩的指数衰减率;gt为梯度,i为时间步,Δθi为参数的改变量;ε是为了维持数值稳定性而添加的常数,η为学习率。可以看出,这种方法可以根据梯度进行动态调整,并且
Figure BDA0002944571550000092
可以动态约束学习率,使其有一个明确的范围。
第六步,将神经网络模型的损失函数定义为数据项和控制方程项之和。
图2为测试集预测值和真实值对比图,数据项为真实数据与预测数据的误差值,使用均方误差(Mean Squared Error,MSE)测量误差的平均大小,记为loss_data=MSE,其计算方法为:
Figure BDA0002944571550000093
其中,yi为预测值,yi为真实值,N为样本个数。
控制方程项为:
Figure BDA0002944571550000094
其中,ρl为地层流体密度,kg/m3;μl为地层流体黏度,Pa·s;q为单位时间内单位体积流入(流出)质量,kg;Cl为地层流体压缩系数,1/Pa;CR为岩石孔隙压缩系数,1/Pa;φ为孔隙度;φ0为参考压力下的岩石孔隙度;p为孔隙压力,Pa;t为时间,s;k为渗透率,m2,其中,针对主裂缝区,k为裂缝渗透率kf;在压裂缝网区时,k为缝网区等效渗透率ke;在基质区,k为基质渗透率km;G为启动压力梯度,Pa/m,其中,针对主裂缝区,不考虑启动压力梯度,即G=0;在压裂缝网区,考虑缝网区启动压力梯度,即G=Ge;在基质区,考虑基质区启动压力梯度,G=Gm
在控制方程的基础上定义控制方程的残差函数为:
Figure BDA0002944571550000095
然后定义误差估计函数:
Figure BDA0002944571550000101
最后将数据项和控制方程项相加,共同构成损失函数:
loss=loss_data+loss_phy
采用自动微分算法(AD)计算控制方程中的偏微分。自动微分方法灵活性强,通过计算图对原子运算使用链式法则便可以计算出任何复杂函数的导数值。
第七步,在第六步添加物理控制方程约束的神经网络基础上对第四步划分后的训练集进行训练,并通过Adam优化器不断减小第六步定义的损失函数直到模型训练结束,得到控制方程项中未知参数渗透率K的反演值。
第八步,采用决定系数R2和L2误差L2_error作为评价指标。当R2值在95%以上时,L2_error值越小,模型的预测效果越好。L2_error计算方法如下:
Figure BDA0002944571550000102
R2的计算方法如下:
Figure BDA0002944571550000103
其中,yi表示真实值,yi表示预测值,
Figure BDA0002944571550000104
表示平均值,m为样本数量。
第九步,用第八步验证后得到的有效模型对测试集进行预测,从而得到页岩油产量的预测结果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种基于物理约束的LSTM模型预测页岩油产量的方法,其特征在于:包括步骤如下:
(1)从油田区块获取实际动态生产数据,包括时间、位置坐标、压力和产量,将获取的实际动态生产数据作为神经网络模型的初始样本数据集;
(2)对步骤(1)中的初始样本数据集去噪,消除异常值;
(3)对步骤(2)中处理后的数据进行标准化和归一化处理,将去噪、标准化和归一化后的数据集定义为
Figure FDA0002944571540000011
(4)对步骤(3)中归一化后的样本数据集划分为训练集和测试集;
(5)将长短期记忆神经网络模型,即LSTM模型作为学习模型,并设置LSTM模型的结构,包括模型的层数、每层神经元的数量、优化器类型和激活函数类型;
(6)将神经网络模型的损失函数定义为数据项和控制方程项之和;
(7)在步骤(6)添加物理控制方程约束的神经网络基础上对步骤(4)划分后的训练集进行训练;
(8)使用L2误差和决定系数R2作为评价指标对步骤(7)训练好的模型进行评价,验证模型的有效性;
(9)用步骤(8)验证后得到的有效模型对测试集进行预测,从而得到页岩油产量的预测结果。
2.根据权利要求1所述的基于物理约束的LSTM模型预测页岩油产量的方法,其特征在于:所述步骤(1)中获取的是36个月的动态生成数据,产量为36个月的日产量。
3.根据权利要求1所述的基于物理约束的LSTM模型预测页岩油产量的方法,其特征在于:所述步骤(2)中首先根据实际经验和物理背景初步检验数据,删除缺省值,然后绘制数据集的正态分布图,正态分布公式如下:
Figure FDA0002944571540000012
其中,σ为数据集的标准差,μ为数据集的平均值,x为数据集的数据;
对于正态分布而言,x落在(μ-3σ,μ+3σ)以外的概率小于千分之三,因而将该范围外的数据作为噪声数据去掉。
4.根据权利要求1所述的基于物理约束的LSTM模型预测页岩油产量的方法,其特征在于:所述步骤(3)中标准化方法为:
Figure FDA0002944571540000021
其中,x为数据集的数据,μ为数据集的平均值,σ为数据集的标准差,x*为经过标准化后的数据值;
标准化后的数据满足均值为0,标准差为1的正态分布,即N(0,1);
归一化方法为:
Figure FDA0002944571540000022
其中,x为数据集的数据,xmin为该数据在所有样本中的最小值,xmax为该数据在所有样本中的最大值,x′为经过归一化处理后的数据值。
5.根据权利要求1所述的基于物理约束的LSTM模型预测页岩油产量的方法,其特征在于:所述步骤(4)中样本数据集前80%的数据作为训练集,剩下20%作为测试集。
6.根据权利要求1所述的基于物理约束的LSTM模型预测页岩油产量的方法,其特征在于:所述步骤(5)中设置LSTM模型的结构,具体为:
设置2层LSTM结构,1个全连接层,第一层LSTM结构有50个LSTMCell单元,第二层LSTM结构有10个LSTMCell单元,优化器采用自适应矩估计优化器Adam,Adam利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率;具体计算方法为:
mi=β*mi-1+(1-β)*gi
Figure FDA0002944571540000023
Figure FDA0002944571540000031
Figure FDA0002944571540000032
Figure FDA0002944571540000033
其中,mi,ni分别为对梯度的一阶矩估计和二阶矩估计;mi和ni分别为对mi,ni的校正,β,v分别为一阶矩和二阶矩的指数衰减率,gi为梯度,i为时间步,Δθi为参数的改变量,ε是为了维持数值稳定性而添加的常数,η为学习率。
7.根据权利要求1所述的基于物理约束的LSTM模型预测页岩油产量的方法,其特征在于:所述步骤(6)中数据项为真实数据与预测数据的误差值,使用均方误差MSE测量误差的平均大小,记为loss_data=MSE,计算方法为:
Figure FDA0002944571540000034
其中,yi为预测值,yi为真实值,N为样本个数;
控制方程项为:
Figure FDA0002944571540000035
其中,ρl为地层流体密度,kg/m3;μl为地层流体黏度,Pa·s;q为单位时间内单位体积流入或流出的质量,kg;Cl为地层流体压缩系数,1/Pa;CR为岩石孔隙压缩系数,1/Pa;φ为孔隙度;φ0为参考压力下的岩石孔隙度;p为孔隙压力,Pa;t为时间,s;k为渗透率,m2,其中,针对主裂缝区,k为裂缝渗透率kf;在压裂缝网区时,k为缝网区等效渗透率ke;在基质区,k为基质渗透率km;G为启动压力梯度,Pa/m,其中,针对主裂缝区,不考虑启动压力梯度,即G=0;在压裂缝网区,考虑缝网区启动压力梯度,即G=Ge;在基质区,考虑基质区启动压力梯度,G=Gm
在控制方程的基础上定义控制方程的残差函数为:
Figure FDA0002944571540000041
然后定义误差估计函数:
Figure FDA0002944571540000042
最后将数据项和控制方程项相加,共同构成损失函数:
loss=loss_data+loss_phy。
8.根据权利要求1所述的基于物理约束的LSTM模型预测页岩油产量的方法,其特征在于:所述步骤(8)中采用决定系数R2和L2误差L2_error作为评价指标;当R2值在95%以上时,L2_error值越小,模型的预测效果越好;L2_error计算方法如下:
Figure FDA0002944571540000043
R2的计算方法如下:
Figure FDA0002944571540000044
其中,yi表示真实值,yi表示预测值,
Figure FDA0002944571540000045
表示平均值,N为样本个数。
9.根据权利要求1所述的基于物理约束的LSTM模型预测页岩油产量的方法,其特征在于:在步骤(7)训练模型时通过优化器不断减小步骤(6)定义的损失函数直到模型训练结束,得到控制方程项中未知参数渗透率K的反演值,从而校正储层的储层渗透率分布特征。
CN202110192283.4A 2021-02-19 2021-02-19 基于物理约束的lstm模型预测页岩油产量的方法 Active CN112819240B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110192283.4A CN112819240B (zh) 2021-02-19 2021-02-19 基于物理约束的lstm模型预测页岩油产量的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110192283.4A CN112819240B (zh) 2021-02-19 2021-02-19 基于物理约束的lstm模型预测页岩油产量的方法

Publications (2)

Publication Number Publication Date
CN112819240A true CN112819240A (zh) 2021-05-18
CN112819240B CN112819240B (zh) 2021-11-26

Family

ID=75864284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110192283.4A Active CN112819240B (zh) 2021-02-19 2021-02-19 基于物理约束的lstm模型预测页岩油产量的方法

Country Status (1)

Country Link
CN (1) CN112819240B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113236228A (zh) * 2021-06-24 2021-08-10 中海石油(中国)有限公司 一种单井产量快速预测方法及系统
CN113297803A (zh) * 2021-06-17 2021-08-24 东北石油大学 一种油气产量智能模拟预估方法和系统
CN113537592A (zh) * 2021-07-15 2021-10-22 中国石油大学(北京) 基于长短时记忆网络的油气藏产量预测方法及装置
CN113792479A (zh) * 2021-08-23 2021-12-14 北京科技大学 一种基于物理约束的煤层气藏压裂效果评价方法
CN115718327A (zh) * 2023-01-10 2023-02-28 中国铁路设计集团有限公司 岩体完整性系数计算方法、系统、电子设备及存储介质
CN115929289A (zh) * 2022-12-05 2023-04-07 西南石油大学 基于时间顺序的页岩气产量预测方法及装置
CN116068449A (zh) * 2023-03-23 2023-05-05 中国科学技术大学 一种物理模型约束深度神经网络的锂电池评估系统及方法
CN117851928A (zh) * 2024-03-07 2024-04-09 特雷西能源科技股份有限公司 基于cnn-lstm模型预测页岩油产量的方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190087965A1 (en) * 2016-03-18 2019-03-21 President And Fellows Of Harvard College Automatically classifying animal behavior
CN110807544A (zh) * 2019-10-08 2020-02-18 北京科技大学 一种基于机器学习的油田剩余油饱和度分布的预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190087965A1 (en) * 2016-03-18 2019-03-21 President And Fellows Of Harvard College Automatically classifying animal behavior
CN110807544A (zh) * 2019-10-08 2020-02-18 北京科技大学 一种基于机器学习的油田剩余油饱和度分布的预测方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297803A (zh) * 2021-06-17 2021-08-24 东北石油大学 一种油气产量智能模拟预估方法和系统
CN113297803B (zh) * 2021-06-17 2022-12-06 东北石油大学 一种油气产量智能模拟预估方法和系统
CN113236228A (zh) * 2021-06-24 2021-08-10 中海石油(中国)有限公司 一种单井产量快速预测方法及系统
CN113537592A (zh) * 2021-07-15 2021-10-22 中国石油大学(北京) 基于长短时记忆网络的油气藏产量预测方法及装置
CN113537592B (zh) * 2021-07-15 2023-09-15 中国石油大学(北京) 基于长短时记忆网络的油气藏产量预测方法及装置
CN113792479A (zh) * 2021-08-23 2021-12-14 北京科技大学 一种基于物理约束的煤层气藏压裂效果评价方法
CN113792479B (zh) * 2021-08-23 2023-09-22 北京科技大学 一种基于物理约束的煤层气藏压裂效果评价方法
CN115929289A (zh) * 2022-12-05 2023-04-07 西南石油大学 基于时间顺序的页岩气产量预测方法及装置
CN115929289B (zh) * 2022-12-05 2024-05-28 西南石油大学 基于时间顺序的页岩气产量预测方法及装置
CN115718327A (zh) * 2023-01-10 2023-02-28 中国铁路设计集团有限公司 岩体完整性系数计算方法、系统、电子设备及存储介质
CN116068449A (zh) * 2023-03-23 2023-05-05 中国科学技术大学 一种物理模型约束深度神经网络的锂电池评估系统及方法
CN117851928A (zh) * 2024-03-07 2024-04-09 特雷西能源科技股份有限公司 基于cnn-lstm模型预测页岩油产量的方法及系统

Also Published As

Publication number Publication date
CN112819240B (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN112819240B (zh) 基于物理约束的lstm模型预测页岩油产量的方法
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN107562784A (zh) 基于ResLCNN模型的短文本分类方法
CN105760673B (zh) 一种河流相储层地震敏感参数模板分析方法
CN111144542A (zh) 油井产能预测方法、装置和设备
CN112989708A (zh) 一种基于lstm神经网络的测井岩性识别方法及系统
CN112818591B (zh) 基于物理约束的dl模型预测致密油压裂范围的方法
CN112733449A (zh) 一种cnn井震联合反演方法、系统、存储介质、设备及应用
CN115618987A (zh) 生产井生产数据预测方法、装置、设备和存储介质
CN116738817B (zh) 一种煤矿多灾种融合自然裂变预警方法及系统
CN113236228B (zh) 一种单井产量快速预测方法及系统
CN114358434A (zh) 基于lstm循环神经网络模型的钻井机械钻速预测方法
CN111914478A (zh) 一种综合地质钻孔测井岩性识别方法
CN113486303A (zh) 一种基于修饰模型集成的长时间序列预测方法
CN115345378A (zh) 一种基于机器学习的页岩气井产量评价方法
CN114088890A (zh) 基于深度bp神经网络的自适应温湿度补偿方法及系统
CN113722997A (zh) 一种基于静态油气田数据的新井动态产量预测方法
CN115293197A (zh) 一种基于长短期记忆网络的钻孔应变数据异常检测方法
CN113095484A (zh) 基于lstm神经网络的股票价格预测方法
CN111338002A (zh) 基于门控循环神经网络模型的孔隙度预测方法
CN118364963A (zh) 基于lstm神经网络的建筑材料价格预测方法
Springer et al. Robust parameter estimation of chaotic systems
CN114114414A (zh) 一种页岩储层“甜点”信息人工智能预测方法
CN109086887A (zh) 深度rbf神经网络与基于熵权的ahp结合的预警方法
Ganji-Azad et al. Reservoir fluid PVT properties modeling using adaptive neuro-fuzzy inference systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant