CN116884537A - 一种页岩油与孔隙壁面相互作用能的数据库智能构建方法 - Google Patents

一种页岩油与孔隙壁面相互作用能的数据库智能构建方法 Download PDF

Info

Publication number
CN116884537A
CN116884537A CN202310647412.3A CN202310647412A CN116884537A CN 116884537 A CN116884537 A CN 116884537A CN 202310647412 A CN202310647412 A CN 202310647412A CN 116884537 A CN116884537 A CN 116884537A
Authority
CN
China
Prior art keywords
shale oil
component
model
pore
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310647412.3A
Other languages
English (en)
Inventor
梁超
杨永飞
宋怀森
尚振骁
刘紫薇
孙海
张磊
钟俊杰
张凯
姚军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202310647412.3A priority Critical patent/CN116884537A/zh
Publication of CN116884537A publication Critical patent/CN116884537A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种页岩油与孔隙壁面相互作用能的数据库智能构建方法,属于数据库构建技术领域,包括如下步骤:通过分子动力学计算方法,获取页岩油藏纳米孔隙中代表性流体与代表性孔隙壁面的相互作用能数据;量化流体和孔隙壁面特征参数,形成神经网络模型原始数据;基于生成对抗网络构建GAN数据增强模型;基于全连接神经网络,建立页岩油藏纳米孔隙中流体与孔隙壁面相互作用能预测模型;基于预测模型,对GAN数据增强模型没有覆盖的区域进行数据补全,构建完整的相互作用能数据库,并建立可视化软件系统。本发明用于构建页岩油藏纳米孔隙中复杂流体组分与多类型孔隙壁面相互作用能数据库,大幅降低相互作用理论模拟计算的昂贵成本。

Description

一种页岩油与孔隙壁面相互作用能的数据库智能构建方法
技术领域
本发明属于数据库构建技术领域,具体涉及一种页岩油与孔隙壁面相互作用能的数据库智能构建方法。
背景技术
页岩油是多组分流体,常划分为轻质组分、中质组分、重质组分以及非烃类组分,页岩纳米孔隙壁面类型分为无机矿物壁面和有机质壁面,有机质以干酪根为主,无机矿物以石英、高岭石等黏土类矿物为主,各流体组分因其分子结构和化学性质不同,导致与孔隙壁面的相互作用强度存在差异。理清流体与孔隙壁面的作用机理和作用强度,有助于制定合理高效的页岩油气开发方案。流体与孔隙壁面的作用强度表现为流体对孔隙壁面的吸附性,相互作用能是评价作用强度的关键参数之一,可通过多种方法估计或计算其数值。流体与孔隙壁面间的相互作用能可通过相互作用理论模拟得到。在计算化学领域,通过分子动力学(Molecular Dynamics,MD)计算相互作用能。但是,对于复杂流体组分和多类型孔隙壁面,采用分子动力学计算方法,无法快速得到各类型烃类流体与各类型孔隙壁面之间的相互作用能,精确地分子模拟理论计算将消耗大量的成本和时间。
目前,利用机器学习建立有针对性的模型,有助于解决长期以来花费大量时间和成本计算相互作用能这一难题。机器学习是一系列基于统计学的方法,利用各种数据挖掘算法从历史数据中获取信息,预测未知数据。本发明要解决的技术问题是,在页岩油藏中,对纳米孔隙中流体与有机质及无机矿物孔隙壁面之间的相互作用能进行预测,进而构建页岩油藏纳米孔隙中流体与有机质及无机矿物壁面作用强度数据库。在页岩纳米孔隙的实验研究中,目前仍然没有足够的实验手段来直接观测和量化流体与有机质及无机矿物孔隙壁面的相互作用能。在理论计算方面,通常使用MD方法分析流体组分对孔隙壁面的相互作用能力,但该方法极大耗费计算时间和资源,对于大规模复杂的分子模拟计算,不再适用。
发明内容
为了解决上述问题,本发明提出了一种页岩油与孔隙壁面相互作用能的数据库智能构建方法,以页岩油藏纳米孔隙中流体和有机质及无机矿物壁面为研究对象,在MD理论计算的基础上,量化页岩油藏纳米孔隙中流体与有机质及无机矿物壁面的相互作用能,结合生成对抗网络(Generative Adversarial Network,GAN)和全连接神经网络(FullyConnected Neural Network,FCNN)建立页岩油藏纳米孔隙中流体与有机质及无机矿物壁面高效率、高精度的相互作用能预测模型,以此构建页岩油藏纳米孔隙中复杂流体组分与多类型孔隙壁面相互作用能数据库。然后,结合构建的数据库统计分析,全面地评价页岩油藏纳米孔隙中流体对壁面的相互作用能力,大幅降低相互作用理论模拟计算的昂贵成本。最后,建立软件和可视化模块,实现输入流体特征和壁面特征数据,快速检索相互作用能数据并输出流体与孔隙壁面相互作用强度图像示意图,实现相互作用强度的可视化显示,呈现更加直观的相互作用强度效果。
本发明的技术方案如下:
一种页岩油与孔隙壁面相互作用能的数据库智能构建方法,采用生成对抗网络和全连接神经网络的智能算法构建数据库,具体包括如下步骤:
步骤1、通过分子动力学计算方法,获取页岩油藏纳米孔隙中代表性流体与代表性孔隙壁面的相互作用能数据;
步骤2、量化流体和孔隙壁面特征参数,形成神经网络模型原始数据;
步骤3、基于生成对抗网络构建GAN数据增强模型,生成与原始数据相似的高质量新样本,扩充流体与孔隙壁面相互作用能数据集;
步骤4、基于全连接神经网络,建立页岩油藏纳米孔隙中流体与孔隙壁面相互作用能预测模型;
步骤5、基于预测模型,对GAN数据增强模型没有覆盖的区域进行数据补全,构建完整的相互作用能数据库,并建立可视化软件系统。
进一步地,步骤1的具体过程为:
步骤1.1、建立多组分页岩油分子模型及纳米孔隙分子模型,组合页岩油在纳米孔隙中吸附的分子模型并进行能量最小化与弛豫;具体过程为:
步骤1.1.1、基于Ligpargen网站建立多组分页岩油分子模型;
首先,利用Ligpargen网站,分别建立甲烷、正十二烷、沥青质分子、正癸胺分子模型,完成电荷平衡优化后,分别导出各个模型对应的四个.lmp类型文件和四个.xyz类型文件;然后,将四个.lmp类型文件进行格式转化,转换得到四个.lt类型文件;同时,将四个.xyz类型基于甲烷、正十二烷、沥青质、正癸胺和岩石孔隙尺寸构建随机分布文件;最后,将随机分布文件和四个.lt类型文件融合,生成多组分页岩油分子模型;
步骤1.1.2、利用Materials Studio软件,建立页岩纳米孔隙分子模型;建立的页岩纳米孔隙分子模型包括页岩高岭石纳米孔隙分子模型、页岩石英纳米孔隙分子模型、页岩方解石纳米孔隙分子模型和页岩Ⅱ—C型干酪根纳米孔隙分子模型;
首先建立页岩高岭石纳米孔隙分子模型,调用Materials Studio软件中的晶胞,使用Materials Studio软件中的Bulid模块切割出高岭石晶胞的晶面高岭石,得到高岭石晶胞模型,优化高岭石晶胞模型的晶格结构参数,生成高岭石晶胞模型文件;将高岭石晶胞模型文件导入Lammps分子模拟器进行文件格式转换,获得高岭石晶胞数据文件,设置高岭石矿物的ClayFF力场参数,将ClayFF力场参数施加到高岭石晶胞模型中,构建页岩高岭石纳米孔隙分子模型;然后按照同样的方式建立页岩石英纳米孔隙分子模型、页岩方解石纳米孔隙分子模型和页岩Ⅱ—C型干酪根纳米孔隙分子模型;
步骤1.1.3、将页岩纳米孔隙分子模型与多组分页岩油分子模型组合得到多组分页岩油纳米孔隙吸附初始模型,对多组分页岩油纳米孔隙吸附初始模型进行能量最小化和弛豫处理,得到多组分页岩油纳米孔隙吸附模型;
首先将页岩高岭石纳米孔隙分子模型与多组分页岩油分子模型相组合,形成多组分页岩油纳米孔隙吸附初始模型,通过对多组分页岩油纳米孔隙吸附初始模型进行能量最小化处理消除重叠的原子构型,使得多组分页岩油纳米孔隙吸附初始模型能量最低化后,获取能量最小化状态下的多组分页岩油纳米孔隙吸附初始模型能量,得到能量最小化处理后的多组分页岩油纳米孔隙吸附初始模型;再对能量最小化处理后的多组分页岩油纳米孔隙吸附初始模型进行优化,设置多组分页岩油纳米孔隙吸附初始模型的弛豫步长和弛豫时间,在NVE正则系综下以预设的弛豫步长和弛豫时间对多组分页岩油纳米孔隙吸附初始模型进行弛豫处理,获取多组分页岩油纳米孔隙吸附初始模型稳定状态下的体系温度值并与真实地层环境温度,通过弛豫处理使得多组分页岩油纳米孔隙吸附初始模型稳定状态下的体系温度值与真实地层环境温度相一致,得到多组分页岩油纳米孔隙吸附模型;然后,依次将页岩石英纳米孔隙分子模型、页岩方解石纳米孔隙分子模型和页岩Ⅱ—C型干酪根纳米孔隙分子模型分别与多组分页岩油分子模型相组合,以相同的方式建立石英、方解石、Ⅱ—C型干酪根的多组分页岩油纳米孔隙吸附模型;
步骤1.2、利用分子动力学方法获取平衡态下多组分页岩油在多组分页岩油纳米孔隙吸附的平衡态分子轨迹,并计算各组分页岩油在纳米孔隙中的吸附密度分布;具体过程为:
首先,基于分子动力学方法,以步长为1飞秒运行10纳秒获得平衡态下页岩油在高岭石纳米孔隙中的吸附构型;进一步对平衡态下页岩油在高岭石纳米孔隙中的吸附构型,以维持原模拟条件下继续进行2纳秒模拟,获取密度分布数据,并以步长为500飞秒输出400帧分子轨迹文件并保存;
在模拟获取分析密度分布数据的过程中,将多组分页岩油所在空间沿z方向以0.025nm的间隔建立数据统计箱,按照公式(1)以1飞秒为步长取2000000组多组分页岩油质量分布的平均值;获取页岩油各组分在纳米孔隙中的吸附密度分布曲线;
式中:ρij为页岩油中j组分在第i个数据统计箱内的平均密度;Nij为页岩油中j组分在第i个数据统计箱中的个数;mj为页岩油中j组分的相对分子质量;x为体系x方向尺寸;y为体系y方向尺寸;hi为第i个数据统计箱高度;NA为阿伏伽德罗常数;然后,按照同样的过程生成石英、方解石、Ⅱ—C型干酪根的分子轨迹文件;
步骤1.3、设置页岩油力场参数和纳米孔隙力场参数,计算多组分页岩油各组分与纳米孔隙的相互作用能,获取多组分页岩油各组分相互作用能数据;
页岩油力场参数和纳米孔隙力场参数共包括原子间参数、键参数、角参数;基于获取的纳米孔隙中的吸附构型及分子轨迹文件,首先,删除纳米孔隙中的吸附构型文件中的库伦相互作用参数;然后采取重现分子轨迹的方式,以500飞秒为步长取400组数据的平均值获取各组分页岩油与孔隙范德华相互作用能;以多组分页岩油为基础,统计分类分析多个页岩油藏地质特征;考虑页岩油密度、赋存环境温压条件、纳米孔隙基质四种因素进行上述的分子动力学模拟获取固-液相互作用能数据,该固-液相互作用能数据即为所需的页岩油藏纳米孔隙中代表性流体与代表性孔隙壁面的相互作用能数据,最终形成流体与孔隙壁面相互作用能小样本数据集。
进一步地,步骤2的具体过程为:首先根据多组分页岩油各组分相互作用能数据,基于多组分页岩基质SEM扫描实验获取的孔隙特征;然后,将孔隙壁面对流体的相互作用能按照强弱进行排序,将其映射到0-1区间内,实现孔隙壁面特征的量化。
进一步地,步骤3中,GAN数据增强模型进行数据扩充的过程为:原始输入数据O包括温度、孔径、壁面类型、页岩油组分、压力、相互作用能;GAN数据增强模型首先将原始输入数据O归一化为x1、x2、x3、x4、x5、x6,生成器将原低维向量投影成为与原始数据维度一致的高维向量X1′、X2′、X3′、X4′、X5′、X6′,然后判别器将归一化后的原始数据O与生成的高维向量进行分布相似性判断,经过不断训练生成器和判别器,最终生成分布相似的数据,再经反归一化得到生成数据O',实现对页岩油藏纳米孔隙中流体与孔隙壁面相互作用能数据地扩充,形成与原始数据相似的高质量新样本;
生成器的输入层为Dense层,输入数据的尺寸为输入数据种类乘上批处理大小,并连接LeakyReLU激活函数层;隐藏层为3层Dense层,激活函数为tanh,第1层20个神经元、第2层10个神经元、第3层6个神经元,并最后连接LeakyReLU激活函数层;输出层为Reshape层,将特征值尺寸规范化到6类,完成数据扩充;
判别器的输入层为Flatten层,将所有特征平铺展开;隐藏层为1层Dense层,神经元个数为50个,并连接ReLU激活函数层;输出层为Dense层,神经元个数为1个,并连接ReLU激活函数层,判断输出数据真假。
进一步地,步骤4中,基于全连接神经网络的预测模型包括输入层、隐藏层、输出层和激活函数;输入层为Dense层,负责接收原始数据,输入数据为5个维度,具体包括温度、孔径、壁面类型、页岩油组分、压力,神经元个数为5个;隐藏层是全连接神经网络中的中间层,隐藏层的神经元数量自由设定,每个神经元都与前一层和后一层的所有神经元相连接,设定隐藏层为5层Dense层,前4层激活函数为tanh,最后一层不加入激活函数,每层神经元个数为20个;输出层是全连接神经网络的最后一层,负责输出网络的预测结果,预测结果为相互作用能,设定输出层为1层Dense层,神经元个数为1个。
进一步地,步骤5中,将GAN数据增强模型扩充的数据集划分为训练集和验证集两个不相交的集合,首先用训练集训练相互作用能预测模型,然后使用该预测模型对验证集的相互作用能进行预测,评估训练完成的模型;通过训练完成的预测模型进行相互作用能预测,对GAN数据增强模型没有覆盖的区域进行数据补全,进而构建完整的相互作用能数据库;
选择均方误差MSE进行模型评估,并取其平均值作为评价最终模型的性能指标;MSE的计算方式为:
其中,h(xi)为模型预测值,yi为真实值,i表示第i个样本,n表示样本总个数。
进一步地,步骤5中,基于MATLAB建立了可视化软件系统:页岩系统,页岩系统包括3个功能模块:基本物性数据库模块、固液相互作用强度数据库模块、状态方程模块;其中,基本物性数据库模块用于查询不同产地页岩油和储层的相关物性,并对储层岩心进行了SEM扫描电镜图像可视化;固液相互作用强度数据库模块,针对不同流体性质、孔隙壁面性质和储层条件,定量化表征固相相互作用的相互作用能、平均力势和数密度分布,并对微观模型进行了可视化;状态方程模块,基于PR状态方程,实现单组分纯物质和双组份二元混合物的压缩系数和逸度系数的计算;该页岩系统通过以上3种功能模块,初步评价页岩油的可动性、储层性质的优劣以及流体状态参数的计算。
进一步地,基本物性数据库模块中,通过选择页岩油来源,自动显示页岩油基本物性和储层岩石基本物性;页岩油基本物性包括页岩油密度、页岩油组成和页岩油碳数分布,页岩油碳数分布为横坐标为碳原子个数,纵坐标为质量分数的曲线图;储层岩石基本物性包括TOC含量、有机质类型、孔隙类型、孔隙度和主要矿物含量,并对储层岩石SEM扫描电镜图像进行了可视化;
所述固液相互作用强度数据库模块中,包括流体性质、纳米孔隙的壁面性质、储层条件、流体和壁面对象的PMF展示、PMF分布、数密度分布;流体性质包括轻质、中质和重质组分的质量分数;纳米孔隙的壁面性质包括上下不同的壁面类型;储层条件包括页岩油的温度和压力,以及狭缝孔的孔径大小;流体和壁面对象的PMF展示中,根据设置的流体类型、壁面类型、上下壁面的吸附能展示当前PMF立体图;PMF分布、数密度分布均为曲线图设置;
所述状态方程模块中,包括组分1和组分2两组单组分纯物质相关参数、温度、压力、组分1的摩尔分数、组分2的摩尔分数、压缩因子、相态、逸度系数;每组单组分纯物质相关参数均包括临界温度、临界压力、偏心因子;状态方程模块既能进行单组分纯物质相关参数计算,也能进行双组分二元混合物相关参数计算;在单组分纯物质相关参数计算中,首先设置组分1中的临界温度、临界压力、偏心因子的参数值,组分2中的临界温度、临界压力、偏心因子的参数值均设置为0,然后设置待计算状态的温度和压力值,最后计算得到压缩因子、逸度系数以及物质所处的相态;组分1的摩尔分数、组分2的摩尔分数也均设置为0;在双组分二元混合物相关参数计算中,分别设置组分1和组分2中的临界温度、临界压力和偏心因子参数,并设置组分1和组分2各自的摩尔分数值,然后设定待计算状态的温度和压力值,经过计算得到组分1和组分2的压缩因子、逸度系数以及物质所处的相态。
本发明所带来的有益技术效果:
1、针对机器学习模型需要大量数据进行训练,使用MD方法计算流体与孔隙壁面相互作用能数据成本高昂,导致数据匮乏,机器学习模型预测精度低的问题,本发明采用GAN算法,基于MD方法计算获取的小样本数据,学习真实页岩油藏纳米孔隙中流体与孔隙壁面相互作用能数据的样本分布规律,以此生成与原始数据相似的高质量新样本,实现数据增强扩充,提高后续预测模型的精确性;
2、依靠现有实验手段,无法直接观测和量化纳米孔隙中流体与孔隙壁面的相互作用能。结合地球化学、分子热力学等基础理论的MD理论计算方法虽然可以获得流体与孔隙壁面的相互作用能,但计算资源昂贵,时间成本高,无法快速得到页岩油藏纳米孔隙中各类型烃类流体与各类型孔隙壁面之间的相互作用能。由于传统的线性方法需要假设预测目标和描述符之间存在线性关系,不适用于本发明的实际情况,因此本发明使用FCNN算法构建页岩油藏纳米孔隙中流体与孔隙壁面相互作用能预测模型,大幅降低计算时间和计算成本,快速高效地获取页岩油藏纳米孔隙中各类型流体与各类型孔隙壁面之间的相互作用能数据;
3、基于构建的流体与孔隙壁面相互作用能预测模型,对基于MD方法计算的小样本原始数据中,未涉及的流体类型与孔隙壁面类型的相互作用能进行量化评估,形成页岩油藏纳米孔隙中流体与孔隙壁面相互作用强度数据库。
4、建立操作软件界面,输入页岩油藏流体特征和孔隙壁面特征数据,输出量化的相互作用能数据,实现快速高效的相互作用强度参数获取。结合分子模拟图像数据,增加流体与孔隙壁面相互作用强度图像示意模块,实现相互作用强度的可视化显示。与只构建机器学习预测模型相比较,构建相互作用强度数据库可以实现更加高效的数据检索,并呈现更加直观的相互作用强度效果。
5、本发明不仅适用于页岩油藏纳米孔隙中构建流体与孔隙壁面相互作用能数据库,也适用于其他有关分子吸附的相互作用能数据库构建领域。
附图说明
图1为本发明页岩油与孔隙壁面相互作用能的数据库智能构建方法流程图。
图2为本发明中孔隙壁面特征量化模型。
图3为本发明中GAN模型的结构示意图。
图4为本发明中30MPa、333K、5nm条件下,多种页岩油组分与不同壁面类型对应的相互作用能数据增强模型示意图。
图5为本发明中GAN数据增强模型进行数据扩充过程的流程图。
图6为本发明中全连接神经网络的结构示意图。
具体实施方式
下面结合附图以及具体实施方式对本发明作进一步详细说明:
如图1所示,一种页岩油与孔隙壁面作用强度数据库的智能构建方法,采用生成对抗网络和全连接神经网络的智能算法构建数据库,具体包括如下步骤:
步骤1、通过分子动力学计算方法,获取页岩油藏纳米孔隙中代表性流体与代表性孔隙壁面的相互作用能数据。具体过程为:
步骤1.1、首先建立多组分页岩油分子模型及纳米孔隙分子模型,组合页岩油在纳米孔隙中吸附的分子模型并进行能量最小化与弛豫。具体过程为:
步骤1.1.1、基于Ligpargen网站建立多组分页岩油分子模型。具体过程为:
首先,利用Ligpargen网站,分别建立甲烷、正十二烷、沥青质分子、正癸胺分子模型,完成电荷平衡优化后,分别导出methane.lmp、n-dodecane.lmp、asphaltene.lmp、n-decylamine.lmp四个.lmp类型文件,以及methane.xyz、n-dodecane.xyz、asphaltene.xyz、n-decylamine.xyz四个.xyz类型文件。
然后,将methane.lmp、n-dodecane.lmp、asphaltene.lmp、n-decylamine.lmp四个.lmp类型文件全部导入moltemplate包中进行格式转化,转换得到methane.lt、n-dodecane.lt、asphaltene.lt、n-decylamine.lt四个.lt类型文件。格式转化的具体实现命令为:ltemplify.py-name methane methane.lmp>methane.lt、ltemplify.py-name n-dodecane n-dodecane.lmp>n-dodecane.lt、ltemplify.py-name asphalteneasphaltene.lmp>asphaltene.lt、ltemplify.py-name n-decylamine n-decylamine.lmp>n-decylamine.lt。
同时,将methane.xyz、n-dodecane.xyz、asphaltene.xyz、n-decylamine.xyz四个.xyz类型文件全部导入Pcakmol包,并基于甲烷、正十二烷、沥青质、正癸胺和岩石孔隙尺寸构建随机分布的oil.xyz文件。
例如,以30MPa,333K,5nm孔径为例,计算各组分页岩油与高岭石孔隙范德华相互作用能时,基于表1中990个甲烷、809个正十二烷、75个沥青质、86个正癸胺和5.92nm×8.81nm×9.39nm的岩石孔隙尺寸,构建随机分布的oil.xyz文件。
表1多组分页岩油组分占比数据
最后,将oil.xyz文件和步骤1.1.1.2中取得的methane.lt、n-dodecane.lt、asphaltene.lt、n-decylamine.lt四个.lt类型文件导入moltemplate包中生成oil.data文件,oil.data文件即为最终建立的多组分页岩油分子模型。生成oil.data的具体实现命令为:moltemplate.sh-xyz oil.xyz system.lt。
步骤1.1.2、利用Materials Studio软件,建立页岩纳米孔隙分子模型。具体过程为:
建立的页岩纳米孔隙分子模型包括页岩高岭石纳米孔隙分子模型、页岩石英纳米孔隙分子模型、页岩方解石纳米孔隙分子模型和页岩Ⅱ—C型干酪根纳米孔隙分子模型。
首先建立页岩高岭石纳米孔隙分子模型,调用Materials Studio软件中的晶胞,使用Materials Studio软件中的Bulid模块切割出高岭石晶胞的(001)晶面高岭石,使模型处于能量最低化,得到高岭石晶胞模型,优化高岭石晶胞模型的晶格结构参数,生成高岭石晶胞模型文件并导出,高岭石晶胞模型文件共包含kaolinite.car和kaolinite.mdf两个文件。优化后的晶格结构参数为:晶胞的长a=0.51535nm、晶胞的宽b=0.89419nm、晶胞的高c=0.73906nm、角度α=91.926°、角度β=105.046°、角度γ=89.797°。
将kaolinite.car、kaolinite.mdf两个文件导入Lammps分子模拟器的msi2lmp包进行文件格式转换,转换后获得后续Lammps分子模拟器可读取的高岭石晶胞数据文件kaolinite.data,设置高岭石矿物的ClayFF力场参数,将ClayFF力场参数施加到高岭石晶胞模型中,构建页岩高岭石纳米孔隙分子模型。文件格式转换的具体实现命令为:./msi2lmp.exe kaolinite-class I-frc cvff-i>data.kaolinite。
然后按照同样的方式建立页岩石英纳米孔隙分子模型、页岩方解石纳米孔隙分子模型和页岩Ⅱ—C型干酪根纳米孔隙分子模型。
步骤1.1.3、将页岩纳米孔隙分子模型与多组分页岩油分子模型组合得到多组分页岩油纳米孔隙吸附初始模型,对多组分页岩油纳米孔隙吸附初始模型进行能量最小化和弛豫处理,得到多组分页岩油纳米孔隙吸附模型。
首先将页岩高岭石纳米孔隙分子模型与多组分页岩油分子模型相组合,形成多组分页岩油纳米孔隙吸附初始模型,通过对多组分页岩油纳米孔隙吸附初始模型进行能量最小化处理消除重叠的原子构型,使得多组分页岩油纳米孔隙吸附初始模型能量最低化后,获取能量最小化状态下的多组分页岩油纳米孔隙吸附初始模型能量,得到能量最小化处理后的多组分页岩油纳米孔隙吸附初始模型;再对能量最小化处理后的多组分页岩油纳米孔隙吸附初始模型进行优化,设置多组分页岩油纳米孔隙吸附初始模型的弛豫步长和弛豫时间,在NVE正则系综下以预设的弛豫步长和弛豫时间对多组分页岩油纳米孔隙吸附初始模型进行弛豫处理,获取多组分页岩油纳米孔隙吸附初始模型稳定状态下的体系温度值并与真实地层环境温度,通过弛豫处理使得多组分页岩油纳米孔隙吸附初始模型稳定状态下的体系温度值与真实地层环境温度相一致,得到多组分页岩油纳米孔隙吸附模型。
然后,依次将页岩石英纳米孔隙分子模型、页岩方解石纳米孔隙分子模型和页岩Ⅱ—C型干酪根纳米孔隙分子模型分别与多组分页岩油分子模型相组合,以相同的方式建立石英、方解石、Ⅱ—C型干酪根的多组分页岩油纳米孔隙吸附模型。
以高岭石为例,具体实现过程为:将步骤1.1.2生成的高岭石晶胞数据文件kaolinite.data和步骤1.1.1生成的多组分页岩油分子模型文件oil.data通过Lammps分子模拟器组合为多组分页岩油纳米孔隙吸附初始模型数据文件adsorption.data,经过OVITO软件可视化为多组分页岩油纳米孔隙吸附初始模型。以1.1nm设置为力场截断半径,即两原子在截断半径以外的相互作用可以忽略不记,目的是减少计算时间。并在页岩油纳米孔隙吸附模型的xyz方向均取周期性边界,即分子运动出模型边界时,必有相同数目的分子从相反的界面回到模型中,从而保证该模拟系统的粒子数恒定,可以有效减小因模拟体系的规模限制而引起的边界效应。通过能量最小化消除adsorption.data文件中重叠的原子构型,并降低系统的能量。最终待体系能量稳定后,获取结构能量最小化的体系及相应的能量最小化状态下的多组分页岩油纳米孔隙吸附模型文件min_adsorption.data。此时,仅是通过移动体系原子完成初步的体系构型稳定,体系的初始温度与实际值偏离较大。所以将能量最小化文件min_adsorption.data,继续通过NVT系综在333K温度下以步长为1fs运行0.5ns,最终获得能量最小化与弛豫后的多组分页岩油纳米孔隙吸附模型文件relaxation_adsorption.data。最终页岩油的温度稳定在333K,与地下真实环境中多组分页岩油的赋存环境一致,增强计算数据的准确性。
步骤1.2、利用分子动力学方法获取平衡态下多组分页岩油在多组分页岩油纳米孔隙吸附的平衡态分子轨迹,并计算各组分页岩油在纳米孔隙中的吸附密度分布。具体过程为:
首先,基于分子动力学方法,以步长为1飞秒运行10纳秒获得平衡态下页岩油在高岭石纳米孔隙中的吸附构型的数据文件over_adsorption.data。进一步对平衡态下页岩油在高岭石纳米孔隙中的吸附构型,以维持原模拟条件下继续进行2纳秒模拟,获取密度分布数据,并以步长为500飞秒输出400帧分子轨迹文件system.lammpstrj并保存。
在模拟获取分析密度分布数据的过程中,将多组分页岩油所在空间沿z方向以0.025nm的间隔建立数据统计箱,按照公式(1)以1飞秒为步长取2000000组多组分页岩油质量分布的平均值。获取页岩油各组分在纳米孔隙中的吸附密度分布曲线。
式中:ρij为页岩油中j组分在第i个数据统计箱内的平均密度;Nij为页岩油中j组分在第i个数据统计箱中的个数;mj为页岩油中j组分的相对分子质量;x为体系x方向尺寸;y为体系y方向尺寸;hi为第i个数据统计箱高度;NA为阿伏伽德罗常数。然后,按照同样的过程生成石英、方解石、Ⅱ—C型干酪根的分子轨迹文件。
上述计算各组分页岩油在纳米孔隙中的吸附密度分布的过程可以通过Lammps分子模拟器的内部对应命令实现具体命令为:fix 1oil ave/chunk 1000 500 500000cc1density/number file density_oil.txt。
步骤1.3、设置页岩油力场参数和纳米孔隙力场参数,计算多组分页岩油各组分与纳米孔隙的相互作用能,获取多组分页岩油各组分相互作用能数据。
页岩油力场参数和纳米孔隙力场参数共包括原子间参数、键参数、角参数,具体设置如表2-表4所示。
表2原子间参数
表3键参数
表4角参数
基于获取的纳米孔隙中的吸附构型及分子轨迹文件,首先,删除纳米孔隙中的吸附构型文件中的库伦相互作用参数。然后采取重现分子轨迹的方式,以500飞秒为步长取400组数据的平均值获取各组分页岩油与孔隙范德华相互作用能。以多组分页岩油为基础,统计分类分析多个页岩油藏地质特征。考虑页岩油密度、赋存环境温压条件、纳米孔隙基质四种因素进行上述的分子动力学模拟获取固-液相互作用能数据,该固-液相互作用能数据即为所需的页岩油藏纳米孔隙中代表性流体(轻质、中质、重质页岩油)与代表性孔隙壁面(石英、方解石、高岭石、II—C型干酪根)的相互作用能数据,最终形成流体与孔隙壁面相互作用能小样本数据集。
上述计算多组分页岩油各组分与纳米孔隙的相互作用能的过程可以通过Lammps分子模拟器的内部对应命令实现,具体命令为:fix en all ave/time 1 100000 100000c_ENERGY file energy_${TEMP}.txt。
页岩富含大量纳米级孔隙,通过分子动力学模拟方法,以多组分页岩油赋存特征为例进行研究。本发明以压力30MPa、温度333K、孔径5nm为例,计算基于多组分页岩基质SEM扫描实验获取的孔隙特征,构建狭缝状的无机纳米孔隙与圆孔状有机纳米孔隙,其中无机孔隙基质以高岭石、石英、方解石为代表,有机孔隙以II—C型干酪根为单体通过模拟退火的方法完成模型构建。针对多组分页岩油的多组分特征,依据各组分占比相同及总密度相等原则,构建含多种组分的页岩油分子模型。利用平衡态分子动力学模拟方法,考察多组温压地层条件下页岩油密度分布、相互作用能、状态变化等固-液间相互作用特征,获取的多组分页岩油在多类型纳米孔隙中的相互作用能数据如表5所示。
表5多组分页岩油各组分相互作用能数据
步骤2、量化流体和孔隙壁面特征参数,形成神经网络模型原始数据。具体过程如下:
孔隙壁面特征量化模型如图2所示,首先根据多组分页岩油各组分相互作用能数据,基于多组分页岩基质SEM扫描实验获取的孔隙特征。然后,将孔隙壁面对流体的相互作用能按照强弱进行排序,将其映射到0,1区间内,实现孔隙壁面特征的量化。量化过程使得壁面条件变为数值化参数,优化神经网络模型的输入特征,在全面考虑流体与壁面相互作用能影响因素的前提下,提高计算效率。
步骤3、基于生成对抗网络构建GAN数据增强模型,生成与原始数据相似的高质量新样本,扩充流体与孔隙壁面相互作用能数据集。
GAN数据增强模型的输入特征包括温度、压力、孔径、壁面条件、页岩油组分和相互作用能数值,其中页岩油组分通过页岩油的密度表示,分为轻质、中质以及重质组分。
生成对抗网络的训练数据为324组相互作用能数据,通过分子模拟实验,每组特征对应于一个相互作用能数据,孔隙壁面特征包括石英壁面、高岭石壁面、方解石壁面和Ⅱ—C型干酪根壁面,温度特征包括333K、393K和453K,压力特征包括20MPa、30MPa和40MPa,页岩油组分特征(用密度表示)包括0.62g/cm3、0.73g/cm3和0.86g/cm3,孔径特征包括2nm、5nm和10nm。根据孔隙壁面特征量化操作,将石英、高岭石、方解石和II—C型干酪根壁面赋值到0-1区间内,其中,石英壁面赋值为0.1686,高岭石壁面赋值为0,方解石壁面赋值为0.4029,II—C型干酪根壁面赋值为1,如表6所示为5nm孔径下的部分相互作用能数据。
表6多组分页岩油各组分相互作用能数据
生成对抗网络的噪声数据为六维随机生成数据,满足标准正态分布,分别对应孔隙壁面特征、温度特征、压力特征、孔径特征、页岩油组分特征以及相互作用能特征,其中,孔隙壁面特征为限定值,只在对应于四种壁面条件的0.1686、0、0.4029、1四个值之间变化。
生成对抗网络模型的结构如图3所示,生成对抗网络模型包含两个神经网络,分别是生成器和判别器。其中,生成器通过隐式学习一组样本的数据分布,从而生成符合该数据分布的人工样本;判别器用于判断生成器合成的样本是否为真,其输出的判别结果将反馈给生成器以改善人工样本的质量,如此循环交替。经过不断迭代更新,生成器能够生成符合真实数据分布的人工样本,而此时判别器无法区分真实样本和人工样本,做出正确判断的概率为0.5,即达到纳什均衡。该学习优化过程属于二元极大极小博弈,模型在训练时需固定一方并更新另一方的参数,通过交替迭代训练使得对方的错误最大化,最终得到能以假乱真的生成模型。
生成器的输入层为Dense层,输入数据的尺寸为输入数据种类(6类)乘上批处理大小(batch size=10),并连接LeakyReLU激活函数层;隐藏层为3层Dense层,激活函数为tanh,第1层20个神经元、第2层10个神经元、第3层6个神经元,并最后连接LeakyReLU激活函数层;输出层为Reshape层,将特征值尺寸规范化到6类,完成数据扩充。
判别器的输入层为Flatten层,将所有特征平铺展开;隐藏层为1层Dense层,神经元个数为50个,并连接ReLU激活函数层;输出层为Dense层,神经元个数为1个,并连接ReLU激活函数层,判断输出数据真假。
通过人工神经网络库Keras内置的BinaryCrossentropy函数定义生成器和判别器的损失函数,让输出值的真值趋近于1,假值趋近于0。生成器和判别器的优化器使用Adam,学习率设定为0.0001,迭代次数Epoch设定为100次。
将MD模拟获取的代表性小样本数据作为原始数据,采用生成对抗网络算法,构建页岩纳米孔隙流体与壁面相互作用能数据增强模型,基于数据增强模型实现数据扩充。如图4所示,数据增强模型生成的是以训练数据点为中心一定范围内的页岩油与孔隙壁面相互作用能数据,对于范围外的数据点,数据增强模型无法覆盖,因此,利用数据增强模型生成的大量高质量数据,训练页岩油与孔隙壁面相互作用能预测模型,对数据增强模型未能覆盖的区域进行补全,最终构建页岩油与孔隙壁面相互作用能数据库。
本发明基于生成对抗网络算法构建GAN数据增强模型,GAN数据增强模型进行数据扩充的过程如图5所示,原始输入数据O包括温度T、孔径r、壁面类型γ、页岩油组分X、压力P、相互作用能E。GAN数据增强模型首先将原始输入数据O归一化为x1、x2、x3、x4、x5、x6。任意高斯噪声序列通过生成器将原低维向量投影成为与原始数据维度一致的高维向量,即将六维噪声数据映射为高维向量X1′、X2′、X3′、X4′、X5′、X6′。然后通过判别器将归一化后的原始数据O与生成的高维向量进行分布相似性判断,经过不断训练生成器和判别器,最终可以生成分布相似的数据,再经反归一化得到生成数据O'。实现对页岩油藏纳米孔隙中流体与孔隙壁面相互作用能数据地扩充,形成与原始数据相似的高质量新样本。最后选取一组新生成的样本,使用MD方法进行分子模拟,验证数据增强模型的准确性。
步骤4、基于全连接神经网络FCNN,建立页岩油藏纳米孔隙中流体与孔隙壁面相互作用能预测模型。
全连接神经网络(FCNN)是一种基础的人工神经网络结构,也称为多层感知器(Multilayer Perceptron,MLP)。在全连接神经网络中,每个神经元都与前一层和后一层的所有神经元相连接,形成一个密集的连接结构。全连接神经网络能够学习输入数据的复杂特征,并进行分类、回归等任务。结构如图6所示。
基于全连接神经网络的预测模型结构包括输入层、隐藏层、输出层和激活函数。输入层为Dense层,负责接收原始数据,输入数据为5个维度,具体包括温度、孔径、壁面类型、页岩油组分、压力,神经元个数为5个;隐藏层是全连接神经网络中的中间层,隐藏层的神经元数量可以自由设定,每个神经元都与前一层和后一层的所有神经元相连接,设定隐藏层为5层Dense层,前4层激活函数为tanh,最后一层不加入激活函数,每层神经元个数为20个;输出层是全连接神经网络的最后一层,负责输出网络的预测结果,预测结果为相互作用能,设定输出层为1层Dense层,神经元个数为1个。
步骤5、基于预测模型,对GAN数据增强模型没有覆盖的区域进行数据补全,构建完整的相互作用能数据库,并建立可视化软件系统。
GAN数据增强模型不能全面的覆盖数据库中不同壁面类型、不同孔径大小、不同温压条件以及不同页岩油组分的相互作用能数据,因此,使用GAN数据增强模型扩充的数据集训练相互作用能预测模型,通过训练完成的预测模型进行相互作用能预测,对GAN数据增强模型没有覆盖的区域进行数据补全,进而构建完整的相互作用能数据库。
将GAN数据增强模型扩充的数据集划分为训练集和验证集两个不相交的集合,首先用训练集训练相互作用能预测模型,然后使用该预测模型对验证集的相互作用能进行预测,评估训练完成的模型。本发明选择均方误差(Mean squared error,MSE)进行可预测性评价。本发明计算预测值与真实值之间的均方误差MSE,并取其平均值作为评价最终模型的性能指标。MSE的计算方式为:
其中,h(xi)为模型预测值,yi为真实值,i表示第i个样本,n表示样本总个数。
基于构建的流体与孔隙壁面相互作用能预测模型,对MD方法未计算的流体类型与孔隙壁面类型的相互作用能,以及GAN数据增强模型没有覆盖的区域进行数据补全,形成完整的页岩油藏纳米孔隙中流体与孔隙壁面相互作用能数据库,方便油藏工程师对页岩油的性质进行评估并助力油田工程设计。
本发明基于MATLAB建立了可视化软件系统:页岩系统Shale V1.0,页岩系统主要包括3个功能模块:基本物性数据库模块、固液相互作用强度数据库模块、状态方程模块。其中,基本物性数据库模块用于查询不同产地页岩油和储层的相关物性,并对储层岩心进行了SEM扫描电镜图像可视化。固液相互作用强度数据库模块,针对不同流体性质、孔隙壁面性质和储层条件,定量化表征固相相互作用的相互作用能、平均力势和数密度分布,并对微观模型进行了可视化;状态方程模块,基于PR状态方程,实现单组分纯物质和双组份二元混合物的压缩系数和逸度系数的计算。该页岩系统通过以上3种功能模块,可以初步评价页岩油的可动性、储层性质的优劣以及流体状态参数的计算。
基本物性数据库模块中,通过选择页岩油来源,自动显示页岩油基本物性和储层岩石基本物性;页岩油基本物性包括页岩油密度、页岩油组成和页岩油碳数分布,页岩油碳数分布为横坐标为碳原子个数,纵坐标为质量分数的曲线图;储层岩石基本物性包括TOC含量、有机质类型、孔隙类型、孔隙度和主要矿物含量,并对储层岩石SEM扫描电镜图像进行了可视化。
以松辽盆地古龙凹陷为例,选择页岩油来源为松辽盆地古龙凹陷后,在页岩油基本物性部分中,自动显示页岩油密度为0.80~0.82g/cm3,页岩油组成包括油质轻(地面密度小于0.8g/cm3)、气油比高(大于50m3/m3),以及页岩油碳数分布的曲线图。在储层岩石基本物性部分中,自动显示TOC含量为0.9~9.0,有机质类型为I~II,孔隙类型为粒间空、粒内孔、晶间孔、有机质孔、页理缝、微裂缝,孔隙度为3.4~16.0,主要矿物含量为黏土矿物2~52%、石英19~43%、斜长石8~65%,以及当前储层岩石SEM扫描电镜图像,储层岩石SEM扫描电镜图像包含其他放大倍数的多张图像,可以选择上一张和下一张进行翻看,更好的观察储层岩石的物性。
固液相互作用强度数据库模块中,包括流体性质、纳米孔隙的壁面性质、储层条件、流体和壁面对象的平均力势(PMF)展示、PMF分布、数密度分布。流体性质包括轻质、中质和重质组分的质量分数。纳米孔隙的壁面性质包括上下不同的壁面类型。储层条件包括页岩油的温度和压力,以及狭缝孔的孔径大小。流体和壁面对象的平均力势(PMF)展示中,根据设置的流体类型、壁面类型、上下壁面的吸附能展示当前PMF立体图。PMF分布、数密度分布均为曲线图设置。
例如,流体性质部分,设置页岩油中轻质、中质和重质组分分别为10%、80%、10%。纳米孔隙的壁面性质部分,设置上下壁面类型均为石英。储层条件部分,设置页岩油的温度为300K,压力为20MPa,狭缝孔的孔径大小为10nm。设置流体为轻质、上壁面、上壁面的吸附能为20.2Kcal/mol,下壁面的吸附能为19.5Kcal/mol。设置好后,该模块会提取出相应对象的相互作用能参数、平均力势和数密度分布,并且会可视化显示微观分子模型的图像。
状态方程模块中,包括组分1和组分2两组单组分纯物质相关参数、温度、压力、组分1的摩尔分数、组分2的摩尔分数、压缩因子、相态、逸度系数。每组单组分纯物质相关参数均包括临界温度、临界压力、偏心因子。
状态方程模块既可以进行单组分纯物质相关参数计算,也可以进行双组分二元混合物相关参数计算。
在单组分纯物质相关参数计算中,首先设置组分1中的临界温度、临界压力、偏心因子的参数值,组分2中的临界温度、临界压力、偏心因子的参数值均设置为0,然后设置待计算状态的温度和压力值,最后计算得到压缩因子、逸度系数以及物质所处的相态。组分1的摩尔分数、组分2的摩尔分数也均设置为0。例如,组分1中的临界温度、临界压力、偏心因子分别设置为304.2K、73.82bar、0.228w;组分2中的临界温度、临界压力、偏心因子的参数值均设置为0;温度设置为300K、压力设置为20bar;组分1的摩尔分数、组分2的摩尔分数也均设置为0;经过计算得到当前物质的压缩因子为0.8862、逸度系数为0.8955、物质所处的相态为气相。
在双组分二元混合物相关参数计算中,分别设置组分1和组分2中的临界温度、临界压力和偏心因子参数,并设置组分1和组分2各自的摩尔分数值,然后设定待计算状态的温度和压力值,经过计算可以得到组分1和组分2的压缩因子、逸度系数以及物质所处的相态。例如,分别设置组分1的临界温度、临界压力和偏心因子分别为304.2K、73.82bar、0.228w;组分1的临界温度、临界压力和偏心因子分别为647.3K、221.2bar、0.344w;温度设置为300K、压力设置为20bar;组分1的摩尔分数、组分2的摩尔分数分别设置为0.2%、0.8%;经过计算得到当前物质组分1的压缩因子为0.02319、逸度系数为0.7031、物质所处的相态为液相,组分2的压缩因子为0.8483、逸度系数为0.8673、物质所处的相态为气相。
本发明系统在输入流体和孔隙壁面特征后,可快速检索相互作用能数据并显示相互作用强度示意图像,实现了相互作用强度的可视化显示,克服了现有的MD分子模拟技术无法高效率量化页岩油藏纳米孔隙中复杂流体组分与多类型孔隙壁面相互作用强度的问题。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (8)

1.一种页岩油与孔隙壁面相互作用能的数据库智能构建方法,其特征在于,采用生成对抗网络和全连接神经网络的智能算法构建数据库,具体包括如下步骤:
步骤1、通过分子动力学计算方法,获取页岩油藏纳米孔隙中代表性流体与代表性孔隙壁面的相互作用能数据;
步骤2、量化流体和孔隙壁面特征参数,形成神经网络模型原始数据;
步骤3、基于生成对抗网络构建GAN数据增强模型,生成与原始数据相似的高质量新样本,扩充流体与孔隙壁面相互作用能数据集;
步骤4、基于全连接神经网络,建立页岩油藏纳米孔隙中流体与孔隙壁面相互作用能预测模型;
步骤5、基于预测模型,对GAN数据增强模型没有覆盖的区域进行数据补全,构建完整的相互作用能数据库,并建立可视化软件系统。
2.根据权利要求1所述页岩油与孔隙壁面相互作用能的数据库智能构建方法,其特征在于,所述步骤1的具体过程为:
步骤1.1、建立多组分页岩油分子模型及纳米孔隙分子模型,组合页岩油在纳米孔隙中吸附的分子模型并进行能量最小化与弛豫;具体过程为:
步骤1.1.1、基于Ligpargen网站建立多组分页岩油分子模型;
首先,利用Ligpargen网站,分别建立甲烷、正十二烷、沥青质分子、正癸胺分子模型,完成电荷平衡优化后,分别导出各个模型对应的四个.lmp类型文件和四个.xyz类型文件;然后,将四个.lmp类型文件进行格式转化,转换得到四个.lt类型文件;同时,将四个.xyz类型基于甲烷、正十二烷、沥青质、正癸胺和岩石孔隙尺寸构建随机分布文件;最后,将随机分布文件和四个.lt类型文件融合,生成多组分页岩油分子模型;
步骤1.1.2、利用Materials Studio软件,建立页岩纳米孔隙分子模型;建立的页岩纳米孔隙分子模型包括页岩高岭石纳米孔隙分子模型、页岩石英纳米孔隙分子模型、页岩方解石纳米孔隙分子模型和页岩Ⅱ—C型干酪根纳米孔隙分子模型;
首先建立页岩高岭石纳米孔隙分子模型,调用Materials Studio软件中的晶胞,使用Materials Studio软件中的Bulid模块切割出高岭石晶胞的晶面高岭石,得到高岭石晶胞模型,优化高岭石晶胞模型的晶格结构参数,生成高岭石晶胞模型文件;将高岭石晶胞模型文件导入Lammps分子模拟器进行文件格式转换,获得高岭石晶胞数据文件,设置高岭石矿物的ClayFF力场参数,将ClayFF力场参数施加到高岭石晶胞模型中,构建页岩高岭石纳米孔隙分子模型;然后按照同样的方式建立页岩石英纳米孔隙分子模型、页岩方解石纳米孔隙分子模型和页岩Ⅱ—C型干酪根纳米孔隙分子模型;
步骤1.1.3、将页岩纳米孔隙分子模型与多组分页岩油分子模型组合得到多组分页岩油纳米孔隙吸附初始模型,对多组分页岩油纳米孔隙吸附初始模型进行能量最小化和弛豫处理,得到多组分页岩油纳米孔隙吸附模型;
首先将页岩高岭石纳米孔隙分子模型与多组分页岩油分子模型相组合,形成多组分页岩油纳米孔隙吸附初始模型,通过对多组分页岩油纳米孔隙吸附初始模型进行能量最小化处理消除重叠的原子构型,使得多组分页岩油纳米孔隙吸附初始模型能量最低化后,获取能量最小化状态下的多组分页岩油纳米孔隙吸附初始模型能量,得到能量最小化处理后的多组分页岩油纳米孔隙吸附初始模型;再对能量最小化处理后的多组分页岩油纳米孔隙吸附初始模型进行优化,设置多组分页岩油纳米孔隙吸附初始模型的弛豫步长和弛豫时间,在NVE正则系综下以预设的弛豫步长和弛豫时间对多组分页岩油纳米孔隙吸附初始模型进行弛豫处理,获取多组分页岩油纳米孔隙吸附初始模型稳定状态下的体系温度值并与真实地层环境温度,通过弛豫处理使得多组分页岩油纳米孔隙吸附初始模型稳定状态下的体系温度值与真实地层环境温度相一致,得到多组分页岩油纳米孔隙吸附模型;然后,依次将页岩石英纳米孔隙分子模型、页岩方解石纳米孔隙分子模型和页岩Ⅱ—C型干酪根纳米孔隙分子模型分别与多组分页岩油分子模型相组合,以相同的方式建立石英、方解石、Ⅱ—C型干酪根的多组分页岩油纳米孔隙吸附模型;
步骤1.2、利用分子动力学方法获取平衡态下多组分页岩油在多组分页岩油纳米孔隙吸附的平衡态分子轨迹,并计算各组分页岩油在纳米孔隙中的吸附密度分布;具体过程为:
首先,基于分子动力学方法,以步长为1飞秒运行10纳秒获得平衡态下页岩油在高岭石纳米孔隙中的吸附构型;进一步对平衡态下页岩油在高岭石纳米孔隙中的吸附构型,以维持原模拟条件下继续进行2纳秒模拟,获取密度分布数据,并以步长为500飞秒输出400帧分子轨迹文件并保存;
在模拟获取分析密度分布数据的过程中,将多组分页岩油所在空间沿z方向以0.025nm的间隔建立数据统计箱,按照公式(1)以1飞秒为步长取2000000组多组分页岩油质量分布的平均值;获取页岩油各组分在纳米孔隙中的吸附密度分布曲线;
式中:ρij为页岩油中j组分在第i个数据统计箱内的平均密度;Nij为页岩油中j组分在第i个数据统计箱中的个数;mj为页岩油中j组分的相对分子质量;x为体系x方向尺寸;y为体系y方向尺寸;hi为第i个数据统计箱高度;NA为阿伏伽德罗常数;然后,按照同样的过程生成石英、方解石、Ⅱ—C型干酪根的分子轨迹文件;
步骤1.3、设置页岩油力场参数和纳米孔隙力场参数,计算多组分页岩油各组分与纳米孔隙的相互作用能,获取多组分页岩油各组分相互作用能数据;
页岩油力场参数和纳米孔隙力场参数共包括原子间参数、键参数、角参数;基于获取的纳米孔隙中的吸附构型及分子轨迹文件,首先,删除纳米孔隙中的吸附构型文件中的库伦相互作用参数;然后采取重现分子轨迹的方式,以500飞秒为步长取400组数据的平均值获取各组分页岩油与孔隙范德华相互作用能;以多组分页岩油为基础,统计分类分析多个页岩油藏地质特征;考虑页岩油密度、赋存环境温压条件、纳米孔隙基质四种因素进行上述的分子动力学模拟获取固-液相互作用能数据,该固-液相互作用能数据即为所需的页岩油藏纳米孔隙中代表性流体与代表性孔隙壁面的相互作用能数据,最终形成流体与孔隙壁面相互作用能小样本数据集。
3.根据权利要求1所述页岩油与孔隙壁面相互作用能的数据库智能构建方法,其特征在于,所述步骤2的具体过程为:首先根据多组分页岩油各组分相互作用能数据,基于多组分页岩基质SEM扫描实验获取的孔隙特征;然后,将孔隙壁面对流体的相互作用能按照强弱进行排序,将其映射到0-1区间内,实现孔隙壁面特征的量化。
4.根据权利要求1所述页岩油与孔隙壁面相互作用能的数据库智能构建方法,其特征在于,所述步骤3中,GAN数据增强模型进行数据扩充的过程为:原始输入数据O包括温度、孔径、壁面类型、页岩油组分、压力、相互作用能;GAN数据增强模型首先将原始输入数据O归一化为x1、x2、x3、x4、x5、x6,生成器将原低维向量投影成为与原始数据维度一致的高维向量X1′、X2′、X3′、X4′、X5′、X6′,然后判别器将归一化后的原始数据O与生成的高维向量进行分布相似性判断,经过不断训练生成器和判别器,最终生成分布相似的数据,再经反归一化得到生成数据O',实现对页岩油藏纳米孔隙中流体与孔隙壁面相互作用能数据地扩充,形成与原始数据相似的高质量新样本;
生成器的输入层为Dense层,输入数据的尺寸为输入数据种类乘上批处理大小,并连接LeakyReLU激活函数层;隐藏层为3层Dense层,激活函数为tanh,第1层20个神经元、第2层10个神经元、第3层6个神经元,并最后连接LeakyReLU激活函数层;输出层为Reshape层,将特征值尺寸规范化到6类,完成数据扩充;
判别器的输入层为Flatten层,将所有特征平铺展开;隐藏层为1层Dense层,神经元个数为50个,并连接ReLU激活函数层;输出层为Dense层,神经元个数为1个,并连接ReLU激活函数层,判断输出数据真假。
5.根据权利要求1所述页岩油与孔隙壁面相互作用能的数据库智能构建方法,其特征在于,所述步骤4中,基于全连接神经网络的预测模型包括输入层、隐藏层、输出层和激活函数;输入层为Dense层,负责接收原始数据,输入数据为5个维度,具体包括温度、孔径、壁面类型、页岩油组分、压力,神经元个数为5个;隐藏层是全连接神经网络中的中间层,隐藏层的神经元数量自由设定,每个神经元都与前一层和后一层的所有神经元相连接,设定隐藏层为5层Dense层,前4层激活函数为tanh,最后一层不加入激活函数,每层神经元个数为20个;输出层是全连接神经网络的最后一层,负责输出网络的预测结果,预测结果为相互作用能,设定输出层为1层Dense层,神经元个数为1个。
6.根据权利要求1所述页岩油与孔隙壁面相互作用能的数据库智能构建方法,其特征在于,所述步骤5中,将GAN数据增强模型扩充的数据集划分为训练集和验证集两个不相交的集合,首先用训练集训练相互作用能预测模型,然后使用该预测模型对验证集的相互作用能进行预测,评估训练完成的模型;通过训练完成的预测模型进行相互作用能预测,对GAN数据增强模型没有覆盖的区域进行数据补全,进而构建完整的相互作用能数据库;
选择均方误差MSE进行模型评估,并取其平均值作为评价最终模型的性能指标;MSE的计算方式为:
其中,h(xi)为模型预测值,yi为真实值,i表示第i个样本,n表示样本总个数。
7.根据权利要求1所述页岩油与孔隙壁面相互作用能的数据库智能构建方法,其特征在于,所述步骤5中,基于MATLAB建立了可视化软件系统:页岩系统,页岩系统包括3个功能模块:基本物性数据库模块、固液相互作用强度数据库模块、状态方程模块;其中,基本物性数据库模块用于查询不同产地页岩油和储层的相关物性,并对储层岩心进行了SEM扫描电镜图像可视化;固液相互作用强度数据库模块,针对不同流体性质、孔隙壁面性质和储层条件,定量化表征固相相互作用的相互作用能、平均力势和数密度分布,并对微观模型进行了可视化;状态方程模块,基于PR状态方程,实现单组分纯物质和双组份二元混合物的压缩系数和逸度系数的计算;该页岩系统通过以上3种功能模块,初步评价页岩油的可动性、储层性质的优劣以及流体状态参数的计算。
8.根据权利要求7所述页岩油与孔隙壁面相互作用能的数据库智能构建方法,其特征在于,所述基本物性数据库模块中,通过选择页岩油来源,自动显示页岩油基本物性和储层岩石基本物性;页岩油基本物性包括页岩油密度、页岩油组成和页岩油碳数分布,页岩油碳数分布为横坐标为碳原子个数,纵坐标为质量分数的曲线图;储层岩石基本物性包括TOC含量、有机质类型、孔隙类型、孔隙度和主要矿物含量,并对储层岩石SEM扫描电镜图像进行了可视化;
所述固液相互作用强度数据库模块中,包括流体性质、纳米孔隙的壁面性质、储层条件、流体和壁面对象的PMF展示、PMF分布、数密度分布;流体性质包括轻质、中质和重质组分的质量分数;纳米孔隙的壁面性质包括上下不同的壁面类型;储层条件包括页岩油的温度和压力,以及狭缝孔的孔径大小;流体和壁面对象的PMF展示中,根据设置的流体类型、壁面类型、上下壁面的吸附能展示当前PMF立体图;PMF分布、数密度分布均为曲线图设置;
所述状态方程模块中,包括组分1和组分2两组单组分纯物质相关参数、温度、压力、组分1的摩尔分数、组分2的摩尔分数、压缩因子、相态、逸度系数;每组单组分纯物质相关参数均包括临界温度、临界压力、偏心因子;状态方程模块既能进行单组分纯物质相关参数计算,也能进行双组分二元混合物相关参数计算;在单组分纯物质相关参数计算中,首先设置组分1中的临界温度、临界压力、偏心因子的参数值,组分2中的临界温度、临界压力、偏心因子的参数值均设置为0,然后设置待计算状态的温度和压力值,最后计算得到压缩因子、逸度系数以及物质所处的相态;组分1的摩尔分数、组分2的摩尔分数也均设置为0;在双组分二元混合物相关参数计算中,分别设置组分1和组分2中的临界温度、临界压力和偏心因子参数,并设置组分1和组分2各自的摩尔分数值,然后设定待计算状态的温度和压力值,经过计算得到组分1和组分2的压缩因子、逸度系数以及物质所处的相态。
CN202310647412.3A 2023-06-02 2023-06-02 一种页岩油与孔隙壁面相互作用能的数据库智能构建方法 Pending CN116884537A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310647412.3A CN116884537A (zh) 2023-06-02 2023-06-02 一种页岩油与孔隙壁面相互作用能的数据库智能构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310647412.3A CN116884537A (zh) 2023-06-02 2023-06-02 一种页岩油与孔隙壁面相互作用能的数据库智能构建方法

Publications (1)

Publication Number Publication Date
CN116884537A true CN116884537A (zh) 2023-10-13

Family

ID=88268705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310647412.3A Pending CN116884537A (zh) 2023-06-02 2023-06-02 一种页岩油与孔隙壁面相互作用能的数据库智能构建方法

Country Status (1)

Country Link
CN (1) CN116884537A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117117923A (zh) * 2023-10-19 2023-11-24 深圳市百酷新能源有限公司 一种基于大数据的储能控制并网管理方法及系统
CN117763213A (zh) * 2023-12-25 2024-03-26 哈尔滨工业大学 一种沥青黏弹构效关系模型的可视化界面建立方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117117923A (zh) * 2023-10-19 2023-11-24 深圳市百酷新能源有限公司 一种基于大数据的储能控制并网管理方法及系统
CN117117923B (zh) * 2023-10-19 2024-04-05 深圳市百酷新能源有限公司 一种基于大数据的储能控制并网管理方法及系统
CN117763213A (zh) * 2023-12-25 2024-03-26 哈尔滨工业大学 一种沥青黏弹构效关系模型的可视化界面建立方法

Similar Documents

Publication Publication Date Title
CN116884537A (zh) 一种页岩油与孔隙壁面相互作用能的数据库智能构建方法
Yang et al. Research and applications of artificial neural network in pavement engineering: a state-of-the-art review
Thanh et al. Knowledge-based machine learning techniques for accurate prediction of CO2 storage performance in underground saline aquifers
Daolun et al. Physics-constrained deep learning for solving seepage equation
Zhang et al. Recent advances in molecular simulation of oil shale kerogen
CN111694856A (zh) 储层敏感性智能预测方法及装置
Jiang et al. Review of shale gas transport prediction: Basic theory, numerical simulation, application of ai methods, and perspectives
Pan et al. Machine learning-based shale wettability prediction: Implications for H2, CH4 and CO2 geo-storage
Yu et al. Analysis of factors of productivity of tight conglomerate reservoirs based on random forest algorithm
Guo et al. Optimization of fracturing parameters for tight oil production based on genetic algorithm
Huang et al. Adsorption and modification behavior of single atoms on the surface of single vacancy graphene: Machine learning accelerated first principle computations
CN111694855B (zh) 储层敏感性智能预测数据处理方法及装置
MolaAbasi et al. Use of GMDH-type neural network to model the mechanical behavior of a cement-treated sand
Yang Analysis of the Impacts of Open Residential Communities on Road Traffic Based on AHP and Fuzzy Theory.
Luo et al. Semi-supervised least squares support vector machine algorithm: application to offshore oil reservoir
Ji et al. Rapid evaluation of capillary pressure and relative permeability for oil–water flow in tight sandstone based on a physics-informed neural network
Al-Jifri et al. New proxy models for predicting oil recovery factor in waterflooded heterogeneous reservoirs
Sun et al. Real-time updating method of local geological model based on logging while drilling process
Irfan et al. Artificial neural network (ANN) modeling for CO2 adsorption on Marcellus Shale
Li et al. Molecular Simulation of CH 4 Nanoscale Behavior and Enhanced Gas Recovery in Organic-Rich Shale
Simeski et al. Corrosive influence of carbon dioxide on crack initiation in quartz: Comparison with liquid water and vacuum environments
Hou et al. Prediction of Fracturing Pressure and Parameter Evaluations at Field Practical Scales
Shakouri et al. Modeling of asphaltic sludge formation during acidizing process of oil well reservoir using machine learning methods
Yu et al. Studies on natural gas production prediction and risk quantification of Sinian gas reservoir in Sichuan Basin
CN110568149B (zh) 沉积盆地烃源岩生排烃史精细快速定量模拟方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination