CN117935971B - 基于图神经网络的深层钻井液处理剂性能预测评价方法 - Google Patents
基于图神经网络的深层钻井液处理剂性能预测评价方法 Download PDFInfo
- Publication number
- CN117935971B CN117935971B CN202410333870.4A CN202410333870A CN117935971B CN 117935971 B CN117935971 B CN 117935971B CN 202410333870 A CN202410333870 A CN 202410333870A CN 117935971 B CN117935971 B CN 117935971B
- Authority
- CN
- China
- Prior art keywords
- drilling fluid
- chemical additive
- model
- graph
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005553 drilling Methods 0.000 title claims abstract description 108
- 239000012530 fluid Substances 0.000 title claims abstract description 102
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 21
- 238000011156 evaluation Methods 0.000 title claims abstract description 19
- 239000000126 substance Substances 0.000 claims abstract description 99
- 239000000654 additive Substances 0.000 claims abstract description 76
- 230000000996 additive effect Effects 0.000 claims abstract description 67
- 238000012549 training Methods 0.000 claims abstract description 25
- 238000003062 neural network model Methods 0.000 claims abstract description 23
- 238000000034 method Methods 0.000 claims abstract description 14
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims description 48
- 238000012360 testing method Methods 0.000 claims description 17
- 238000013210 evaluation model Methods 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 8
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 3
- 150000003839 salts Chemical class 0.000 claims description 3
- 239000004033 plastic Substances 0.000 claims description 2
- 229920003023 plastic Polymers 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims 1
- 238000011161 development Methods 0.000 abstract description 8
- 239000007788 liquid Substances 0.000 abstract description 3
- 229920000642 polymer Polymers 0.000 description 8
- 239000003921 oil Substances 0.000 description 6
- 239000000463 material Substances 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- -1 tackifier Substances 0.000 description 4
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 3
- 239000004698 Polyethylene Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000013043 chemical agent Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 229920000573 polyethylene Polymers 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000009477 glass transition Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002052 molecular layer Substances 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229920002907 Guar gum Polymers 0.000 description 1
- 229920002319 Poly(methyl acrylate) Polymers 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 229920001807 Urea-formaldehyde Polymers 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- GZCGUPFRVQAUEE-SLPGGIOYSA-N aldehydo-D-glucose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-SLPGGIOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 239000000665 guar gum Substances 0.000 description 1
- 235000010417 guar gum Nutrition 0.000 description 1
- 229960002154 guar gum Drugs 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 230000001050 lubricating effect Effects 0.000 description 1
- 229920001495 poly(sodium acrylate) polymer Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- NNMHYFLPFNGQFZ-UHFFFAOYSA-M sodium polyacrylate Chemical compound [Na+].[O-]C(=O)C=C NNMHYFLPFNGQFZ-UHFFFAOYSA-M 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 239000000230 xanthan gum Substances 0.000 description 1
- 229920001285 xanthan gum Polymers 0.000 description 1
- 235000010493 xanthan gum Nutrition 0.000 description 1
- 229940082509 xanthan gum Drugs 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于图神经网络的深层钻井液处理剂性能预测评价方法,属钻井化学技术领域。方法包括:获取大量钻井液化学添加剂样本,构建钻井液化学添加剂数据集;构建图神经网络模型,利用钻井液化学添加剂数据集,完成模型训练;输入待预测的钻井液化学添加剂,得到其性能预测与评价结果。本发明实现了基于分子结构及其性质预测及评价钻井液化学添加剂的性能,在保证了一定预测准确性的同时,大幅度提高了钻井液化学添加剂的研制效率,降低了成本。为深层油气开发提供了高效技术支持。
Description
技术领域
本发明涉及基于图神经网络的深层钻井液处理剂性能预测评价方法,属于钻井化学技术领域。
背景技术
随着常规易开采油气资源的逐渐枯竭,油气开发正逐渐向深层发展。我国深层油气资源储量大,开发程度低。我国原油对外依存度很高,开发深层油气资源对保障国家能源安全具有重大意义。钻井液在钻井过程中起着冲洗井底、携带岩屑、平衡地层压力、冷却与润滑钻头、稳定井壁、传递功率等重要作用。深层油气埋藏深、温度高、压力高,易发生井漏、井塌、井喷、卡钻等事故,储层损害严重,这对钻井液提出了很高的要求,必须研制出相应的钻井液添加剂使钻井液满足所需性能。
钻井液处理剂可以调节钻井液性能,包括增粘剂、降滤失剂、润滑剂等。钻井液处理剂的好坏直接决定了钻井液的性能,因此,研制深层钻井液也就是研制相应的钻井液处理剂。目前钻井液处理剂的研制主要靠人工合成筛选的方法,合成过程较为繁琐,效率低,且成功率低,成本较高。
现有技术中,针对于利用神经网络来进行钻井液配方预测的,都未涉及到分子层面,仅通过对现有的配方数据进行学习预测,而钻井液成分复杂,钻井液化学添加剂种类多、加量少、但对性质影响显著。现有的技术未充分考虑钻井液处理剂对性能的影响,得到的预测结果可靠性不高。利用图神经网络对分子性能进行预测已有较多应用,但大多数预测的是分子本身的性质,如聚合物本身的介电常数、玻璃化转变温度、分子的亲核性、亲电性等。没有文献利用图神经网络来预测钻井液化学添加剂的性能,且钻井液的性能并非分子本身的性质,无法直接利用分子本身的性质(介电常数、玻璃化转变温度、亲核性、亲电性等)直接判断其作为钻井液化学添加剂的性能优劣。
发明内容
针对现有技术的不足,本发明提供一种基于图神经网络的深层钻井液处理剂性能预测评价方法,从分子层面考虑了钻井液化学添加剂对钻井液性质的影响,以解决目前研制钻井液化学添加剂过程中效率低、成功率低、成本高等问题,大大提高了预测结果的可靠性。
本发明的技术方案如下:
基于图神经网络的深层钻井液处理剂性能预测评价方法,包括以下步骤:
S1:获取大量钻井液化学添加剂样本,构建钻井液化学添加剂数据集;
S2:构建图神经网络模型,利用钻井液化学添加剂数据集,完成模型训练;
S3:输入待预测的钻井液化学添加剂,得到其性能预测与评价结果。
优选的,步骤S1中,所述钻井液化学添加剂样本,包括钻井液化学添加剂的结构和相关性质;
所述的钻井液化学添加剂结构,采用SMILES字符串表示,SMILES字符串用于表示化学分子的图结构,SMILES字符串包括一系列字符,字符分别代表了分子中的原子、化学键、电荷、构型信息;
所述的钻井液化学添加剂相关性质,具体包括以下参数的一种或多种:分子量、溶解度、粘度、动切力、滤失量、pH值、钻井液密度、摩阻系数、抗盐能力、抗温能力。
钻井液化学添加剂样本数据,可以从文献中、现有资料中或实验等方法获得,但需要保证不同数据来源之间的数据有一致性和可对比性。
进一步优选的,钻井液化学添加剂的分子量统一使用数均分子量、重均分子量、粘均分子量、Z均分子量中的一种;钻井液化学添加剂的粘度统一采用表观粘度、塑性粘度、漏斗粘度中的一种。
优选的,步骤S2中,所述图神经网络模型包括图嵌入层、正则化层、图卷积层、图池化层、全连接层、输入输出层;图嵌入层将节点特征和边特征映射到一个低维空间,从而更好的捕捉节点之间的相似关系,提高模型对复杂关系的建模能力;正则化层通过标准化和随机丢弃过程,防止模型出现过拟合,提高模型的泛化性能;图卷积层通过提取数据的局部特征,降低模型复杂度,提高模型的建模能力;图池化层通过降低数据维度,减少模型中的参数数量和复杂度,增强模型的泛化能力;全连接层的每个神经元都与前一层的神经元相连,捕捉其之前的全部特征,完成特征融合,实现模型预测;输入输出层用来输入和输出数据。
图神经网络是一种基于图结构的深度学习模型,图是一种包含节点和连接各节点的边组成的一种数据结构,图神经网络的核心是通过学习捕捉各节点之间的相互关系来获取图的结构与特征,从而可以不规则、复杂的图数据。
图神经网络在化学领域有较大的应用空间,图神经网络将化学分子结构看作图,原子作为图的节点,化学键为图的边,从而可以学习分子结构特征,在分子层面对其性质做出预测。
优选的,步骤S2中,利用钻井液化学添加剂数据集训练图神经网络模型前,对数据预处理;包括将钻井液化学添加剂的SMILES字符串解析转换为分子图,分子图中,原子表示为节点,化学键表示为边;将钻井液化学添加剂相关性质作为额外的节点整合到图的节点特征中;将整合好的图作为输入传入图神经网络模型。
进一步优选的,在输入图神经网络模型之前,将整合好的图转换为可输入至图神经网络模型的特征矩阵,特征矩阵包括节点特征矩阵、边特征矩阵和连接矩阵;节点特征矩阵用于表示原子的相关性质,如电荷、原子半径;边特征矩阵用于表示化学键的相关性质,如化学键类型、键级、键长、键能;连接矩阵表示不同原子之间是否存在化学键。
进一步优选的,图可表示为G = (X, E, A),其中X为节点特征矩阵,E为边特征矩阵,A为连接矩阵;
节点特征矩阵X可表示为:X = [x 1 , x 2 , …, x i ,…, x N ] T ,其中x i 为第i个节点的特征,N为节点数;
边特征矩阵E可表示为:,其中e ij 为节点x i 和节点x j 之间的边的特征,i范围为1-N,j范围为1-N,N为节点数;
连接矩阵A可表示为:,若节点x i 与节点x j 之间存在边,则= 1,否则为0。
进一步优选的,将数据集划分为训练集、验证集、测试集,完成图神经网络模型的训练,将训练集的数据传入未训练的初始图神经网络模型中,不断迭代训练,利用验证集评估模型性能,计算均方误差MSE和决定系数R2;
,其中/>表示样本数量,/>表示第i个样本的预测值,表示第i个样本的真实值;
MSE反映了模型的预测结果与真实值之间的差异,MSE越小则模型性能越好;
,其中/>表示样本数量,/>表示第i个样本的预测值,表示第i个样本的真实值,/>表示样本的均值;
R2反映了回归模式说明因变量变化可靠程度,R2越接近1则模型性能越好。
当均方误差MSE和决定系数R2均达到设定的阈值时,模型训练结束;
最后利用测试集测试模型的性能,在测试集上计算模型最终的均方误差MSE和决定系数R2,得到深层钻井液化学添加剂性能预测评价模型。
进一步优选的,按照训练集:验证集:测试集=0.8:0.1:0.1的比例划分数据集。
优选的,步骤S3中,首先确定待预测钻井液化学添加剂结构,并将其转换为SMILES字符串;
其中待预测钻井液化学添加剂可以根据需要人工设计,或利用计算机批量生成,从而实现某种材料的性能预测或大规模的材料筛选。
将SMILES字符串转换为分子图进而转化为可输入至模型的矩阵形式,输入至深层钻井液化学添加剂性能预测评价模型,得到钻井液化学添加剂的预测评价结果。
本发明的有益效果在于:
通过深度学习的方法,在分子层面,基于分子结构及其性质实现钻井液化学添加剂的性能预测及评价,在保证了一定预测准确性的同时,大幅度提高了钻井液化学添加剂的研制效率,降低了成本,为深层油气开发提供了高效技术支持。
附图说明
图1为本发明的流程图;
图2为本发明用于筛选预测深层钻井液增粘剂的数据集构建流程图;
图3为丙烯酰胺分子的SMILES字符串实例;
图4为聚乙烯分子的SMILES字符串实例;
图5为本发明基于图神经网络的深层钻井液化学添加剂性能预测评价模型的构建流程图;
图6为本发明利用基于图神经网络的深层钻井液化学添加剂性能预测评价模型实现钻井液化学添加剂性能预测及评价流程图;
图7为实施例1中训练集试所得的模型性能评价图。
具体实施方式
下面通过实施例并结合附图对本发明做进一步说明,但不限于此。本发明未详尽说明的,均按本领域常规技术。
实施例
基于图神经网络的深层钻井液处理剂性能预测评价方法,如图1所示,包括以下步骤:
S1:获取大量钻井液化学添加剂样本,构建钻井液化学添加剂数据集;在现有资料、文献中,获取大量钻井液增粘剂或具有增粘作用的化学剂样本数据。
所述钻井液化学添加剂样本,包括钻井液化学添加剂的结构和相关性质;所述的钻井液化学添加剂结构,采用SMILES字符串表示,SMILES字符串用于表示化学分子的图结构,SMILES字符串包括一系列字符,字符分别代表了分子中的原子、化学键、电荷、构型信息;可以用于表示化学分子的图结构。以丙烯酰胺为例,丙烯酰胺的SMILES字符串如图3所示。对于聚合物结构,用SMILES字符串表示其链节结构,用分隔符[*]分割聚合物的链节。以聚乙烯为例,聚乙烯的SMILES字符串如图4所示。
所述的钻井液化学添加剂相关性质,具体包括以下参数的一种或多种:分子量、溶解度、粘度、动切力、滤失量、pH值、钻井液密度、摩阻系数、抗盐能力、抗温能力。
将各化学剂的SMILES字符串与其性质一一相对应,即完成了用于筛选预测深层钻井液增粘剂的数据集构建。
其中,分子量统一为粘均分子量。粘度统一采用表观粘度,粘度单位为mPa·s。
获取样本数据后首先检查是否符合上述标准,将不符合的数值空缺,后续通过实验方法补充。如图2所示。
对于不同来源的样本数据要保证其一致性与可对比性,不符合的数据应当整条删除或空缺留待后续补充。
补充样本中缺失的实验数据步骤如下;
获取到的样本数据部分缺少分子量,部分缺少0.1%质量分数水溶液的粘度数据。缺少分子量的样本均属于聚合物,因此用乌氏粘度计测量其特性粘度,进而获得聚合物的粘均分子量。用旋转粘度计测定0.1%质量分数水溶液的粘度数据。
S2:构建图神经网络模型,利用钻井液化学添加剂数据集,完成模型训练;
所述图神经网络模型包括图嵌入层、正则化层、图卷积层、图池化层、全连接层、输入输出层;图嵌入层将节点特征和边特征映射到一个低维空间,从而更好的捕捉节点之间的相似关系,提高模型对复杂关系的建模能力;正则化层通过标准化和随机丢弃过程,防止模型出现过拟合,提高模型的泛化性能;图卷积层通过提取数据的局部特征,降低模型复杂度,提高模型的建模能力;图池化层通过降低数据维度,减少模型中的参数数量和复杂度,增强模型的泛化能力;全连接层的每个神经元都与前一层的神经元相连,捕捉其之前的全部特征,完成特征融合,实现模型预测;输入输出层用来输入和输出数据。
图神经网络是一种基于图结构的深度学习模型,图是一种包含节点和连接各节点的边组成的一种数据结构,图神经网络的核心是通过学习捕捉各节点之间的相互关系来获取图的结构与特征,从而可以不规则、复杂的图数据。图神经网络将化学分子结构看作图,原子作为图的节点,化学键为图的边,从而可以学习分子结构特征,在分子层面对其性质做出预测。
利用钻井液化学添加剂数据集训练图神经网络模型前,对数据预处理;包括将钻井液化学添加剂的SMILES字符串解析转换为分子图,分子图中,原子表示为节点,化学键表示为边;将钻井液化学添加剂相关性质作为额外的节点整合到图的节点特征中;将整合好的图转换为可输入至图神经网络模型的特征矩阵,特征矩阵包括节点特征矩阵、边特征矩阵和连接矩阵;节点特征矩阵用于表示原子的相关性质,如电荷、原子半径;边特征矩阵用于表示化学键的相关性质,如化学键类型、键级、键长、键能;连接矩阵表示不同原子之间是否存在化学键。然后作为输入传入图神经网络模型。
图可表示为G = (X,E,A),其中X为节点特征矩阵,E为边特征矩阵,A为连接矩阵,分别对应节点特征、边特征以及它们之间的连接关系。
节点特征矩阵X可表示为:X = [x 1 , x 2 , …, x i …, x N ] T ,其中x i 为第i个节点的特征,i取1-N,N为节点数;
边特征矩阵E可表示为:,其中e ij 为节点x i 和节点x j 之间的边的特征,i范围为1-N,j范围为1-N,N为节点数;
连接矩阵A可表示为:,若节点x i 与节点x j 之间存在边,则/>= 1,否则为0。
将数据集划分为训练集、验证集、测试集,利用数据集完成图神经网络模型的训练。
按照训练集:验证集:测试集=0.8:0.1:0.1的比例划分数据集。将划分好的训练集的数据传入未训练的初始图神经网络模型中,不断迭代训练,利用验证集评估模型性能,计算均方误差MSE和决定系数R2;
,其中/>表示样本数量,/>表示第i个样本的预测值,/>表示第i个样本的真实值;
MSE反映了模型的预测结果与真实值之间的差异,MSE越小则模型性能越好;
,其中/>表示样本数量,/>表示第i个样本的预测值,表示第i个样本的真实值,/>表示样本的均值;
R2反映了回归模式说明因变量变化可靠程度,R2越接近1则模型性能越好。
当均方误差MSE和决定系数R2均达到设定的阈值时,模型训练结束;
最后利用测试集测试模型的性能,在测试集上计算模型最终的均方误差MSE和决定系数R2,得到深层钻井液化学添加剂性能预测评价模型。如图5所示。
S3:输入待预测的钻井液化学添加剂,得到其性能预测与评价结果。
首先确定待预测钻井液化学添加剂结构,并将其转换为SMILES字符串;待预测的钻井液化学添加剂可以根据需要人工设计,或利用计算机批量生成,从而实现某种材料的性能预测或大规模的材料筛选。
将SMILES字符串转换为分子图进而转化为可输入至模型的矩阵形式,输入至深层钻井液化学添加剂性能预测评价模型,输入完成之后,模型将给出所输入的钻井液化学添加剂性能的预测及评价,得到钻井液化学添加剂的预测评价结果。如图6所示。
本实施例所采用的数据集通过实验方法获得,共计163条钻井液增粘剂数据,利用测试集测试所得的模型性能如图7所示。
利用本实施例获得的钻井液化学添加剂模型预测部分聚合物的粘度,随后利用实验测定其实际粘度,计算预测所得的相对误差,结果如表1所示。
表1利用模型预测聚合物粘度的相对误差
聚合物名称 | 相对误差 |
聚乙二醇 | 6.8% |
聚丙烯酰胺 | 8.3% |
聚丙烯酸钠 | 7.5% |
聚丙烯酸甲酯 | 8.8% |
黄原胶 | 10.5% |
瓜尔胶 | 9.4% |
羧甲基纤维素钠 | 12.3% |
尿素甲醛树脂 | 14.2% |
由图7和表1可知,训练所得的深层钻井液化学添加剂性能预测评价模型相对误差较小,模型的预测准确率较高。因此,深层钻井液化学添加剂性能预测评价模型可以辅助深层钻井液化学添加剂的研发,降低成本,大幅度提高研发效率。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (2)
1.基于图神经网络的深层钻井液处理剂性能预测评价方法,其特征在于,包括以下步骤:
S1:获取大量钻井液化学添加剂样本,构建钻井液化学添加剂数据集;
所述钻井液化学添加剂样本,包括钻井液化学添加剂的结构和相关性质;
所述的钻井液化学添加剂结构,采用SMILES字符串表示,SMILES字符串用于表示化学分子的图结构,SMILES字符串包括一系列字符,字符分别代表了分子中的原子、化学键、电荷、构型信息;
所述的钻井液化学添加剂相关性质,具体包括以下参数的一种或多种:分子量、溶解度、粘度、动切力、滤失量、pH值、钻井液密度、摩阻系数、抗盐能力、抗温能力;
钻井液化学添加剂的分子量统一使用数均分子量、重均分子量、粘均分子量、Z均分子量中的一种;钻井液化学添加剂的粘度统一采用表观粘度、塑性粘度、漏斗粘度中的一种;
S2:构建图神经网络模型,利用钻井液化学添加剂数据集,完成模型训练;
所述图神经网络模型包括图嵌入层、正则化层、图卷积层、图池化层、全连接层、输入输出层;图嵌入层将节点特征和边特征映射到一个低维空间;正则化层通过标准化和随机丢弃过程,防止模型出现过拟合;图卷积层提取数据的局部特征;图池化层降低数据维度;全连接层的每个神经元都与前一层的神经元相连,捕捉其之前的全部特征,完成特征融合,实现模型预测;输入输出层用来输入和输出数据;
利用钻井液化学添加剂数据集训练图神经网络模型前,对数据预处理;包括将钻井液化学添加剂的SMILES字符串解析转换为分子图,分子图中,原子表示为节点,化学键表示为边;将钻井液化学添加剂相关性质作为额外的节点整合到图的节点特征中;将整合好的图作为输入传入图神经网络模型;
在输入图神经网络模型之前,将整合好的图转换为可输入至图神经网络模型的特征矩阵,特征矩阵包括节点特征矩阵、边特征矩阵和连接矩阵;节点特征矩阵用于表示原子的相关性质,包括电荷、原子半径;边特征矩阵用于表示化学键的相关性质,包括化学键类型、键级、键长、键能;连接矩阵表示不同原子之间是否存在化学键;
图表示为G = (X, E, A),其中X为节点特征矩阵,E为边特征矩阵,A为连接矩阵;
节点特征矩阵X表示为:X = [x 1 , x 2 , …,x i ,…, x N ] T ,其中x i 为第i个节点的特征,N为节点数;
边特征矩阵E表示为:,其中e ij 为节点x i 和节点x j 之间的边的特征,i范围为1-N,j范围为1-N,N为节点数;
连接矩阵A表示为:;若节点x i 与节点x j 之间存在边,则/>= 1,否则为0;
将数据集划分为训练集、验证集、测试集,将训练集的数据传入未训练的初始图神经网络模型中,不断迭代训练,利用验证集评估模型性能,计算均方误差MSE和决定系数R2;
,其中/>表示样本数量,/>表示第i个样本的预测值,/>表示第i个样本的真实值;
,其中/>表示样本数量,/>表示第i个样本的预测值,/>表示第i个样本的真实值,/>表示样本的均值;
当均方误差MSE和决定系数R2均达到设定的阈值时,模型训练结束;
最后利用测试集测试模型的性能,在测试集上计算模型最终的均方误差MSE和决定系数R2,得到深层钻井液化学添加剂性能预测评价模型;
S3:输入待预测的钻井液化学添加剂,得到其性能预测与评价结果;
首先确定待预测钻井液化学添加剂结构,并将其转换为SMILES字符串;
将SMILES字符串转换为分子图进而转化为可输入至模型的矩阵形式,输入至深层钻井液化学添加剂性能预测评价模型,得到钻井液化学添加剂的预测评价结果。
2.根据权利要求1所述的基于图神经网络的深层钻井液处理剂性能预测评价方法,其特征在于,按照训练集:验证集:测试集=0.8:0.1:0.1的比例划分数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410333870.4A CN117935971B (zh) | 2024-03-22 | 2024-03-22 | 基于图神经网络的深层钻井液处理剂性能预测评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410333870.4A CN117935971B (zh) | 2024-03-22 | 2024-03-22 | 基于图神经网络的深层钻井液处理剂性能预测评价方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117935971A CN117935971A (zh) | 2024-04-26 |
CN117935971B true CN117935971B (zh) | 2024-06-21 |
Family
ID=90764974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410333870.4A Active CN117935971B (zh) | 2024-03-22 | 2024-03-22 | 基于图神经网络的深层钻井液处理剂性能预测评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117935971B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114220497A (zh) * | 2021-12-14 | 2022-03-22 | 中国科学院过程工程研究所 | 一种基于迁移学习和图神经网络的离子液体型抗生素的药性预测方法及高通量筛选平台 |
CN116343943A (zh) * | 2023-02-28 | 2023-06-27 | 江西师范大学 | 基于图神经网络编码离子液体特征的方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107228890B (zh) * | 2017-06-19 | 2019-07-23 | 山东师范大学 | 一种泡沫石墨烯化学传感器对化学有机溶剂的识别方法 |
US11651841B2 (en) * | 2019-05-15 | 2023-05-16 | International Business Machines Corporation | Drug compound identification for target tissue cells |
EP4081932A4 (en) * | 2019-12-23 | 2023-06-14 | The Regents of the University of California | METHOD AND SYSTEM FOR DIGITAL STAINING OF MICROSCOPY IMAGES USING DEPTH LEARNING |
CN113257369B (zh) * | 2021-05-18 | 2022-08-30 | 南京邮电大学 | 一种基于多任务图神经网络的分子毒性预测方法和装置 |
CN114822718B (zh) * | 2022-03-25 | 2024-04-09 | 云南大学 | 基于图神经网络的人体口服生物利用度预测方法 |
CN115148302A (zh) * | 2022-05-18 | 2022-10-04 | 上海天鹜科技有限公司 | 一种基于图神经网络与多任务学习的化合物性质预测方法 |
CN115274008A (zh) * | 2022-08-08 | 2022-11-01 | 苏州创腾软件有限公司 | 基于图神经网络的分子性质预测方法和系统 |
CN115346619A (zh) * | 2022-08-19 | 2022-11-15 | 杭州电子科技大学 | 一种基于图神经网络的高分子海水淡化膜的设计方法 |
CN115497576B (zh) * | 2022-11-17 | 2023-04-07 | 苏州创腾软件有限公司 | 基于图神经网络的聚合物性质预测方法和系统 |
CN116504333A (zh) * | 2022-12-06 | 2023-07-28 | 四川大学 | 一种基于深层图神经网络的分子表示方法及系统 |
CN115938501A (zh) * | 2022-12-07 | 2023-04-07 | 华东师范大学 | 基于图卷积神经网络预测小分子化合物溶剂化能的方法 |
CN115798629A (zh) * | 2022-12-28 | 2023-03-14 | 哈尔滨理工大学 | 一种基于图神经网络的可解释性分子性质预测方法及系统 |
CN117393060A (zh) * | 2023-10-13 | 2024-01-12 | 中国科学院生态环境研究中心 | 挥发性有机物大气氧化反应速率常数预测模型的建立方法 |
-
2024
- 2024-03-22 CN CN202410333870.4A patent/CN117935971B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114220497A (zh) * | 2021-12-14 | 2022-03-22 | 中国科学院过程工程研究所 | 一种基于迁移学习和图神经网络的离子液体型抗生素的药性预测方法及高通量筛选平台 |
CN116343943A (zh) * | 2023-02-28 | 2023-06-27 | 江西师范大学 | 基于图神经网络编码离子液体特征的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117935971A (zh) | 2024-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101560879B (zh) | 用于低渗透气藏的试井分析控制系统及方法 | |
CN108229811B (zh) | 一种评价碳酸盐岩缝洞型油藏注水效果的方法 | |
CN111911115A (zh) | 一种页岩气井动态配产方法 | |
CN107895092A (zh) | 一种基于复杂非线性注采建模的井间连通定量评价方法 | |
CN117935971B (zh) | 基于图神经网络的深层钻井液处理剂性能预测评价方法 | |
CN107291667A (zh) | 一种井间连通程度确定方法及系统 | |
CN109063403B (zh) | 一种滑溜水压裂优化设计方法 | |
CN114004999A (zh) | 一种基于机器学习的钻井液流变参数实时测量方法 | |
CN116644284A (zh) | 一种地层分类特征因子确定方法、系统、电子设备及介质 | |
CN114460639B (zh) | 页岩油储层渗透率的预测方法及装置 | |
CN117648573A (zh) | 基于元素录井数据和综合录井数据的地层可钻性预测方法 | |
CN112943160A (zh) | 一种油井化学堵水效果的评价方法 | |
CN110909451A (zh) | 一种基于神经网络的原油切水方法及系统 | |
CN112855127A (zh) | 气井积液识别方法及装置 | |
CN114562236B (zh) | 一种基于集成学习模型的地质工程一体化井漏实时预警方法 | |
CN112488805B (zh) | 基于多元回归时间序列分析的长租市场预警方法 | |
CN116307670A (zh) | 一种基于双向长短期记忆网络的油气井溢漏风险监测方法及系统 | |
CN112834404A (zh) | 页岩储层的产气能力的确定方法和装置 | |
CN113627067A (zh) | 一种用于预测断溶体油层产能的方法及系统 | |
CN113051305A (zh) | 一种堵漏材料粒径优选方法及电子设备 | |
CN112329345B (zh) | 超稠油油砂储层微压裂改造储层连通性判断方法及系统 | |
CN110400093A (zh) | 页岩油工业价值等级评价方法、装置及电子设备 | |
CN117575106B (zh) | 一种煤层气井产气剖面预测方法、系统、电子设备及介质 | |
CN116906025B (zh) | 一种采油工程生产异常诊断装置 | |
CN111159907B (zh) | 一种暴雨作用下的边坡模拟方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |