CN117935971B

CN117935971B - 基于图神经网络的深层钻井液处理剂性能预测评价方法

Info

Publication number: CN117935971B
Application number: CN202410333870.4A
Authority: CN
Inventors: 金家锋; 宋立德; 孙金声; 吕开河; 张帆; 张洁; 刘锋报; 白英睿; 王金堂
Original assignee: China University of Petroleum East China
Current assignee: China University of Petroleum East China
Priority date: 2024-03-22
Filing date: 2024-03-22
Publication date: 2024-06-21
Anticipated expiration: 2044-03-22
Also published as: CN117935971A

Abstract

本发明公开了基于图神经网络的深层钻井液处理剂性能预测评价方法，属钻井化学技术领域。方法包括：获取大量钻井液化学添加剂样本，构建钻井液化学添加剂数据集；构建图神经网络模型，利用钻井液化学添加剂数据集，完成模型训练；输入待预测的钻井液化学添加剂，得到其性能预测与评价结果。本发明实现了基于分子结构及其性质预测及评价钻井液化学添加剂的性能，在保证了一定预测准确性的同时，大幅度提高了钻井液化学添加剂的研制效率，降低了成本。为深层油气开发提供了高效技术支持。

Description

基于图神经网络的深层钻井液处理剂性能预测评价方法

技术领域

本发明涉及基于图神经网络的深层钻井液处理剂性能预测评价方法，属于钻井化学技术领域。

背景技术

随着常规易开采油气资源的逐渐枯竭，油气开发正逐渐向深层发展。我国深层油气资源储量大，开发程度低。我国原油对外依存度很高，开发深层油气资源对保障国家能源安全具有重大意义。钻井液在钻井过程中起着冲洗井底、携带岩屑、平衡地层压力、冷却与润滑钻头、稳定井壁、传递功率等重要作用。深层油气埋藏深、温度高、压力高，易发生井漏、井塌、井喷、卡钻等事故，储层损害严重，这对钻井液提出了很高的要求，必须研制出相应的钻井液添加剂使钻井液满足所需性能。

钻井液处理剂可以调节钻井液性能，包括增粘剂、降滤失剂、润滑剂等。钻井液处理剂的好坏直接决定了钻井液的性能，因此，研制深层钻井液也就是研制相应的钻井液处理剂。目前钻井液处理剂的研制主要靠人工合成筛选的方法，合成过程较为繁琐，效率低，且成功率低，成本较高。

现有技术中，针对于利用神经网络来进行钻井液配方预测的，都未涉及到分子层面，仅通过对现有的配方数据进行学习预测，而钻井液成分复杂，钻井液化学添加剂种类多、加量少、但对性质影响显著。现有的技术未充分考虑钻井液处理剂对性能的影响，得到的预测结果可靠性不高。利用图神经网络对分子性能进行预测已有较多应用，但大多数预测的是分子本身的性质，如聚合物本身的介电常数、玻璃化转变温度、分子的亲核性、亲电性等。没有文献利用图神经网络来预测钻井液化学添加剂的性能，且钻井液的性能并非分子本身的性质，无法直接利用分子本身的性质（介电常数、玻璃化转变温度、亲核性、亲电性等）直接判断其作为钻井液化学添加剂的性能优劣。

发明内容

针对现有技术的不足，本发明提供一种基于图神经网络的深层钻井液处理剂性能预测评价方法，从分子层面考虑了钻井液化学添加剂对钻井液性质的影响，以解决目前研制钻井液化学添加剂过程中效率低、成功率低、成本高等问题，大大提高了预测结果的可靠性。

本发明的技术方案如下：

基于图神经网络的深层钻井液处理剂性能预测评价方法，包括以下步骤：

S1：获取大量钻井液化学添加剂样本，构建钻井液化学添加剂数据集；

S2：构建图神经网络模型，利用钻井液化学添加剂数据集，完成模型训练；

S3：输入待预测的钻井液化学添加剂，得到其性能预测与评价结果。

优选的，步骤S1中，所述钻井液化学添加剂样本，包括钻井液化学添加剂的结构和相关性质；

所述的钻井液化学添加剂结构，采用SMILES字符串表示，SMILES字符串用于表示化学分子的图结构，SMILES字符串包括一系列字符，字符分别代表了分子中的原子、化学键、电荷、构型信息；

所述的钻井液化学添加剂相关性质，具体包括以下参数的一种或多种：分子量、溶解度、粘度、动切力、滤失量、pH值、钻井液密度、摩阻系数、抗盐能力、抗温能力。

钻井液化学添加剂样本数据，可以从文献中、现有资料中或实验等方法获得，但需要保证不同数据来源之间的数据有一致性和可对比性。

进一步优选的，钻井液化学添加剂的分子量统一使用数均分子量、重均分子量、粘均分子量、Z均分子量中的一种；钻井液化学添加剂的粘度统一采用表观粘度、塑性粘度、漏斗粘度中的一种。

优选的，步骤S2中，所述图神经网络模型包括图嵌入层、正则化层、图卷积层、图池化层、全连接层、输入输出层；图嵌入层将节点特征和边特征映射到一个低维空间，从而更好的捕捉节点之间的相似关系，提高模型对复杂关系的建模能力；正则化层通过标准化和随机丢弃过程，防止模型出现过拟合，提高模型的泛化性能；图卷积层通过提取数据的局部特征，降低模型复杂度，提高模型的建模能力；图池化层通过降低数据维度，减少模型中的参数数量和复杂度，增强模型的泛化能力；全连接层的每个神经元都与前一层的神经元相连，捕捉其之前的全部特征，完成特征融合，实现模型预测；输入输出层用来输入和输出数据。

图神经网络是一种基于图结构的深度学习模型，图是一种包含节点和连接各节点的边组成的一种数据结构，图神经网络的核心是通过学习捕捉各节点之间的相互关系来获取图的结构与特征，从而可以不规则、复杂的图数据。

图神经网络在化学领域有较大的应用空间，图神经网络将化学分子结构看作图，原子作为图的节点，化学键为图的边，从而可以学习分子结构特征，在分子层面对其性质做出预测。

优选的，步骤S2中，利用钻井液化学添加剂数据集训练图神经网络模型前，对数据预处理；包括将钻井液化学添加剂的SMILES字符串解析转换为分子图，分子图中，原子表示为节点，化学键表示为边；将钻井液化学添加剂相关性质作为额外的节点整合到图的节点特征中；将整合好的图作为输入传入图神经网络模型。

进一步优选的，在输入图神经网络模型之前，将整合好的图转换为可输入至图神经网络模型的特征矩阵，特征矩阵包括节点特征矩阵、边特征矩阵和连接矩阵；节点特征矩阵用于表示原子的相关性质，如电荷、原子半径；边特征矩阵用于表示化学键的相关性质，如化学键类型、键级、键长、键能；连接矩阵表示不同原子之间是否存在化学键。

进一步优选的，图可表示为G = (X, E, A)，其中X为节点特征矩阵，E为边特征矩阵，A为连接矩阵；

节点特征矩阵X可表示为：X = [x ₁ , x ₂ , …, x _i ,…, x _N]^T，其中x _i为第i个节点的特征，N为节点数；

边特征矩阵E可表示为：，其中e _ij为节点x _i和节点x _j之间的边的特征，i范围为1-N，j范围为1-N，N为节点数；

连接矩阵A可表示为：，若节点x _i与节点x _j之间存在边，则= 1，否则为0。

进一步优选的，将数据集划分为训练集、验证集、测试集，完成图神经网络模型的训练，将训练集的数据传入未训练的初始图神经网络模型中，不断迭代训练，利用验证集评估模型性能，计算均方误差MSE和决定系数R²；

，其中/>表示样本数量，/>表示第i个样本的预测值，表示第i个样本的真实值；

MSE反映了模型的预测结果与真实值之间的差异，MSE越小则模型性能越好；

，其中/>表示样本数量，/>表示第i个样本的预测值，表示第i个样本的真实值，/>表示样本的均值；

R²反映了回归模式说明因变量变化可靠程度，R²越接近1则模型性能越好。

当均方误差MSE和决定系数R²均达到设定的阈值时，模型训练结束；

最后利用测试集测试模型的性能，在测试集上计算模型最终的均方误差MSE和决定系数R²，得到深层钻井液化学添加剂性能预测评价模型。

进一步优选的，按照训练集：验证集：测试集=0.8:0.1:0.1的比例划分数据集。

优选的，步骤S3中，首先确定待预测钻井液化学添加剂结构，并将其转换为SMILES字符串；

其中待预测钻井液化学添加剂可以根据需要人工设计，或利用计算机批量生成，从而实现某种材料的性能预测或大规模的材料筛选。

将SMILES字符串转换为分子图进而转化为可输入至模型的矩阵形式，输入至深层钻井液化学添加剂性能预测评价模型，得到钻井液化学添加剂的预测评价结果。

本发明的有益效果在于：

通过深度学习的方法，在分子层面，基于分子结构及其性质实现钻井液化学添加剂的性能预测及评价，在保证了一定预测准确性的同时，大幅度提高了钻井液化学添加剂的研制效率，降低了成本，为深层油气开发提供了高效技术支持。

附图说明

图1为本发明的流程图；

图2为本发明用于筛选预测深层钻井液增粘剂的数据集构建流程图；

图3为丙烯酰胺分子的SMILES字符串实例；

图4为聚乙烯分子的SMILES字符串实例；

图5为本发明基于图神经网络的深层钻井液化学添加剂性能预测评价模型的构建流程图；

图6为本发明利用基于图神经网络的深层钻井液化学添加剂性能预测评价模型实现钻井液化学添加剂性能预测及评价流程图；

图7为实施例1中训练集试所得的模型性能评价图。

具体实施方式

下面通过实施例并结合附图对本发明做进一步说明，但不限于此。本发明未详尽说明的，均按本领域常规技术。

实施例

基于图神经网络的深层钻井液处理剂性能预测评价方法，如图1所示，包括以下步骤：

S1：获取大量钻井液化学添加剂样本，构建钻井液化学添加剂数据集；在现有资料、文献中，获取大量钻井液增粘剂或具有增粘作用的化学剂样本数据。

所述钻井液化学添加剂样本，包括钻井液化学添加剂的结构和相关性质；所述的钻井液化学添加剂结构，采用SMILES字符串表示，SMILES字符串用于表示化学分子的图结构，SMILES字符串包括一系列字符，字符分别代表了分子中的原子、化学键、电荷、构型信息；可以用于表示化学分子的图结构。以丙烯酰胺为例，丙烯酰胺的SMILES字符串如图3所示。对于聚合物结构，用SMILES字符串表示其链节结构，用分隔符[*]分割聚合物的链节。以聚乙烯为例，聚乙烯的SMILES字符串如图4所示。

将各化学剂的SMILES字符串与其性质一一相对应，即完成了用于筛选预测深层钻井液增粘剂的数据集构建。

其中，分子量统一为粘均分子量。粘度统一采用表观粘度，粘度单位为mPa·s。

获取样本数据后首先检查是否符合上述标准，将不符合的数值空缺，后续通过实验方法补充。如图2所示。

对于不同来源的样本数据要保证其一致性与可对比性，不符合的数据应当整条删除或空缺留待后续补充。

补充样本中缺失的实验数据步骤如下；

获取到的样本数据部分缺少分子量，部分缺少0.1%质量分数水溶液的粘度数据。缺少分子量的样本均属于聚合物，因此用乌氏粘度计测量其特性粘度，进而获得聚合物的粘均分子量。用旋转粘度计测定0.1%质量分数水溶液的粘度数据。

所述图神经网络模型包括图嵌入层、正则化层、图卷积层、图池化层、全连接层、输入输出层；图嵌入层将节点特征和边特征映射到一个低维空间，从而更好的捕捉节点之间的相似关系，提高模型对复杂关系的建模能力；正则化层通过标准化和随机丢弃过程，防止模型出现过拟合，提高模型的泛化性能；图卷积层通过提取数据的局部特征，降低模型复杂度，提高模型的建模能力；图池化层通过降低数据维度，减少模型中的参数数量和复杂度，增强模型的泛化能力；全连接层的每个神经元都与前一层的神经元相连，捕捉其之前的全部特征，完成特征融合，实现模型预测；输入输出层用来输入和输出数据。

图神经网络是一种基于图结构的深度学习模型，图是一种包含节点和连接各节点的边组成的一种数据结构，图神经网络的核心是通过学习捕捉各节点之间的相互关系来获取图的结构与特征，从而可以不规则、复杂的图数据。图神经网络将化学分子结构看作图，原子作为图的节点，化学键为图的边，从而可以学习分子结构特征，在分子层面对其性质做出预测。

利用钻井液化学添加剂数据集训练图神经网络模型前，对数据预处理；包括将钻井液化学添加剂的SMILES字符串解析转换为分子图，分子图中，原子表示为节点，化学键表示为边；将钻井液化学添加剂相关性质作为额外的节点整合到图的节点特征中；将整合好的图转换为可输入至图神经网络模型的特征矩阵，特征矩阵包括节点特征矩阵、边特征矩阵和连接矩阵；节点特征矩阵用于表示原子的相关性质，如电荷、原子半径；边特征矩阵用于表示化学键的相关性质，如化学键类型、键级、键长、键能；连接矩阵表示不同原子之间是否存在化学键。然后作为输入传入图神经网络模型。

图可表示为G = (X,E,A)，其中X为节点特征矩阵，E为边特征矩阵，A为连接矩阵，分别对应节点特征、边特征以及它们之间的连接关系。

节点特征矩阵X可表示为：X = [x ₁ , x ₂ , …, x _i …, x _N]^T，其中x _i为第i个节点的特征，i取1-N，N为节点数；

连接矩阵A可表示为：，若节点x _i与节点x _j之间存在边，则/>= 1，否则为0。

将数据集划分为训练集、验证集、测试集，利用数据集完成图神经网络模型的训练。

按照训练集：验证集：测试集=0.8:0.1:0.1的比例划分数据集。将划分好的训练集的数据传入未训练的初始图神经网络模型中，不断迭代训练，利用验证集评估模型性能，计算均方误差MSE和决定系数R²；

，其中/>表示样本数量，/>表示第i个样本的预测值，/>表示第i个样本的真实值；

最后利用测试集测试模型的性能，在测试集上计算模型最终的均方误差MSE和决定系数R²，得到深层钻井液化学添加剂性能预测评价模型。如图5所示。

首先确定待预测钻井液化学添加剂结构，并将其转换为SMILES字符串；待预测的钻井液化学添加剂可以根据需要人工设计，或利用计算机批量生成，从而实现某种材料的性能预测或大规模的材料筛选。

将SMILES字符串转换为分子图进而转化为可输入至模型的矩阵形式，输入至深层钻井液化学添加剂性能预测评价模型，输入完成之后，模型将给出所输入的钻井液化学添加剂性能的预测及评价，得到钻井液化学添加剂的预测评价结果。如图6所示。

本实施例所采用的数据集通过实验方法获得，共计163条钻井液增粘剂数据，利用测试集测试所得的模型性能如图7所示。

利用本实施例获得的钻井液化学添加剂模型预测部分聚合物的粘度，随后利用实验测定其实际粘度，计算预测所得的相对误差，结果如表1所示。

表1利用模型预测聚合物粘度的相对误差

聚合物名称	相对误差
		聚乙二醇	6.8%
聚丙烯酰胺	8.3%
		聚丙烯酸钠	7.5%
聚丙烯酸甲酯	8.8%
		黄原胶	10.5%
瓜尔胶	9.4%
		羧甲基纤维素钠	12.3%
尿素甲醛树脂	14.2%

由图7和表1可知，训练所得的深层钻井液化学添加剂性能预测评价模型相对误差较小，模型的预测准确率较高。因此，深层钻井液化学添加剂性能预测评价模型可以辅助深层钻井液化学添加剂的研发，降低成本，大幅度提高研发效率。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.基于图神经网络的深层钻井液处理剂性能预测评价方法，其特征在于，包括以下步骤：

所述钻井液化学添加剂样本，包括钻井液化学添加剂的结构和相关性质；

所述的钻井液化学添加剂相关性质，具体包括以下参数的一种或多种：分子量、溶解度、粘度、动切力、滤失量、pH值、钻井液密度、摩阻系数、抗盐能力、抗温能力；

钻井液化学添加剂的分子量统一使用数均分子量、重均分子量、粘均分子量、Z均分子量中的一种；钻井液化学添加剂的粘度统一采用表观粘度、塑性粘度、漏斗粘度中的一种；

所述图神经网络模型包括图嵌入层、正则化层、图卷积层、图池化层、全连接层、输入输出层；图嵌入层将节点特征和边特征映射到一个低维空间；正则化层通过标准化和随机丢弃过程，防止模型出现过拟合；图卷积层提取数据的局部特征；图池化层降低数据维度；全连接层的每个神经元都与前一层的神经元相连，捕捉其之前的全部特征，完成特征融合，实现模型预测；输入输出层用来输入和输出数据；

利用钻井液化学添加剂数据集训练图神经网络模型前，对数据预处理；包括将钻井液化学添加剂的SMILES字符串解析转换为分子图，分子图中，原子表示为节点，化学键表示为边；将钻井液化学添加剂相关性质作为额外的节点整合到图的节点特征中；将整合好的图作为输入传入图神经网络模型；

在输入图神经网络模型之前，将整合好的图转换为可输入至图神经网络模型的特征矩阵，特征矩阵包括节点特征矩阵、边特征矩阵和连接矩阵；节点特征矩阵用于表示原子的相关性质，包括电荷、原子半径；边特征矩阵用于表示化学键的相关性质，包括化学键类型、键级、键长、键能；连接矩阵表示不同原子之间是否存在化学键；

图表示为G = (X, E, A)，其中X为节点特征矩阵，E为边特征矩阵，A为连接矩阵；

节点特征矩阵X表示为：X = [x ₁ , x ₂ , …,x _i ,…, x _N]^T，其中x _i为第i个节点的特征，N为节点数；

边特征矩阵E表示为：，其中e _ij为节点x _i和节点x _j之间的边的特征，i范围为1-N，j范围为1-N，N为节点数；

连接矩阵A表示为：；若节点x _i与节点x _j之间存在边，则/>= 1，否则为0；

将数据集划分为训练集、验证集、测试集，将训练集的数据传入未训练的初始图神经网络模型中，不断迭代训练，利用验证集评估模型性能，计算均方误差MSE和决定系数R²；

，其中/>表示样本数量，/>表示第i个样本的预测值，/>表示第i个样本的真实值，/>表示样本的均值；

最后利用测试集测试模型的性能，在测试集上计算模型最终的均方误差MSE和决定系数R²，得到深层钻井液化学添加剂性能预测评价模型；

S3：输入待预测的钻井液化学添加剂，得到其性能预测与评价结果；

首先确定待预测钻井液化学添加剂结构，并将其转换为SMILES字符串；

2.根据权利要求1所述的基于图神经网络的深层钻井液处理剂性能预测评价方法，其特征在于，按照训练集：验证集：测试集=0.8:0.1:0.1的比例划分数据集。