CN113723838B

CN113723838B - 基于卷积神经网络的随钻安全风险智能识别方法

Info

Publication number: CN113723838B
Application number: CN202111027964.1A
Authority: CN
Inventors: 夏文鹤; 胡万俊; 李皋; 李永杰; 蒋俊
Original assignee: Southwest Petroleum University
Current assignee: Southwest Petroleum University
Priority date: 2021-09-02
Filing date: 2021-09-02
Publication date: 2023-04-18
Anticipated expiration: 2041-09-02
Also published as: CN113723838A; US20230074074A1

Abstract

本发明公开了基于卷积神经网络的随钻安全风险智能识别方法，包括：步骤1：随钻安全风险参数特征及数据处理，利用Pearson系数相关性分析法对随钻监测参数建立相关性分析模型；步骤2：随钻安全监测数据处理，对样本时间跨度进行分析，构建训练样本数据和测试样本数据，并对样本进行预处理；步骤3：随钻安全风险识别网络结构设计；步骤4：通过训练好的安全风险识别网络对随钻安全风险进行识别。本发明在随钻监测工程的应用中，能大幅度提高钻井效率和储层钻遇率，降低钻井复杂事故率和成本，给钻井工作提供了强有力的安全保障，在一定程度上满足当前钻井降本增效的迫切需求，也为我国智能钻井技术的发展提供新的思路。

Description

基于卷积神经网络的随钻安全风险智能识别方法

技术领域

本发明涉及井下随钻安全领域，尤其涉及基于卷积神经网络的随钻安全风险智能识别方法。

背景技术

钻井是一项非常复杂的地下工程，地质条件、工程条件、人工操作等众多因素的影响给钻井工程的效率、安全、质量提出了重大挑战。因此，如何在复杂的现场条件下及时的识别出卡钻、产气、井壁失稳、钻具断裂等随钻安全风险并做出相应处理，预防大型事故的发生，是提升钻完井成功率、降低钻完井成本的关键一环。现阶段的钻井过程中，最常见的判断方式是依靠各类仪器的工作状况以及采集到的各类井下参数，由现场监测人员根据经验实时观察判断随钻安全风险。人工识别的方式对现场监测人员的专业知识水平有较高的要求，并使得判断结果具有较强的主观性和时间滞后性。同时，不同井由于地质条件、人工操作等因素，发生安全风险时的特征有所不同，进一步增加了现场人工监测的难度。

近年来，随着人工智能技术在全球范围内迅猛发展，油气勘探开发智能化成为全球油气行业发展的热点。我国油气行业也开始推进智能钻井发展步伐，结合大数据、人工智能等前沿理论与技术有望大幅度提高复杂油气产量和采收率，降低钻完井成本，成为保证我国能源战略安全的变革性技术。

2015年开始，西南石油大学李皋、孟英峰等人针对气体钻井，建立了气体钻井过程中井壁失稳、产水、产气、井下燃爆、钻柱失效等主要风险发生与对应参数变化的关系模型。进而基于已有的地面监测技术，形成了有效的气体钻井随钻安全风险辨识方法。2017年，邱少林、张来斌等人分析影响井下事故风险的钻井液密度、流变性、滤失量、岩石类型等7种因素，通过建立井下事故风险评估指标体系，实现了井下事故风险的模糊综合量化评估。同年，中国石油大学管志川等人提出了基于粒子群算法的BP神经网络钻井风险评估方法。2019年，胜亚楠、管志川等人提出了基于不确定性分析的钻井工程风险定量评价方法。2020年，王茜等人提出基于钻井模型与专家系统结合的方式对井下安全风险进行识别。综上所诉，钻井技术正由传统钻井向着结合机器学习与人工智能的智能钻井方向不断发展。但由于钻井安全风险复杂程度高，且历史数据有限，网络训练效果不佳。因此目前的研究成果仍主要以专家系统结合BP神经网络为主。专家系统要求制定大量的专家经验规则，BP网络则需要在网络训练前期使用如支持向量机一类的机器学习算法对数据进行复杂的预处理和特征提取。专家规则制定和特征提取算法等因素使系统依旧具有一定的人为主观性，还有可能摒弃掉了部分有价值的数据特征。同时，专家规则与特征提取算法越复杂，识别系统应用条件局限性越强，适应能力差，实时性差，难以达到随钻安全风险识别的要求，故成功应用于钻井工程实时随钻识别的案例较少。

发明内容

本发明的目的在于克服现有技术的不足，使用小样本学习的方法扩充样本数据，利用学习效率更高的卷积神经网络对随钻监测数据进行训练学习，实现自主学习式的特征提取与特征学习，很大程度上简化了数据预处理过程，减少网络训练时的主观性，提高识别系统应用性和实时性，提高识别效率，提供了一种基于卷积神经网络的随钻安全风险智能识别方法。

本发明的目的是通过以下技术方案来实现的：

基于卷积神经网络的随钻安全风险智能识别方法，包括以下步骤：

步骤1：随钻安全风险参数特征及数据处理，利用Pearson系数相关性分析法对随钻监测参数建立相关性分析模型；

步骤2：随钻安全监测数据处理，对样本时间跨度进行分析，构建训练样本数据和测试样本数据，并对样本进行预处理；

步骤3：随钻安全风险识别网络结构设计，并对网络模型进行训练；

步骤4：通过训练好的安全风险识别网络对随钻安全风险进行识别。

进一步的，所述步骤1具体包括以下子步骤：

步骤101：获取多口井随钻监测历史数据，初步筛选出能及时反应钻进过程工况变化的监测参数，并清理掉其中的无效或错误数据；

步骤102：根据随钻监测过程中参数的重要性，进一步精选若干核心参数，降低后续数据处理量；

步骤103：根据钻进过程不同阶段，将数据集按各阶段做进一步分类；

步骤104：利用现有随钻安全风险理论模型，形成各类安全风险对应监测数据变化的宏观规律，再结合Pearson参数相关性分析结果，确定表征各安全风险工况最精炼的样本中各参数构成。

进一步的，所述步骤2具体包括以下子步骤：

步骤201：对每一种随钻安全风险分别构建多种不同时间跨度的样本数据，并用多个网络同时进行随钻安全风险识别训练，通过对比实验确保网络既能包含随钻安全风险的大部分特征，也尽可能地降低了系统时延性；同时，对钻井监测数据离线分析，构建训练样本数据与测试样本数据；

步骤202：使用少样本学习对样本数据进行预处理，利用数据增强中缩放、裁剪、插值以及SMOTE算法对样本进行处理，并使用迁移学习算法将已训练好的相似网络中的权重迁移至具备一定相关性的新网络进行训练；

步骤203：对样本中数值大小差异太大的部分数据进行归一化处理。

进一步的，所述利用数据增强中缩放、裁剪、插值以及SMOTE算法对样本进行处理具体为：对于部分上涨幅度大，变化特征明显的历史数据可使用数据缩放以及裁剪将变化过程中的部分数据提取并扩展至相同的时间跨度，以形成新的训练样本，随后利用分段插值法对缩放后的数据进行填充，使其与原始样本相同；数据缩放插值后，再通过SMOTE算法，对少数类样本进行分析并根据少数类样本人工合成新样本并添加到数据集中。

进一步的，所述步骤3包括以下子步骤：

步骤301：网络框架选择，随钻安全风险识别网络采用基于卷积神经网络进行井下安全风险的训练学习；使用卷积层对样本数据进行特征提取即预学习，再使用后向传播算法对所有的网络参数进行优化；

步骤302：网络结构设计，包括输入层、卷积层1、卷积层2、隐含层和输出层，采用elu函数作为激活函数，采用主成分分析法对输入全连接层之前的数据进行降维处理。

进一步的，所述卷积层1用于提取各参数自身的变化趋势，采用m*1的一维纵向卷积核分别在n个参数上进行单独的卷积计算。

进一步的，所述卷积层2用于提取参数间的变化关系，使用1*n的一维横向卷积核对矩阵的每一行进行单独特征提取。

进一步的，所述主成分分析法旨在将一组N维向量降为K维，0<K<N，计算流程如下：

步骤3021：将p*n阶的变量矩阵的每一行进行归一化处理，并按列组成新的矩阵X；

步骤3022：求解m阶矩阵X的协方差矩阵；

步骤3023：计算协方差矩阵C的特征值与相应的特征向量；

步骤3024：将特征向量按对应特征值大小从上到下按行排列成矩阵，然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵P；

步骤3025：将矩阵X与矩阵P相乘即可得到降维到k维后的数据。

进一步的，所述隐含层节点数S＝2x+1，其中，x为输入层节点数；且隐含层节点数S<N-1，N为网络训练样本数。

本发明的有益效果：本发明利用少样本学习扩充样本数据，卷积神经网络学习和训练网络模型的方法，实现了对数据自学习式的特征提取，高效地提取到钻井监测数据的有效特征，不仅能获取多个随钻监测参数之间相互制约及关联关系，而且能同时提取多个随钻监测参数随钻进过程的变化特征，充分表征随钻安全风险过程中监测数据的变化规律；实现自主学习式的特征提取与特征学习，很大程度上简化了数据预处理过程，减少网络训练时的主观性。与已有的识别系统相比，训练后的模型识别延迟低，实时性强，准确率高，应用灵活性强，具备更优的泛化能力和抗干扰能力。通过气体钻井多井次的随钻安全风险识别应用测试，成功识别出地层产气、地层出水和卡钻等多种安全风险，与钻后随钻监测报告结果一致，证实该方法的识别有效性。本发明在一定程度上满足当前钻井降本增效的迫切需求，为我国智能钻井技术风险自动识别方法的发明提供新思路。

附图说明

图1是本发明的方法流程图。

图2是气体钻井随钻监测参数曲线图。

图3是小样本学习示意图。

图4是数据预处理示意图。

图5是神经网络结构对比图。

图6是随钻安全风险识别网络结构图。

图7是地层产气网络训练结果示意图。

图8是地层出水训练结果示意图。

图9是卡钻训练结果示意图。

图10是接立柱训练结果示意图。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本实施例中，如图1所示，基于卷积神经网络的随钻安全风险智能识别方法，包括以下步骤：

步骤1：随钻安全风险参数特征及数据处理；

钻井过程中往往有着大量繁杂的监测仪器和监测数据。如录井数据的大钩负荷、顶驱转速、立管压力，主副排砂气体组分监测数据等。如图2所示，随钻监测现场根据实际需要，将部分监测数据以曲线图的方式实时显示，用于监测人员实时观察和分析数据变化趋势。监测数据一般以1-5秒的频率进行采集，然后根据参数类型以时间顺序存储，单日的钻井监测数据能达到4万条以上。

对比图2中两口井的近似工况，A井为大邑某井钻遇地层产气时随钻监测参数示意图，其甲烷浓度与排压大幅上升，而顶驱转速与顶驱扭矩无明显异常。B井为新某井钻遇产气时随钻监测参数示意图，其甲烷浓度与排压小幅上升，但由于诱发卡钻导致顶驱转速与顶驱扭矩异常。由此可见，钻井随钻安全风险复杂程度高，不同风险间具备不同的参数特征，同类安全风险受到地质条件，人工操作等因素的影响，在不同井之间的特征也有一定的不同。现场人员如不具备专业的知识水平和丰富的经验，难以准确的通过随钻监测参数判断出井下钻井状况。另一方面，随钻监测参数数据量大，刷新频率高，监测系统对数据的处理时间若太长，便失去了实时监测的意义。因此，识别精度高，实时性强的智能随钻安全风险识别方法对钻井工程有重要的意义。

以气体钻井为例，其重要的随钻安全风险主要包括以下几个方面：地层产气，地层出水，卡钻，钻具断裂，井下燃爆，产硫化氢，井壁失稳等。由于随钻监测参数种类繁多，若全部用于随钻安全风险分析，模型复杂度高，网络训练难度大，需先对随钻安全风险与随钻监测参数之间的对应关系进行宏观把控。本发明利用Pearson系数相关性分析法对随钻监测参数建立相关性分析模型。主要步骤如下：

(1)整理各个井随钻监测历史数据，为了更精确的判断各参数的相关性，筛选出处于钻进过程中的监测数据，并清理掉其中由于采集仪器、信号传输等原因导致的无效或错误数据；

(2)根据随钻监测过程中参数的重要性，进一步筛选参数；如表1所示，在本实施例中，最终共选择13种核心监测参数进行Pearson相关系数分析；

表1 13种进行Pearson相关系数分析的参数

(3)参数中甲烷浓度在每口井的历史监测数据中仅在地层产气后才具有意义，产气前数据皆为0值，若将所有经整理后的数据直接分析，会在很大程度上影响甲烷浓度参数与其余参数的相关系数。因此，对当前阶段的数据集做进一步分类，进行非甲烷浓度的相关系数计算时，将当前阶段数据中甲烷浓度参数数据删除，视为数据集A；进行甲烷浓度与其余参数的相关系数计算时，将当前阶段中所有甲烷浓度为0值的数据删除，视为数据集B；数据集分布如表2所示。

表2数据集分组大小情况

(4)基于数据集A、数据集B，计算Pearson相关系数分析结果，可以以热力图的形式展示；

基于相关性分析结果，结合现有的随钻安全风险理论模型与多个专家经验，对历史数据中的各类安全风险数据变化规律进行整理，部分重要安全风险参数的变化特征如表3所示。

表3气体钻井重要安全风险参数特征

需要特别说明的是，在分析结果中，接立柱属于钻井过程中的正常工作流程，随着钻进流程不断深入，现有钻柱长度会无法满足进一步钻进的长度要求，因此在整个钻进过程中会不断接新的钻柱。但由于在接立柱过程中需对环空气体泄压以及频繁上提下放钻具等一系列操作，会导致各类监测参数异常变化，如排砂管线排压激增，大钩载荷、大钩高度、扭矩与立压频繁上升下降等，且由于井内气体积压，导致接立柱工作结束阶段返出气体湿度快速上涨，若在钻遇气层后还会导致返出气体组分中甲烷浓度与总烃上升。因此，在发明随钻安全风险识别方法时，若增加对接立柱工作的识别，否则易导致在接立柱过程中多类安全风险的误判。另一方面，表2是对随钻监测参数的宏观变化规律的把握，但不同井之间的变化幅度、比率均有所不同，难以定量的分析，且对地质条件差别较大的多口井的识别泛化能力亦存在不足，还需做进一步分析。

步骤2：随钻安全监测数据处理；如前文所述，随钻监测参数多以时间为序进行采集，以多参数组成的二维数组进行存储。通过二维数组中参数的变化趋势以及各参数间的变化关系能有效的识别大多数随钻安全风险。因此，随钻安全风险识别网络的样本结构应为一段时间内，多种安全风险参数的监测数据构成的二维数组。

(1)样本时间跨度分析。在将历史数据转换为神经网络输入数据时，单次样本的时间跨度需要考究。如图2所示，发生同类随钻安全风险时不同参数的变化时间跨度有所不同，发生不同类随钻安全风险时同类参数变化时间跨度也会不同。各参数在不同随钻安全风险下的变化时间跨度差异大，时间跨度最短的如卡钻时的顶驱转速与顶驱扭矩仅在转瞬之间；而变化时间跨度长的如地层出水时的排砂管线返出气体湿度则会持续上涨长达数个小时。因此，在构建神经网络训练样本时，单个样本所选取的时间跨度若过短会导致单次样本特征不全，无法涵盖所有参数的变化特征，降低网络学习效率。而选取时间跨度过长则会导致网络在训练时参数特征复杂，网络对有效特征的学习效率低下，且还会导致网络训练完成后的识别系统在应用时对卡钻、地层产气等部分随钻安全风险的识别时间延迟过高，错过最佳预警时机，失去识别系统的应用价值。

针对该问题，本发明对每一种随钻安全风险分别构建三种不同时间跨度的样本数据，用三个网络同时进行随钻安全风险识别训练，通过对比实验确保网络既能包含随钻安全风险的大部分特征，也尽可能地降低了系统时延性。四类识别网络样本时间跨度分布情况如表4所示。另一方面，每个样本以2秒为样本内数据间的时间间隔，既能包含大部分随钻安全风险的完整特征，亦尽可能地降低了模型复杂度和网络训练难度。

表4样本时间跨度分布概况

随后，以表3为基础，本发明对钻井监测数据离线分析，初步构建了训练样本数据与测试样本数据。以地层产气40秒样本为例，表5所示为提取后单次样本示意图，单次样本为20*5的二维数据。

表5单次样本示意表

构建后的部分样本数量如表6所示，表中第二第三列数据仅为具有安全风险特征的样本数量。虽然随钻监测数据单日数据量可达4万条以上，但其中能够表征发生随钻安全风险的有效数据很少，构建后的安全风险类样本数据量十分有限。为了避免样本失衡，样本集中不同类的样本比例一般不超过1:2，因此，本发明完整样本集数量概况如表中第四第五列所示。其中，由于测试样本集不受此限制，整体数量较多。

表6部分随钻安全风险样本数目概况

(2)由于样本集中安全风险类样本数量很少，网络难以高效提取到数据的有效特征。因此，本发明使用少样本学习对样本数据进行预处理。如图3所示，在少样本条件下，本发明主要采用数据增强与迁移学习算法。利用数据增强中缩放、裁剪、插值以及SMOTE算法对样本进行处理。数据缩放、裁剪、插值算法在保留样本特征的前提下丰富样本个数，SMOTE算法在扩充样本数量的同时减少样本的不平衡性，使原始样本中的类别不再严重失衡。数据增强算法从根源上提高网络学习效率，降低网络过拟合的概率。使用迁移学习算法则旨在通过将已训练好的相似网络中的权重迁移至具备一定相关性的新网络进行训练，让新的网络不再从零开始学习，从网络层面提高学习效率，在样本数不足的网络中能很好的辅助网络学习，提高网络的识别精度。

由于在随钻安全风险的参数特征中，相较于每个参数变化幅度的数值大小而言，各参数的变化方式即上升或下降以及所有参数的整体变化规律更为重要。因此，针对部分上涨幅度大，变化特征明显的历史数据可使用数据缩放将变化过程中的部分数据提取并扩展至相同的时间跨度，以形成新的训练样本。随后利用分段插值法对缩放后的数据进行填充，使其与原始样本相同。其中分段插值采用拉格朗日分段插值，其公式如下：

数据缩放插值后，再使用SMOTE算法。通过SMOTE算法，对少数类样本进行分析并根据少数类样本人工合成新样本并添加到数据集中，进一步提升网络的识别性能。SMOTE算法合成公式如下：

(x_new，y_new)＝(x，y)+rand(0-1)*((x_n-x)，(y_n-y))

其中，(x_new，y_new)为新的样本点，(x，y)为原始样本点，(x_n-y_n)为原始样本点的最近邻点。

经数据增强处理后，部分随钻安全风险训练集样本与测试集样本分布情况如表7所示。与表6对比，各类样本数量都有了显著提升。

表7部分随钻安全风险样本数目概况

迁移学习算法则需要在进行网络训练时，优先训练如地层产气一类样本丰富、样本特征明显的风险类型。然后将训练后的网络权重迁移至地层出水一类样本数量较少、样本特征不明显的风险类型训练中，增强后者网络的学习效率。在迁移过程中，若针对如随钻监测参数曲线、测井曲线等图像识别，其特征提取难度大，则一般应锁定隐含层或输出层，重点训练卷积层即特征提取层。而对于一般的二维参数分析，如果不同场景间特征一致性较高，只是数值范围等有不同，则应锁定卷积层，微调或部分微调后面的隐含层或输出层。这样既可以维持网络的基本稳定，巩固已有的训练成果，也可提高后续训练效率。

(3)另一方面，由于样本中数值大小差异太大，影响网络训练效果，需对部分参数进行归一化处理。在提取出的参数中，甲烷浓度、氧气浓度、相对湿度等参数数值范围均在0-100之间(百分数)，故以上述参数为标准，对其余参数按以下公式进行最大最小归一化：

本发明训练前期，完整的数据样本构建方法如图4所示。其中，历史监测参数共包含了新疆博孜井、迪北井，四川大邑井、老君井、龙岗井等多区块的十余口井。该十余口井跨度大，样本特征丰富，不同井之间存在的共通性与差异性能进一步提高模型的泛化能力。

步骤3：随钻安全风险识别网络结构设计，并对网络模型进行训练。

(1)针对钻井参数特征，将全连接神经网络与卷积神经网络进行对比。全连接神经网络单一的使用隐含层以及后向传播算法对数据进行训练学习，且输入层仅支持一维数据。但由前文可知，随钻监测的数据样本可视为二维数据，若使用全连接神经网络，会摒弃掉数据间所有的位置关系；卷积神经网络输入层支持二维数据，保留了随钻安全风险样本的全部特征，并且在隐含层的基础上，优先使用卷积层对样本数据进行特征提取即预学习，再使用后向传播算法对所有的网络参数进行优化。而基于损失函数梯度下降的后向传播算法对卷积层参数的优化更实现了自学习式的特征提取，即网络在训练学习过程中，根据训练结果的好坏不断完善卷积层的特征提取算法，既提高了样本有效特征的提取率，又大幅减少了整套系统的人为主观性。

综上所述，本发明选择卷积神经网络进行井下安全风险的训练学习，更高效的提取到监测参数的有效特征，提高网络训练效率。训练后的识别系统亦具备更高的准确率和实时性。

(2)本发明基于图3所示的卷积神经网络基本结构，结合随钻安全风险样本特征，构建的随钻安全风险识别网络结构如图6所示。

输入层：如前文所述，为了提高识别准确率，本发明单个样本选取1分钟为时间跨度，同时为了降低系统计算量，提高网络识别效率与实时性，单个样本选取2秒的数据采集频率。使最后的输入层数据为30*n的二维矩阵，其中n为各类安全风险特征参数数量。

卷积层：通过多个卷积层与多个卷积核的卷积操作可提取到输入层的多重特征，提高网络学习效率和泛化能力。如表1所示，大部分安全风险的特征主要体现在两个方面：各参数自身的变化趋势以及不同参数间对应的变化关系。因此，为了良好的提取到多个随钻监测参数的有效特征，本发明的卷积神经网络模型中，使用两层卷积层进行特征提取，分别着眼于风险参数特征的两个方面。卷积层1负责提取各参数自身的变化趋势。由于输入层为p*n的二维数组，且数组中每一列为单一参数随时间的数值变化，卷积层1采用m*1的一维纵向卷积核分别在n个参数上进行单独的卷积计算。同时，由于不同风险的参数特征时间跨度有所不同，如地层出水往往体现在整个一分钟的数据变化上，而卡钻则发生在转瞬之间，为了更好的兼容大部分随钻安全风险特征，卷积层1含3类m*1卷积核，共计使用20个卷积核，以不同长度对每一个参数进行单独特征提取。在三个不同时间跨度的网络中，m、s的值如表8所示。其中，同样大小的卷积核中每个卷积核的权重不同，使用复数个同样大小不同权重的卷积核可更加全面的对输入矩阵进行特征提取，但数量不宜过多，否则易导致网络无法正确收敛。

表8卷积层1参数m、s取值表

卷积层2负责提取参数间的变化关系，使用1*n的一维横向卷积核对矩阵的每一行进行单独特征提取。虽然是一维卷积核，但由于卷积层1处理过后的矩阵中每一个元素均是不同长度即不同时间跨度下单个参数的变化特征，卷积层2的一维卷积核最终提取到的是不同时间跨度下多风险参数间的变化关系。卷积层2共计使用20个卷积核。卷积层1与卷积层2的结合实现了BP神经网络无法完成的针对二维矩阵的特征提取算法。

激活函数：为了增强网络的非线性处理能力，提高学习效率，网络使用elu函数作为激活函数：

在常用的激活函数中，Relu函数导数计算简单，梯度下降快，模型收敛速度快，适用于大部分网络。但Relu函数在学习率过大或参数初始化存在问题时可能导致神经元坏死现象，即某些神经元永远不会被激活，相应参数永远不会被更新。elu函数是针对Relu函数的一个改进型，当输入为负数时，elu函数有一定的输出值，缓解了神经元坏死现象。作为可调整的参数，使函数具备了一定的抗干扰能力。经过网络训练对比测试，elu函数相较于Relu函数有着更快的收敛速度，在地层出水的网络训练中，使得准确率提高了13％。

主成分分析法：在本实施例的网络结构中，每个样本经过了多组卷积层，每个卷积层亦使用了多个不同大小的卷积核从多个角度提取样本的特征，提取后的数据无可避免的包含冗余信息与噪音信息，复数卷积核与卷积层还可能使得卷积后的数据包含重复特征。对于样本数量充足的网络来说，可以依靠大量的样本训练让网络在后半段的全连接层进一步筛选出输入信息的有效特征，但对于本实施中的这类样本数量不足的网络来说，可能无法高效的学习到每个样本的有效信息，影响网络的训练效率以及识别系统的识别准确率。因此，对于本实施例中的网络训练，在将数据输入全连接层之前，需使用主成分分析法对数据进行降维处理，减少数据中的无效信息与重复特征，从网络结构方面提高模型对有效特征的学习能力。主成分分析法旨在将一组N维向量降为K维，K大于0小于N，其主要计算流程如下：

A)将p*n阶的变量矩阵的每一行进行归一化处理，并按列组成新的矩阵X；

B)按下式，求解m阶矩阵X的协方差矩阵；

C)计算协方差矩阵C的特征值与相应的特征向量；

D)将特征向量按对应特征值大小从上到下按行排列成矩阵，然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵P；

E)Y＝XP即为降维到k维后的数据。

由于本实施例大部分网络卷积层中均使用了三种卷积核，卷积后的数据具备最少三倍的重复特征，因此数据降维需将卷积后的数据维度降低为原始维度的三分之一。

全连接层：数据降维后，采用常规全连接神经网络，由于样本数量少，模型复杂度不高，使用一个隐含层。基于Kolmogorov定理，隐含层节点数应满足以下公式：S＝2x+1；式中，S为隐含层节点数，x为输入层节点数。且隐含层节点数需小于N-1，其中N为网络训练样本数，否则网络模型的系统误差与训练样本的特性无关而趋于零，即建立的网络模型没有泛化能力，也没有任何实用价值。故本网络隐含层含有150个节点。所用激活函数同为elu函数。

网络的输出层采用二分类的形式，节点数为2。输出层采用Softmax函数：

其中，y_i是Softmax函数的输入值，C为输入值的个数。

Softmax函数可将网络的多分类输出值转化为相对概率，即通过Softmax函数，网络的输出转化为0-1之间的数值，且和为1。Softmax使得识别系统的最终输出为安全风险发生与否的相对概率，识别结果更为直观高效。网络损失函数也随之选择交叉熵损失函数。

部分安全风险训练结果与分析：本节完成了整个网络的搭建与训练，部分安全风险训练结果如下，本节所示图中横坐标均为训练次数，纵坐标为损失值或样本准确率(％)。

(1)地层产气：地层产气三个不同时间跨度的网络训练效果中，20秒网络单个样本数据量小，容易训练，loss下降更为迅速。但样本所含有效数据特征较少，约6000次训练之后，loss值已很难下降，在整个训练集样本上的准确率达到90％后基本不再上升，测试集样本准确率则仅有80％左右。测试集样本准确率与训练集样本准确率相差较大，网络存在一定的过拟合现象。但40秒网络与60秒网络单个样本数据量较大，样本所含数据特征丰富，最终训练效果更优。60秒网络最终loss值已不足0.1，训练集与测试集准确率均高于95％。60秒网络训练结果如图7所示。

(2)地层出水：地层出水网络训练效果中，三个地层出水网络经过约5000次训练后，模型损失值与准确度趋于平稳。与地层产气网络类似，随着单个样本时间跨度的增加，样本所含数据特征更加丰富，网络训练效果越好，最终识别准确率以60秒网络为最佳。训练集准确率与测试集准确率变化趋势基本同步，最终准确率大小也非常接近，基本排除过拟合的可能性。地层出水60秒网络训练结果如图8所示。

(3)卡钻：卡钻网络中，40秒网络与60秒网络仅大约1000次训练后，网络损失值已不足0.1，训练集准确率均高于95％，测试集准确率均高于90％，且趋于平稳。由于卡钻风险特征明显，有利于网络更快的学习到有效特征，训练过程中网络均收敛迅速，loss值下降快，且最终训练集准确率基本一致。60秒网络如图9所示。

(4)接立柱：由于接立柱网络五个参数变化均为断崖式变化，特征非常明显。因此接立柱三个网络训练过程loss值均收敛极快，训练集准确率与测试集准确率上升迅速，训练效果非常良好。接立柱180秒网络最终训练结果如图10所示。

综上所诉，四种识别网络训练结束后最优测试集准确度分别为98％、87.9％、98％以及98.7％。由此可见，在三种安全风险与接立柱的训练过程中，模型均达到了较为可观的识别准确率。说明该模型在钻井安全风险识别中具有良好的识别效率，若能提高样本数量，还可进一步提高模型的泛化能力。

现场实际应用。将所有训练后的模型进行整合后，进行数次现场的随钻安全风险实时预警应用测试，如大邑区块的大邑*井、德阳新*井等。在常规钻井随钻监测工作中，由于现场无智能监测和报警系统，一般由录井及相关参数监测人员二十四小时轮班进行监测工作。如发现参数异常，则报告给井队二十四小时轮班决策人员综合判断工况，再通知司钻采取下一步施工措施。监测及判断劳动强度大，时效性差，误判率较高，可靠性差，难以及时处理突发状况，且对现场监测人员的理论知识与监测经验均有很高的要求。在本发明的数次现场实时预警应用测试中，对钻进过程中的大部分安全风险均成功识别与警示，大幅度减轻了现场监测人员的劳动强度。在随钻现场的实时识别过程中，本系统能先于现场监测人员识别井下安全风险，识别延时低，时效性强，识别准确率高。

以大邑*井为例，在该井的随钻安全风险实时预警应用测试中，识别系统成功识别数次地层产气、地层出水、卡钻风险以及接立柱工作。当现场钻井工程钻至测量井深5149.18m时，识别系统第一时间警示地层产气概率达到97.25％。经识别系统警示后，现场监测人进一步确认钻遇小股甲烷气体，识别系统成功预警；现场工程钻至测量井深5173.06m时，识别系统提醒现场已开始进行接立柱工作，停止对地层产气、地层出水、卡钻风险的识别，识别结果与现场钻井工作流程一致；现场工程钻至测量井深5254.58m时，识别系统及时提醒地层出水概率高达83.54％。经本系统提醒后，现场监测人员报告决策人员并根据排砂状况确认钻遇水层，识别系统成功预警；现场工程钻至测量井深5254.69m时，识别系统提醒卡钻概率高达96.54％，随后现场监测人员判断钻具遇卡并通知司钻处理。

以上为部分随钻监测实时预警测试情况。钻井工作完成后，将完整识别结果与该井随钻监测时报结论对比分析，如表9所示。可见，该系统识别结果与随钻监测时报保持一致。

表9某井识别结果对比

本发明根据目前随钻安全风险监测的现状和实际需要，设计了与当前随钻监测系统监测数据形式相匹配的卷积神经网络结构及训练方法，通过使用卷积神经网络，能高效获取到随钻监测参数间隐藏的安全风险特征，各类随钻安全风险识别准确率均达到90％以上。在多次气体钻井随钻现场应用测试中，成功识别地层产气、地层出水、卡钻等多种随钻安全风险，识别结果与现场监测人员判断以及钻后随钻监测报告一致，证实本发明在钻井安全风险识别中具有良好的识别效果，且相较于传统的人工判断方式，可提前2～3分钟确定现场工况，为实施有效的安全风险处理措施赢得宝贵时间。随钻现场应用测试证明，卷积神经网络能获取多个随钻监测参数之间相互制约及关联关系，能同时提取多个随钻监测参数随钻进过程的变化特征，相较与传统的BP神经网络，其在随钻监测数据的特征提取领域有明显优势，故其在实时随钻安全风险识别方面具备着极佳的应用前景。基于卷积神经网络，本发明可直接利用随钻监测数据结合训练好的网络模型进行安全风险识别，实现极低延迟的实时监测，解决了之前使用的神经网络系统无法实时高效识别的缺点。随着样本数据的增加，还可进一步优化本发明对更多随钻安全风险的识别精度，提高本方法的泛化能力和抗干扰能力。同时，由于本发明是自学习式的进行特征提取和模型训练，数据中亦有大部分来自于常规钻井参数。在针对非气体钻井，如泥浆钻井、欠平衡钻井等工程的随钻安全风险识别时，本发明同样具备良好的应用前景。

本发明在随钻监测工程中的应用，大幅度提高钻井效率和储层钻遇率，降低钻井复杂事故率和成本，给钻井工作提供了强有力的安全保障，在一定程度上满足当前钻井降本增效的迫切需求，也为我国智能钻井技术的发展提供新的思路。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护的范围由所附的权利要求书及其等效物界定。

Claims

1.基于卷积神经网络的随钻安全风险智能识别方法，其特征在于，包括以下步骤：

步骤1：随钻安全风险参数特征及数据处理，利用 Pearson 皮尔逊系数相关性分析法对随钻监测参数建立相关性分析模型, 具体包括以下子步骤：

步骤104：利用现有随钻安全风险理论模型，形成各类安全风险对应监测数据变化的宏观规律，再结合Pearson皮尔逊参数相关性分析结果，确定表征各安全风险工况最精炼的样本中各参数构成；

步骤3：随钻安全风险识别网络结构设计，并对网络模型进行训练, 包括以下子步骤：

步骤301：使用卷积层对样本数据进行特征提取即预学习，再使用后向传播算法对所有的网络参数进行优化；

步骤302：网络结构设计，包括输入层、卷积层1、卷积层2、隐含层和输出层，采用elu指数线性单位函数作为激活函数，采用主成分分析法对输入全连接层之前的数据进行降维处理；

2.根据权利要求1所述的基于卷积神经网络的随钻安全风险智能识别方法，其特征在于，所述步骤2具体包括以下子步骤：

步骤202：使用少样本学习对样本数据进行预处理，利用数据增强中缩放、裁剪、插值以及 SMOTE 人工少数类过采样算法对样本进行处理，并使用迁移学习算法将已训练好的相似网络中的权重迁移至具备一定相关性的新网络进行训练；

3.根据权利要求2所述的基于卷积神经网络的随钻安全风险智能识别方法，其特征在于，所述利用数据增强中缩放、裁剪、插值以及 SMOTE 人工少数类过采样算法对样本进行处理具体为：对于部分上涨幅度大，变化特征明显的历史数据可使用数据缩放以及裁剪将变化过程中的部分数据提取并扩展至相同的时间跨度，以形成新的训练样本，随后利用分段插值法对缩放后的数据进行填充，使其与原始样本相同；数据缩放插值后，再通过SMOTE人工少数类过采样算法，对少数类样本进行分析并根据少数类样本人工合成新样本并添加到数据集中。

4.根据权利要求1所述的基于卷积神经网络的随钻安全风险智能识别方法，其特征在于，所述卷积层1用于提取各参数自身的变化趋势，采用m*1的一维纵向卷积核分别在 n 个参数上进行单独的卷积计算，n为各类安全分析特征参数数量，m为不同时间跨度网络中卷积核大小。

5.根据权利要求1所述的基于卷积神经网络的随钻安全风险智能识别方法，其特征在于，所述卷积层2用于提取参数间的变化关系，使用1*n的一维横向卷积核对矩阵的每一行进行单独特征提取，n为各类安全分析特征参数数量。

6.根据权利要求1所述的基于卷积神经网络的随钻安全风险智能识别方法，其特征在于，所述主成分分析法旨在将一组N维向量降为K维，0<K<N，计算流程如下：

步骤3022：求解m阶矩阵X的协方差矩阵；

步骤3023：计算协方差矩阵C的特征值与相应的特征向量；

步骤3025：将矩阵X与矩阵P相乘即可得到降维到 k 维后的数据；

其中，m为不同时间跨度网络中卷积核大小，N为网络训练样本数。

7.根据权利要求1所述的基于卷积神经网络的随钻安全风险智能识别方法，其特征在于，所述隐含层节点数S=2x+1，其中，x为输入层节点数；且隐含层节点数S<N-1，N为网络训练样本数。