CN115640526A - 钻井风险识别模型及建立方法、识别方法和计算机设备 - Google Patents
钻井风险识别模型及建立方法、识别方法和计算机设备 Download PDFInfo
- Publication number
- CN115640526A CN115640526A CN202211093505.8A CN202211093505A CN115640526A CN 115640526 A CN115640526 A CN 115640526A CN 202211093505 A CN202211093505 A CN 202211093505A CN 115640526 A CN115640526 A CN 115640526A
- Authority
- CN
- China
- Prior art keywords
- model
- risk
- drilling
- network
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明提供了一种钻井风险识别模型及建立方法、识别方法和计算机设备。所述钻井风险识别模型建立方法包括:建立包含有风险表征参数的数据库;基于数据库建立复合网络模型,该模型包括卷积网络层和RBF网络层;训练所述网络模型,得到钻井风险识别模型。所述模型由上述方法得到。所述识别方法基于上述模型实现。所述设备包括处理器,存储有计算机程序的存储器,当处理器执行时,实现上述的建立方法,或者实现上述的识别方法。本发明能够对气体钻井风险进行快速有效的识别,有利于维护钻井正常运行,降低钻井成本。
Description
技术领域
本发明涉及油气钻井领域,具体来讲,涉及一种钻井风险智能识别模型、一种钻井风险智能识别模型的建立方法、一种钻井风险智能识别方法、以及实现一种钻井风险智能识别方法的计算机设备和计算机可读存储介质。
背景技术
近年来,钻井技术在国内发展迅速,但同时也存在着一些安全问题。目前,对于钻井技术的安全风险监测手段仍存在不足,监测数据出现异常时,需要监测人员及时、准确地进行判断。这就导致现场对于异常风险的诊断存在较强的主观性和滞后性,同时因不同地区钻井条件的差异性导致反映异常风险是否发生的相关参数特征差异较大,也增加了现场监测的难度。如何及时、准确地识别随钻安全风险并做出相应处理,已经成为了保证气体钻井成功率的重要环节。
就目前而言,对于智能化识别钻井风险进行安全监测还缺乏研究。例如,于2020年12月01日公开的发明名称为一种基于长短期记忆网络的油气井钻井溢漏预警方法,公开号为CN112016766A的专利文献记载了了一种基于长短期记忆网络的油气井钻井溢漏预警方法,该方法包括以下步骤:构建基于长短期记忆网络的溢漏风险预警模型,溢漏风险预警模型包括输入层、隐含层和输出层;利用已有的钻井风险数据对溢漏风险预警模型进行训练;利用训练后的溢漏风险预警模型进行油气井钻井溢漏预警。该方法能够降低风险识别对先验知识和专家经验的依赖,但是该方法主要适用于钻井溢漏风险的预警,对于其他钻井风险的实用性较差。
于2019年11月12日公开的发明名称为基于卷积神经网络的钻井溢漏风险识别方法、系统及设备、公开号为CN110443488A的专利文献记载了一种基于卷积神经网络的钻井溢漏风险识别方法,该方法通过获取由综合录井仪采集的实时工况数据;对综合录井仪采集到的每一个实时工况数据采用滑动重叠采样方式对数据集进行扩充;将实时工况数据进行归一化预处理;将归一化预处理后的实时工况数据输入到训练好的卷积神经网络模型中,最终输出钻井溢漏风险识别结果。该方法虽然运用到卷积神经网络模型但是对卷积神经网络模型的应用比较浅,卷积神经网络初始聚类中心设计不合理,中心宽度过宽,容易导致模型训练无法收敛,容易造成识别失误,不能做出快速有效的识别,而且应用范围较窄,对于其他的井下风险的识别率较低。上述两种方法均用到新的信息技术去减少风险识别过程中的人为因素,但是应用范围较窄,未对卷积神经网络模型做出改进,识别率低,容易出现识别失败的问题。
发明内容
本发明的目的在于解决现有技术存在的上述不足中的至少一项。例如,本发明提供了钻井风险识别模型的建立方法,以克服现有技术中钻井风险识别速度慢,识别不准确的缺陷。
为了实现上述目的,本发明一方面提供了一种钻井风险识别模型的建立方法,所述方法可以包括以下步骤:建立包含有风险表征参数的数据库;基于数据库,建立复合网络模型,该模型包括卷积神经网络层和RBF神经网络层;其中,卷积神经网络层包括有第一卷积层和第二卷积层,第一卷积层能够提取各参数本身所隐含的特征信息,第二卷积层能够提取各参数之间所隐含的联系,并能将不同尺度的特征信息结合起来得到复合的特征信息;RBF 神经网络层能够将所述复合的特征信息进行分类;训练所述复合网络模型,得到钻井风险识别模型。
在本发明的钻井风险识别模型的建立方法的一个示例性实施例中,所述第一和第二卷积层均使用了三个不同尺度的卷积核。
在本发明的钻井风险识别模型的建立方法的一个示例性实施例中,在建立复合网络模型之后,所述方法还包括对模型进行优化的步骤。
在本发明的钻井风险识别模型的建立方法的一个示例性实施例中,所述优化可以包括K-means算法的优化方式。
在本发明的钻井风险识别模型的建立方法的一个示例性实施例中,所述训练包括:基于距离均方误差的损失函数分量训练并更新K-means算法的聚类中心。
在本发明的钻井风险识别模型的建立方法的一个示例性实施例中,在所述训练中制定了隐藏层节点数选取准则,以提高所述模型的计算效率和泛化性。
本发明另一方面提供了一种钻井风险识别模型,所述模型可以由如上所述的钻井风险识别模型的建立方法得到。
本发明再一方面提供了一种钻井风险智能识别方法,所述方法可以包括以下步骤:获取多个风险表征参数;利用卷积神经网络提取所述各参数的特征信息以及各参数之间的联系,得到复合的特征信息;利用RBF神经网络将所述复合的特征信息进行分类;通过不同风险的隐藏层节点数与评价值关系对钻井风险进行实时风险识别,得到所述风险表征参数模型的风险发生的概率。
本发明再一方面提供了一种钻井风险智能识别方法,所述RBF神经网络是经优化和训练后的网络;其中,所述优化可以包括:采用K-means算法对所述RBF神经网络的聚类中心以及中心宽度进行初始化;所述训练可以包括:基于距离均方误差的损失函数分量,训练并更新K-means算法的聚类中心。
在本发明的钻井风险智能识别方法的一个示例性实施例中,在所述智能识别方法中制定了隐藏层节点数选取准则,以提高所述模型的计算效率和泛化性。
在本发明的钻井风险智能识别方法的一个示例性实施例中,所述隐藏层选取规则可以包括:对网络模型训练的准确率以及网络模型的训练时间赋予权重,并根据不同隐藏层节点数对应的两个参数的比值来判定隐藏层节点的选取是否合理。
在本发明的钻井风险智能识别方法的一个示例性实施例中,所述隐藏层节点数选取规则可以包括:(1)确定卷积网络输入层的个数和RBF神经网络输出层的个数,确定基本网络模型,该模型包括了卷积网络和RBF神经网络; (2)根据确定RBF神经网络初始的隐藏层节点个数,其中,l 为RBF网络输入节点个数;r为隐藏层节点个数;k为RBF网络输出层节点个数;ε为常系数,取值范围为0-10;(3)对基本网络模型进行训练得到最终训练时间T以及基本网络模型测试集准确率B,为了消除指标之间的量纲影响,将所述训练时间以及所述网络模型测试集准确率进行0-1归一化;(4)利用下式得到不同隐藏层节点数对应评价值C(r),其中,μ和ν分别为常系数;(5)针对不同风险类型,设置不同的隐藏层节点数增量Δr,并重复步骤(4)得到新的评价值C(r+1),若新的评价值持续降低或者趋于不变,则停止增加隐藏层节点数;(6)将不同隐藏层节点数对应的评价值进行0-1 归一化,并将归一化后的评价值C(r)为100%的点对应的隐藏层节点数作为最优节点数。
在本发明的钻井风险智能识别方法的一个示例性实施例中,所述获取多个风险表征参数包括安全风险类型和采样时间,其中,在风险类型为地层产气的情况下,所述多个风险表征参数可以包括:管线排压、甲烷浓度、管线差压以及氧气浓度;在风险类型为地层出水的情况下,所述多个风险表征参数可以包括大钩负荷、立管压力以及出口湿度;在风险类型为卡钻风险的情况下,所述多个风险表征参数可以包括转盘转速和转盘扭矩。
在本发明的钻井风险智能识别方法的一个示例性实施例中,所述卷积神经网络可以包含第一卷积网络层和第二卷积网络层,其中,第一卷积网络层用于提取所述参数模型中的各参数本身所隐含的特征信息;第二卷积网络层用于提取所述参数模型中的各参数之间所隐含的联系。
在本发明的钻井风险智能识别方法的一个示例性实施例中,所述第一卷积网络层C1的卷积核尺寸可以为m*1,即某个特征参数的m行1列的时间特征信息,其中,m为卷积核纵向长度;所述第二卷积网络层C2的卷积核尺寸可以为1*n,用于提取某个风险在1行n列的表征参数上的参数间的关联特征信息,其中,n为各类安全风险特征参数数量。
本发明再一方面提供了一种计算机设备,所述设备可以包括:处理器;存储器,存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的钻井风险识别模型的建立方法,或者如上所述的钻井风险智能识别方法。
本发明再一方面提供了一种存储有计算机程序的计算机可读存储介质,当所述计算机程序在被处理器执行时实现如上所述的钻井风险识别模型的建立方法,或者如上所述的钻井风险智能识别方法。
与现有技术相比,本发明的有益效果可包括以下内容的至少一项:
(1)本发明采用算法优化的方式对RBF网络层聚类中心以及中心宽度进行初始化,解决了模型训练无法收敛的问题;
(2)本发明能够对钻井过程中出现的风险进行快速有效的识别,降低钻井成本;
(3)本发明提高了钻井风险识别效率减少了人工干预,提高了检测精度能够加快钻井精度节省工作周期。
附图说明
通过下面结合附图进行的描述,本发明的上述和其他目的和/或特点将会变得更加清楚,其中:
图1示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的方法流程图。
图2示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的数据点二维空间投影图。
图3示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的二维高斯核函数图。
图4示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的神经网络模型结构图。
图5A示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的不同风险的隐藏层节点数与评价值关系图的地层产气模型图。
图5B示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的不同风险的隐藏层节点数与评价值关系图的出水模型图。
图5C示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的不同风险的隐藏层节点数与评价值关系图的卡钻模型图。
图6A示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的地层产气风险训练集训练结果的损失值图。
图6B示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的地层产气风险训练集训练结果的准确率图。
图7A示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的地层出水风险训练集训练结果的损失值图。
图7B示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的地层出水风险训练集训练结果的准确率图。
图8A示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的卡钻风险训练集训练结果的损失值图。
图8B示出了本发明的一种钻井风险智能识别方法的一个示例性实施例的卡钻风险训练集训练结果的准确率图。
图9示出了本发明的一种钻井风险智能识别设备的一个示例性实施例的计算机设备结构示意图。
附图标记说明:
100-计算机设备,110-存储器,120-处理器。
具体实施方式
在下文中,将结合附图和具体实施例来详细说明本发明的一种钻井风险识别模型及建立方法、识别方法和计算机设备。
需要说明的是,“第一”、“第二”等仅仅是为了方便描述和便于区分,而不能理解为指示或暗示相对重要性。
示例性实施例1
本示例性实施例一方面提供了一种钻井风险识别模型的建立方法。
所述钻井风险识别模型的建立方法可包括以下步骤:
建立包含有风险表征参数的数据库。
基于数据库,建立复合网络模型,该模型包括卷积神经网络层和RBF神经网络层。
其中,卷积神经网络层包括有第一卷积层和第二卷积层,第一卷积层能够提取各参数本身所隐含的特征信息,第二卷积层能够提取各参数之间所隐含的联系,并能将不同尺度的特征信息结合起来得到复合的特征信息。
在本实施例中,第一和第二卷积层均使用了三个不同尺度的卷积核。
RBF神经网络层能够将所述复合的特征信息进行分类。
训练所述复合网络模型,得到钻井风险识别模型。
在本实施例中,在训练中制定了隐藏层节点数选取准则,用以提高所述模型的计算效率和泛化性。隐藏层节点数选取准则在运行前已经前置在算法中,不包含于RBF神经网络层中,可独立运行。
该隐藏层节点数选取准则可以应用于整个风险识别模型中,但由于该模型中仅RBF神经网络层有隐藏层节点,也可理解为作用在RBF神经网络层。
通过本实施例所提出的隐藏层选取规则可以对网络模型的测试集准确率以及训练时间赋予权重,并根据不同隐藏层节点数对应的两个参数的比值来判定隐藏层节点的选取是否合理。
通过本实施例所提出的隐藏层选取规则对RBF神经网络层的隐藏层节点进行训练,能够得到不同风险的评价值与隐藏层节点数关系。本领域的技术人员可以根据经验选取不同风险模型的隐藏层节点数增量从而使得钻井风险识别模型的识别评价结果达到最优。
在本实施例中,建立复合网络模型之后,上述方法还包括对模型的优化步骤。
在本实施例中,可以通过K-means算法对模型进行优化,之后基于距离均方误差的损失函数分量训练并更新K-means算法的聚类中心。
进一步地,K-means算法的优化可以与示例性实施例3中的相同。
进一步地,基于距离均方误差的损失函数分量训练可以与示例性实施例 3中的相同。
在本实施例中,所述风险表征参数可以与示例性实施例3中的相同。
在本实施例中,第一和第二卷积层可以与示例性实施例3中的相同。
在本实施例中,RBF神经网络层可以与示例性实施例3中的相同。
示例性实施例2
本示例性实施例提供了一种钻井风险识别模型。
所述钻井风险识别模型可以包括如示例性实施例1所述的钻井风险识别模型的建立方法得到。
示例性实施例3
本示例性实施例提供了一种钻井风险智能识别方法。
在所述钻井风险智能识别方法的一个示例性实施例中,风险智能识别方法可包括以下步骤:
S100、获取多个风险表征参数。
在本实施例中,获取多个风险表征参数可以包括安全风险类型和采样时间。
其中,在风险类型为地层产气风险的情况下,所述多个风险表征参数包括:管线排压、甲烷浓度、管线差压以及氧气浓度。
在风险类型为地层出水风险的情况下,所述多个风险表征参数包括大钩负荷、立管压力以及出口湿度。
在风险类型为卡钻风险的情况下,所述多个风险表征参数包括转盘转速和转盘扭矩。
S200、利用卷积神经网络提取各参数的特征信息以及各参数之间的联系,得到复合的特征信息。
在本实施例中,卷积神经网络包含第一卷积网络层和第二卷积网络层。
其中,第一卷积网络层用于提取参数中的各参数本身所隐含的特征信息。
第一卷积网络层的卷积核尺寸为m*1,即某个特征参数的m行1列的时间特征信息,其中,m为卷积核纵向长度。
第二卷积网络层用于提取参数中的各参数之间所隐含的联系。
第二卷积网络层的卷积核尺寸为1*n,用于提取某个风险在1行n列的表征参数上的参数间的关联特征信息,其中,n为各类安全风险特征参数数量。
S300、利用RBF神经网络将所述复合的特征信息进行分类。
在本实施例中,RBF神经网络是经优化和训练后的网络。
其中,可以采用K-means算法对RBF神经网络的聚类中心以及中心宽度进行初始化。
因为不合理的聚类中心可能会导致网络在训练过程中无法有效收敛,可以通过距离均方误差的损失函数分量,训练并更新K-means算法聚类中心cr的值。即可以基于距离均方误差的损失函数分量,训练并更新K-means算法的聚类中心。
S400、通过不同风险的隐藏层节点数与评价值关系对钻井风险进行实时风险识别,得到所述风险表征参数模型的风险发生的概率。
在本实施例中,上述智能识别方法中还包括隐藏层节点数选取准则。该隐藏层节点数选取准则用以提高所述模型的计算效率和泛化性。
隐藏层选取规则包括:对网络模型训练的准确率以及网络模型的训练时间赋予权重,并根据不同隐藏层节点数对应的两个参数的比值来判定隐藏层节点的选取是否合理。
在本实施例中,隐藏层节点数选取规则可以包括以下步骤:
(1)确定卷积网络输入层的个数和RBF神经网络输出层的个数,确定基本网络模型,该模型包括了卷积网络和RBF神经网络。
(3)对基本网络模型进行训练得到最终训练时间T以及基本网络模型测试集准确率B,为了消除指标之间的量纲影响,将所述训练时间以及所述网络模型测试集准确率进行0-1归一化。
(5)针对不同风险类型,设置不同的隐藏层节点数增量Δr,并重复步骤 (4)得到新的评价值C(r+1),若新的评价值持续降低或者趋于不变,则停止增加隐藏层节点数。
(6)将不同隐藏层节点数对应的评价值进行0-1归一化,并将归一化后的评价值C(r)为100%的点对应的隐藏层节点数作为最优节点数。
示例性实施例4
本示例性实施例提供了一种存储有计算机程序的计算机可读存储介质。该计算机可读存储介质存储有当被处理器执行时使得处理器执行根据本发明的钻井风险识别模型的建立方法,或者钻井风险智能识别方法的计算机程序。该计算机可读记录介质是可存储由计算机系统读出的数据的任意数据存储装置。计算机可读记录介质的示例包括:只读存储器、随机存取存储器、只读光盘、磁带、软盘、光数据存储装置和载波(诸如经有线或无线传输路径通过互联网的数据传输)。
示例性实施例5
本示例性实施例提供了一种计算机设备。该计算机设备包括处理器和存储器。存储器用于存储计算机程序。计算机程序被处理器执行使得处理器执行根据本发明的钻井风险识别模型的建立方法,或者钻井风险智能识别方法的计算机程序。
为了更好地理解本发明的上述示例性实施例,以下结合附图和具体示例进一步阐明本发明内容,但本发明的内容不局限于下面的实施例。
示例1
本示例提供了一种钻井风险智能识别方法,针对复杂的钻井风险本示例基于RBF分类器的改进卷积神经网络来实现对钻井风险快速准确的识别。
RBF神经网络相较于传统的全连接神经网络而言可以将低维数据映射到高维数据,在一定程度上实现非线性分类任务,同时RBF神经网络还是对连续函数的最佳逼近,存在“局部映射”的特点,因此泛化能力更好,计算速度更快。现场应用结果表明该方法具有较强的适应性和有效性,且相较于传统卷积神经网络能够更早识别异常风险的发生。
如图1所示,气体钻井风险识别方法可以采用下述技术方案实现。
步骤1:对气体钻井随钻监测过程中常见的三个安全风险:地层产气风险,地层出水风险和卡钻风险进行相关表征参数的分析总结。从而构建风险表征参数模型,并将所述风险表征参数模型作为输入样本,输入卷积网络。
因为地层产气风险和卡钻风险发生时相关表征参数变化迅速且幅度较大,所以构建参数模型时可以选择60s为一个采样时间。而发生地层出水风险时,相关参数变化缓慢且幅度较小,为了充分体现地层出水时参数变化趋势,可以选择120s为一个采样时间。
最终针对上述三种不同风险构建出风险表征参数模型如表1所示。
表1安全风险表征参数模型
步骤2:将建立好的风险表征参数模型作为卷积层的输入样本,输入样本为p×n(p=30,60)的矩阵,其中,p为样本纵向长度,n为各类安全风险特征参数数量。
一般来说,常规的卷积神经网络的卷积层通常采用层层叠加的方式并且每层只有一个尺寸的卷积核。本发明为了获取不同尺度的特征信息,采用了两个卷积层,分别是第一卷积网络层C1和第二卷积网络层C2。
由于各个风险的输入数据模型结构不同,因此针对不同风险下所使用的卷积核尺寸也不同。
在本示例中,卷积层的输入模型是m*n维,其中m为时间跨度,n为表征参数个数。本示例所建立的卷积层先通过不同m*1尺寸的卷积核获取输入数据在不同时间跨度的特征信息,然后再通过1*n尺寸的卷积核获取风险表征参数之间的特征信息。
具体来说,第一卷积网络层C1的卷积核尺寸为m*1,即某个特征参数的 m行1列的时间特征信息,其中,m为卷积核纵向长度。
所述第二卷积网络层C2的卷积核尺寸为1*n,用于提取某个风险在1行 n列的表征参数上的参数间的关联特征信息,其中,n为各类安全风险特征参数的数量。
另外,因为ELU函数相比于其它激活函数能够更好地改进卷积神经网络的学习特性,从而有效地防止梯度消失并且具有更好的泛化性能,所以本发明可以选用ELU函数作为卷积层的激活函数。
步骤3:采用非线性网络作为分类器对卷积网络层得到的数据进行分类处理。
由于钻井过程异常风险发生过程中各监测数据呈现出高度复杂的非线性特征。需要将多井次收集的卡钻风险监测数据与正常钻进风险监测数据经特征提取处理后映射到二维平面PC1-PC2中,得到如图2所示的投影结果。需要说明的是,图中,PC1和PC2为数据点投影在二维平面上的坐标值信息;圆形为类别1,表示卡钻风险未发生;三角形为类别2,表示卡钻风险发生。
由图2可以看出虽然转盘转速和转盘扭矩参数与卡钻风险高度关联,并可在一定程度表征卡钻风险,但在二维平面上无法直接通过一条直线将两类风险数据点进行准确区分,也即转盘转速和转盘扭矩参数与卡钻风险发生与否存在一定非线性关系。
传统卷积神经网络对数据进行分类往往通过全连接层进行处理,全连接层在处理这种复杂非线性问题时,各层之前所有节点均通过线性加权的方式对数据进行拟合。
使用传统的方式对复杂的非线性数据进行分类处理,一般在全连接层通过增加隐藏层层数或者节点数的方式实现近似非线性分类的效果,但由于结构自身的局限性,往往难以达到理想的结果。同时结构复杂则会导致参数过多,计算效率低,难以满足钻井现场对于计算速度的需求,且泛化性较低。
因此本发明采用非线性网络作为分类器来对数据进行分类处理。
本发明可以选择RBF神经网络实现数据进行分类处理功能。RBF神经网络是一种由输入层,隐藏层和输出层组成的三层前馈神经网络,各层有多个神经元,相邻两层单元之间单向连接。输入层到隐藏层是一个非线性的信息传递过程,隐藏层通常用高斯核函数作为径向基函数,通过计算输入向量与聚类中心之间的欧氏距离以及调整中心向量的宽度来控制径向作用范围,再计算输入向量的高斯值得到其隐藏层节点的输出为:
图中,纵坐标为输入数据点x对应的高斯值;横坐标x为输入数据区间;实线为当c=0,δ2=0.2时高斯函数在x=0时响应最强,其作用范围在x ∈(-1.2,1.2);虚线为当c=0,δ2=5时高斯函数在x=0时响应最强,其作用范围在x∈(-5,5);点线为当c=-2,δ2=0.2时高斯函数在x=-2时响应最强,其作用范围在x∈(-3.2,-0.8)。
高斯核函数作为非线性函数,通过调整的大小从而控制函数映射范围,函数的输入信号x靠近函数的中央范围时,隐含层节点将产生较大的输出,当输入距离值为0时,函数输出最大值。随着权值和输入向量间的距离不断增加,网络输出非线性递减,也就是说径向基函数对输入信号在局部产生响应。
由此可以看出这种网络具有局部非线性逼近能力,也即通过计算数据点的高斯核函数值,可将其映射到更高维的空间内。根据Cover定理,将输入向量从低维线性不可分的情况映射到高维空间后数据将变得线性可分。
步骤4:通过RBF神经网络分析升维后的三维空间数据点,模拟出数据内部的规律性。
升维后的三维空间数据点分布在高斯曲面上,相较于二维空间,存在一个平面使数据变得更接近直接线性可分的条件,虽然仍然存在部分数据点不可直接分割,但数量已大幅下降,同时也意味着分类精度的大幅提升。
若进一步采用更高维的空间,分类精度可继续提升。对网络结构而言,当输入向量x越接近中心向量cr时,隐藏层神经元的响应越强,对最终输出结果影响也越大,反之,则影响很小。这充分体现了RBF神经网络计算速度快的特点以及局部逼近特性。
利用高斯核函数的特性,RBF神经网络理论上可通过一个简单的三层网络结构逼近任意非线性函数,可以模拟出数据内部难以解析的规律性。
根据上述步骤最终绘制出本发明的神经网络模型结构图如图4所示。
示例2
本示例提供了一种钻井风险智能识别方法,该方法是在示例1的钻井风险智能识别方法的基础之上增加了优化步骤:采用K-means算法来确定RBF 神经网络模型的初始参数。
具体地,采用K-means算法来确定RBF神经网络模型的初始参数。
一般来说,RBF神经网络的聚类中心以及宽度直接影响着整个模型的最终结果。K-means算法是典型的无监督学习方法,对于输入数据不需要定义标签,只根据样本之间的距离作为相似性的评判标准,符合本发明的应用场景。因此本发明利用K-means算法对卷积网络所识别的特征信息进行聚类中心初始化。
基于K-means算法优化RBF神经网络模型层参数具体步骤可包括:
步骤1:将卷积神经网络所提取的复合的特征信息作为K-means算法的输入X={x1,x2,…,xN},随机选取h个不同的数据作为初始化聚类中心。
步骤2:计算输入样本X与初始化聚类中心cr(s)之间的距离: dis(X,cr(s))=‖X-cr(s)‖r=1,2,…,h,将输入样本X按照最小距离准则进行划分。
步骤4:重复步骤2和步骤3,当新的聚类中心不再发生变化时,输出最终聚类中心cr,按照公式,计算隐藏层节点的宽度δr,其中为第r个聚类中心与其它相距最近的样本中心之间的距离,最终得到初始化聚类中心cr和初始化中心宽度δr。
示例3
本示例提供了一种钻井风险智能识别方法,该方法是在示例2的钻井风险智能识别方法的基础之上增加了步骤:基于距离均方误差的损失函数分量来对整个网络模型进行训练,从而更好地优化模型参数。
具体地,K-means算法根据训练样本的特点确定了网络的初始中心点以及宽度,但是在本发明的网络模型训练过程中,卷积神经网络层所提取的特征信息会不断得到优化,最佳的聚类中心可能会发生改变,这会导致一开始通过K-means算法初始化的聚类中心和宽度变得不适合。
为了达到更快的训练效率和更准确的识别效果,本发明提出了一个基于距离均方误差的损失函数分量来对整个网络模型进行训练,从而更好地优化模型参数。
具体包括以下步骤:
步骤1:基于输入样本X与初始化聚类中心cr(s)之间的距离: dis(X,cr(s))=‖X-cr(s)‖r=1,2,…,h,得到基于距离均方误差的损失函数分量:
其中,lossun sup ervised为将每个样本与聚类中心距离的均方误差求和。
步骤2:根据上述公式把网络模型训练过程中损失函数的计算方法修改为:
Loss=lossmean-squared+lossunsuoervised,
其中,lossmean-squared为均方误差损失函数。
步骤3:将计算所得的结果通过Adam优化器进行反向传播训练,同时对整个神经网络的所有权重和偏置等参数进行优化,并优化cr和δr,其中,cr为第r个隐藏层节点中心向量;δr为第r个隐藏层节点中心向量宽度。
示例4
本示例提供了一种钻井风险智能识别方法,该方法是在示例1、2或3的钻井风险智能识别方法的基础之上增加了步骤:新的隐藏层节点数选择步骤。
具体地,在限定隐藏层数的条件下,RBF神经网络的隐藏层节点数对整个网络的性能有着重大影响,隐藏层节点数过少会导致模型出现欠拟合现象,而隐藏层节点数过多会导致模型结构变得复杂,泛化性降低。在钻井风险智能识别场景中,对模型计算效率以及泛化性的要求都较高。因此,为了满足现场应用的需求,对于隐藏层节点数的合理选择变得极为重要。
本示例提出了一种隐藏层节点数选择的方法,该方法对网络模型的测试集准确率以及训练时间赋予权重,并根据不同隐藏层节点数对应的两个参数的比值来判定隐藏层节点的选取是否合理。
具体来说可包括以下步骤:
步骤1:确定网络模型的输入输出层的个数,确定基本的模型结构。
步骤3:对网络模型进行训练得到最终训练时间T以及网络模型测试集准确率B,为了消除指标之间的量纲影响,将所述训练时间以及所述网络模型测试集准确率进行0-1归一化。
步骤5:针对不同风险识别模型设置不同的隐藏层节点数增量Δr,并重复步骤4得到新的评价值C(r+1)。若新的评价值持续降低或者趋于不变,则停止增加隐藏层节点数。
具体来说,评价值是准确率与训练时间之间的一种比值关系,所期望结果是准确率高但训练时间短,因此评价值达到100%后,随着隐藏层节点数增加,准确率不会再有较大幅度的提高,但是模型会变得复杂导致训练时间会逐渐增加。因此不存在评价值持续升高的情况,评价值一定会在达到峰值后逐渐降低。
步骤6:将不同隐藏层节点数对应的评价值进行0-1归一化,并将归一化后的评价值C(r)为100%的点对应的隐藏层节点数作为最优节点数。
例如:在本示例所示出的隐藏层选取规则下,三种风险所得到的评价值与隐藏层节点数关系如图5A、图5B和图5C所示。
从图5A可以看出,地层产气模型在隐藏层节点数为29时评价值达到 100%,可选取隐藏层节点数增量为1,且在评价结果达到最优后,随着隐藏层节点数增加评价结果逐渐变差。
从图5B可以看出,地层出水模型在隐藏层节点数为40时评价值达到 100%,可选取隐藏层节点数增量为5,在达到最优评价结果后,随着隐藏层节点数增加评价结果逐渐变差。
从图5C可以看出,卡钻模型在隐藏层节点数为25时评价值达到100%,可选取隐藏层节点数增量为1,且在评价结果达到最优以后,随着隐藏层节点数增加评价结果逐渐变差。
示例5
本示例提供了一种钻井风险识别模型,该方法是在示例1、2、3或4的钻井风险智能识别方法的基础之上构建出钻井风险识别模型。
本示例示出了使用不同地区气体钻井随钻监测系统所采集到的监测数据进行训练后的结果。
在本示例中,对本发明的钻井风险识别模型,卷积神经网络和RBF神经网络同时训练8000次。
本示例中的数据使用不同地区气体钻井随钻监测系统所采集到的监测数据,将十余口井的历史监测数据按照地层产气、地层出水、卡钻风险发生时的相关表征参数进行整理,可以采用示例1、2、3或4的钻井风险智能识别方法中任意一种方法构建样本模型和构建分类网络。
将本示例所提出的钻井风险识别模型与传统的卷积神经网络进行实验结果对比,同时为了验证本示例中的钻井风险识别模型相较于单一的RBF神经网络效果是否变得更好,本示例按照相同方式构建了一个RBF网络模型来进行性能对比。
图6A和图6B示出了本示例的地层产气风险的样本训练集训练结果。
图6A示出了经过训练后各神经网络的损失值,图中,实线表示本发明的钻井风险识别模型的损失值,虚线表示卷积神经网络的损失值,点线表示 RBF神经网络的损失值。由图6A可以看出本发明的钻井风险识别模型训练效果最好,在训练3000次后损失值收敛。
图6B示出了经过训练后各神经网络的训练集的准确率,图中,实线表示本发明的钻井风险识别模型的准确率,虚线表示卷积神经网络的准确率,点线表示RBF神经网络的准确率。由图6B可以看出本发明的钻井风险识别模型的最终训练集的准确率达到98%。
图7A和图7B示出了本实施例的地层出水风险的样本训练集训练结果。
图7A示出了经过训练后各神经网络的损失值,图中,实线表示本发明的钻井风险识别模型的损失值,虚线表示卷积神经网络的损失值,点线表示 RBF神经网络的损失值。由图7A可以看出三种神经网络在训练8000次后损失值最终都收敛。
图7B示出了经过训练后各神经网络的训练集的准确率,图中,实线表示本发明的钻井风险识别模型的准确率,虚线表示卷积神经网络的准确率,点线表示RBF神经网络的准确率。由图7B可以看出RBF神经网络对地层出水训练集的准确率仅有83%,卷积神经网络对训练集准确率达到94%,而本发明改进后的钻井风险识别模型对训练集准确率在训练步数达到4000次以后基本不变最终达到95%。
卡钻风险的表征参数有转盘钻速和转盘扭矩两个参数。三种网络的卡钻风险的样本训练集训练结果如图8A和图8B所示。
图8A示出了经过训练后各神经网络的损失值,图中,实线表示本发明的钻井风险识别模型的损失值,虚线表示卷积神经网络的损失值,点线表示 RBF神经网络的损失值。由图8A可以看出三种神经网络的损失值收敛的很快。
图8B示出了经过训练后各神经网络的训练集的准确率,图中,实线表示本发明的钻井风险识别模型的准确率,虚线表示卷积神经网络的准确率,点线表示RBF神经网络的准确率。由图8B可以看出三种神经网络对训练集样本均有较好的识别效果,准确率都达到了90%以上。
测试集在三种神经网络中的准确率如表3所示。在不同风险下的网络训练损失值都收敛,说明三种神经网络都具有良好的训练效果,但从对测试集的最终识别结果可以看出三种神经网络对测试集的识别准确率存在差异。由表3可以看出本发明改进的钻井风险识别模型对三种风险的测试集的准确率分别达到97.32%、95.25%、93.78%,均好于卷积神经网络以及RBF神经网络的测试结果。
表3测试集测试结果对比
本示例的结果表明在对钻井风险识别的场合下,本示例所提出的钻井风险识别模型表现出了更突出的性能优势,能成功推理出数据内部所蕴含的规律性。卷积层采用多个卷积核同时提取特征信息的方式使得网络模型对于数据具有更丰富的特征提取能力,将RBF神经网络作为分类器应用于卷积神经网络,网络模型对于数据之间所蕴含的特征信息的分析处理能力得到了有效地增强。
示例6
在本示例中,可以采用示例1、2、3或4的钻井风险智能识别方法,或示例5的钻井风险识别模型,对现场钻井数据进行处理。
本示例示出了,丰谷A井和新A井在随钻监测过程中地层产气时间段运用本发明上述任意一种钻井风险智能识别方法或钻井风险识别模型得到的现场测试结果。
一般来说钻井现场情况复杂,关闭降尘水,改变注气量等操作都有可能会影响地层产气风险表征参数变化,尤其当甲烷浓度变化较小时,现场监控人员往往难以第一时间做出反应。为降低误报概率,将风险识别阈值设为60%。
选取丰谷A井和新A井在随钻监测过程中地层产气时间段的现场测试结果进行说明,其中丰谷A井数据如表4所示。
表4丰谷A井地层产气风险现场应用效果
从表4可以看出,丰谷A井地层产气时间段内,本发明的钻井风险智能识别方法在22时06分45秒判定地层产气,而CNN卷积神经网络和RBF网络模型分别在22时07分25秒和22时07分29秒才识别出地层产气。
网络模型在新A井11时38分59秒判定地层产气,而CNN卷积神经网络和RBF网络模型分别在11时39分17秒和11时39分15秒才识别出地层产气。地层产气风险识别方法现场应用结果表明,本发明的钻井风险智能识别方法效果响应迅速,实际效果明显优于CNN卷积神经网络以及RBF神经网络,且对于不同地区的气体钻井场合都具有良好的效果。
选取新A井和新盛B井在随钻监测过程中地层出水时间段的测试结果进行说明。测试方式以及判定风险是否发生的方式与地层产气风险识别方式相同,新A井测试结果如图表5所示。
表5新A井地层出水风险现场应用效果
从表5可知,新A井地层出水阶段,本发明的钻井风险智能识别方法在现场出口湿度还未发生显著变化时,于10时21分19秒即根据多个表征参数的变化判定地层出水风险发生,比CNN卷积神经网络提前了8s,比RBF网络提前了22s。
在另一井场新盛B井的现场应用过程中,本发明的钻井风险智能识别方法在现场时间5时41分51秒判定地层出水,相较CNN卷积神经网络和RBF 网络识别结果提前了16s。由此表明本发明所提出的网络模型在识别地层出水风险时,能有效地根据相关风险发生时的表征参数对风险进行及时的判断,达到了较好的识别效果。
卡钻风险往往直接影响气体钻井是否还能正常钻进,因此对卡钻风险的及时识别非常重要,本发明的钻井风险智能识别方法反应迅速,能够及时给监控人员提供辅助判断,通知司钻处理,确保整个钻井过程的顺利进行。
例如:在丰谷A井发生卡钻风险的过程中,本发明的钻井风险智能识别方法在现场时间21时57分37秒提示发生卡钻风险,相较于CNN卷积神经网络和RBF神经网络识别结果分别提前了8s和7s。
示例7
如图9所示,一种计算机设备100包括存储器110和处理器120,存储器110中存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的钻井风险识别模型的建立方法,或者如上所述的钻井风险智能识别方法。
尽管上面已经结合示例性实施例及附图描述了本发明,但是本领域普通技术人员应该清楚,在不脱离权利要求的精神和范围的情况下,可以对上述实施例进行各种修改。
Claims (17)
1.一种钻井风险识别模型的建立方法,其特征在于,所述方法包括以下步骤:
建立包含有风险表征参数的数据库;
基于数据库,建立复合网络模型,该模型包括卷积神经网络层和RBF神经网络层;其中,卷积神经网络层包括有第一卷积层和第二卷积层,第一卷积层能够提取各参数本身所隐含的特征信息,第二卷积层能够提取各参数之间所隐含的联系,并能将不同尺度的特征信息结合起来得到复合的特征信息;RBF神经网络层能够将所述复合的特征信息进行分类;
训练所述复合网络模型,得到钻井风险识别模型。
2.根据权利要求1所述的钻井风险识别模型的建立方法,其特征在于,所述第一和第二卷积层均使用了三个不同尺度的卷积核。
3.根据权利要求1所述的钻井风险识别模型的建立方法,其特征在于,在建立复合网络模型之后,所述方法还包括对模型进行优化的步骤。
4.根据权利要求3所述的钻井风险识别模型的建立方法,其特征在于,所述优化包括K-means算法的优化方式。
5.根据权利要求4所述的钻井风险识别模型的建立方法,其特征在于,所述训练包括:基于距离均方误差的损失函数分量训练并更新K-means算法的聚类中心。
6.根据权利要求1所述的钻井风险识别模型的建立方法,其特征在于,在所述训练中制定了隐藏层节点数选取准则,以提高所述模型的计算效率和泛化性。
7.一种钻井风险识别模型,所述模型由权利要求1至6中任一项所述的方法得到。
8.一种钻井风险智能识别方法,其特征在于,所述方法包括以下步骤:
获取多个风险表征参数;
利用卷积神经网络提取所述各参数的特征信息以及各参数之间的联系,得到复合的特征信息;
利用RBF神经网络将所述复合的特征信息进行分类;
通过不同风险的隐藏层节点数与评价值关系对钻井风险进行实时风险识别,得到所述风险表征参数模型的风险发生的概率。
9.根据权利要求8所述的钻井风险智能识别方法,其特征在于,所述RBF神经网络是经优化和训练后的网络;其中,
所述优化包括:采用K-means算法对所述RBF神经网络的聚类中心以及中心宽度进行初始化;
所述训练包括:基于距离均方误差的损失函数分量,训练并更新K-means算法的聚类中心。
10.根据权利要求8所述的钻井风险智能识别方法,其特征在于,在所述智能识别方法中制定了隐藏层节点数选取准则,以提高所述模型的计算效率和泛化性。
11.根据权利要求10所述的钻井风险智能识别方法,其特征在于,所述隐藏层选取规则包括:
对网络模型训练的准确率以及网络模型的训练时间赋予权重,并根据不同隐藏层节点数对应的两个参数的比值来判定隐藏层节点的选取是否合理。
12.根据权利要求11所述的钻井风险智能识别方法,其特征在于,所述隐藏层节点数选取规则包括:
(1)确定卷积网络输入层的个数和RBF神经网络输出层的个数,确定基本网络模型,该模型包括了卷积网络和RBF神经网络;
(3)对基本网络模型进行训练得到最终训练时间T以及基本网络模型测试集准确率B,为了消除指标之间的量纲影响,将所述训练时间以及所述网络模型测试集准确率进行0-1归一化;
(4)利用下式得到不同隐藏层节点数对应评价值C(r),其中,
(5)针对不同风险类型,设置不同的隐藏层节点数增量Δr,并重复步骤(4)得到新的评价值C(r+1),若新的评价值持续降低或者趋于不变,则停止增加隐藏层节点数;
(6)将不同隐藏层节点数对应的评价值进行0-1归一化,并将归一化后的评价值C(r)为100%的点对应的隐藏层节点数作为最优节点数。
13.根据权利要求8所述的钻井风险智能识别方法,其特征在于,所述获取多个风险表征参数包括安全风险类型和采样时间,其中,
在风险类型为地层产气的情况下,所述多个风险表征参数包括:管线排压、甲烷浓度、管线差压以及氧气浓度;
在风险类型为地层出水的情况下,所述多个风险表征参数包括大钩负荷、立管压力以及出口湿度;
在风险类型为卡钻风险的情况下,所述多个风险表征参数包括转盘转速和转盘扭矩。
14.根据权利要求8所述的风险智能识别方法,其特征在于,所述卷积神经网络包含第一卷积网络层和第二卷积网络层,其中,
第一卷积网络层用于提取所述参数模型中的各参数本身所隐含的特征信息;
第二卷积网络层用于提取所述参数模型中的各参数之间所隐含的联系。
15.根据权利要求14所述的风险智能识别方法,其特征在于,所述第一卷积网络层的卷积核尺寸为m*1,即某个特征参数的m行1列的时间特征信息,其中,m为卷积核纵向长度;
所述第二卷积网络层的卷积核尺寸为1*n,用于提取某个风险在1行n列的表征参数上的参数间的关联特征信息,其中,n为各类安全风险特征参数数量。
16.一种计算机设备,其特征在于,所述设备包括:
处理器;
存储器,存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1~6中任一项所述的钻井风险识别模型的建立方法,或者实现如权利要求8~15中任一项所述的钻井风险智能识别方法。
17.一种存储有计算机程序的计算机可读存储介质,其特征在于,当计算机程序在被处理器执行时实现如权利要求1~6中任一项所述的钻井风险识别模型的建立方法,或者实现如权利要求8~15中任意一项所述的钻井风险智能识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211093505.8A CN115640526A (zh) | 2022-09-08 | 2022-09-08 | 钻井风险识别模型及建立方法、识别方法和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211093505.8A CN115640526A (zh) | 2022-09-08 | 2022-09-08 | 钻井风险识别模型及建立方法、识别方法和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115640526A true CN115640526A (zh) | 2023-01-24 |
Family
ID=84942189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211093505.8A Pending CN115640526A (zh) | 2022-09-08 | 2022-09-08 | 钻井风险识别模型及建立方法、识别方法和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115640526A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116822971A (zh) * | 2023-08-30 | 2023-09-29 | 长江大学武汉校区 | 一种井壁风险等级预测方法 |
CN117420150A (zh) * | 2023-12-18 | 2024-01-19 | 西安石油大学 | 一种基于钻井参数的分析预测系统及其预测方法 |
-
2022
- 2022-09-08 CN CN202211093505.8A patent/CN115640526A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116822971A (zh) * | 2023-08-30 | 2023-09-29 | 长江大学武汉校区 | 一种井壁风险等级预测方法 |
CN116822971B (zh) * | 2023-08-30 | 2023-11-14 | 长江大学武汉校区 | 一种井壁风险等级预测方法 |
CN117420150A (zh) * | 2023-12-18 | 2024-01-19 | 西安石油大学 | 一种基于钻井参数的分析预测系统及其预测方法 |
CN117420150B (zh) * | 2023-12-18 | 2024-03-08 | 西安石油大学 | 一种基于钻井参数的分析预测系统及其预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101426B (zh) | 基于自编码器的无监督学习图像异常检测方法 | |
CN115640526A (zh) | 钻井风险识别模型及建立方法、识别方法和计算机设备 | |
CN112083498B (zh) | 一种基于深度神经网络的多波地震油气储层预测方法 | |
CN111340292B (zh) | 一种基于聚类的集成神经网络pm2.5预测方法 | |
CN110213244A (zh) | 一种基于时空特征融合的网络入侵检测方法 | |
CN107463993B (zh) | 基于互信息-核主成分分析-Elman网络的中长期径流预报方法 | |
US20040002928A1 (en) | Pattern recognition method for reducing classification errors | |
CN110377605B (zh) | 一种结构化数据的敏感属性识别与分类分级方法 | |
CN110134719B (zh) | 一种结构化数据敏感属性的识别与分类分级方法 | |
CN112735097A (zh) | 一种区域滑坡预警方法及系统 | |
CN110880369A (zh) | 基于径向基函数神经网络的气体标志物检测方法及应用 | |
CN115758212A (zh) | 一种基于并行网络和迁移学习的机械设备故障诊断方法 | |
CN111681022A (zh) | 一种网络平台数据资源价值评估方法 | |
CN112504682A (zh) | 基于粒子群优化算法的底盘发动机故障诊断方法及系统 | |
CN114818809A (zh) | 基于交叉小波的sca-svm电机滚动轴承的故障诊断方法 | |
CN114487129A (zh) | 基于声发射技术的柔性材料的损伤识别方法 | |
CN113987910A (zh) | 一种耦合神经网络与动态时间规划的居民负荷辨识方法及装置 | |
CN111178897B (zh) | 在不平衡数据上快速特征学习的代价敏感的动态聚类方法 | |
CN117370766A (zh) | 一种基于深度学习的卫星任务规划方案评估方法 | |
CN116842358A (zh) | 一种基于多尺度卷积和自适应特征融合的软测量建模方法 | |
CN111914471A (zh) | 一种基于快速核独立成分分析的精馏塔故障检测方法 | |
Ragab et al. | Mathematical Modelling of Quantum Kernel Method for Biomedical Data Analysis. | |
CN115083511A (zh) | 基于图表示学习与注意力的外围基因调控特征提取方法 | |
CN115496103A (zh) | 一种压缩感知域下基于改进的pso-lstsvm的流体管道泄漏识别方法 | |
CN113657520A (zh) | 一种基于深度置信网络和长短时记忆网络的入侵检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |