CN117386344A - 一种基于两阶段学习的钻井异常工况诊断方法及系统 - Google Patents
一种基于两阶段学习的钻井异常工况诊断方法及系统 Download PDFInfo
- Publication number
- CN117386344A CN117386344A CN202311703864.5A CN202311703864A CN117386344A CN 117386344 A CN117386344 A CN 117386344A CN 202311703864 A CN202311703864 A CN 202311703864A CN 117386344 A CN117386344 A CN 117386344A
- Authority
- CN
- China
- Prior art keywords
- data
- drilling
- stage
- abnormal
- blocks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005553 drilling Methods 0.000 title claims abstract description 79
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000003745 diagnosis Methods 0.000 title claims abstract description 17
- 230000006870 function Effects 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000013145 classification model Methods 0.000 claims abstract description 21
- 230000005856 abnormality Effects 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 238000009826 distribution Methods 0.000 claims abstract description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000011478 gradient descent method Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 4
- 238000011524 similarity measure Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 2
- 238000002347 injection Methods 0.000 claims 1
- 239000007924 injection Substances 0.000 claims 1
- 238000005192 partition Methods 0.000 description 10
- 238000011161 development Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000008398 formation water Substances 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21B—EARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B44/00—Automatic control systems specially adapted for drilling operations, i.e. self-operating systems which function to carry out or modify a drilling operation without intervention of a human operator, e.g. computer-controlled drilling systems; Systems specially adapted for monitoring a plurality of drilling variables or conditions
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21B—EARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B49/00—Testing the nature of borehole walls; Formation testing; Methods or apparatus for obtaining samples of soil or well fluids, specially adapted to earth drilling or wells
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Geology (AREA)
- Mining & Mineral Resources (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Geochemistry & Mineralogy (AREA)
- Environmental & Geological Engineering (AREA)
- Fluid Mechanics (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于两阶段学习的钻井异常工况诊断方法及系统,该方法包括如下步骤:S1:处理随钻录井参数,对每个特征通道采用滑动窗口进行多尺度划分,得到分块;S2:采用异常检测模型进行第一阶段的异常检测:学习分块之间和分块内部两种数据表示,并计算两者之间的差异,给出异常判断;S3:将判断结果重新整理到新的数据集中;S4:采用不均衡多分类模型进行第二阶段的不均衡多分类:结合标签分布相关边界损失函数和延迟重赋权训练,达到对异常结果的识别。本发明利用两阶段学习的思想可解决实际的钻井样本不均衡导致的异常识别准确率低的问题。
Description
技术领域
本发明涉及钻井开发技术领域,尤其涉及一种基于两阶段学习的钻井异常工况诊断方法及系统。
背景技术
气体欠平衡钻井技术是近年来为适应油气开发而提出的及时发现、保护油气层和增产、提高产能的新型工艺技术。与钻井液钻井技术相比,气体钻井具有较低的综合成本、能有效克服传统钻井液钻井的漏失情况和提高钻井的机械钻速等优点。同时由于气体钻井低密度与高流速的特殊性,在进行气体钻井大面积推广应用同时,也暴露出了一些安全隐患与风险。比如钻井过程中发生的地层产气不仅容易造成人员伤亡和经济损失,对环境也造成污染,地层产水、卡钻、接立柱等安全事故的发生也会对大家的生命有威胁。
近年来,随着人工智能技术在全球范围内迅猛发展,油气勘探开发智能化成为全球油气行业发展的热点,也成为保障中国能源战略安全的变革性技术。各界人士对于气体钻井安全问题也有了更高的期望,随着对钻井安全风险研究的深入,专家从研究气体钻井过程中发生安全问题的主要影响因素与对应参数变化的关系模型到提出采用钻井模型与专家系统相结合,不断总结挖掘判断安全风险的方法。钻井技术正由传统模式向机器学习与人工智能相结合的方向发展。
发明内容
本发明的目的是提供一种基于两阶段学习的钻井异常工况诊断方法及系统,以解决实际的钻井样本不均衡导致异常识别准确率低的技术问题。
本发明是采用以下技术方案实现的:一种基于两阶段学习的钻井异常工况诊断方法,包括如下步骤:
S1:处理随钻录井参数,对每个特征通道采用滑动窗口进行多尺度划分,得到分块;
S2:采用异常检测模型进行第一阶段的异常检测:学习分块之间和分块内部两种数据表示,并计算两者之间的差异,给出异常判断;
S3:将判断结果重新整理到新的数据集中;
S4:采用不均衡多分类模型进行第二阶段的不均衡多分类:结合标签分布相关边界损失函数和延迟重赋权训练,达到对异常结果的识别。
进一步的,步骤S1包括如下子步骤:
S11:采用三次样条插值将不同钻井采样点的原始数据时间间隔统一,并进行归一化处理;
S12:设置不同的滑动窗口大小,即为读取数据的长度,每个长度的滑动窗口所采样的数据记为一个分块;每一个分块由多个特征通道组成,组成分块的所有特征通道记为分块内。
进一步的,步骤S2包括如下子步骤:
S21:通过多头自注意力网络对分块之间的关系进行建模,得到分块间的数据表示,记为:
,其中,/>表示连接,/>为一个可学习参数矩阵,/>为网络层的维度,/>表示实数集,/>为分块的注意力权重;
S22:通过多头自注意力网络对分块内的数据之间的关系进行建模,得到分块内的数据表示,记为:
,其中,/>为一个可学习参数矩阵,/>为分块的注意力权重;
S23:将不同尺度下的分块的数据表示映射到原始时间序列的形状中,对于分块间分支,使用重复分块的方式进行上采样,得到分块间最终的数据表示,记为:
,
对于分块内分支,使用重复分块内的点的方式进行上采样,得到分块内最终的数据表示,记为:
,其中,/>表示上采样,/>表示分块集合,/>表示分块内的数据表示,/>表示分块间的数据表示。
进一步的,步骤S2还包括如下子步骤:
S24:使用基于库尔贝克-莱布勒散度的损失函数来衡量分块间数据表示和分块内数据表示的相似性;
S25:反复上述步骤,使用梯度下降法和梯度停止法异步更新双注意力对比网络,通过优化器最小化损失函数,进行模型训练。
进一步的,步骤S2还包括如下子步骤:
S26:定义原始随钻录井数据,异常得分记为/>,计算公式如下:
,其中,/>为实数集,/>为随钻录井数据的长度,/>为随钻录井数据的维度,/>表示输入的时间序列,/>为分快内的数据表示,/>为分块间的数据表示,/>表示两个输出向量/>和/>的相似性度量,计算公式如下:
,
S27:基于逐个数据点的异常得分,记为/>,设置一个超参数用来决定一个点是否是异常:/>。
进一步的,步骤S3具体为:将第一阶段识别的异常数据重新组合为数据集,将第一阶段识别为正常的数据重新组合为数据集/>,对于任意录井参数/>,其中/>表示特征向量,/>表示标签:
如果,则将样本加入集合/>,即/>;
如果,则将样本加入集合/>,即/>。
进一步的,步骤S4包括如下子步骤:
S41:在训练轮次1到指定训练轮次,使用标签分布相关边界损失函数/>训练多分类模型/>,使用随机梯度下降来进行反向传播并更新模型网络参数;
S42:在训练轮次到训练轮次/>,使用样本数量对损失函数进行重赋权,使用在归一化的学习率的随机梯度下降优化器优化多分类模型/>;
S43:通过多分类模型输出结果:
,其中,/>是一个k维向量,诊断的类别/>,其中k表示样本的类别数量,置信度/>最高的类别为最终诊断类别。
一种基于两阶段学习的钻井异常工况诊断系统,用以实现上述所述的一种基于两阶段学习的钻井异常工况诊断方法,包括数据处理模块、异常检测模型和不均衡多分类模型,其中,
数据处理模块,用以处理随钻录井参数,对每个特征通道采用滑动窗口进行多尺度划分,得到分块;
常检测模型,用以进行第一阶段的异常检测,学习分块之间和分块内部两种数据表示,并计算两者之间的差异,给出异常判断;
不均衡多分类模型,用以进行第二阶段的不均衡多分类,结合标签分布相关边界损失函数和延迟重赋权训练,达到对异常结果的识别。
一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,实现上述所述的一种基于两阶段学习的钻井异常工况诊断方法。
一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现上述所述的一种基于两阶段学习的钻井异常工况诊断方法。
本发明的有益效果在于:本发明利用两阶段学习的思想解决实际的钻井样本不均衡导致的异常识别准确率低的问题。首先对已经获取的钻井工况进行数据预处理包括特征筛选、时序数据插值、钻井工况编码;然后使用滑动窗口将时序数据划分成固定长度的小序列,用于捕捉时序序列的局部信息。将固定长度的小序列输入到两个具有相同注意力的网络分支。这两个分支共享网络权重,但是计算过程不共享,一个分支学习不同固定长度的小序列之间的关系,得到一种表示,另一个网络学习固定长度小序列内部的关系,得到另一种表示。通过对比两种不同视角的表示,正常点两种表示接近,异常点两种表示差异大,从而进行有效的钻井工况检测。实现一阶段的异常检测,对于第二阶段将标签分布相关边界损失函数替换原来的交叉熵损失函数,使得模型更加偏向于小样本数据,在使用延迟重赋权训练用于诊断不均衡钻井异常数据的多分类模型ResNet32(拥有32层网络结构的残差网络),从而达到对异常结果的准确识别。根据识别模型的判断及时有效的采取措施可以有效的防止事故的发生。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明流程图;
图2为双头注意力对比表示学习网络结构图;
图3为多分类模型网络结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
参见图1至图3,一种基于两阶段学习的钻井异常工况诊断方法,包括如下步骤:
S1:处理随钻录井参数,对每个特征通道采用滑动窗口进行多尺度划分(不同大小的滑动窗口读取的数据),划分得到的数据属于整个数据的一部分,定义为分块。分块用于获取不同粒度的局部信息。
S2:用双分支注意力网络(一种多分支深度学习架构,允许模型同时学习多个方面的特征,并通过注意力机制来动态调整这些特征的权重),分别学习分块之间和分块内部两种数据表示。
S3:计算分块之间的数据表示和分块内部的数据表示之间的差异。
S4:计算异常数据,并给出异常判断。
S5:将判断出的异常钻井数据和正常钻井数据重新整理到新的数据集中。
S6:在训练轮次1到指定训练轮次使用标签分布相关边界损失函数(标签分布不均衡时使用的分类损失函数)训练多分类模型/>(32层残差网络),使用随机梯度下降来进行反向传播并更新模型网络参数。
S7:在训练轮次到训练轮次/>使用样本数量对损失函数进行重赋权(调整损失函数中不同部分权重),使用在归一化(将数据缩放到区间/>)的学习率的随机梯度下降优化器优化模型。
S8:通过多分类模型计算得出异常类别向量。需要说明的是,附图2中,K表示键,Q表示查询,HX表示注意力网络层,分块i表示将原数据分成i块;附图3中,*5表示有五层,*4表示有四层。
在本实施例当中,步骤S1包括以下子步骤:
S11:采用三次样条插值将不同钻井采样点的原始数据时间间隔统一(每个特征通道单独处理),并进行归一化处理。
S12:记原始的随钻录井数据为,其中/>表示实数集,/>为随钻录井数据的长度,/>为随钻录井数据的维度,滑动窗口的大小,即为读取数据的长度,分别设置为2,3,5,每个长度的滑动窗口所采样的数据记为一个分块,提供给步骤S2计算分块间之间的数据表示;每一个分块由多个特征通道(网络的输出通道数)组成,组成分块的所有特征通道记为分块内,提供给步骤S2计算每一个分块内部的数据表示。
S13:步骤S12将随钻录井数据原始数据处理为,其中/>表示实数集,/>为分块的尺寸,/>为分块的个数,/>为特征通道数。特征通道信息与分块的维度进行融合,将输入的随钻录井数据变为/>。
在本实施例当中,步骤S2包括以下子步骤:
S21:将每一个分块视为一个单元,通过多头自注意力网络对分块之间的关系进行建模。具体的,将原维度为的分块嵌入一个形状为/>的维度,其中/>表示实数集,/>表示网络层的维度,/>表示分块的个数。通过多头注意力网络的参数权重来计算分块间的数据表示。
首先,初始化查询和键,公式如下:
,
其中表示第i个分块,/>为查询,/>为键,为/>的可学习参数矩阵,/>为/>的可学习参数矩阵,/>表示实数集,/>表示注意力网络的头数,/>为分块的个数,/>为网络层的维度。
计算注意力权重,公式如下:
,
其中表示用来归一化注意力权重的函数,/>为第i个分块的注意力权重,/>为查询,/>为键的转置,/>为网络层的维度,/>表示实数集,/>表示注意力网络的头数,/>为分块的个数,最后将多头注意力网络得到的注意力权重结合起来得到分块间的数据表示,记为/>,公式如下:
,
其中表示连接,/>为一个可学习参数矩阵,/>为网络层的维度,/>表示实数集。
S22:通过多头自注意力网络对分块内的数据之间的关系进行建模。具体的,将原维度为N的分块内嵌入一个形状为的维度。其中/>表示实数集,/>表示网络层的维度,/>表示分块的尺寸。通过多头注意力网络的参数权重来计算分块内的数据表示。
首先,初始化查询和键,计算公式如下:
,
其中表示第i个分块内,/>为查询,/>为键,为/>的可学习参数矩阵,/>为/>的可学习参数矩阵,表示实数集,/>表示注意力网络的头数,/>为分块的个数,/>为网络层的维度。
然后计算注意力权重,计算公式如下:
,
其中表示用来归一化注意力权重的函数,/>为第i个分块的注意力权重,/>为查询,/>为键的转置,/>为网络层的维度,/>表示实数集,/>表示注意力网络的头数,/>为分块尺寸,最后将多头注意力网络得到的注意力权重结合起来得到分块内的数据表示,记为/>,公式如下:
,
其中表示连接,/>为一个可学习参数矩阵,/>为网络层的维度,/>表示实数集。对于分块间自注意力表示网络和分块内自注意力表示网络,他们共享权重/>。
S23:将不同尺度下的分块的数据表示映射到原始时间序列的形状中,对于分块间分支,使用重复分块的方式进行上采样,对于分块内分支,使用重复分块内的点的方式进行上采样。将分块间分支的数据表示求和得到分块间最终的数据表示,记为N,将分块内分支的数据表示求和得到分块内最终的数据表示,记为,计算公式如下:
,/>,
其中表示上采样,/>表示分块集合,/>表示分块内的数据表示,/>表示分块间的数据表示。
在本实施例当中,步骤S3包括以下子步骤:
S31:使用一个基于库尔贝克-莱布勒散度(KL散度)的损失函数来衡量这两种表示的相似性。损失函数的形式如下:
,
其中X表示输入的时间序列,为分快内的数据表示,N为分块间的数据表示,表示在自注意力网络中实行梯度停止的策略,/>表示两个输出向量/>和N的相似性度量,计算公式如下:
,
S32:反复执行步骤S2和步骤S3,使用梯度下降法和梯度停止法异步更新双注意力对比网络,通过优化器最小化损失函数,进行模型训练。
在本实施例当中,步骤S4包括以下子步骤:
S41:定义原始随钻录井数据,异常得分记为/>,计算公式如下:
,
为实数集,/>为随钻录井数据的长度,/>为随钻录井数据的维度,/>表示输入的时间序列,/>为分快内的数据表示,/>为分块间的数据表示,/>表示两个输出向量/>和/>的相似性度量,计算公式如下:
,
S42:基于逐个数据点的异常得分,记为/>,设置一个超参数用来决定一个点是否是异常,即一个点的异常得到超过/>表示异常,记为1,否则为正常点,记为0,详情如下:
。
在本实施例当中,步骤S5具体为: 将第一阶段识别的异常数据重新组合为数据集D1,将第一阶段识别为正常的数据重新组合为数据集D2,具体的如下:
对于任意录井参数,其中x表示特征向量,y表示标签:
如果,则将该样本加入集合/>,即/>;
如果,则将该样本加入集合/>,即/>。
在本实施例当中,步骤S6包括以下子步骤:
S61:将异常钻井数据用大小为100的滑动窗口取值存为新的数据,记为D。
S62:初始化多分类模型(32层网络结构的残差网络)的权重参数/>。
S63:在训练轮次1到指定训练轮次重复执行步骤。
S64: 随机从数据集D中抽取m个样本,组成小批次数据B。
S65: 计算标签分布相关边界损失函数,计算公式如下:
,
其中表示多分类模型/>(拥有32层网络结构的残差网络)对于数据属于第j类的置信度。/>表示输入的样本集合,/>代指置信度函数,/>代指类别为y的置信度,其中/>,C是常量,k表示样本的类别数量,/>为类别y的样本数量。
S66:更新损失函数,更新公式如下:
,
其中m表示样本数量,B表示从数据集中抽取的m个数据集合,表示第y类样本的数量,/>表示多分类模型/>(拥有32层网络结构的残差网络)的权重参数。
S67:使用随机梯度下降优化更新模型,更新模型参数的公式如下:
,
其中表示学习率,/>表示损失函数/>相对于权重参数/>的梯度。
S68:更新学习率,公式如下:
,
其中是一个常数。
在本实施例当中,步骤S7包括以下子步骤:
S71:在训练轮次到训练轮次/>重复执行S72、S73、S74、S75步骤。
S72:随机从数据集D中抽取m个样本,组成小批次数据集B。
S73:计算标签分布相关边界损失函数,计算公式如下:
,
其中表示多分类模型/>(拥有32层网络结构的残差网络)对于数据属于第j类的置信度。/>表示输入的样本集合,其中/>,C是常量。
S74:使用频率对损失函数重新加权更新,更新公式如下:
,
其中m表示样本数量,B表示从数据集中抽取的m个数据集合,表示第y类样本的数量,/>表示多分类模型/>(拥有32层网络结构的残差网络)的权重参数。
S75:更新多分类模型(拥有32层网络结构的残差网络)参数,公式如下:
,
其中表示学习率,/>表示损失函数/>相对于权重参数/>的梯度,/>表示第y类样本的数量,/>表示输入的样本集合,B表示从数据集中抽取的m个数据集合。
在本实施例当中,步骤S8具体为: 结合标签分布相关边界损失函数和延迟重赋权训练用于诊断不均衡钻井异常数据的多分类模型(拥有32层网络结构的残差网络),其输出/>,其中,/>是一个k维向量,诊断的类别/>,其中k表示样本的类别数量,也就是说置信度Z最高的类别为最终诊断类别。
本发明还提供了一种基于两阶段学习的钻井异常工况诊断系统,用以实现上述所述的一种基于两阶段学习的钻井异常工况诊断方法,包括数据处理模块、异常检测模型和不均衡多分类模型,其中,
数据处理模块,用以处理随钻录井参数,对每个特征通道采用滑动窗口进行多尺度划分,得到分块;
常检测模型,用以进行第一阶段的异常检测,学习分块之间和分块内部两种数据表示,并计算两者之间的差异,给出异常判断;
不均衡多分类模型,用以进行第二阶段的不均衡多分类,结合标签分布相关边界损失函数和延迟重赋权训练,达到对异常结果的识别。
本发明还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,实现上述所述的一种基于两阶段学习的钻井异常工况诊断方法。
本发明还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现上述所述的一种基于两阶段学习的钻井异常工况诊断方法。
本发明将异常检测和不均衡多分类共同用于钻井异常工况诊断,将已有的交叉熵损失函数修改为标签分布相关边界损失函数,增强与少数类有关的分类器,并使用延迟在赋权的训练方式,使模型在分类结果上面表现的更好。
对于前述的实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例属于优选实施例,所涉及的动作并不一定是本申请所必须的。
上述实施例中,描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (10)
1.一种基于两阶段学习的钻井异常工况诊断方法,其特征在于,包括如下步骤:
S1:处理随钻录井参数,对每个特征通道采用滑动窗口进行多尺度划分,得到分块;
S2:采用异常检测模型进行第一阶段的异常检测:学习分块之间和分块内部两种数据表示,并计算两者之间的差异,给出异常判断;
S3:将判断结果重新整理到新的数据集中;
S4:采用不均衡多分类模型进行第二阶段的不均衡多分类:结合标签分布相关边界损失函数和延迟重赋权训练,达到对异常结果的识别。
2.如权利要求1所述的一种基于两阶段学习的钻井异常工况诊断方法,其特征在于,步骤S1包括如下子步骤:
S11:采用三次样条插值将不同钻井采样点的原始数据时间间隔统一,并进行归一化处理;
S12:设置不同的滑动窗口大小,即为读取数据的长度,每个长度的滑动窗口所采样的数据记为一个分块;每一个分块由多个特征通道组成,组成分块的所有特征通道记为分块内。
3.如权利要求1所述的一种基于两阶段学习的钻井异常工况诊断方法,其特征在于,步骤S2包括如下子步骤:
S21:通过多头自注意力网络对分块之间的关系进行建模,得到分块间的数据表示,记为:
,其中,/>表示连接,/>为一个可学习参数矩阵,/>为分块的注意力权重;
S22:通过多头自注意力网络对分块内的数据之间的关系进行建模,得到分块内的数据表示,记为:
,其中,/>为一个可学习参数矩阵,/>为分块的注意力权重;
S23:将不同尺度下的分块的数据表示映射到原始时间序列的形状中,对于分块间分支,使用重复分块的方式进行上采样,得到分块间最终的数据表示,记为:
,
对于分块内分支,使用重复分块内的点的方式进行上采样,得到分块内最终的数据表示,记为:
,其中,/>表示上采样,/>表示分块集合,/>表示分块内的数据表示,/>表示分块间的数据表示。
4.如权利要求3所述的一种基于两阶段学习的钻井异常工况诊断方法,其特征在于,步骤S2还包括如下子步骤:
S24:使用基于库尔贝克-莱布勒散度的损失函数来衡量分块间数据表示和分块内数据表示的相似性;
S25:反复上述步骤,使用梯度下降法和梯度停止法异步更新双注意力对比网络,通过优化器最小化损失函数,进行模型训练。
5.如权利要求4所述的一种基于两阶段学习的钻井异常工况诊断方法,其特征在于,步骤S2还包括如下子步骤:
S26:定义原始随钻录井数据,异常得分记为/>,计算公式如下:
,其中,/>为实数集,/>为随钻录井数据的长度,/>为随钻录井数据的维度,/>表示输入的时间序列,/>为分快内的数据表示,/>为分块间的数据表示,/>表示两个输出向量/>和/>的相似性度量,计算公式如下:
,
S27:基于逐个数据点的异常得分,记为/>,设置一个超参数/>用来决定一个点是否是异常:/>。
6.如权利要求1所述的一种基于两阶段学习的钻井异常工况诊断方法,其特征在于,步骤S3具体为:将第一阶段识别的异常数据重新组合为数据集,将第一阶段识别为正常的数据重新组合为数据集/>,对于任意录井参数/>,其中/>表示特征向量,/>表示标签:
如果,则将样本加入集合/>,即/>;
如果,则将样本加入集合/>,即/>。
7.如权利要求1所述的一种基于两阶段学习的钻井异常工况诊断方法,其特征在于,步骤S4包括如下子步骤:
S41:在训练轮次1到指定训练轮次,使用标签分布相关边界损失函数/>训练多分类模型/>,使用随机梯度下降来进行反向传播并更新模型网络参数;
S42:在训练轮次到训练轮次/>,使用样本数量对损失函数进行重赋权,使用在归一化的学习率的随机梯度下降优化器优化多分类模型/>;
S43:通过多分类模型输出结果:
,其中,/>是一个k维向量,诊断的类别/>,其中k表示样本的类别数量,置信度/>最高的类别为最终诊断类别。
8.一种基于两阶段学习的钻井异常工况诊断系统,用以实现权利要求1~7任意一项所述的一种基于两阶段学习的钻井异常工况诊断方法,其特征在于,包括数据处理模块、异常检测模型和不均衡多分类模型,其中,
数据处理模块,用以处理随钻录井参数,对每个特征通道采用滑动窗口进行多尺度划分,得到分块;
常检测模型,用以进行第一阶段的异常检测,学习分块之间和分块内部两种数据表示,并计算两者之间的差异,给出异常判断;
不均衡多分类模型,用以进行第二阶段的不均衡多分类,结合标签分布相关边界损失函数和延迟重赋权训练,达到对异常结果的识别。
9.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时,实现权利要求1~7任意一项所述的一种基于两阶段学习的钻井异常工况诊断方法。
10.一种计算机可读存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1~7任意一项所述的一种基于两阶段学习的钻井异常工况诊断方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311703864.5A CN117386344B (zh) | 2023-12-13 | 2023-12-13 | 一种基于两阶段学习的钻井异常工况诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311703864.5A CN117386344B (zh) | 2023-12-13 | 2023-12-13 | 一种基于两阶段学习的钻井异常工况诊断方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117386344A true CN117386344A (zh) | 2024-01-12 |
CN117386344B CN117386344B (zh) | 2024-02-23 |
Family
ID=89437820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311703864.5A Active CN117386344B (zh) | 2023-12-13 | 2023-12-13 | 一种基于两阶段学习的钻井异常工况诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117386344B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117662106A (zh) * | 2024-01-30 | 2024-03-08 | 四川霍尼尔电气技术有限公司 | 一种钻机电控系统及电控方法 |
CN117687890A (zh) * | 2024-02-02 | 2024-03-12 | 山东大学 | 基于操作日志的异常操作识别方法、系统、介质及设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109594967A (zh) * | 2018-11-27 | 2019-04-09 | 南通世盾信息技术有限公司 | 一种基于录井大数据的卡钻事故检测预警方法 |
US20210047910A1 (en) * | 2018-05-09 | 2021-02-18 | Landmark Graphics Corporation | Learning based bayesian optimization for optimizing controllable drilling parameters |
US20220003651A1 (en) * | 2020-07-06 | 2022-01-06 | Landmark Graphics Corporation | Estimating relative permeability and capillary pressures of a geological formation based on multiphase upscaling |
CN114065613A (zh) * | 2021-10-27 | 2022-02-18 | 中国华能集团清洁能源技术研究院有限公司 | 基于深度迁移学习的多工况流程工业故障检测诊断方法 |
CN114991757A (zh) * | 2022-06-08 | 2022-09-02 | 中国石油天然气股份有限公司 | 一种随钻地层压力测录一体化监测方法及系统 |
US20230184044A1 (en) * | 2021-12-14 | 2023-06-15 | Halliburton Energy Services, Inc. | Real-Time Influx Management Envelope Tool with a Multi-Phase Model and Machine Learning |
CN116760742A (zh) * | 2023-06-21 | 2023-09-15 | 南京南瑞信息通信科技有限公司 | 基于多阶段混合时空融合的网络流量异常检测方法及系统 |
CN116838955A (zh) * | 2023-06-30 | 2023-10-03 | 浙江大学 | 一种两阶段的油气管道沿线干扰识别方法 |
CN117033989A (zh) * | 2023-07-17 | 2023-11-10 | 中国石油大学(华东) | 一种基于Transformer的油井异常判定方法 |
CN117349798A (zh) * | 2023-12-05 | 2024-01-05 | 西南石油大学 | 一种基于非均衡回归的机械钻速预测方法及系统 |
-
2023
- 2023-12-13 CN CN202311703864.5A patent/CN117386344B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210047910A1 (en) * | 2018-05-09 | 2021-02-18 | Landmark Graphics Corporation | Learning based bayesian optimization for optimizing controllable drilling parameters |
CN109594967A (zh) * | 2018-11-27 | 2019-04-09 | 南通世盾信息技术有限公司 | 一种基于录井大数据的卡钻事故检测预警方法 |
US20220003651A1 (en) * | 2020-07-06 | 2022-01-06 | Landmark Graphics Corporation | Estimating relative permeability and capillary pressures of a geological formation based on multiphase upscaling |
CN114065613A (zh) * | 2021-10-27 | 2022-02-18 | 中国华能集团清洁能源技术研究院有限公司 | 基于深度迁移学习的多工况流程工业故障检测诊断方法 |
US20230184044A1 (en) * | 2021-12-14 | 2023-06-15 | Halliburton Energy Services, Inc. | Real-Time Influx Management Envelope Tool with a Multi-Phase Model and Machine Learning |
CN114991757A (zh) * | 2022-06-08 | 2022-09-02 | 中国石油天然气股份有限公司 | 一种随钻地层压力测录一体化监测方法及系统 |
CN116760742A (zh) * | 2023-06-21 | 2023-09-15 | 南京南瑞信息通信科技有限公司 | 基于多阶段混合时空融合的网络流量异常检测方法及系统 |
CN116838955A (zh) * | 2023-06-30 | 2023-10-03 | 浙江大学 | 一种两阶段的油气管道沿线干扰识别方法 |
CN117033989A (zh) * | 2023-07-17 | 2023-11-10 | 中国石油大学(华东) | 一种基于Transformer的油井异常判定方法 |
CN117349798A (zh) * | 2023-12-05 | 2024-01-05 | 西南石油大学 | 一种基于非均衡回归的机械钻速预测方法及系统 |
Non-Patent Citations (3)
Title |
---|
QISHUAI YIN等: "Drilling performance improvement in offshore batch wells based on rig state classification using machine learning", JOURNAL OF PETROLEUM SCIENCE AND ENGINEERING, pages 1 - 24 * |
SHENGNAN WU等: "Real-time risk analysis method for diagnosis and warning of offshore downhole drilling incident", JOURNAL OF LOSS PREVENTION IN THE PROCESS INDUSTRIES, pages 1 - 12 * |
司孟菡: "钻井溢流实时预警方法研究" * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117662106A (zh) * | 2024-01-30 | 2024-03-08 | 四川霍尼尔电气技术有限公司 | 一种钻机电控系统及电控方法 |
CN117662106B (zh) * | 2024-01-30 | 2024-04-19 | 四川霍尼尔电气技术有限公司 | 一种钻机电控系统及电控方法 |
CN117687890A (zh) * | 2024-02-02 | 2024-03-12 | 山东大学 | 基于操作日志的异常操作识别方法、系统、介质及设备 |
CN117687890B (zh) * | 2024-02-02 | 2024-05-03 | 山东大学 | 基于操作日志的异常操作识别方法、系统、介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN117386344B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117386344B (zh) | 一种基于两阶段学习的钻井异常工况诊断方法及系统 | |
Cheraghi et al. | Application of machine learning techniques for selecting the most suitable enhanced oil recovery method; challenges and opportunities | |
Wei et al. | Predicting injection profiles using ANFIS | |
CN108171209A (zh) | 一种基于卷积神经网络进行度量学习的人脸年龄估计方法 | |
CN110991690B (zh) | 一种基于深度卷积神经网络的多时次风速预测方法 | |
CN110941734B (zh) | 基于稀疏图结构的深度无监督图像检索方法 | |
CN115758212A (zh) | 一种基于并行网络和迁移学习的机械设备故障诊断方法 | |
Angelin et al. | Outlier Detection using Clustering Techniques–K-means and K-median | |
CN114944053A (zh) | 一种基于时空超图神经网络的交通流预测方法 | |
CN112633328A (zh) | 一种基于深度学习的致密油藏改造效果评价方法 | |
CN114511710A (zh) | 一种基于卷积神经网络的图像目标检测方法 | |
Ye et al. | A deep learning-based method for automatic abnormal data detection: Case study for bridge structural health monitoring | |
CN113920472A (zh) | 一种基于注意力机制的无监督目标重识别方法及系统 | |
Kolajoobi et al. | Investigating the capability of data-driven proxy models as solution for reservoir geological uncertainty quantification | |
CN116310647A (zh) | 一种基于增量学习的劳保物品目标检测方法及系统 | |
CN113792594B (zh) | 一种基于对比学习的视频中语言片段定位方法及装置 | |
Sun et al. | Incomplete data processing method based on the measurement of missing rate and abnormal degree: Take the loose particle localization data set as an example | |
Lin et al. | Optimal CNN-based semantic segmentation model of cutting slope images | |
Haixiang et al. | Optimizing reservoir features in oil exploration management based on fusion of soft computing | |
CN115048873B (zh) | 一种用于飞机发动机的剩余使用寿命预测系统 | |
Kachwala et al. | Predicting Rainfall from Historical Data Trends | |
Zha et al. | Recognizing plans by learning embeddings from observed action distributions | |
Abbas et al. | Unsupervised machine learning technique for classifying production zones in unconventional reservoirs | |
CN115222684A (zh) | 一种基于多任务增量学习的表面缺陷检测方法 | |
CN112184037B (zh) | 一种基于加权svdd的多模态过程故障检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |