CN115618173A - 基于间隔增广马氏距离的地质钻进过程异常检测方法 - Google Patents

基于间隔增广马氏距离的地质钻进过程异常检测方法 Download PDF

Info

Publication number
CN115618173A
CN115618173A CN202211299269.5A CN202211299269A CN115618173A CN 115618173 A CN115618173 A CN 115618173A CN 202211299269 A CN202211299269 A CN 202211299269A CN 115618173 A CN115618173 A CN 115618173A
Authority
CN
China
Prior art keywords
interval
mahalanobis distance
data
sample set
augmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211299269.5A
Other languages
English (en)
Inventor
胡文凯
胡斌
曹卫华
吴敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202211299269.5A priority Critical patent/CN115618173A/zh
Publication of CN115618173A publication Critical patent/CN115618173A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明公开了一种基于间隔增广马氏距离的地质钻进过程异常检测方法,首先,获取正常状态下钻进过程样本集
Figure DDA0003903876130000011
和待检测样本集
Figure DDA0003903876130000012
进行标准化分别得到样本集X和测试集Y,并将X作为基准信号;其次,分别对X和Y中样本进行间隔增广,并计算不同间隔及增广次数下X的均值向量和协方差矩阵。再次,分别计算每一间隔增广后的训练样本和待检测样本的马氏距离。最后,对不同间隔及增广参数下训练样本的马氏距离分布进行核密度估计,并设置报警限,比较待检测样本马氏距离和报警限以判断是否发生异常。最后对跳钻异常进行实验验证,证明本发明可有效降低异常发生时报警时延以及误、漏报率,提高复杂地质钻进过程的异常监测水平。

Description

基于间隔增广马氏距离的地质钻进过程异常检测方法
技术领域
本发明涉及地质勘探钻进过程智能控制领域,尤其涉及一种基于间隔增广马氏距离的地质钻进过程异常检测方法。
背景技术
我国深部地质资源储量丰富,开发潜力巨大。为实现国家资源能源供给,地质资源勘探与开发成为必然。深部地质勘探是一个存在大量随机性、模糊性以及不确定性的非常复杂的过程,它无法对井下的工作状况进行直接进行观察。由于地下高温高压高扰动等特性突出,钻头时常穿越软硬交替、岩石破碎地带等突变地层,钻进异常随时可能发生。不仅影响整个工程进度,还威胁到生命财产的安全,造成巨大的钻进事故和经济损失。因此,掌握钻井过程中的关键信息,并及时准确地检测出钻井过程中出现的异常成为地质钻进研究的重要课题。
目前,钻进过程异常的检测可简要分为两类:(1)基于模型的方法:通过建立起不同的系统机理模型,对钻进过程信号进行训练与识别。但是在实际钻进过程中,井下环境复杂多变、信号微弱,很难通过单一模型来模拟出实际的钻进过程,(2)基于数据驱动的方法:现有研究大都利用原始钻探数据或简单的统计学特征作为输入,将所有的原点参数或特征作为分类器的输入,模型的复杂度很高,对于早期异常检测的性能可能很差。
因此,复杂地质钻进过程中的异常信号微弱,检测困难是亟待解决的技术问题。
发明内容
针对复杂地质钻进过程中的异常信号微弱,检测困难等技术问题,本发明提供基于间隔增广马氏距离的地质钻进过程异常检测方法,可以有效降低异常发生时报警时延以及误、漏报率,提高复杂地质钻进过程的异常监测水平。
第一方面,一种基于间隔增广马氏距离的地质钻进过程异常检测方法,包括以下步骤:
获取一段正常状态下的钻进过程数据
Figure BDA0003903876110000021
以及待检测样本数据
Figure BDA0003903876110000022
Figure BDA0003903876110000023
进行数据标准化得到数据集X,作为基准信号,并利用
Figure BDA0003903876110000024
中特征参数的统计度量对
Figure BDA0003903876110000025
中对应参数进行数据标准化,作为待检测样本集Y;
对数据集X和待检测样本集Y进行间隔增广,得到不同间隔个数λ和增广次数L下的正常样本集Xλ,L和待检测样本集Yλ,L,并计算对应间隔及增广参数下Xλ,L的协方差矩阵∑λ,L和均值向量μλ,L
计算正常样本集Xλ,L中每一样本xλ,L(g)与均值向量μλ,L在协方差矩阵∑λ,L下的马氏距离值
Figure BDA0003903876110000026
计算待检测样本集Yλ,L中每一待检测样本yλ,L(k)与均值向量μλ,L在协方差矩阵∑λ,L下的马氏距离值dλ,L(k);
利用高斯核密度估计方法估计不同间隔个数λ及增广次数L下正常样本集Xλ,L中所有数据马氏距离值的分布情况
Figure BDA0003903876110000027
设置给定置信水平下的报警限Aλ,L
比较马氏距离值dλ,L(k)与报警限Aλ,L的大小,若马氏距离值dλ,L(k)超出了报警限Aλ,L,则判断为发生了异常。
进一步地,在所述比较马氏距离值dλ,L(k)与报警限Aλ,L的大小,若马氏距离值dλ,L(k)超出了报警限Aλ,L,则判断为发生了异常的步骤之后,还包括:
计算不同间隔个数λ和增广次数L下马氏距离值dλ,L(k)的不同评价指标;
根据优劣解距离法计算综合指标的局部最优值,综合指标的局部最优值对应的间隔个数λ和增广次数L即为间隔个数和增广次数的局部最优值。
进一步地,所述钻进过程异常包括:跳钻、卡钻、断钻具、井溢以及井漏。
进一步地,所述间隔增广的具体过程如下:
依据间隔个数λ及增广次数L的不同,在当前时刻数据点所形成的间隔增广样本向量包含当前时刻数据样本以及间隔个数为λ的前L个采样时刻的数据样本进行堆叠形成间隔增广向量;
在g时刻,正常样本集X中间隔增广向量xλ,L(g)的计算公式为:
xλ,L(g)=[x(g)…x(g-λ(j-1))…x(g-λ(L-1))]
其中,x(g)表示正常样本集X中的第g个样本向量,x(g-λ(j-1))表示正常样本集X中的第g-λ(j-1)个样本向量,x(g-λ(L-1))表示正常样本集X中的第g-λ(L-1)个样本向量,j表示第j次增广;
在k时刻,待检测样本集Y中间隔增广向量yλ,L(k)的计算公式为:
yλ,L(k)=[y(k)…y(k-λ(j-1))…y(k-λ(L-1))]
其中,y(k)表示待检测样本集Y中的第k个样本向量,y(k-λ(j-1))表示待检测样本集Y中的第k-λ(j-1)个样本向量,y(k-λ(L-1))表示待检测样本集Y中的第k-λ(L-1)个样本向量,j表示第j次增广。
进一步地,所述马氏距离的计算公式如下:
在g时刻,正常样本集Xλ,L中马氏距离值
Figure BDA0003903876110000031
的计算为:
Figure BDA0003903876110000032
在k时刻,待检测样本集Yλ,L中马氏距离值dλ,L(k)计算为:
Figure BDA0003903876110000033
其中,∑λ,L -1表示对协方差矩阵∑λ,L求逆矩阵。
进一步地,所述利用高斯核密度估计方法估计不同间隔个数λ及增广次数L下正常样本集Xλ,L中所有数据马氏距离值的分布情况
Figure BDA0003903876110000034
计算公式如下:
Figure BDA0003903876110000035
其中,x为自变量,表示连续化的增广马氏距离数值,h为核密度估计选择的带宽,N1表示正常样本集X中样本的个数,[N1+λ(1-L)]为正常样本集X间隔增广后样本的个数,i表示正常数据样本的序数,
Figure BDA0003903876110000036
为间隔增广后任一正常样本数据的马氏距离,k()为采用的高斯核函数,计算公式如下:
Figure BDA0003903876110000037
其中,exp表示指数函数。
进一步地,所述设置给定置信水平下的报警限Aλ,L,包括:
给定置信水平δ,通过概率密度积分公式求解报警限Aλ,L,概率密度积分公式如下:
Figure BDA0003903876110000041
第二方面,本发明提供了一种基于间隔增广马氏距离的地质钻进过程异常检测装置,包括以下单元:
数据获取模块,用于获取一段正常状态下的钻进过程数据
Figure BDA0003903876110000042
以及待检测样本数据
Figure BDA0003903876110000043
标准化模块,用于对
Figure BDA0003903876110000044
进行数据标准化得到数据集X,作为基准信号,并利用
Figure BDA0003903876110000045
中特征参数的统计度量对
Figure BDA0003903876110000046
中对应参数进行数据标准化,作为待检测样本集Y;
间隔增广模块,用于对数据集X和待检测样本集Y进行间隔增广,得到不同间隔λ和增广次数L下的正常样本集Xλ,L和待检测样本集Yλ,L,并计算对应间隔增广次数下Xλ,L的协方差矩阵∑λ,L和均值向量μλ,L
马氏距离计算模块,用于计算正常样本集Xλ,L中每一样本xλ,L(g)与均值向量μλ,L在协方差矩阵∑λ,L下的马氏距离值
Figure BDA0003903876110000047
还用于计算待检测样本集Yλ,L每一待检测样本yλ,L(k)与均值向量μλ,L在协方差矩阵∑λ,L下的马氏距离值dλ,L(k);
报警限设置模块,用于利用高斯核密度估计方法估计不同间隔λ及增广次数L下正常样本集Xλ,L中所有样本马氏距离值的分布情况
Figure BDA0003903876110000048
设置给定置信水平下的报警限Aλ,L
异常判断模块,用于比较马氏距离值dλ,L(k)与报警限Aλ,L的大小,若马氏距离值dλ,L(k)超出了报警限Aλ,L,则判断为发生了异常。
第三方面,一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的基于间隔增广马氏距离的地质钻进过程异常检测方法的步骤。
第四方面,一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的基于间隔增广马氏距离的地质钻进过程异常检测方法的步骤。
本发明提供的技术方案具有以下有益效果:
本发明提供了一种基于间隔增广马氏距离的地质钻进过程异常检测方法,首先,获取正常状态下钻进过程样本集
Figure BDA0003903876110000051
和待检测样本集
Figure BDA0003903876110000052
进行数据标准化分别得到样本集X和测试集Y,并将X作为基准信号;其次,分别对X和Y中样本进行间隔增广,并计算出不同间隔及增广参数下X的均值向量以及协方差矩阵。再次,分别计算给定间隔及增广参数下训练样本和待检测样本的马氏距离。最后,对不同间隔增广参数下训练样本的马氏距离分布进行核密度估计,并设置报警限,将计算出的待检测样本马氏距离与报警限进行比较,以区分是否发生异常。本发明可以提高钻进过程微弱异常信号的检测能力和检测精度,降低检测报警时延,保障钻进过程安全稳定运行。
附图说明
下面以钻进过程中的跳钻异常作为实施例并结合附图对本发明作进一步说明,附图中:
图1是本发明一种基于间隔增广马氏距离的地质钻进过程异常检测方法流程图;
图2是本发明中跳钻异常检测所采用的钻进参数时序图,其中t=0s~1500s区间范围内为正常数据时间序列,t=1501s~3500s区间范围内跳钻异常下特征参数各自的时间序列;
图3是本发明中应用于跳钻异常检测时,最优间隔(λ=3)及增广次数(L=7)下正常样本的马氏距离核密度估计与卡方分布及正态分布拟合效果对比图;
图4是不同参数λ及L下综合指标曲面图,其中椭圆为选择出的最优综合指标(λ=3,L=7);
图5自上而下依次为PCA的T2、SPE两个指标报警监控时序图,标准马氏距离(Mahalanobis Distance,MD)报警监控时序图以及最优间隔增广(Interval Augmented,IA)参数下马氏距离的时序图,其中,图中折线为不同监控指标下的时间序列,虚直线为报警阈值,监测指标数值超过报警阈值的数据被识别为异常数据点;
图6是本发明一种基于间隔增广马氏距离的地质钻进过程异常检测装置的结构图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现以其中一种钻进异常——跳钻异常进行方法展开,并对照附图详细说明本发明的具体实施方式。
图1整体展示了本发明的实施步骤,提供了一种基于间隔增广马氏距离的地质钻进过程异常检测方法,具体步骤如下:
S1:获取一段正常状态下的钻进过程数据
Figure BDA0003903876110000061
(训练集)以及待检测样本数据
Figure BDA0003903876110000062
(测试集);对
Figure BDA0003903876110000063
进行数据标准化得到数据集X,作为基准信号,并利用
Figure BDA0003903876110000064
中特征参数的统计度量对待检测数据
Figure BDA0003903876110000065
中对应参数进行数据标准化,作为待检测样本集Y。
跳钻异常主要是钻遇砾石层软硬夹层及不均匀质地灰岩等地层,导致牙轮受力不均产生的。跳钻异常主要可以通过扭矩、钩载以及转速的变化来反映。具体来说,扭矩和钩载的波动范围逐渐增大,而转速由于可能脱离地层,信号会有一定幅度的增加。因此,本发明实施例选取扭矩、钩载以及转速三个特征量的变化来反映跳钻异常是否发生,具体地,上述钻井工程参数可以通过传感器进行测量。
需要说明的是,本发明方法适用于钻进过程中的多种异常检测,例如卡钻、断钻具、井溢以及井漏,并不局限于跳钻异常这一种类别。
具体地,对于正常状态下钻进过程数据
Figure BDA0003903876110000066
Figure BDA0003903876110000067
进行Z-Score标准化得到数据集X,作为基准信号。利用
Figure BDA0003903876110000068
中特征参数的均值和标准差对
Figure BDA0003903876110000069
中对应参数数据进行Z-Score标准化,作为待检测样本Y。训练集
Figure BDA00039038761100000610
和待检测数据
Figure BDA00039038761100000611
的Z-Score标准化方法如下:
Figure BDA00039038761100000612
Figure BDA00039038761100000613
其中,
Figure BDA00039038761100000614
选用的特征参数为三个维度,任一特征向量
Figure BDA00039038761100000615
Figure BDA0003903876110000071
N1表示训练集样本的个数(本发明选用了500个数据),均值矩阵
Figure BDA0003903876110000072
任一特征向量的均值向量
Figure BDA0003903876110000073
Figure BDA0003903876110000074
表示训练集
Figure BDA0003903876110000075
第j个特征参数数据的均值,标准差矩阵σ=[σ1 σ2 σ3],任一特征参量的标准差向量
Figure BDA0003903876110000076
Figure BDA0003903876110000077
表示训练集
Figure BDA0003903876110000078
第j个特征参数数据的标准差。
Figure BDA0003903876110000079
任一特征向量
Figure BDA00039038761100000710
N2表示待检测样本的个数(本发明选用了3500个数据)。
此外,在其他实施例中,数据标准化方法还可以选择min-max标准化,log函数转换以及模糊量化法。
图2展示了本发明中所选择的钻进过程原始数据,其中从t=0s~1500s区间范围内为正常数据时间序列,t=1501s~3500s范围内为跳钻异常下三个特征参数各自的时间序列。
S2:对数据集X和待检测样本集Y进行间隔增广,得到不同间隔个数λ和增广次数L下的正常样本集Xλ,L和待检测样本集Yλ,L,并计算对应间隔增广次数下Xλ,L的协方差矩阵∑λ,L和均值向量μλ,L
数据集X间隔增广为:
Figure BDA00039038761100000711
其中,λ和L分别表示间隔样本个数和增广次数,N1为正常样本集X中样本个数,
Figure BDA00039038761100000712
在测试集时间瞬间k时,间隔增广样本yλ,L(k)计算公式为:
yλ,L(k)=[y(k)…y(k-λ(j-1))…y(k-λ(L-1))]
其中,y(k)表示待检测样本集Y中的第k个样本向量,y(k-λ(j-1))表示待检测样本集Y中的第k-λ(j-1)个样本向量,y(k-λ(L-1))表示待检测样本集Y中的第k-λ(L-1)个样本向量,j表示第j次增广。
S3:计算正常样本集Xλ,L中每一样本xλ,L(g)与均值向量μλ,L(训练样本)在协方差矩阵∑λ,L下的马氏距离值
Figure BDA0003903876110000081
计算待检测样本集Yλ,L每一待检测样本yλ,L(k)与均值向量μλ,L(测试样本)在协方差矩阵∑λ,L下的马氏距离值dλ,L(k);
马氏距离的计算方式如下:
在g时刻,正常样本集Xλ,L中马氏距离值
Figure BDA0003903876110000082
的计算为:
Figure BDA0003903876110000083
其中,∑λ,L -1表示对协方差矩阵∑λ,L求逆矩阵,
Figure BDA0003903876110000084
μi为间隔增广样本集Xλ,L中第i列数据的均值。
在k时刻,待检测样本集Yλ,L中马氏距离值dλ,L(k)计算为:
Figure BDA0003903876110000085
定义任意两个维度Ci和Cj间的协方差为:
Cov(Ci,Cj)=E[(Ci-E(Ci))(Cj-E(Cj))]
其中,E(Ci)与E(Cj)分别为维度Ci和Cj的期望值,则协方差矩阵∑λ,L可计算为:
Figure BDA0003903876110000086
S4:利用高斯核密度估计方法估计不同间隔λ及增广次数L下正常样本集Xλ,L所有数据马氏距离值的分布情况,设置给定置信水平下的报警限Aλ,L
首先利用高斯核密度估计方法估计出步骤S2中不同间隔λ与增广次数L下正常数据样本集Xλ,L马氏距离的分布情况,之后设置给定置信区间下的报警限Aλ,L。高斯核密度函数
Figure BDA0003903876110000087
估计如下:
Figure BDA0003903876110000088
其中,x为自变量,表示连续化的增广马氏距离数值,h为核密度估计选择的带宽,这里为默认值5.0474,N1表示正常样本集X中样本的个数,[N1+λ(1-L)]为正常样本集X间隔增广后样本的个数(本实施例选择500个正常样本向量),i表示正常数据样本的序数,
Figure BDA0003903876110000091
为间隔增广后正常样本集Xλ,L中第i个数据的马氏距离,k()为采用的高斯核函数,计算方式如下:
Figure BDA0003903876110000092
其中,exp表示指数函数。在估计出不同间隔及增广次数下的正常样本马氏距离密度分布后,给定置信水平δ(本发明设置δ=99%),通过概率密度积分公式求解报警限Aλ,L,概率密度积分公式如下:
Figure BDA0003903876110000093
图3展示了本发明实施例中最优间隔(λ=3)及增广次数(L=7)下正常样本的马氏距离核密度估计与卡方分布及正态分布估计拟合效果对比图,其中虚线为核密度估计密度曲线,直曲线为卡方分布密度曲线,点线为正态分布密度曲线。
S5:比较dλ,L(k)与报警限Aλ,L间的大小判断检测异常。
在不同间隔个数和增广次数下,规定当dλ,L(k)的值超过报警限Aλ,L时,认为发生跳钻异常,并在k+1时刻进行报警。
在步骤S5之后,还包括:
验证指标及综合
测试集的四个验证指标如下:
Figure BDA0003903876110000094
Figure BDA0003903876110000095
Figure BDA0003903876110000096
其中,Acc为正确率,MAR为漏报率,FAR为误报率,TP为真正例,TN为真反例,FP为假正例,FN为假反例。此外,待检测数据样本Y∈R3500×3,前1500个样本为正常数据,后2000个样本为异常数据,并规定指标在1501s时间点开始到某一个时间点持续发生报警10s这段时间为检测时延(Detection Delay,DD)。
为了综合平衡指标,选择出最优间隔增广,这里选用优劣解距离法将上述四个验证指标统一为1个指标,通过选择不同的间隔个数λ和增广次数L,计算不同λ,L下dλ,L(k)的不同指标,并进行参数调优,本发明实施例选择的优化区间为间隔个数λ(a)=1,2,3,4,5,L(b)=1~30。优劣解距离法步骤如下:
1、将所有的指标转化为极大型指标;
设指标矩阵
Figure BDA0003903876110000101
(λ和L共150种组合)由于指标MAR,FAR与DD数值越小,效果越好,因此将此三个指标转化为极大型指标,转化如下:
Figure BDA0003903876110000102
其中,
Figure BDA0003903876110000103
Figure BDA0003903876110000104
i∈1~150,表示指标矩阵的行数,j∈1~4,表示指标矩阵的列数。
2、对正向化矩阵
Figure BDA0003903876110000105
进行标准化处理得到标准化矩阵Ind:
Ind=[Acc MAR FAR DD]
其中,
Figure BDA0003903876110000106
3、利用Ind计算综合评定指标(Comprehensive Indicators,CI)
对于任一间隔增广参数下的综合评定指标CI(i)计算如下:
Figure BDA0003903876110000107
其中,
Figure BDA0003903876110000108
即寻找到某间隔增广参数(λ和L)下的综合指标CI,使得CI到每个维度上最优指标距离最近,综合指标CI局部最优值对应的间隔增广参数即为间隔增广参数的局部最优值。
图4展示了在不同参数λ及L下综合指标的曲面图,其中椭圆为选择出的最优综合指标(在λ=3,L=7取得)。
为了展示出所提方法的有效性,本发明实施例与其他方法(包括PCA(PrincipalComponent Analysis)的T2和SPE(Squared Prediction Error)指标,标准马氏距离)进行对比,图5自上而下依次为PCA的T2、SPE两个指标报警监控时序图,标准马氏距离(Mahalanobis Distance,MD)报警监控时序图以及局部最优间隔增广(IntervalAugmented,IA)参数下马氏距离的时序图,其中,图中折线为不同监控指标下的时间序列,虚直线为报警限,监测指标数值超过报警限的数据被识别为异常数据点。并在表1中给出不同方法的各个评价指标对比,与其他方法相比,所提方法在整体上具有良好的效果。
表1不同方法指标对比
Figure BDA0003903876110000111
图5展示了整体展示了一种基于间隔增广马氏距离的地质钻进过程异常检测装置,用于实施上述的地质钻进过程异常检测方法,该装置具体包括以下模块:
数据获取模块1,用于获取一段正常状态下的钻进过程数据
Figure BDA0003903876110000112
以及待检测样本数据
Figure BDA0003903876110000113
标准化模块2,用于对
Figure BDA0003903876110000114
进行数据标准化得到数据集X,作为基准信号,并利用
Figure BDA0003903876110000115
中特征参数的均值和标准差对
Figure BDA0003903876110000116
中对应参数进行数据标准化,作为待检测样本集Y;
间隔增广模块3,用于对数据集X和待检测样本集Y进行间隔增广,得到不同间隔λ和增广次数L下的正常样本集Xλ,L和待检测样本集Yλ,L,并计算对应间隔增广次数下Xλ,L的协方差矩阵∑λ,L和均值向量μλ,L
马氏距离计算模块4,用于计算正常样本集Xλ,L中每一样本xλ,L(g)与均值向量μλ,L在协方差矩阵∑λ,L下的马氏距离值
Figure BDA0003903876110000117
还用于计算待检测样本集Yλ,L每一待检测样本yλ,L(k)与均值向量μλ,L在协方差矩阵∑λ,L下的马氏距离值dλ,L(k);
报警限设置模块5,用于利用高斯核密度估计方法估计不同间隔λ及增广次数L下正常样本集Xλ,L中所有样本马氏距离值的分布情况
Figure BDA0003903876110000121
设置给定置信水平下的报警限Aλ,L
异常判断模块6,用于比较马氏距离值dλ,L(k)与报警限Aλ,L的大小,若马氏距离值dλ,L(k)超出了报警限Aλ,L,则判断为发生了异常。
此外,本实施例中还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的基于间隔增广马氏距离的孔内跳钻异常检测方法的步骤。
此外,本实施例中还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的基于间隔增广马氏距离的地质钻进过程异常检测方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为标识。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于间隔增广马氏距离的地质钻进过程异常检测方法,其特征在于,包括以下步骤:
获取一段正常状态下的钻进过程数据
Figure FDA0003903876100000011
以及待检测样本数据
Figure FDA0003903876100000012
Figure FDA0003903876100000013
进行数据标准化得到数据集X,作为基准信号,并利用
Figure FDA0003903876100000014
中特征参数的统计度量对
Figure FDA0003903876100000015
中对应参数进行数据标准化,作为待检测样本集Y;
对数据集X和待检测样本集Y进行间隔增广,得到不同间隔个数λ和增广次数L下的正常样本集Xλ,L和待检测样本集Yλ,L,并计算对应间隔及增广参数下Xλ,L的协方差矩阵∑λ,L和均值向量μλ,L
计算正常样本集Xλ,L中每一样本xλ,L(g)与均值向量μλ,L在协方差矩阵∑λ,L下的马氏距离值
Figure FDA0003903876100000017
计算待检测样本集Yλ,L中每一待检测样本fλ,L(k)与均值向量μλ,L在协方差矩阵∑λ,L下的马氏距离值dλ,L(k);
利用高斯核密度估计方法估计不同间隔个数λ及增广次数L下正常样本集Xλ,L中所有数据马氏距离值的分布情况
Figure FDA0003903876100000016
设置给定置信水平下的报警限Aλ,L
比较马氏距离值dλ,L(k)与报警限Aλ,L的大小,若马氏距离值dλ,L(k)超出了报警限Aλ,L,则判断为发生了异常。
2.根据权利要求1所述的基于间隔增广马氏距离的地质钻进过程异常检测方法,其特征在于,在所述比较马氏距离值dλ,L(k)与报警限Aλ,L的大小,若马氏距离值dλ,L(k)超出了报警限Aλ,L,则判断为发生了异常的步骤之后,还包括:
计算不同间隔个数λ和增广次数L下马氏距离值dλ,L(k)的不同评价指标;
根据优劣解距离法计算综合指标的局部最优值,综合指标的局部最优值对应的间隔个数λ和增广次数L即为间隔个数和增广次数的局部最优值。
3.根据权利要求1所述的钻进过程异常包括:跳钻、卡钻、断钻具、井溢以及井漏。
4.根据权利要求1所述的基于间隔增广马氏距离的地质钻进过程异常检测方法,其特征在于,所述间隔增广的具体过程如下:
依据间隔个数λ及增广次数L的不同,在当前时刻数据点所形成的间隔增广样本向量包含当前时刻数据样本以及间隔个数为λ的前L个采样时刻的数据样本进行堆叠形成间隔增广向量;
在g时刻,正常样本集X中间隔增广向量xλ,L(g)的计算公式为:
xλ,L(g)=[x(g)…x(g-λ(j-1))…x(g-λ(L-1))]
其中,x(g)表示正常样本集X中的第g个样本向量,x(g-λ(j-1))表示正常样本集X中的第g-λ(j-1)个样本向量,x(g-λ(L-1))表示正常样本集X中的第g-λ(L-1)个样本向量,j表示第j次增广;
在k时刻,待检测样本集Y中间隔增广向量yλ,L(k)的计算公式为:
yλ,L(k)=[y(k)…y(k-λ(j-1))…y(k-λ(L-1))]
其中,y(k)表示待检测样本集Y中的第k个样本向量,y(k-λ(j-1))表示待检测样本集Y中的第k-λ(j-1)个样本向量,y(k-λ(L-1))表示待检测样本集Y中的第k-λ(L-1)个样本向量,j表示第j次增广。
5.根据权利要求1所述的基于间隔增广马氏距离的地质钻进过程异常检测方法,其特征在于,所述马氏距离计算公式如下:
在g时刻,正常样本集Xλ,L中马氏距离值
Figure FDA0003903876100000021
的计算为:
Figure FDA0003903876100000022
在k时刻,待检测样本集Yλ,L中马氏距离值dλ,L(k)计算为:
Figure FDA0003903876100000023
其中,∑λ,L -1表示对协方差矩阵∑λ,L求逆矩阵。
6.根据权利要求1所述的基于间隔增广马氏距离的地质钻进过程异常检测方法,其特征在于,所述利用高斯核密度估计方法估计不同间隔个数λ及增广次数L下正常样本集Xλ,L中所有数据马氏距离值的分布情况
Figure FDA0003903876100000024
计算公式如下:
Figure FDA0003903876100000025
其中,x为自变量,表示连续化的增广马氏距离数值,h为核密度估计选择的带宽,N1表示正常样本集X中样本的个数,[N1+λ(1-L)]为正常样本集X间隔增广后样本的个数,i表示正常数据样本的序数,
Figure FDA0003903876100000031
为间隔增广后任一正常样本数据的马氏距离,k()为采用的高斯核函数,计算公式如下:
Figure FDA0003903876100000032
其中,exp表示指数函数。
7.根据权利要求6所述的基于间隔增广马氏距离的地质钻进过程异常检测方法,其特征在于,所述设置给定置信水平下的报警限Aλ,L,包括:
给定置信水平δ,通过概率密度积分公式求解报警限Aλ,L,概率密度积分公式如下:
Figure FDA0003903876100000033
8.一种基于间隔增广马氏距离的地质钻进过程异常检测装置,其特征在于,包括以下单元:
数据获取模块,用于获取一段正常状态下的钻进过程数据
Figure FDA0003903876100000034
以及待检测样本数据
Figure FDA0003903876100000035
标准化模块,用于对
Figure FDA0003903876100000036
进行数据标准化得到数据集X,作为基准信号,并利用
Figure FDA0003903876100000037
中特征参数的统计度量对
Figure FDA0003903876100000038
中对应参数进行数据标准化,作为待检测样本集Y;
间隔增广模块,用于对数据集X和待检测样本集Y进行间隔增广,得到不同间隔λ和增广次数L下的正常样本集Xλ,L和待检测样本集Yλ,L,并计算对应间隔增广次数下Xλ,L的协方差矩阵∑λ,L和均值向量μλ,L
马氏距离计算模块,用于计算正常样本集Xλ,L中每一样本xλ,L(g)与均值向量μλ,L在协方差矩阵∑λ,L下的马氏距离值
Figure FDA0003903876100000039
还用于计算待检测样本集Yλ,L每一待检测样本yλ,L(k)与均值向量μλ,L在协方差矩阵∑λ,L下的马氏距离值dλ,L(k);
报警限设置模块,用于利用高斯核密度估计方法估计不同间隔λ及增广次数L下正常样本集Xλ,L中所有样本马氏距离值的分布情况
Figure FDA00039038761000000310
设置给定置信水平下的报警限Aλ,L
异常判断模块,用于比较马氏距离值dλ,L(k)与报警限Aλ,L的大小,若马氏距离值dλ,L(k)超出了报警限Aλ,L,则判断为发生了异常。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于间隔增广马氏距离的地质钻进过程异常检测方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于间隔增广马氏距离的地质钻进过程异常检测方法的步骤。
CN202211299269.5A 2022-10-24 2022-10-24 基于间隔增广马氏距离的地质钻进过程异常检测方法 Pending CN115618173A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211299269.5A CN115618173A (zh) 2022-10-24 2022-10-24 基于间隔增广马氏距离的地质钻进过程异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211299269.5A CN115618173A (zh) 2022-10-24 2022-10-24 基于间隔增广马氏距离的地质钻进过程异常检测方法

Publications (1)

Publication Number Publication Date
CN115618173A true CN115618173A (zh) 2023-01-17

Family

ID=84865385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211299269.5A Pending CN115618173A (zh) 2022-10-24 2022-10-24 基于间隔增广马氏距离的地质钻进过程异常检测方法

Country Status (1)

Country Link
CN (1) CN115618173A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116203557A (zh) * 2023-03-06 2023-06-02 北京交通大学 一种基于探地雷达的传统石砌墙体内部残损及异常物无损辨识方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116203557A (zh) * 2023-03-06 2023-06-02 北京交通大学 一种基于探地雷达的传统石砌墙体内部残损及异常物无损辨识方法
CN116203557B (zh) * 2023-03-06 2024-03-05 北京交通大学 一种基于探地雷达的传统石砌墙体内部残损及异常物无损辨识方法

Similar Documents

Publication Publication Date Title
Gurina et al. Application of machine learning to accidents detection at directional drilling
Arul et al. Applications of shapelet transform to time series classification of earthquake, wind and wave data
Li et al. Diagnosis of downhole incidents for geological drilling processes using multi-time scale feature extraction and probabilistic neural networks
CN115618173A (zh) 基于间隔增广马氏距离的地质钻进过程异常检测方法
CN112529341A (zh) 一种基于朴素贝叶斯算法的钻井漏失机率预测方法
CN112395382A (zh) 基于变分自编码器的船舶异常航迹数据检测方法和装置
Hou et al. Automatic gas influxes detection in offshore drilling based on machine learning technology
CN110555235A (zh) 基于向量自回归模型的结构局部缺陷检测方法
CN114925536A (zh) 机载系统phm测试性建模与诊断策略优化方法和装置
CN110188399B (zh) 一种基于多相关序列的大坝安全监测单测点评价方法
Ye et al. Drilling formation perception by supervised learning: Model evaluation and parameter analysis
CN114997296A (zh) 一种基于gru-vae模型的无监督航迹异常检测方法及系统
CN113312696B (zh) 基于arima算法的桥梁健康状况动态预测告警方法
Zhang et al. Spectral radius-based interval principal component analysis (SR-IPCA) for fault detection in industrial processes with imprecise data
Xie et al. A novel quality control method of time-series ocean wave observation data combining deep-learning prediction and statistical analysis
Duan et al. Intelligent kick warning based on drilling activity classification
CN107256333A (zh) 一种基于预测和动态阈值的Argo剖面异常检测方法
CN115966074B (zh) 基于机器学习的盾构刀盘结泥饼预警方法及系统
CN116561673A (zh) 多维度多层次分析方法在混凝土大坝安全监测分析系统平台中的应用方法
CN114371677B (zh) 基于谱半径-区间主成分分析的工业过程状态监测方法
CN116186609A (zh) 一种基于lstm的载人潜水器传感器故障数据增强方法
CN111121943B (zh) 零点故障检测方法、装置、计算机设备和可读存储介质
CN110009033A (zh) 一种基于动态主元分析的钻井过程异常预警模型
CN111594156B (zh) 一种天然气水合物饱和度计算方法及系统
CN114818493A (zh) 一种隧道岩体完整程度定量评价的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination