CN111598129B - 基于动态时间规整的钻进过程数据异常判别与校正的方法 - Google Patents

基于动态时间规整的钻进过程数据异常判别与校正的方法 Download PDF

Info

Publication number
CN111598129B
CN111598129B CN202010281882.9A CN202010281882A CN111598129B CN 111598129 B CN111598129 B CN 111598129B CN 202010281882 A CN202010281882 A CN 202010281882A CN 111598129 B CN111598129 B CN 111598129B
Authority
CN
China
Prior art keywords
data
drilling process
dtw
outlier
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010281882.9A
Other languages
English (en)
Other versions
CN111598129A (zh
Inventor
吴敏
杨傲雪
陈略峰
曹卫华
陈鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202010281882.9A priority Critical patent/CN111598129B/zh
Publication of CN111598129A publication Critical patent/CN111598129A/zh
Application granted granted Critical
Publication of CN111598129B publication Critical patent/CN111598129B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Earth Drilling (AREA)

Abstract

本发明提供了一种基于动态时间规整的钻进过程数据异常判别与校正的方法,采用马氏距离据进行离群点检测,得到离群点数据的集合;利用动态时间规整算法检测每个离群点数据附近区域内两个时间序列的相似性,由模糊C均值聚类算法确定该离群点是属于由传感检测误差等外界因素导致的异常值还是属于因发生钻井事故导致的异常值;使用K近邻算法对判断由外界因素导致的异常值进行校正处理,并将校正后的数据保存到数据库中,保留因发生钻井事故导致的异常值,保留数据特性。本发明的有益效果是:在保留钻进过程某些数据特性的同时,提高钻进过程检测数据的准确性和完整性,为钻进过程的状态监测、优化和控制方面的研究奠定基础,具有实用性和适用性。

Description

基于动态时间规整的钻进过程数据异常判别与校正的方法
技术领域
本发明涉及地质钻探工程领域,尤其涉及基于动态时间规整的钻进过程数据异常判别与校正的方法。
背景技术
目前,我国社会经济保持着高速发展的势头,对资源能源的需求度也越来越高。然而,我国当前的矿产资源勘探深度平均只有500米,油气开采深度平均也不足4500米。按照矿产资源勘探深度来界定深部钻探,我国深层石油资源占剩余石油资源的40%左右,深层天然气资源占剩余天然气资源的60%左右。同时,据初步统计我国深部非常规能源储量可观,页岩气可开采储量为36.0825万亿立方米,约占世界总证实储量的20%左右;埋深2000米以上的煤层气地质资源约为36.81万亿立方米,占世界煤层气总资源的13%左右。因此,随着浅层资源能源的枯竭、大量深部资源及非常规能源的探明,深部地质勘探开发成为必然。
钻进过程涉及的信息种类较多,是地下相同地质体的综合反映,具有较强的相关性,通过他们可以反映出当前钻井环境。其中工程参数是钻井工况的反映,参数的采集和应用是提高钻井效益和安全施工的必要手段,因此参数的采集至关重要。
然而在深部勘探过程中直接检测的钻进过程参数存在着可靠性差、价值密度低等问题,一方面,在钻井过程中随时可能遇到不同的地质条件,如岩性、地层压力的变化等复杂多变因素,导致事故频发。当事故发生时,通常会使得多个钻进过程参数出现上升或下降的趋势,从而脱离正常值;另一方面,由于井下环境恶劣、设备工作不稳定等原因,传感器损坏或灵敏度下降,检测值可能会产生突变导致量测误差,数据出现异常。两种类型的异常值在钻进过程中混合出现,因此,如何快速有效的检测判断出钻进离群点数据中由于测量失误导致的异常值,并进行校核,对于钻进过程的控制、状态监测等来说具有重要意义。
本发明提出了一种基于动态时间规整的钻进过程数据异常判别与校正方法,实现钻进过程中异常值检测及产生原因的判断,从而在保留数据特性的同时,能够对由外界因素导致的异常值进行校正,以保证钻进过程数据的可靠性。
发明内容
钻进过程中事故频发,通常有两方面的原因导致钻进过程数据异常,一方面是由于传感检测误差等外界因素导致数据异常,另一方面是发生钻井事故时,数据出现异常。为了解决上述问题,在钻进过程中得到钻进过程数据,根据事故发生时一般有两个或以上参数发生相同趋势变化(上升或下降)的特性,使用本发明提供了一种基于动态时间规整的钻进过程数据异常判别与校正的方法完成数据异常判别与校正,该方法主要包括以下步骤:
S1:采用马氏距离对所述钻进过程数据进行离群点数据检测,得到一个由若干离群点数据形成的集合;
S2:以该集合中各个离群点数据为中心,使用DTW算法计算一定长度p内两个时间序列间的最小距离dtwu;其中,p为大于零的正数;两个时间序列的选择原则为:在发生事故时的变化趋势相类似,即数据变化趋势为同时上升或同时下降;
S3:基于模糊C均值聚类算法对计算得到的dtwu值进行聚类划分,得到若干类别;根据正常钻进时与上述同样长度时间序列内的dtwp值,计算所述若干类别的不同聚类中心与该dtwp值的距离lk,并结合异常敏感系数q,1≤q≤1.5,判断lk是否大小qlmin;若是,则第k类聚类中离群点数据是由于检测误差引起的异常值;若否,则该离群点数据由是于钻进事故引起的异常值;其中,k为大于零的正整数,表示聚类类别;lmin为聚类中心与dtwp值间的最小的欧式距离;
S4:使用K近邻算法对由于检测误差引起的异常离群点数据进行处理,选取距离异常离群点数据最近的K个邻居的平均值,以替换该异常离群点数据进行校核,并将校核后的数据保存到历史数据库中;K为大于0的正数。
进一步地,对钻进过程数据进行离群点数据检测的具体过程如下:
(1-1):X={xi|i=1,2,…,M}表示钻进过程数据的集合,其中M表示钻进过程相关数据的总数量;采用如下所示的马氏距离对钻进过程数据X进行离群点数据检测:
Figure GDA0004273466760000021
其中,xi表示第i个钻进过程数据,T表示转置,Σ-1表示钻进过程数据xi与整个时间序列内数据平均值u的协方差矩阵;
(1-2):对步骤(1-1)中检测得到的马氏距离进行降序排序,若所述钻进过程数据xi处的马氏距离di小于dset值,则xi为正常数据,其中,dset为设置的某一序号i处的马氏距离的阀值;若所述钻进过程数据xi处的马氏距离di大于等于dset值,则xi为离群点数据xu
进一步地,使用DTW算法计算长度p内两个时间序列间距离的过程如下:
若这两个时间序列为P和Q,分别表示钻进过程中发生事故时有相同变化趋势的两个参数,计算以离群点数据为中心,p时间长度区间内时间序列的相似性,两个时间序列P和Q的长度分别为a和b,根据如下公式得到最小动态时间规整距离dtwu
γ(i,j)=e(pi,qj)+min{γ(i-1,j)+γ(i-1,j-1)+γ(i,j-1)}
dtwu=γ(a,b)
其中,e(pi,qj)是pi和qj两个数据点的距离,γ(i,j)是累积距离,从(0,0)点开始匹配两个序列P和Q,每到一个点,之前所有点计算的距离都会累积为γ(i,j);最终到(a,b)点处的γ(i,j)值为最小动态时间规整距离dtwu
进一步地,基于模糊C均值聚类算法对计算得到的DTW值dtwu进行聚类划分的过程如下:
设定核模糊C均值聚类算法的目标函数Jm如下:
Figure GDA0004273466760000031
Figure GDA0004273466760000032
Figure GDA0004273466760000033
其中,Jm是模糊C均值聚类算法的目标函数,K是聚类个数,m是模糊指数,μku是离群点数据xu相对于聚类中心ck的隶属度,u是第u个离群点,U是离群点的总数目,
Figure GDA0004273466760000034
表示控制聚类过程中的模糊性,dtwu表示最小动态时间规整距离,ck和cf分别表示第k类与第f类的聚类中心;通过更新聚类中心ck和模糊隶属度μku来实现Jm的最小。
进一步地,通过以下公式分别计算聚类中心ck与正常钻进时p长度时间序列内的DTW值dtwp的欧式距离:
lk=||ck-dtwp||
其中,lk为聚类中心ck与正常钻进时p长度时间序列DTW值dtwp的欧式距离;通过比较得到的所有欧式距离,找到最小的欧式距离lmin,根据异常敏感系数q,当距离lk大于qlmin时,判定第k类聚类中离群点数据是由于检测误差引起的异常值,反之是由于钻进事故引起的异常值。
本发明提供的技术方案带来的有益效果是:能够保证钻进过程检测数据的可靠性,为钻进过程控制、状态监测方面的研究奠定基础,具有实用性和适用性。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例中一种基于动态时间规整的钻进过程数据异常判别与校正的方法的流程图;
图2是本发明实施例中动态时间规整(DTW)算法原理示意图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
本发明的实施例提供了一种基于动态时间规整的钻进过程数据异常判别与校正的方法备。
请参考图1,图1是本发明实施例中一种基于动态时间规整的钻进过程数据异常判别与校正的方法的流程图,具体包括以下步骤:
S1:采用马氏距离对钻进过程数据进行离群点数据检测,检测出离群点数据集合;
(1-1):X={xi|i=1,2,…,M}表示钻进过程数据的集合,其中M表示钻进过程相关数据的总数量;采用马氏距离对运行数据X进行离群点检测,马氏距离的计算公式如下所示:
Figure GDA0004273466760000041
其中,xi表示钻进过程数据,T表示转置,Σ-1表示钻进数据xi与整个时间序列内数据平均值u的协方差矩阵;
(1-2):对马氏距离进行降序排序,选取某一序号i处的马氏距离dset为阀值,若所述运行数据xi处的di小于dset值,则所述数据xi被检测为正常数据;若所述运行数据xi处的di大于等于dset值,则所述数据xi被检测为离群点数据xu
S2:根据如图2所示的针对离群点数据集合,以各离群点为中心,使用动态时间规整(DTW)算法计算p时间长度内两个时间序列间的距离,两个时间序列的选择为在发生事故时具有相同的变化趋势(上升或下降);在p时间长度内两个时间序列的长度(即数据点数)分别为a和b,可能会出现由于检测周期不同而数据点不等的情况,故采用动态时间规整的方法衡量相似度;
γ(i,j)=e(pi,qj)+min{γ(i-1,j)+γ(i-1,j-1)+γ(i,j-1)}
dtwu=γ(a,b)
其中,e(pi,qj)是pi和qj两个数据点的距离,γ(i,j)是累积距离,从(0,0)点开始匹配两个序列P和Q,每到一个点,之前所有点计算的距离都会累积为γ(i,j);最终到(a,b)点处的γ(i,j)值为最小动态时间规整距离dtwu
S3:使用模糊C均值聚类算法对离群点数据附近区域的动态时间规整距离进行聚类划分,得到若干类别;然后计算正常钻进过程数据在该区域长度内的动态时间规整距离和所述若干类别不同聚类中心的欧式距离,当该类对应的欧氏距离大于设定的阈值时,该类中的离群点即为由于传感器误差等外界因素引起的数据异常。假设p时间长度内正常钻进过程数据的动态时间规整距离为dtwp,所述若干类别分别为A1、A2及A3类,所述若干类别对应的聚类中心分别为B1、B2及B3,则需要计算出dtwp到B1的欧式距离L1、dtwp到B2的欧式距离L2和dtwp到B3的欧式距离L3,然后比较L1、L2和L3的大小,得到最小的欧式距离,假设最小的欧式距离为L1,则大于q*L1的距离对应的类别中均为由于检测误差引起的数据异常;
所述基于模糊C均值聚类算法对计算得到的DTW值dtwu进行聚类划分的计算过程为:
(3-1):设定核模糊C均值聚类算法的目标函数Jm如下:
Figure GDA0004273466760000061
Figure GDA0004273466760000062
Figure GDA0004273466760000063
其中,Jm是模糊C均值聚类算法的目标函数,K是聚类个数,m是模糊指数,μku是离群点数据xu相对于聚类中心ck的隶属度,u是第u个离群点,U是离群点的总数目,
Figure GDA0004273466760000064
表示控制聚类过程中的模糊性,dtwu表示最小动态时间规整距离,ck和cf分别表示第k类与第f类的聚类中心;通过更新聚类中心ck和隶属度μku来实现Jm的最小。
(3-2):通过以下公式分别计算聚类中心ck与正常钻进时p长度时间序列内的DTW值dtwp的欧式距离:
lk=||ck-dtwp||
其中,lk为聚类中心ck与正常钻进时p长度时间序列DTW值dtwp的欧式距离;通过比较得到的所有欧式距离,找到最小的欧式距离lmin,引入异常敏感系数q,1≤q≤1.5,当距离lk大于qlmin时,判定第k类中的数据是由于检测误差引起的异常值,反之是由于钻进事故引起的异常值;
S4:使用K近邻算法对异常数据进行处理。针对判别出的由于传感器误差等外界因素引起的数据异常,在异常点附近寻找K个距离最近的数据点标签,将这些标签处数据的平均值作为校正值进行保存;假设任一数据异常点u,最近邻的正常数值分别为C1,...,CK,平均值为D,将正常数据D替换掉所述数据异常点u,并将数据D存储到u对应的序号标签处;
所述使用K近邻算法对由于检测误差引起的异常值进行处理包括以下步骤:
针对检测判断所得的由于检测误差引起的钻进过程异常数据点xh,根据某种距离度量选择出K个最相近的数据,使用该数据的平均值替换异常值进行校核,然后根据序号标签把校核后的异常数据保存到历史数据库中。
本实施中选用钻进过程中的两个钻井液参数:钻井液出口密度、钻井液出口电导率,以实际钻进过程中某井的145组钻井液数据为具体对象。在此基础上,首先采用马氏距离对钻进过程数据进行离群点数据检测,得到离群点数据的集合;然后针对该数据集合,以各离群点为中心,使用动态时间规整(DTW)算法计算一定时间长度内两个时间序列间的距离,以衡量相似性;其次使用模糊C均值聚类算法对离群点数据附近区域的动态时间规整距离进行聚类划分,得到若干类别,计算正常钻进过程数据在该区域长度内的动态时间规整距离和所述若干类别不同聚类中心的欧式距离,当该类对应的欧氏距离大于设定的阈值时,该类中的离群点即为由于传感器误差等外界因素引起的数据异常;最后应用K近邻算法对所述每个由于外界因素引起的异常数据进行校正,并将校正后的值按原有数据的标签保存到数据库中。具体步骤如下:
(1)离群点数据的检测
由于钻进过程中事故频发,因此导致数据异常通常有两个方面的原因,一方面是由于钻井事故发生,致使数据以一定的趋势偏离正常值,且一般会有两个或以上的参数同时发生变化;另一方面是由于传感检测误差等外界因素引起的异常。因此需要辨别引起数据异常的原因,以达到提高数据可靠性的同时,保留数据特性的目的。首先进行离群点的检测,以减少计算复杂度,采用欧氏距离对本实施例中获得的145组钻井液出口密度数据进行离群点检测,得到离群点标记如图2所示,具体数据如表1所示,此处仅针对钻井液出口密度数据做离群点检测;
表1钻井液出口密度离群点数据
Figure GDA0004273466760000071
Figure GDA0004273466760000081
(2)动态时间规整计算两个时间序列间最小距离衡量相似度
在检测得到钻井液出口密度离群点数据的基础上,针对离群点数据集合,以各离群点为中心,使用动态时间规整(DTW)算法计算12min时间长度内两个时间序列间的动态时间规整距离。两个时间序列分别为钻井液密度出口密度与钻井液出口电导率序列,两者在发生井涌事故时会出现同时下降的情况,因此可根据这一特性进行判断。计算所得21个离群点的动态时间规整距离分别为16.8951、15.9526、14.9695、15.6951、20.9003、14.2744、20.5718、18.8943、21.4817、18.3252、15.2824、18.2310、17.3085、18.4837、19.5432、16.1712、15.8764、16.3769、17.1975、16.9834、16.8730。
(3)使用模糊C均值聚类对动态时间规整值进行聚类划分判断
模糊C均值聚类算法对离群点数据附近区域的动态时间规整距离进行聚类划分,得到若干类别如下:
[c1 c2 c3]=[22.4354 27.1106 24.5492]
进行聚类划分后,计算正常钻进过程数据在该区域长度内动态时间规整距离与所述若干类别不同聚类中心的欧式距离,并设定异常敏感系数与最小欧氏距离之积为阈值。当该类对应的欧氏距离大于设定的阈值时,该类中的离群点即为由于传感器误差等外界因素引起的数据异常。12min时间长度内正常钻进数据的动态时间规整距离为18.8272,该值与聚类中心的欧式距离分别为3.6082、8.2834、5.7220,则第2、3类中的动态时间规整距离对应的离群点为由于量测误差等外界因素引起的异常。
(4)基于K近邻算法校正由于外界因素引起的异常值
判别出哪些数据是由于量测误差等外界因素引起的异常后,针对该集群中的钻井液出口密度值,使用欧氏距离选择出5个相距该值最近的正常值,并计算其平均值,代替该处的异常值完成校正,最后将校正结果进行保存。校正后的钻井液出口密度异常数据如表2所示,表2钻井液出口密度一列中加粗的为由于发生井涌事故而引发的异常值,因此不需要校正以保留该处的数据特性。
表2校正后的异常运行数据
Figure GDA0004273466760000091
本发明的有益效果是:能够在保留钻进过程某些数据特性的同时,保证钻进过程检测数据的准确性和完整性,为钻进过程的状态监测、优化和控制方面的研究奠定基础,具有实用性和适用性。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于动态时间规整的钻进过程数据异常判别与校正的方法,在钻进过程中得到钻进过程数据;其特征在于:包括以下步骤:
S1:采用马氏距离对所述钻进过程数据进行离群点数据检测,得到一个由若干离群点数据形成的集合;
S2:以该集合中各个离群点数据为中心,使用DTW算法计算一定长度p内两个时间序列间的最小距离dtwu;即每个离群点对应一个离群点数据,其中,p为大于零的正数;两个时间序列的选择原则为:在发生事故时的变化趋势相类似,即数据变化趋势为同时上升或同时下降;
S3:基于模糊C均值聚类算法对计算得到的dtwu值进行聚类划分,得到若干类别;根据正常钻进时与上述同样长度时间序列内的dtwp值,计算所述若干类别的不同聚类中心与该dtwp值的距离lk,并结合异常敏感系数q,1≤q≤1.5,判断lk是否大小qlmin;若是,则第k类聚类中离群点数据是由于检测误差引起的异常值;若否,则该离群点数据由是于钻进事故引起的异常值;其中,k为大于零的正整数,表示聚类类别;lmin为聚类中心与dtwp值间的最小的欧式距离;
S4:使用K近邻算法对由于检测误差引起的异常离群点数据进行处理,选取距离异常离群点数据最近的K个邻居的平均值,以替换该异常离群点数据进行校核,并将校核后的数据保存到历史数据库中;K为大于0的正数。
2.如权利要求1所述的一种基于动态时间规整的钻进过程数据异常判别与校正的方法,其特征在于:步骤S1中,对钻进过程数据进行离群点数据检测的具体过程如下:
(1-1):X={xi|i=1,2,…,M}表示钻进过程数据的集合,其中M表示钻进过程相关数据的总数量;采用如下所示的马氏距离对钻进过程数据X进行离群点数据检测:
Figure FDA0004226288330000011
其中,xi表示第i个钻进过程数据,T表示转置,Σ-1表示钻进过程数据xi与整个时间序列内数据平均值u的协方差矩阵;
(1-2):对步骤(1-1)中检测得到的马氏距离进行降序排序,若所述钻进过程数据xi处的马氏距离di小于dset值,则xi为正常数据,其中,dset为设置的某一序号i处的马氏距离的阀值;若所述钻进过程数据xi处的马氏距离di大于等于dset值,则xi为离群点数据xu
3.如权利要求1所述的一种基于动态时间规整的钻进过程数据异常判别与校正的方法,其特征在于:步骤S2中,使用DTW算法计算长度p内两个时间序列间距离的过程如下:
若这两个时间序列为P和Q,分别表示钻进过程中发生事故时有相同变化趋势的两个参数,计算以离群点数据为中心,p时间长度区间内时间序列的相似性,两个时间序列P和Q的长度分别为a和b,根据如下公式得到最小动态时间规整距离dtwu
γ(i,j)=e(pi,qj)+min{γ(i-1,j)+γ(i-1,j-1)+γ(i,j-1)}
dtwu=γ(a,b)
其中,e(pi,qj)是pi和qj两个数据点的距离,γ(i,j)是累积距离,i和j分别表示第i个数据点和第j个数据点,i和j均为正整数;从(0,0)点开始匹配两个序列P和Q,每到一个点,之前所有点计算的距离都会累积为γ(i,j);最终到(a,b)点处的γ(i,j)值为最小动态时间规整距离dtwu
4.如权利要求1所述的一种基于动态时间规整的钻进过程数据异常判别与校正的方法,其特征在于:步骤S3中,基于模糊C均值聚类算法对计算得到的DTW值dtwu进行聚类划分的过程如下:
设定核模糊C均值聚类算法的目标函数Jm如下:
Figure FDA0004226288330000021
Figure FDA0004226288330000022
Figure FDA0004226288330000023
其中,Jm是模糊C均值聚类算法的目标函数,K是聚类个数,m是模糊指数,μku是离群点数据xu相对于聚类中心ck的隶属度,u是第u个离群点,U是离群点的总数目,
Figure FDA0004226288330000031
表示控制聚类过程中的模糊性,dtwu表示最小动态时间规整距离,ck和cf分别表示第k类与第f类的聚类中心;通过更新聚类中心ck和隶属度μku来实现Jm的最小。
5.如权利要求4所述的一种基于动态时间规整的钻进过程数据异常判别与校正的方法,其特征在于:步骤S3中,通过以下公式分别计算聚类中心ck与正常钻进时p长度时间序列内的DTW值dtwp的欧式距离:
lk=||ck-dtwp||
其中,lk为聚类中心ck与正常钻进时p长度时间序列DTW值dtwp的欧式距离;通过比较得到的所有欧式距离,找到最小的欧式距离lmin,根据异常敏感系数q,当距离lk大于qlmin时,判定第k类聚类中离群点数据是由于检测误差引起的异常值,反之是由于钻进事故引起的异常值。
CN202010281882.9A 2020-04-11 2020-04-11 基于动态时间规整的钻进过程数据异常判别与校正的方法 Active CN111598129B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010281882.9A CN111598129B (zh) 2020-04-11 2020-04-11 基于动态时间规整的钻进过程数据异常判别与校正的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010281882.9A CN111598129B (zh) 2020-04-11 2020-04-11 基于动态时间规整的钻进过程数据异常判别与校正的方法

Publications (2)

Publication Number Publication Date
CN111598129A CN111598129A (zh) 2020-08-28
CN111598129B true CN111598129B (zh) 2023-07-11

Family

ID=72188742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010281882.9A Active CN111598129B (zh) 2020-04-11 2020-04-11 基于动态时间规整的钻进过程数据异常判别与校正的方法

Country Status (1)

Country Link
CN (1) CN111598129B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112380992B (zh) * 2020-11-13 2022-12-20 上海交通大学 一种加工过程监控数据准确性评估与优化方法及装置
CN112528784B (zh) * 2020-12-01 2022-06-21 中国地质大学(武汉) 一种面向正常钻柱振动信号的粘滑和跳钻异常识别方法
CN113327655B (zh) * 2021-04-21 2022-08-05 福建亿能达信息技术股份有限公司 多维度数据的离群值检测方法、装置、设备和介质
CN115945570A (zh) * 2023-01-06 2023-04-11 上汽通用五菱汽车股份有限公司 一种自动判断冲压零件成形质量的方法及系统
CN117571107B (zh) * 2024-01-15 2024-03-15 山西富衡达自动化设备有限公司 一种智能化无人值守地磅异常监测系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009245228A (ja) * 2008-03-31 2009-10-22 Yamatake Corp 異常検出方法および異常検出装置
CN108776276A (zh) * 2018-06-29 2018-11-09 合肥工业大学 用电异常检测方法及系统
CN110457550A (zh) * 2019-07-05 2019-11-15 中国地质大学(武汉) 一种烧结过程中异常运行数据的校正方法
CN110838073A (zh) * 2019-11-11 2020-02-25 中国海洋石油集团有限公司 一种基于聚类算法的钻井溢流数据异常值处理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3109801A1 (en) * 2015-06-26 2016-12-28 National University of Ireland, Galway Data analysis and event detection method and system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009245228A (ja) * 2008-03-31 2009-10-22 Yamatake Corp 異常検出方法および異常検出装置
CN108776276A (zh) * 2018-06-29 2018-11-09 合肥工业大学 用电异常检测方法及系统
CN110457550A (zh) * 2019-07-05 2019-11-15 中国地质大学(武汉) 一种烧结过程中异常运行数据的校正方法
CN110838073A (zh) * 2019-11-11 2020-02-25 中国海洋石油集团有限公司 一种基于聚类算法的钻井溢流数据异常值处理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Hesam Izakiana等.Fuzzy clustering of time series data using dynamic time warping distance.Engineering Applications of Artificial Intelligence.2015,第235-244页. *
曾利云 ; 肖云 ; 张植豪 ; .基于时间序列和聚类的挤压机能耗异常检测研究.机电工程技术.2018,(第09期),第32-36页. *

Also Published As

Publication number Publication date
CN111598129A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN111598129B (zh) 基于动态时间规整的钻进过程数据异常判别与校正的方法
CN108388921B (zh) 一种基于随机森林的溢流漏失实时识别方法
CN107676064B (zh) 一种水驱油藏含水率预测方法及其预测装置
CN109255134B (zh) 一种抽油机井故障情况的获取方法
CN108952699B (zh) 一种复杂地质钻进过程地层岩性智能识别方法
CN112529341B (zh) 一种基于朴素贝叶斯算法的钻井漏失机率预测方法
CN107122860B (zh) 基于网格搜索和极限学习机的冲击地压危险等级预测方法
CN114139458B (zh) 基于机器学习的钻井参数优化方法
CN114357750A (zh) 一种采空区充水状态评估方法
CN108520267A (zh) 一种基于时空特征的水文遥测数据异常检测方法
CN103995972A (zh) 一种地层对比方法
CN115293316A (zh) 基于ssa-elman中深埋厚煤层导水裂隙带预测方法
CN112966355A (zh) 基于深度学习的盾构机刀具剩余使用寿命预测方法
CN116822971A (zh) 一种井壁风险等级预测方法
CN110322083B (zh) 页岩油气可采储量预警方法
CN115809411A (zh) 一种基于测井数据的改进型决策树岩性识别方法
CN114063150B (zh) 一种基于ml-knn算法的“震源-台站”速度模型选取方法
CN113253343B (zh) 基于微地震监测技术识别地下储气库断层活动的方法
CN109973068B (zh) 油藏注水诱导裂缝的识别方法及装置
CN110377798B (zh) 基于角度熵的离群点检测方法
CN111274736A (zh) 一种基于有导师学习神经网络算法的导水裂隙带预测方法
CN110674868A (zh) 一种基于高维钻进参数信息的地层岩性识别系统及其方法
CN117540277B (zh) 一种基于WGAN-GP-TabNet算法的井漏预警方法
CN112348350B (zh) 一种油田开发后期层系重组方法、计算机设备及存储介质
CN117094565B (zh) 一种国有集团企业主体责任落实分级评估系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant