CN109594967A - 一种基于录井大数据的卡钻事故检测预警方法 - Google Patents
一种基于录井大数据的卡钻事故检测预警方法 Download PDFInfo
- Publication number
- CN109594967A CN109594967A CN201811425245.3A CN201811425245A CN109594967A CN 109594967 A CN109594967 A CN 109594967A CN 201811425245 A CN201811425245 A CN 201811425245A CN 109594967 A CN109594967 A CN 109594967A
- Authority
- CN
- China
- Prior art keywords
- data
- bit freezing
- early warning
- well logging
- big data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH DRILLING; MINING
- E21B—EARTH DRILLING, e.g. DEEP DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B44/00—Automatic control systems specially adapted for drilling operations, i.e. self-operating systems which function to carry out or modify a drilling operation without intervention of a human operator, e.g. computer-controlled drilling systems; Systems specially adapted for monitoring a plurality of drilling variables or conditions
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH DRILLING; MINING
- E21B—EARTH DRILLING, e.g. DEEP DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B47/00—Survey of boreholes or wells
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH DRILLING; MINING
- E21B—EARTH DRILLING, e.g. DEEP DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B2200/00—Special features related to earth drilling for obtaining oil, gas or water
- E21B2200/22—Fuzzy logic, artificial intelligence, neural networks or the like
Abstract
本发明公开了一种基于录井大数据的卡钻检测预警方法,步骤一:数据预处理,将自动录井装置采集的业务参数和管理人员记录的日志数据进行预处理,实现钻井事故自动标注;步骤二:数据特征重组,对原始数据进行重采样和平滑处理,判断数据字段的重要性;步骤三:学习模型选型,采用随机森林模型处理卡钻检测数据;步骤四:判别模型调优,采用交叉验证方法对学习模型进行调参,并将最终生成的模型用于检测钻井工程异常。本发明发掘业务数据中的有效信息,卡钻检测准确率高,领先与现有的人工判别。
Description
技术领域
本发明涉及一种工程异常检测方法,特别是一种基于录井大数据的卡钻事故检测预警方法。
背景技术
目前,在油田生产过程逐步现代化与智能化的背景下,钻井过程中的工程异常检测(尤其是井漏、卡钻、气体异常等)主要是基于专家系统对录井设备所采集的作业数据的分析,管理人员利用其生产经验与专业知识发现生产参数变化中的异常,对可能存在的异常工况进行人工判定,然而人工判别依赖于管理人员的业务经验与主观性,难以及时判别事故并采取处理措施,并且维护专家系统需要花费大量的人力财力,如何实现钻井工程异常的自动判别,成为一个亟待解决的问题。
发明内容
本发明所要解决的技术问题是提供一种基于录井大数据的卡钻事故检测预警方法,实现钻井工程异常自动检测。
为解决上述技术问题,本发明所采用的技术方案是:
一种基于录井大数据的卡钻事故检测预警方法,其特征在于包含以下步骤:
步骤一:数据预处理,将自动录井装置采集的业务参数和管理人员记录的日志数据进行预处理,实现钻井事故自动标注;
步骤二:数据特征重组,对原始数据进行重采样和平滑处理,判断数据字段的重要性;
步骤三:学习模型选型,采用随机森林模型处理卡钻检测数据;
步骤四:判别模型调优,采用交叉验证方法对学习模型进行调参,并将最终生成的模型用于检测钻井工程异常。
进一步地,所述步骤一具体为
现有录井数据包括自动录井装置采集的业务参数以及管理人员记录的日志数据,前者属于结构化数据,而后者则属于非结构化数据;
对于结构化数据,每口井拥有相当多的字段,其中包括大量缺失或者无效数据,认为恒定字段以及缺失值占比超过80%的字段为无效数据并予以删除,对于其余缺失值采用插值的方法进行补充;
对于非结构化数据,采用语料匹配的方法对日志信息进行提取,生成形式为“井号,时间,事故类型”的结构化数据,达到钻井事故自动标注的目的。
进一步地,所述自动录井装置采集的业务参数包含出入口流量、立管压力。
进一步地,所述管理人员记录的日志数据包含事故类型、事故时间。
进一步地,所述步骤二具体为
首先,原始生产数据的更新周期通常很短,产生了大量的冗余数据,需要进行重采样;
然后,设备采集的数据中存在噪音成分,设定滑动窗口对数据进行移动平均处理,使得数据的变化更为平滑稳定;
最后,采用主成分分析方法判断数据字段的重要性,从而帮助管理人员更好地利用参数判断工程异常。
进一步地,所述主成分分析方法是通过计算数据矩阵的协方差矩阵,并得到协方差矩阵的特征值与特征向量,特征值越大表明该特征越重要。
进一步地,假定录井设备采集了N组数据,即{X(1),X(2),…,X(i),…,X(N)},其中X(i)∈Rm,为X(i)的第j个生产参数,则主成分分析的具体步骤如下:
(1)将特征数据进行标准化:
其中为第j个参数的样本均值;
(2)计算协方差矩阵:
C=DX(DX)T/N,
其中为标准化后的数据矩阵;
(3)将协方差矩阵进行特征分解:
C=UΛUT,
其中为特征值矩阵,且λ1,λ2,…,λd为非递减序列, U=[u1,u2,…,um]为对应的特征向量矩阵;
(4)特征值的排序决定了数据字段的重要程度,即前l个重要的字段为 u1,u2,…,ul,l≤m。
进一步地,所述步骤三具体为卡钻检测在本质上属于多分类问题,即根据工程参数判断此时的工况是否存在异常,并且属于哪类异常,因此采用的学习模型为随机森林,通过建立多个模型组合来解决该多分类问题,基于多个弱分类器的结果进行投票选择,最终生成一个强分类器。
进一步地,所述随机森林的具体步骤为:
(1)选择C4.5决策树作为基础分类模型,随机且有放回地从N个样本中选取ni个训练样本构成子集,作为第i个决策树的训练集;
(2)对于每棵决策树,从m维特征空间中随机选取一个维度为常数p的子集,并从中选取最佳分割属性进行分类;
(3)重复上述步骤,直至所有决策树无法生长;
(4)利用所有的决策树进行投票表决。
进一步地,所述步骤四具体为结合大量的离线数据,采用常用的交叉验证方法对学习模型进行调参,确定弱分类器的个数以及决策树分裂时随机选取的特征数,并将最终生成的判别模型接入现有系统上线。
本发明与现有技术相比,具有以下优点和效果:
1、本发明在传统专家系统的基础上,充分利用录井设备采集的数据,利用机器学习算法挖掘生产参数与卡钻之间的关系;
2、本发明最终生成的判别模型能够发现潜在的安全事故威胁,为事故预警系统提供数据支持,使管理人员能够在事故发生之前及时采取相应处理措施,降低甚至避免事故危害;
3、本发明发掘业务数据中的有效信息,卡钻检测准确率高,领先与现有的人工判别,对生成数据的处理与特征重组;将机器学习所得知识与专家系统规则相结合。
附图说明
图1是本发明的一种基于录井大数据的卡钻事故检测预警方法的流程图。
具体实施方式
下面通过实施例对本发明作进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。
如图1所示,本发明的一种基于录井大数据的卡钻事故检测预警方法,其特征在于包含以下步骤:
步骤一:数据预处理,将自动录井装置采集的业务参数和管理人员记录的日志数据进行预处理,实现钻井事故自动标注;其中,自动录井装置采集的业务参数包含出入口流量、立管压力。管理人员记录的日志数据包含事故类型、事故时间。
现有录井数据包括自动录井装置采集的业务参数以及管理人员记录的日志数据,前者属于结构化数据,而后者则属于非结构化数据;
对于结构化数据,每口井拥有相当多的字段,其中包括大量缺失或者无效数据,不进行数据清洗会影响最终生成模型的性能,因此认为恒定字段以及缺失值占比较高(超过80%以上)的字段为无效数据并予以删除,对于其余缺失值采用插值的方法进行补充。
对于非结构化数据,采用语料匹配的方法对日志信息进行提取,生成形式为(井号,时间,事故类型)的结构化数据。例如,“林7-平44在5月20日 11点30分发生卡钻,持续5分钟”为日志中的一条记录,则将该记录转换为(林 7-平44,05-20 11:30-05-20 11:35,卡钻),达到钻井事故自动标注的目的。
步骤二:数据特征重组,对原始数据进行重采样和平滑处理,判断数据字段的重要性;
首先,原始生产数据的更新周期通常很短,产生了大量的冗余数据,容易使学习模型产生过拟合,同时为了提高模型的运行效率,需要进行重采样。
然后,由于设备采集的数据中存在相当的噪音成分,使各个字段均有不同程度的突变,因此设定滑动窗口对数据进行移动平均处理,使得数据的变化更为平滑稳定。
最后,为了帮助管理人员更好地利用参数判断是否发生事故,采用主成分分析方法判断数据字段的重要性,其思想是通过计算数据矩阵的协方差矩阵,并得到协方差矩阵的特征值与特征向量,特征值越大表明该特征越重要。
假定录井设备采集了N组数据,即{X(1),X(2),…,X(i),…,X(N)},其中 为X(i)的第j个生产参数,则主成分分析的具体步骤如下:
(1)将特征数据进行标准化:
其中为第j个参数的样本均值;
(2)计算协方差矩阵:
C=DX(DX)T/N,
其中为标准化后的数据矩阵;
(3)将协方差矩阵进行特征分解:
C=UΛUT,
其中特征值矩阵,且λ1,λ2,…,λd为非递减序列, U=[u1,u2,…,um]为对应的特征向量矩阵;
(4)特征值的排序决定了数据字段的重要程度,即前l个重要的字段为 u1,u2,…,ul,l≤m。
步骤三:学习模型选型,采用随机森林模型处理卡钻检测数据;
卡钻的检测在本质上属于多分类问题,即根据工程参数判断此时的工况是否存在卡钻的可能性,可能性多大。本发明中的学习模型为随机森林,在本质上属于集成学习,即通过建立多个模型组合来解决该多分类问题,基于多个弱分类器的结果进行投票选择,最终生成一个强分类器。仍以步骤二中假定的参数为基准,则随机森林的具体步骤为:
(1)选择C4.5决策树作为基础分类模型,随机且有放回地从N个样本中选取ni个训练样本构成子集,作为第i个决策树的训练集;
(2)对于每棵决策树,从m维特征空间中随机选取一个维度为常数p的子集,并从中选取最佳分割属性进行分类;
(3)重复上述步骤,直至所有决策树无法生长;
(4)利用所有的决策树进行投票表决。
整个学习模型的参数为决策树的棵数,参数p的值,通过交叉验证进行参数选定。
步骤四:判别模型调优,采用交叉验证方法对学习模型进行调参,并将最终生成的模型用于检测钻井工程异常。
结合大量的离线数据,采用常用的交叉验证方法对学习模型进行调参,确定弱分类器的个数以及决策树分裂时随机选取的特征数,并将最终生成的判别模型接入现有系统上线。
由于异常工况检测可以抽象为一个多分类问题,因此可以采用多种机器学习算法作为该方法中的学习模型,例如神经网络、支持向量机、感知器、聚类方法等,每种方法都具有各自的特点与使用场合。
根据仿真实验与效果对比,本方法采用的集成学习方法在检测准确度与运行效率上已经能够满足生产需要,随着硬件设备运行与网络传输速度的提高,深度学习可能成为更好的替代方案。
本发明在传统专家系统的基础上,充分利用录井设备采集的数据,利用机器学习算法挖掘生产参数与卡钻之间的关系。本方法最终生成的判别模型能够发现潜在的安全事故威胁,为事故预警系统提供数据支持,使管理人员能够在事故发生之前及时采取相应处理措施,降低甚至避免事故危害。
本说明书中所描述的以上内容仅仅是对本发明所作的举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种修改或补充或采用类似的方式替代,只要不偏离本发明说明书的内容或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (10)
1.一种基于录井大数据的卡钻检测预警方法,其特征在于包含以下步骤:
步骤一:数据预处理,将自动录井装置采集的业务参数和管理人员记录的日志数据进行预处理,实现钻井事故自动标注;
步骤二:数据特征重组,对原始数据进行重采样和平滑处理,判断数据字段的重要性;
步骤三:学习模型选型,采用随机森林模型处理卡钻检测数据;
步骤四:判别模型调优,采用交叉验证方法对学习模型进行调参,并将最终生成的模型用于检测钻井工程异常。
2.按照权利要求1所述的一种基于录井大数据的卡钻检测预警方法,其特征在于:所述步骤一具体为
现有录井数据包括自动录井装置采集的业务参数以及管理人员记录的日志数据,前者属于结构化数据,而后者则属于非结构化数据;
对于结构化数据,每口井拥有相当多的字段,其中包括大量缺失或者无效数据,认为恒定字段以及缺失值占比超过80%的字段为无效数据并予以删除,对于其余缺失值采用插值的方法进行补充;
对于非结构化数据,采用语料匹配的方法对日志信息进行提取,生成形式为“井号,时间,事故类型”的结构化数据,达到钻井事故自动标注的目的。
3.按照权利要求2所述的一种基于录井大数据的卡钻检测预警方法,其特征在于:所述自动录井装置采集的业务参数包含出入口流量、立管压力。
4.按照权利要求2所述的一种基于录井大数据的卡钻检测预警方法,其特征在于:所述管理人员记录的日志数据包含事故类型、事故时间。
5.按照权利要求1所述的一种基于录井大数据的卡钻检测预警方法,其特征在于:所述步骤二具体为
首先,原始生产数据的更新周期通常很短,产生了大量的冗余数据,需要进行重采样;
然后,设备采集的数据中存在噪音成分,设定滑动窗口对数据进行移动平均处理,使得数据的变化更为平滑稳定;
最后,采用主成分分析方法判断数据字段的重要性,从而帮助管理人员更好地利用参数判断工程异常。
6.按照权利要求5所述的一种基于录井大数据的卡钻检测预警方法,其特征在于:所述主成分分析方法是通过计算数据矩阵的协方差矩阵,并得到协方差矩阵的特征值与特征向量,特征值越大表明该特征越重要。
7.按照权利要求6所述的一种基于录井大数据的卡钻检测预警方法,其特征在于:假定录井设备采集了N组数据,即{X(1),X(2),…,X(i),…,X(N)},其中X(i)∈Rm,为X(i)的第j个生产参数,则主成分分析的具体步骤如下:
(1)将特征数据进行标准化:
其中为第j个参数的样本均值;
(2)计算协方差矩阵:
C=DX(DX)T/N,
其中为标准化后的数据矩阵;
(3)将协方差矩阵进行特征分解:
C=UΛUT,
其中为特征值矩阵,且λ1,λ2,…,λd为非递减序列,U=[u1,u2,…,um]为对应的特征向量矩阵;
(4)特征值的排序决定了数据字段的重要程度,即前l个重要的字段为u1,u2,…,ul,l≤m。
8.按照权利要求1所述的一种基于录井大数据的卡钻检测预警方法,其特征在于:所述步骤三具体为
卡钻检测在本质上属于多分类问题,即根据工程参数判断此时的工况是否存在异常,并且属于哪类异常,因此采用的学习模型为随机森林,通过建立多个模型组合来解决该多分类问题,基于多个弱分类器的结果进行投票选择,最终生成一个强分类器。
9.按照权利要求8所述的一种基于录井大数据的卡钻检测预警方法,其特征在于:所述随机森林的具体步骤为:
(1)选择C4.5决策树作为基础分类模型,随机且有放回地从N个样本中选取ni个训练样本构成子集,作为第i个决策树的训练集;
(2)对于每棵决策树,从m维特征空间中随机选取一个维度为常数p的子集,并从中选取最佳分割属性进行分类;
(3)重复上述步骤,直至所有决策树无法生长;
(4)利用所有的决策树进行投票表决。
10.按照权利要求1所述的一种基于录井大数据的卡钻检测预警方法,其特征在于:所述步骤四具体为结合大量的离线数据,采用常用的交叉验证方法对学习模型进行调参,确定弱分类器的个数以及决策树分裂时随机选取的特征数,并将最终生成的判别模型接入现有系统上线。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811425245.3A CN109594967A (zh) | 2018-11-27 | 2018-11-27 | 一种基于录井大数据的卡钻事故检测预警方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811425245.3A CN109594967A (zh) | 2018-11-27 | 2018-11-27 | 一种基于录井大数据的卡钻事故检测预警方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109594967A true CN109594967A (zh) | 2019-04-09 |
Family
ID=65959748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811425245.3A Pending CN109594967A (zh) | 2018-11-27 | 2018-11-27 | 一种基于录井大数据的卡钻事故检测预警方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109594967A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113496302A (zh) * | 2020-04-02 | 2021-10-12 | 中国石油化工股份有限公司 | 一种对钻井风险进行智能识别预警的方法与系统 |
CN117386344A (zh) * | 2023-12-13 | 2024-01-12 | 西南石油大学 | 一种基于两阶段学习的钻井异常工况诊断方法及系统 |
CN117722170A (zh) * | 2024-02-09 | 2024-03-19 | 四川诺克钻探机械有限公司 | 一种钻探作业中采用自动化控制的方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004220236A (ja) * | 2003-01-14 | 2004-08-05 | Nippon Telegr & Teleph Corp <Ntt> | データ分析方法、装置、プログラム及び該プログラムを記録した記録媒体 |
CN104636814A (zh) * | 2013-11-14 | 2015-05-20 | 中国科学院深圳先进技术研究院 | 一种随机森林模型的优化方法及系统 |
CN105089620A (zh) * | 2014-05-14 | 2015-11-25 | 中国石油天然气集团公司 | 卡钻的监测系统、方法及装置 |
CN108375808A (zh) * | 2018-03-12 | 2018-08-07 | 南京恩瑞特实业有限公司 | Nriet基于机器学习的大雾预报方法 |
-
2018
- 2018-11-27 CN CN201811425245.3A patent/CN109594967A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004220236A (ja) * | 2003-01-14 | 2004-08-05 | Nippon Telegr & Teleph Corp <Ntt> | データ分析方法、装置、プログラム及び該プログラムを記録した記録媒体 |
CN104636814A (zh) * | 2013-11-14 | 2015-05-20 | 中国科学院深圳先进技术研究院 | 一种随机森林模型的优化方法及系统 |
CN105089620A (zh) * | 2014-05-14 | 2015-11-25 | 中国石油天然气集团公司 | 卡钻的监测系统、方法及装置 |
CN108375808A (zh) * | 2018-03-12 | 2018-08-07 | 南京恩瑞特实业有限公司 | Nriet基于机器学习的大雾预报方法 |
Non-Patent Citations (2)
Title |
---|
刘强 等: "岩体质量分类的PCA-RF模型及应用", 《黄金科学技术》 * |
李广 等: "基于随机森林的钻井工程预警研究", 《石油天然气学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113496302A (zh) * | 2020-04-02 | 2021-10-12 | 中国石油化工股份有限公司 | 一种对钻井风险进行智能识别预警的方法与系统 |
CN117386344A (zh) * | 2023-12-13 | 2024-01-12 | 西南石油大学 | 一种基于两阶段学习的钻井异常工况诊断方法及系统 |
CN117386344B (zh) * | 2023-12-13 | 2024-02-23 | 西南石油大学 | 一种基于两阶段学习的钻井异常工况诊断方法及系统 |
CN117722170A (zh) * | 2024-02-09 | 2024-03-19 | 四川诺克钻探机械有限公司 | 一种钻探作业中采用自动化控制的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106895975B (zh) | 基于Stacked SAE深度神经网络的轴承故障诊断方法 | |
CN110929918B (zh) | 一种基于CNN和LightGBM的10kV馈线故障预测方法 | |
CN104573740B (zh) | 一种基于svm分类模型的设备故障诊断方法 | |
CN112529341B (zh) | 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 | |
WO2021128576A1 (zh) | 基于生成式对抗网络的刀具状态监测数据集增强方法 | |
CN101345704B (zh) | 基于支持向量机的对等网络流量检测方法 | |
CN110263846A (zh) | 基于故障数据深度挖掘及学习的故障诊断方法 | |
CN109829236A (zh) | 一种基于XGBoost特征提取的压缩机故障诊断方法 | |
CN109594967A (zh) | 一种基于录井大数据的卡钻事故检测预警方法 | |
CN107122860B (zh) | 基于网格搜索和极限学习机的冲击地压危险等级预测方法 | |
CN111126658A (zh) | 一种基于深度学习的煤矿瓦斯预测方法 | |
CN109741797A (zh) | 一种利用深度学习技术预测小分子化合物水溶性等级的方法 | |
CN114429152A (zh) | 基于动态指数对抗性自适应的滚动轴承故障诊断方法 | |
CN115496108A (zh) | 一种基于流形学习和大数据分析的故障监测方法及系统 | |
CN115587290A (zh) | 基于变分自编码生成对抗网络的航空发动机故障诊断方法 | |
CN109164794B (zh) | 基于偏f值selm的多变量工业过程故障分类方法 | |
CN111652253A (zh) | 一种基于大数据的井漏事故检测预警方法 | |
CN111242490A (zh) | 低渗透油藏特征主控因素提取方法、设备及可读存储介质 | |
CN109344171A (zh) | 一种基于数据流处理的非线性系统特征变量显著性挖掘法 | |
CN110888850B (zh) | 一种基于电力物联网平台的数据质量检测方法 | |
CN110348510B (zh) | 一种基于深水油气钻井过程阶段性特征的数据预处理方法 | |
CN116204825A (zh) | 一种基于数据驱动的生产线设备故障检测方法 | |
CN108493933A (zh) | 一种基于深度决策树算法的电力负荷特性挖掘方法 | |
CN114417704A (zh) | 一种基于改进栈式自编码的风电机组发电机健康评估方法 | |
Silva et al. | Classifying feature models maintainability based on machine learning algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190409 |
|
RJ01 | Rejection of invention patent application after publication |