CN109472285B - 井漏识别方法、装置及计算机设备 - Google Patents

井漏识别方法、装置及计算机设备 Download PDF

Info

Publication number
CN109472285B
CN109472285B CN201811147260.6A CN201811147260A CN109472285B CN 109472285 B CN109472285 B CN 109472285B CN 201811147260 A CN201811147260 A CN 201811147260A CN 109472285 B CN109472285 B CN 109472285B
Authority
CN
China
Prior art keywords
sample data
data
classification
initial
lost circulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811147260.6A
Other languages
English (en)
Other versions
CN109472285A (zh
Inventor
马君
马旭鑫
金玮
邸抗
祝军
宫本儒
李新宅
安向哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunlun Digital Technology Co ltd
China National Petroleum Corp
BGP Inc
Original Assignee
BGP Inc
CNPC Beijing Richfit Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGP Inc, CNPC Beijing Richfit Information Technology Co Ltd filed Critical BGP Inc
Priority to CN201811147260.6A priority Critical patent/CN109472285B/zh
Publication of CN109472285A publication Critical patent/CN109472285A/zh
Application granted granted Critical
Publication of CN109472285B publication Critical patent/CN109472285B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21BEARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
    • E21B47/00Survey of boreholes or wells
    • E21B47/10Locating fluid leaks, intrusions or movements

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Mining & Mineral Resources (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Geology (AREA)
  • Fluid Mechanics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geochemistry & Mineralogy (AREA)
  • Environmental & Geological Engineering (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Geophysics (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种井漏识别方法、装置及计算机设备,属于钻井技术领域。本发明通过将历史钻井数据及其对应的井漏情况作为初始数据,并对该初始数据进行清洗,使之更符合分类模型的输入要求,可以提高分类结果的准确度;在该样本数据中,按照贡献值从大到小,提取预设数量的特征及其对应的样本数据,以便减少输入分类模型中的数据量,提高模型训练速度和准确度;然后,根据该预设数量的特征对应的样本数据及井漏情况,获取符合预设准确度要求的分类模型。在实时识别井漏情况时,将实时钻井数据输入该分类模型中,得到井漏识别结果。上述井漏识别方法无需要求现场工程师具备较高操作水平,即可得到准确度和时效性较高的井漏识别结果。

Description

井漏识别方法、装置及计算机设备
技术领域
本发明涉及钻井技术领域,特别涉及一种井漏识别方法、装置及计算机设备。
背景技术
在地下钻井工程中,井下可能会发生多种复杂情况,这些复杂情况轻者延误钻进,重者引发严重安全事故。在常见的井下复杂情况中,井漏是发生率最高且造成经济损失最大的复杂情况,因此,有必要寻求方法根据钻井数据对井漏情况进行识别。
目前常用的方法是:根据钻进过程中泥浆池总体积和出入流量差的变化来对井漏情况进行识别,当泥浆池总体积变小或者出入流量差变大时,确定井漏情况已经发生。
因泥浆池面积过大或者出入流量差统计不准,该方法只有当井漏发生到一定程度时才能识别,故该方法识别的准确度和时效性较低;并且该方法对现场工程师的操作水平要求较高。
发明内容
本发明实施例提供了一种井漏识别方法、装置及计算机设备,能够解决目前常用的井漏识别方法识别的准确度和时效性较低,并且该方法现场工程师的操作水平要求较高的问题。所述技术方案如下:
第一方面,提供了一种井漏识别方法,该方法包括:
获取按照时序排列的初始数据,该初始数据包括历史钻井数据和该历史钻井数据对应的井漏情况;
对该初始数据进行数据清洗,得到样本数据,该样本数据包括正样本数据和负样本数据,该正样本数据为井漏期间的历史钻井数据,该负样本数据为非井漏期间的历史钻井数据;
对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征;
对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征;
获取该样本数据的统计特征和该样本数据的小波特征对分类结果的贡献值,该分类结果为对该样本数据进行分类得到的用于井漏识别的结果,该贡献值表示特征对该分类结果的影响大小;
按照该贡献值从大到小,获取预设数量的特征,从该正样本数据和负样本数据中提取该预设数量的特征对应的正样本数据和负样本数据;
基于该预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型,该多个初始第一分类模型为采用不同分类算法的模型;
基于该预设数量的特征对应的正样本数据和负样本数据以及该多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型,该第二分类模型包括该多个第一分类模型;
获取实时钻井数据;
将该实时钻井数据输入该第二分类模型,获取第二分类结果;
对该第二分类结果进行处理,得到井漏识别结果。
在一种可能实现方式中,对该初始数据进行数据清洗包括:
对该初始数据进行异常值处理;
对该异常值处理后的数据进行移动平均;
对该移动平均处理后的数据进行标准化处理,得到该样本数据。
在一种可能实现方式中,该样本数据的统计特征包括:该样本数据的方差、极差、中位数、偏度、峰度和变异系数。
在一种可能实现方式中,对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征包括:
对该正样本数据,基于第一步长的第一滑动窗口,获取该正样本数据的统计特征;
对该负样本数据,基于第二步长的第一滑动窗口,获取该负样本数据的统计特征;
其中,该第一步长小于该第二步长。
在一种可能实现方式中,对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征包括:
对该正样本数据,基于第一步长的该第一滑动窗口,对该正样本数据进行离散小波变换,得到该正样本数据的小波特征;
对该负样本数据,基于第二步长的该第一滑动窗口,对该负样本数据进行离散小波变换,得到该负样本数据的小波特征;
其中,该第一步长小于该第二步长。
在一种可能实现方式中,该多个初始第一分类模型包括:决策树分类模型、随机森林模型和支持向量机模型。
在一种可能实现方式中,该初始第二分类模型为逻辑回归模型。
在一种可能实现方式中,该初始数据包括:总池体积、总池入口流量、总池出口流量、立管压力、大钩负荷、大钩高度、钻速、相对流量以及钻井液压力。
第二方面,提供了一种井漏识别装置,该装置包括:
数据获取模块,用于获取按照时序排列的初始数据,该初始数据包括历史钻井数据和该历史钻井数据对应的井漏情况;
数据清洗模块,用于对该初始数据进行数据清洗,得到样本数据,该样本数据包括正样本数据和负样本数据,该正样本数据为井漏期间的历史钻井数据,该负样本数据为非井漏期间的历史钻井数据;
统计特征获取模块,用于对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征;
小波特征获取模块,用于对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征;
贡献值获取模块,用于获取该样本数据的统计特征和该样本数据的小波特征对分类结果的贡献值,该分类结果为对该样本数据进行分类得到的用于井漏识别的结果,该贡献值表示特征对该分类结果的影响大小;
特征数据提取模块,用于按照该贡献值从大到小,获取预设数量的特征,从该正样本数据和负样本数据中提取该预设数量的特征对应的正样本数据和负样本数据;
第一分类模型训练模块,用于基于该预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型,该多个初始第一分类模型为采用不同分类算法的模型;
第二分类模型训练模块,用于基于该预设数量的特征对应的正样本数据和负样本数据以及该多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型,该第二分类模型包括该多个第一分类模型;
数据获取模块,还用于获取实时钻井数据;
分类结果获取模块,用于将该实时钻井数据输入该第二分类模型,获取第二分类结果;
井漏识别结果获取模块,用于对该第二分类结果进行处理,得到井漏识别结果。
第三方面,提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条指令,该指令由该处理器加载并执行以实现如第一方面井漏识别方法中任一可能实现方式所执行的操作。
本发明实施例提供的技术方案带来的有益效果是:
通过将历史钻井数据和该历史钻井数据对应的井漏情况作为初始数据,并对该初始数据进行清洗,得到更符合分类模型输入要求的样本数据,可以提高分类模型输出的分类结果的准确度;在该样本数据中,按照贡献值从大到小,获取预设数量的特征,以便减少输入分类模型中的数据量,进而减少分类模型训练时的运算量,提高模型训练速度和准确度,并且在对实时钻井数据进行分类时,提高分类速度;然后,提取预设数量的特征对应的样本数据,进而根据该预设数量的特征对应的样本数据,以及该样本数据对应的井漏情况,获取多个第一分类模型,进而获取符合预设准确度要求的第二分类模型。在需要实时识别钻井时的井漏情况时,获取实时钻井数据,并将该实时钻井数据输入第二分类模型中,进而得到井漏识别结果。上述井漏识别方法无需要求现场工程师具备较高操作水平,即可得到准确度和时效性较高的井漏识别结果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种井漏识别方法流程图;
图2是本发明实施例提供的一种井漏识别方法流程图;
图3是本发明实施例提供的一种井漏识别装置的结构示意图;
图4是本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是本发明实施例提供的一种井漏识别方法流程图,该井漏识别方法可以应用于计算机设备。参见图1,该实施例包括:
101、获取按照时序排列的初始数据。
该初始数据包括历史钻井数据和该历史钻井数据对应的井漏情况。
102、对该初始数据进行数据清洗,得到样本数据。
该样本数据包括正样本数据和负样本数据,该正样本数据为井漏期间的历史钻井数据,该负样本数据为非井漏期间的历史钻井数据。
103、对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征。
104、对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征。
105、获取该样本数据的统计特征和该样本数据的小波特征对分类结果的贡献值。
该分类结果为对该样本数据进行分类得到的用于井漏识别的结果,该贡献值表示特征对该分类结果的影响大小。
106、按照该贡献值从大到小,获取预设数量的特征,从该正样本数据和负样本数据中提取该预设数量的特征对应的正样本数据和负样本数据。
107、基于该预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型。
该多个初始第一分类模型为采用不同分类算法的模型。
108、基于该预设数量的特征对应的正样本数据和负样本数据以及该多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型。
该第二分类模型包括该多个第一分类模型。
109、获取实时钻井数据。
110、将该实时钻井数据输入该第二分类模型,获取第二分类结果。
111、对该第二分类结果进行处理,得到井漏识别结果。
本发明实施例提供的方法,通过将历史钻井数据和该历史钻井数据对应的井漏情况作为初始数据,并对该初始数据进行清洗,得到更符合分类模型输入要求的样本数据,可以提高分类模型输出的分类结果的准确度;在该样本数据中,按照贡献值从大到小,获取预设数量的特征,以便减少输入分类模型中的数据量,进而减少分类模型训练时的运算量,提高模型训练速度和准确度,并且在对实时钻井数据进行分类时,提高分类速度;然后,提取预设数量的特征对应的样本数据,进而根据该预设数量的特征对应的样本数据,以及该样本数据对应的井漏情况,获取多个第一分类模型,进而获取符合预设准确度要求的第二分类模型。在需要实时识别钻井时的井漏情况时,获取实时钻井数据,并将该实时钻井数据输入第二分类模型中,进而得到井漏识别结果。上述井漏识别方法无需要求现场工程师具备较高操作水平,即可得到准确度和时效性较高的井漏识别结果。
在一种可能实现方式中,对该初始数据进行数据清洗包括:对该初始数据进行异常值处理;对该异常值处理后的数据进行移动平均;对该移动平均处理后的数据进行标准化处理,得到该样本数据。
在一种可能实现方式中,该样本数据的统计特征包括:该样本数据的方差、极差、中位数、偏度、峰度和变异系数。
在一种可能实现方式中,对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征包括:对该正样本数据,基于第一步长的第一滑动窗口,获取该正样本数据的统计特征;对该负样本数据,基于第二步长的第一滑动窗口,获取该负样本数据的统计特征;其中,该第一步长小于该第二步长。
在一种可能实现方式中,对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征包括:对该正样本数据,基于第一步长的该第一滑动窗口,对该正样本数据进行离散小波变换,得到该正样本数据的小波特征;对该负样本数据,基于第二步长的该第一滑动窗口,对该负样本数据进行离散小波变换,得到该负样本数据的小波特征;其中,该第一步长小于该第二步长。
在一种可能实现方式中,该多个初始第一分类模型包括:决策树分类模型、随机森林模型和支持向量机模型。
在一种可能实现方式中,该初始第二分类模型为逻辑回归模型。
在一种可能实现方式中,该初始数据包括:总池体积、总池入口流量、总池出口流量、立管压力、大钩负荷、大钩高度、钻速、相对流量以及钻井液压力。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图2是本发明实施例提供的一种井漏识别方法流程图,该井漏识别方法可以应用于计算机设备。参见图2,该实施例包括:
201、获取按照时序排列的初始数据。
该初始数据包括历史钻井数据和该历史钻井数据对应的井漏情况,例如,可以在一段时间内选取多个取样时间点,获取该多个取样时间点对应的初始数据,并将该初始数据按照该取样时间点的时序排列。任一个取样时间点对应一组历史钻井数据,该一组历史钻井数据也对应该取样时间点的井漏情况,该初始数据将在经过清洗处理后用于训练初始第一分类模型。
在一种可能实现方式中,该初始数据包括:总池体积、总池入口流量、总池出口流量、立管压力、大钩负荷、大钩高度、钻速、相对流量以及钻井液压力。
其中,总池体积是指用于储存钻井过程中循环使用的工作液的泥浆池的总体积;总池入口流量是指泥浆池入口处的流量;总池出口流量是指泥浆池出口处的流量;立管压力是指井口钻具在钻进过程中所承受的压力;大钩负荷是指钻井过程中钻具悬重与钻井液浮力之差;大钩高度是指钻井过程中大钩与地面之间的距离;钻速是指钻进速度;相对流量是指总池出口流量与总池入口流量之差;钻井液压力是指井下钻井液对油层的压力。上述初始数据能够从不同侧面反映井漏情况。
202、对该初始数据进行数据清洗,得到样本数据,该样本数据包括正样本数据和负样本数据。
对初始数据进行数据清洗,能够使输入初始第一分类模型的数据更符合模型的输入要求,进而提高第二分类模型输出的分类结果的准确度,以便提高该井漏识别方法的准确度。
其中,该正样本数据为井漏期间的历史钻井数据,该负样本数据为非井漏期间的历史钻井数据,按照对应的井漏情况将该样本数据分为正样本数据和负样本数据,通过对数据格式进行调整,为后续初始第一分类模型的训练过程提供更符合输入要求的数据。
在一种可能实现方式中,对该初始数据进行数据清洗包括下述过程:
(一)、对该初始数据进行异常值处理。
该异常值是指初始数据中的负值、缺失值或与该初始数据的平均值有较大差距的值,通常对异常值的处理方式是将其替换为0或初始数据的平均值,以防止异常值对分类模型训练过程造成影响并降低第二分类模型的准确度。对于与该初始数据的平均值有较大差距的异常值的识别,可以采用拉依达准则法、肖维勒准则法等异常值识别方法,本实施例对此不做限定。
(二)、对该异常值处理后的数据进行移动平均。
对于经过异常值处理后的数据,为了去除数据序列中不光滑的毛刺,使得数据在时序上的变化更加平稳,需要对该数据进行移动平均。对数据进行移动平均的方法可以是:基于第二滑动窗口,计算第二滑动窗口内的数据的平均值,用该平均值替换第二滑动窗口内中间位置的一个或两个数据,以此类推。上述每个第二滑动窗口内包括时间上连续的一定数量的数据。
(三)、对该移动平均处理后的数据进行标准化处理,得到该样本数据。
该步骤用于消除数据之间由于物理量纲不同造成的数值上的差异,使输入初始第一分类模型的数据更符合模型的输入要求。例如,可以采用标准差标准化方法对数据进行处理,使处理后的数据符合标准正态分布,即均值为0,标准差为1。
203、对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征。
该第一滑动窗口用于从按照时序排列的样本数据中提取一定数量的数据,以供后续使用。样本数据的统计特征能够从整体上反映样本数据的特征,用于后续初始第一分类模型的训练过程。
在一种可能实现方式中,该样本数据的统计特征包括:该样本数据的方差、极差、中位数、偏度、峰度和变异系数。
其中,方差是指一组数据中各个数据与其平均数之差的平方值的平均数,能够用来度量数据与其平均数之间的偏离程度;极差是数据变动的最大范围;中位数是把一组数据按照高低排序后,中间位置的一个数据;偏度能够反映统计数据分布偏斜的方向和程度;峰度是表征概率密度分布曲线在平均值处峰值高低的特征数;变异系数是数据标准差与数据平均数之比。
在一种可能实现方式中,对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征包括:对该正样本数据,基于第一步长的第一滑动窗口,获取该正样本数据的统计特征;对该负样本数据,基于第二步长的第一滑动窗口,获取该负样本数据的统计特征;其中,该第一步长小于该第二步长。
由于井漏期间的历史钻井数据的数量相对于非井漏期间的少,造成正样本数量也较少,为了平衡正负样本,对于正样本数据,采用基于第一步长,即较小步长的第一滑动窗口,来获取正样本数据的统计特征;对于负样本数据,采用基于第二步长,即较大步长的第一滑动窗口,来获取负样本数据的统计特征。通过平衡正负样本,可以提高第一分类模型和第二分类模型的准确度。
204、对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征。
与短时傅里叶变换等传统谱分析方法相比,小波变换尤其适合分析有突变和尖峰等不连续特性的信号。井漏事故由于发生迅速,其数据也具有突变性。离散小波变换是指将时序内的样本数据作为数字信号,将数字信号在时间域和频率域内分解为多个分辨率的分量,从而同时表达信号的趋势性特征和局部特征,时间序列经小波变换后,得到一系列小波特征,这些小波特征能够表示该信号在时间-频率域的能量分布。
在一种可能实现方式中,对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征包括:对该正样本数据,基于第一步长的该第一滑动窗口,对该正样本数据进行离散小波变换,得到该正样本数据的小波特征;对该负样本数据,基于第二步长的该第一滑动窗口,对该负样本数据进行离散小波变换,得到该负样本数据的小波特征;其中,该第一步长小于该第二步长。
由于井漏期间的历史钻井数据的数量相对于非井漏期间的比较少,造成正样本数量也较少,为了平衡正负样本,对于正样本数据,采用基于第一步长,即较小步长的第一滑动窗口,来获取正样本数据的小波特征;对于负样本数据,采用基于第二步长,即较大步长的第一滑动窗口,来获取负样本数据的小波特征。通过平衡正负样本,可以提高第一分类模型和第二分类模型的准确度。
205、获取该样本数据的统计特征和该样本数据的小波特征对分类结果的贡献值。
其中,该分类结果为对该样本数据进行分类得到的用于井漏识别的结果,该贡献值表示特征对该分类结果的影响大小,获取该贡献值有利于选取样本数据的统计特征和小波特征中对该分类结果影响较大的特征。例如,任一特征x对该分类结果的贡献值可以通过下述公式获取:
Figure BDA0001817079940000101
其中,F(x)表示特征x对分类结果的的贡献值;n-表示负样本数;μ-表示负样本均值;μ表示正样本和负样本的均值;n+表示正样本数;μ+表示正样本均值;xi表示特征x的第i个负样本数据;xj表示特征x的第j个正样本数据。
206、按照该贡献值从大到小,获取预设数量的特征。
选取样本数据的统计特征和小波特征中对该分类结果影响较大的预设数量的特征,能够剔除特征中对该分类结果影响较小或者没有影响的特征,以便减少输入初始第一分类模型中的数据量,进而减少初始第一分类模型训练时的运算量,提高模型训练速度和准确度,并且在对实时钻井数据进行分类时,提高第二分类模型的分类速度。
例如,可以按照特征的贡献值大小,获取90个特征,以供后续使用。
207、从该正样本数据和负样本数据中提取该预设数量的特征对应的正样本数据和负样本数据。
该预设数量的特征对应的正样本数据和负样本数据用于输入初始第一分类模型。
208、基于该预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型。
该预设数量的特征对应的正样本数据和负样本数据即为初始第一分类模型的输入样本。
例如,该多个初始第一分类模型的训练过程可以包括下述步骤:
(一)、将该输入样本划分为第一样本和第二样本,例如,可以将输入样本的80%划分为第一样本,将输入样本的20%划分为第二样本,第一样本用于训练初始第一分类模型,第二样本用于训练初始第二分类模型。
(二)、确定初始第一分类模型,该初始第一分类模型包括一些参数。
(三)、将第一样本中的部分数据输入初始第一分类模型,得到初始第一分类结果。
(四)、对于每一个初始第一分类结果,基于第一样本作为正样本数据或者负样本数据所带的井漏与否的标签,得到该初始第一分类结果的准确度。
(五)、基于该初始第一分类结果的准确度,判断该准确度是否符合第一分类模型的预设准确度要求,如果符合,输出中间第一分类模型;如果不符合,对该初始第一分类模型中的参数进行调整,直至该准确度符合第一分类模型的预设准确度要求,输出中间第一分类模型。
(六)、将第一样本中的其他数据输入该中间第一分类模型,得到该中间第一分类结果的准确度,重复步骤(五),直至得到符合预设准确度要求的第一分类模型。
该多个初始第一分类模型为采用不同分类算法的模型。在一种可能实现方式中,该多个初始第一分类模型包括:决策树分类模型、随机森林模型和支持向量机模型。
其中,决策树分类模型简单直观,可以处理多维度输出的分类问题;随机森林模型对于多维特征的数据集分类有很高的效率,准确率较高,实现起来也比较简单;支持向量机模型避开了从归纳到演绎的传统过程,效率较高。
209、基于该预设数量的特征对应的正样本数据和负样本数据以及该多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型。
其中,该初始第二分类模型可以是该多个第一分类模型的结合,该多个第一分类结果分别在该初始第二分类模型输出的结果中占有一定的权重,该第二分类模型输出的第二分类结果为该多个第一分类结果加权平均后的结果。
将步骤208中所述的第二样本输入该初始第二分类模型,获取该初始第二分类模型的准确度,调整该多个第一分类结果在该初始第二分类模型输出的结果中所占的权重,直到符合该第二分类模型的预设准确度要求,输出该第二分类模型。
在一种可能实现方式中,该初始第二分类模型为逻辑回归模型。
采用逻辑回归模型作为初始第二分类模型得到第二分类模型,该第二分类模型输出的第二分类结果为该多个第一分类结果加权平均后的结果,且各第一分类结果所占的权重根据输入数据的不同有所不同,该第二分类结果包括每一个第一分类结果对应的权重以及该权重对应的阈值。采用逻辑回归模型得到的分类结果准确度更高,且易于理解和实现。
210、获取实时钻井数据。
获取实时钻井过程中的总池体积、总池入口流量、总池出口流量、立管压力、大钩负荷、大钩高度、钻速、相对流量以及钻井液压力。对上述数据进行清洗,并获取该数据的统计特征和小波特征,根据步骤206中获取的预设数量的特征,提取该数据中的该预设数量的特征对应的实时钻井数据,以供下述步骤使用。
211、将该实时钻井数据输入该第二分类模型,获取第二分类结果。
该第二分类结果能够反映每一个时间点对应的基于第二分类模型的分类结果。
212、对该第二分类结果进行处理,得到井漏识别结果。
对该第二分类结果进行处理,得到实时井漏识别结果,以便在井漏情况发生时,可以根据该井漏识别结果及时采取措施。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
本发明实施例提供的方法,通过将历史钻井数据和该历史钻井数据对应的井漏情况作为初始数据,并对该初始数据进行清洗,得到更符合分类模型输入要求的样本数据,可以提高分类模型输出的分类结果的准确度;在该样本数据中,按照贡献值从大到小,获取预设数量的特征,以便减少输入分类模型中的数据量,进而减少分类模型训练时的运算量,提高模型训练速度和准确度,并且在对实时钻井数据进行分类时,提高分类速度;然后,提取预设数量的特征对应的样本数据,进而根据该预设数量的特征对应的样本数据,以及该样本数据对应的井漏情况,获取多个第一分类模型,进而获取符合预设准确度要求的第二分类模型。在需要实时识别钻井时的井漏情况时,获取实时钻井数据,并将该实时钻井数据输入第二分类模型中,进而得到井漏识别结果。上述井漏识别方法无需要求现场工程师具备较高操作水平,即可得到准确度和时效性较高的井漏识别结果。进一步地,采用小步长的第一滑动窗口来获取正样本数据的统计特征和小波特征,采用大步长的第一滑动窗口来获取负样本数据的统计特征和小波特征,可以平衡正负样本,提高第一分类模型和第二分类模型的准确度。
图3是本发明实施例提供的一种井漏识别装置的结构示意图,参见图3,该装置包括:
数据获取模块301,用于获取按照时序排列的初始数据,该初始数据包括历史钻井数据和该历史钻井数据对应的井漏情况。
数据清洗模块302,用于对该初始数据进行数据清洗,得到样本数据,该样本数据包括正样本数据和负样本数据,该正样本数据为井漏期间的历史钻井数据,该负样本数据为非井漏期间的历史钻井数据。
统计特征获取模块303,用于对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征。
小波特征获取模块304,用于对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征。
贡献值获取模块305,用于获取该样本数据的统计特征和该样本数据的小波特征对分类结果的贡献值,该分类结果为对该样本数据进行分类得到的用于井漏识别的结果,该贡献值表示特征对该分类结果的影响大小。
特征数据提取模块306,用于按照该贡献值从大到小,获取预设数量的特征,从该正样本数据和负样本数据中提取该预设数量的特征对应的正样本数据和负样本数据。
第一分类模型训练模块307,用于基于该预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型,该多个初始第一分类模型为采用不同分类算法的模型。
第二分类模型训练模块308,用于基于该预设数量的特征对应的正样本数据和负样本数据以及该多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型,该第二分类模型包括该多个第一分类模型。
数据获取模块301,还用于获取实时钻井数据。
分类结果获取模块309,用于将该实时钻井数据输入该第二分类模型,获取第二分类结果。
井漏识别结果获取模块310,用于对该第二分类结果进行处理,得到井漏识别结果。
本发明实施例提供的装置,通过将历史钻井数据和该历史钻井数据对应的井漏情况作为初始数据,并对该初始数据进行清洗,得到更符合分类模型输入要求的样本数据,可以提高分类模型输出的分类结果的准确度;在该样本数据中,按照贡献值从大到小,获取预设数量的特征,以便减少输入分类模型中的数据量,进而减少分类模型训练时的运算量,提高模型训练速度和准确度,并且在对实时钻井数据进行分类时,提高分类速度;然后,提取预设数量的特征对应的样本数据,进而根据该预设数量的特征对应的样本数据,以及该样本数据对应的井漏情况,获取多个第一分类模型,进而获取符合预设准确度要求的第二分类模型。在需要实时识别钻井时的井漏情况时,获取实时钻井数据,并将该实时钻井数据输入第二分类模型中,进而得到井漏识别结果。上述井漏识别方法无需要求现场工程师具备较高操作水平,即可得到准确度和时效性较高的井漏识别结果。
需要说明的是:上述实施例提供的井漏识别装置在进行井漏识别时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的井漏识别装置与井漏识别方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图4是本发明实施例提供的一种计算机设备的结构示意图,该计算机设备400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器(centralprocessing units,CPU)401和一个或一个以上的存储器402,其中,所述存储器402中存储有至少一条指令,所述至少一条指令由所述处理器401加载并执行以实现上述各个方法实施例提供的方法。当然,该计算机设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该计算机设备还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由计算机设备中的处理器执行以完成上述实施例中的井漏识别方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种井漏识别方法,其特征在于,所述方法包括:
获取按照时序排列的初始数据,所述初始数据包括历史钻井数据和所述历史钻井数据对应的井漏情况;
对所述初始数据进行数据清洗,得到样本数据,所述样本数据包括正样本数据和负样本数据,所述正样本数据为井漏期间的历史钻井数据,所述负样本数据为非井漏期间的历史钻井数据;
对所述样本数据,基于第一滑动窗口,获取所述样本数据的统计特征;
对所述样本数据,基于所述第一滑动窗口,对所述样本数据进行离散小波变换,得到所述样本数据的小波特征;
获取所述样本数据的统计特征和所述样本数据的小波特征对分类结果的贡献值,所述分类结果为对所述样本数据进行分类得到的用于井漏识别的结果,所述贡献值表示特征对所述分类结果的影响大小;
按照所述贡献值从大到小,获取预设数量的特征,从所述正样本数据和负样本数据中提取所述预设数量的特征对应的正样本数据和负样本数据;
基于所述预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型,所述多个初始第一分类模型为采用不同分类算法的模型;
基于所述预设数量的特征对应的正样本数据和负样本数据以及所述多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型,所述第二分类模型包括所述多个第一分类模型;
获取实时钻井数据;
将所述实时钻井数据输入所述第二分类模型,获取第二分类结果;
对所述第二分类结果进行处理,得到井漏识别结果;
所述对所述样本数据,基于第一滑动窗口,获取所述样本数据的统计特征包括:
对所述正样本数据,基于第一步长的第一滑动窗口,获取所述正样本数据的统计特征,以平衡正负样本。
2.根据权利要求1所述的方法,其特征在于,所述对所述初始数据进行数据清洗包括:
对所述初始数据进行异常值处理;
对所述异常值处理后的数据进行移动平均;
对所述移动平均处理后的数据进行标准化处理,得到所述样本数据。
3.根据权利要求1所述的方法,其特征在于,所述样本数据的统计特征包括:所述样本数据的方差、极差、中位数、偏度、峰度和变异系数。
4.根据权利要求1所述的方法,其特征在于,所述对所述样本数据,基于第一滑动窗口,获取所述样本数据的统计特征还包括:
对所述负样本数据,基于第二步长的第一滑动窗口,获取所述负样本数据的统计特征;
其中,所述第一步长小于所述第二步长。
5.根据权利要求1所述的方法,其特征在于,所述对所述样本数据,基于所述第一滑动窗口,对所述样本数据进行离散小波变换,得到所述样本数据的小波特征包括:
对所述正样本数据,基于第一步长的所述第一滑动窗口,对所述正样本数据进行离散小波变换,得到所述正样本数据的小波特征;
对所述负样本数据,基于第二步长的所述第一滑动窗口,对所述负样本数据进行离散小波变换,得到所述负样本数据的小波特征;
其中,所述第一步长小于所述第二步长。
6.根据权利要求1所述的方法,其特征在于,所述多个初始第一分类模型包括:决策树分类模型、随机森林模型和支持向量机模型。
7.根据权利要求1所述的方法,其特征在于,所述初始第二分类模型为逻辑回归模型。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述初始数据包括:总池体积、总池入口流量、总池出口流量、立管压力、大钩负荷、大钩高度、钻速、相对流量以及钻井液压力。
9.一种井漏识别装置,其特征在于,所述装置包括:
数据获取模块,用于获取按照时序排列的初始数据,所述初始数据包括历史钻井数据和所述历史钻井数据对应的井漏情况;
数据清洗模块,用于对所述初始数据进行数据清洗,得到样本数据,所述样本数据包括正样本数据和负样本数据,所述正样本数据为井漏期间的历史钻井数据,所述负样本数据为非井漏期间的历史钻井数据;
统计特征获取模块,用于对所述样本数据,基于第一滑动窗口,获取所述样本数据的统计特征;
小波特征获取模块,用于对所述样本数据,基于所述第一滑动窗口,对所述样本数据进行离散小波变换,得到所述样本数据的小波特征;
贡献值获取模块,用于获取所述样本数据的统计特征和所述样本数据的小波特征对分类结果的贡献值,所述分类结果为对所述样本数据进行分类得到的用于井漏识别的结果,所述贡献值表示特征对所述分类结果的影响大小;
特征数据提取模块,用于按照所述贡献值从大到小,获取预设数量的特征,从所述正样本数据和负样本数据中提取所述预设数量的特征对应的正样本数据和负样本数据;
第一分类模型训练模块,用于基于所述预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型,所述多个初始第一分类模型为采用不同分类算法的模型;
第二分类模型训练模块,用于基于所述预设数量的特征对应的正样本数据和负样本数据以及所述多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型,所述第二分类模型包括所述多个第一分类模型;
数据获取模块,还用于获取实时钻井数据;
分类结果获取模块,用于将所述实时钻井数据输入所述第二分类模型,获取第二分类结果;
井漏识别结果获取模块,用于对所述第二分类结果进行处理,得到井漏识别结果;
所述统计特征获取模块,用于对所述正样本数据,基于第一步长的第一滑动窗口,获取所述正样本数据的统计特征,以平衡正负样本。
10.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至权利要求8任一项所述的井漏识别方法所执行的操作。
CN201811147260.6A 2018-09-29 2018-09-29 井漏识别方法、装置及计算机设备 Active CN109472285B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811147260.6A CN109472285B (zh) 2018-09-29 2018-09-29 井漏识别方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811147260.6A CN109472285B (zh) 2018-09-29 2018-09-29 井漏识别方法、装置及计算机设备

Publications (2)

Publication Number Publication Date
CN109472285A CN109472285A (zh) 2019-03-15
CN109472285B true CN109472285B (zh) 2020-12-22

Family

ID=65663234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811147260.6A Active CN109472285B (zh) 2018-09-29 2018-09-29 井漏识别方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN109472285B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110766192B (zh) * 2019-09-10 2022-09-09 中国石油大学(北京) 基于深度学习的钻井井漏预测系统及方法
CN110671095B (zh) * 2019-09-23 2021-03-26 中国地质大学(武汉) 一种地质地层压力智能随钻软测量方法
CN110866043A (zh) * 2019-10-12 2020-03-06 上海上湖信息技术有限公司 数据预处理方法及装置、存储介质、终端
CN113051305A (zh) * 2019-12-27 2021-06-29 中国石油化工股份有限公司 一种堵漏材料粒径优选方法及电子设备
CN111414955B (zh) * 2020-03-17 2023-08-25 昆仑数智科技有限责任公司 石油钻井井漏溢流智能检测方法、装置以及电子设备
CN113496302B (zh) * 2020-04-02 2024-05-14 中国石油化工股份有限公司 一种对钻井风险进行智能识别预警的方法与系统
CN112215509A (zh) * 2020-10-21 2021-01-12 拉扎斯网络科技(上海)有限公司 资源参数的确定方法、装置及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388921A (zh) * 2018-03-05 2018-08-10 中国石油集团工程技术研究院有限公司 一种基于随机森林的溢流漏失实时识别方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103967478B (zh) * 2014-05-21 2017-10-27 北京航空航天大学 一种基于电导探针的垂直井流型辨识方法
US9579700B2 (en) * 2014-05-30 2017-02-28 Iteris, Inc. Measurement and modeling of salinity contamination of soil and soil-water systems from oil and gas production activities
CN104462846B (zh) * 2014-12-22 2017-11-10 山东鲁能软件技术有限公司 一种基于支持向量机的设备故障智能诊断方法
CN106677763B (zh) * 2016-12-29 2020-02-07 沈阳工业大学 一种基于动态集成建模的油井动液面预测方法
CN108304941A (zh) * 2017-12-18 2018-07-20 中国软件与技术服务股份有限公司 一种基于机器学习的故障预测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388921A (zh) * 2018-03-05 2018-08-10 中国石油集团工程技术研究院有限公司 一种基于随机森林的溢流漏失实时识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Leakage paths identification in NVM using biased data retention;J.Postel-Pellerin 等;《Microelectronics Reliability》;20101130;第1474-1478页 *
基于随机森林的管网漏失诊断方法;王学渊 等;《计算机应用》;20180615;第20-23页 *

Also Published As

Publication number Publication date
CN109472285A (zh) 2019-03-15

Similar Documents

Publication Publication Date Title
CN109472285B (zh) 井漏识别方法、装置及计算机设备
CN111798312B (zh) 一种基于孤立森林算法的金融交易系统异常识别方法
CN104200291A (zh) 一种基于小波变换和arma-svm的涌水量预测方法
CN104807589B (zh) 一种集输-立管系统内气液两相流流型的在线识别方法
CN110175541B (zh) 一种海平面变化非线性趋势提取的方法
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
CN111144548A (zh) 抽油机井工况的识别方法及装置
CN108197795B (zh) 恶意团体账户识别方法、装置、终端及存储介质
CN112307130B (zh) 一种文档级远程监督关系抽取方法及系统
CN113961424A (zh) 分布式系统的故障预测方法以及故障预测装置
CN109342018A (zh) 一种水轮机空化状态监测方法
CN104809229A (zh) 一种文本特征词提取方法及系统
CN117351307A (zh) 一种模型训练方法、装置、设备及存储介质
CN110956675B (zh) 技术成熟度曲线自动生成方法及装置
CN110210154B (zh) 利用大坝测点数据判断测点表征大坝性态相似度的方法
CN116629686A (zh) 一种评估企业能耗数据的方法及装置
CN104111109A (zh) 一种基于不同阶次统计量及支持向量机的机械振动状态识别方法
CN116361695A (zh) 异常数据检测方法以及装置
KR102357475B1 (ko) 개선된 gbtd 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법
CN114862404A (zh) 基于聚类样本与极限梯度的信用卡欺诈检测方法及设备
CN111461461B (zh) 一种水利工程异常检测方法及系统
CN109657404B (zh) 基于混沌修正群智能寻优的采煤机故障自动诊断系统
CN114860616B (zh) 一种代码检测方法、装置、设备和存储介质
CN117972398B (zh) 一种断路器故障特征信息提取方法及系统
CN116894585B (zh) 一种应用于未来社区综合数据智能分析方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room 1501, Gehua building, No.1 Qinglong Hutong, Dongcheng District, Beijing

Patentee after: Kunlun Digital Technology Co.,Ltd.

Patentee after: BGP INC., CHINA NATIONAL PETROLEUM Corp.

Address before: 1501, Gehua building, 1 Qinglong Hutong, Dongcheng District, Beijing

Patentee before: RICHFIT INFORMATION TECHNOLOGY Co.,Ltd.

Patentee before: BGP INC., CHINA NATIONAL PETROLEUM Corp.

CP03 Change of name, title or address
TR01 Transfer of patent right

Effective date of registration: 20220321

Address after: Room 1501, Gehua building, No.1 Qinglong Hutong, Dongcheng District, Beijing

Patentee after: Kunlun Digital Technology Co.,Ltd.

Patentee after: CHINA NATIONAL PETROLEUM Corp.

Address before: Room 1501, Gehua building, No.1 Qinglong Hutong, Dongcheng District, Beijing

Patentee before: Kunlun Digital Technology Co.,Ltd.

Patentee before: BGP INC., CHINA NATIONAL PETROLEUM Corp.

TR01 Transfer of patent right