CN108678728A - 一种基于k-means的油井参数分析组合算法 - Google Patents

一种基于k-means的油井参数分析组合算法 Download PDF

Info

Publication number
CN108678728A
CN108678728A CN201810459511.8A CN201810459511A CN108678728A CN 108678728 A CN108678728 A CN 108678728A CN 201810459511 A CN201810459511 A CN 201810459511A CN 108678728 A CN108678728 A CN 108678728A
Authority
CN
China
Prior art keywords
oil well
efficiency
data
oil
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810459511.8A
Other languages
English (en)
Inventor
高巍
史玥婷
王卫江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201810459511.8A priority Critical patent/CN108678728A/zh
Publication of CN108678728A publication Critical patent/CN108678728A/zh
Pending legal-status Critical Current

Links

Classifications

    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21BEARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
    • E21B47/00Survey of boreholes or wells
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mining & Mineral Resources (AREA)
  • Business, Economics & Management (AREA)
  • Geology (AREA)
  • Primary Health Care (AREA)
  • Animal Husbandry (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Geophysics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Fluid Mechanics (AREA)
  • Agronomy & Crop Science (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geochemistry & Mineralogy (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明方法涉及一种基于k‑means的油井参数分析组合算法,该方法可以充分分析挖掘多项油井生产参数的潜在信息,为油田工作人员进行生产优化、故障诊断提供科学指导,而不是单纯依靠工人观测经验,减少了人力浪费,同时也避免了新人缺少经验容易判断失误造成一定经济损失或者是安全隐患的问题。本发明是通过以下技术方案实现:首先对油井产量相关和效率相关的多参数进行降维特征提取,然后设置不同初始点进行多次k‑means聚类循环,通过相似性矩阵判决实现聚类融合,使得聚类更为精准。本发明对油井多参数进行分析聚类,算法稳定可靠,提升了油井数据分析水平。

Description

一种基于k-means的油井参数分析组合算法
技术领域
本方法涉及一种基于k-means的油井数据分析组合算法,可以挖掘分析油井参数的潜在信息,并对油井按照工作状态进行分类和分析,提升油井效率和生产能力。
背景技术
随着油田信息化程度的加深,油井多项生产参数被实时的精确采集和传输存储,形成了大量数据资源。传统的油田参数分析主要针对两类参数,一类是以载荷为主的力学参数,是油井负荷量、产液量和平衡情况等工作状态的重要监控参数,对力学参数的分析可以辅助实现抽油机平衡校准、补偿和故障分析等;另外一类是电参数,是一组抽油机电机运行过程中电压、电流和电功率等构成的电气参数,对电参数的分析可以。但是,目前国内外对抽油机力学参数与电参数的分析研究都相对比较独立,没有挖掘出多元油井参数之间的关系,而且对采集到的数据只有一部分进行了分析,数据类型较少。
研究基于大数据和机器学习的油井数据分析,可以更为精准的从数据分析的角度给出结论,而不是单纯依靠工人观测经验,可以减少一定的人力浪费,同时也避免了新人缺少经验容易判断失误造成一定经济损失或者是安全隐患的问题。但是,目前在油井应用的数据挖掘算法都是单一算法,在精确性、分析速度等方面都有待提高。
发明内容
为了更科学、更全面地分析和挖掘油井参数中的有用信息,基于多元生产参数对油井进行聚类,帮助工作人员进行生产优化决策,提出一种基于k-means的油井参数分析组合算法。首先对与油井产量相关的参数和与效率相关的参数油井工作参数进行降维特征提取,通过k-means和相似性矩阵聚类融合可以更为精准的从大数据分析的角度实现油井聚类,分析出高产高效、高产低效和低产低效井,为油田工作人员进行生产优化、故障诊断提供科学指导。
本发明的目的是通过以下技术方案实现的。
本发明的基于k-means的油井参数分析组合算法,步骤为:
步骤一:将采油厂N口油井的实时原始数据按与产量相关的参数排列成矩阵X1和按与效率相关的参数排列成矩阵X2
所述的原始油井数据包括与产量相关的参数,如:冲程、冲次、实际生产时间、实际产液量、井底流压;和与效率相关的参数,如:泵效、系统效率、油压、套压、油温、含水率、平均有功功率、平均转速、平均功率因数、平均电机的输出轴功率、光杆功率、泵功率、有效功率、电机功率损耗、皮带损耗、减速箱损耗、四连杆功率损耗、抽油杆功率损失、抽油泵损失功率、油管摩阻损失功率、系统效率、地面效率、电机效率、皮带四连杆及减速箱效率、井下效率、抽油杆部分效率、平衡率、电机负载率、抽油机负载率、油管压头损失、泵吸入口压力、有效举升高度、泵效、泵充满系数、冲程损失泵效、气体损失泵效、漏失损失泵效、容积损失泵效和有功日耗电量;
所述的矩阵X1,X2,每行代表采油厂中的一口油井的一组实时数据,每列为顺序排列的油井多元参数;
步骤二:对矩阵X1,X2每一行进行PCA主成分分析法降维,分别选取降维至k1,k2维后的数据对原信息的贡献率超过90%时的k1,k2个特征值,Yn=[X1第n行降维后的k1个特征值,X2第n行降维后的k2个特征值],n∈{0,1,...,N}是降维提取特征后的数据样本;
步骤三:设定相似性矩阵A中每个元素Aij初值为0,i,j初值为1,设定循环序数h初值为0,设定总聚类循环次数H,需满足H<N-3;
所述的相似性矩阵A,矩阵的第i行第j列表示的是第i口油井降维提取特征后的数据样本Yi和第j口油井降维提取特征后的数据样本Yj之间的相似度,公式为
步骤四:选取第h口油井特征数据Yh,第h+1口油井特征数据Yh+1,第h+2口油井特征数据Yh+2井作为聚类初始点,用k-means算法对降维后的油井数据Yn,n∈{0,1,...,N}聚类成三类;
步骤五:判断Yi和Yj是否被分为同一类别时,当Yi和Yj被分为同一类时,Aij的值累加1/H;
步骤六:j=j+1,当j<N+1时,循环执行步骤五,否则将j设为1并执行步骤七;
步骤七:i=i+1,当i<N+1时,循环执行步骤五,否则执行步骤八;
步骤八:h=h+1,当h<H时,循环执行步骤四至步骤七,否则,结束循环并执行步骤九;
步骤九:遍历相似性矩阵A,当A中某个元素值Aij处于[0.5,1)时,说明特征数据Yi,数据数据Yj属于同一类别的概率大于0.5时,即大部分的情况下第i口油井和第j口油井经数据聚类分析后是属于同一个类别的,则可以认为实际上这两口油井就是属于一个类别当中的;
步骤十:然后再对这些特征数据对两两进行处理,分为三种不同情况,第一种是当两个特征数据都没有被划分到某个类别的时候,将它们划分为同一个类别,同时标记两个特征数据为已标记状态;第二种情况是两个特征数据中有一个被划分到某个类别,而另一个没有类别标签的时候,将没有标签的特征数据标记为与有类别标签的特征数据相同标签,两个特征数据也同样标记为已标记状态;最后一种情况是两个特征数据都已经被标记,但是被分类到不同的类别当中,此时,将两个类别合并为一个类别;最终,得到三类油井的聚类情况,辅助油田工作人员更为科学地对高产高效井、高产低效井和低产低效井进行分别管理,优化。
有益效果
本发明方法充分分析挖掘多项油井生产参数的潜在信息,通过降维特征提取同时考虑了油井产量和效率两方面参数并减少了数据量保证了算法分析的实时性,通过k-means和相似性矩阵聚类融合可以更为精准的从大数据分析的角度实现油井聚类,为油田工作人员进行生产优化、故障诊断提供科学指导,而不是单纯依靠工人观测经验,减少了人力浪费,同时也避免了新人缺少经验容易判断失误造成一定经济损失或者是安全隐患的问题。
附图说明
图1是本发明方法的算法流程图。
具体实施方式
下面结合附图和实施例对本发明做进一步说明。
实施例
步骤一:将采油厂N口油井的实时原始数据按与产量相关的参数排列成矩阵X1和按与效率相关的参数排列成矩阵X2
所述的原始油井数据包括与产量相关的参数,如:冲程、冲次、实际生产时间、实际产液量、井底流压;和与效率相关的参数,如:泵效、系统效率、油压、套压、油温、含水率、平均有功功率、平均转速、平均功率因数、平均电机的输出轴功率、光杆功率、泵功率、有效功率、电机功率损耗、皮带损耗、减速箱损耗、四连杆功率损耗、抽油杆功率损失、抽油泵损失功率、油管摩阻损失功率、系统效率、地面效率、电机效率、皮带四连杆及减速箱效率、井下效率、抽油杆部分效率、平衡率、电机负载率、抽油机负载率、油管压头损失、泵吸入口压力、有效举升高度、泵效、泵充满系数、冲程损失泵效、气体损失泵效、漏失损失泵效、容积损失泵效和有功日耗电量;参数种类包括但不限于以上所述参数,在构成矩阵X1,X2时尽可能提供更多的数据种类,数据种类的排列顺序需保证对所有油井同一顺序即可;由于油井数据采集频率有所不同,一般选用同一天的一组数据,采集频率高的数据进行均值处理,一天只采集一次的则直接选取该数据,对需要体现油井采油一个周期中不同工作瞬间的参数,可用一个周期内的多个数据排列成矩阵X1,X2
所述的矩阵X1,X2,每行代表采油厂中的一口油井的一组实时数据,每列为油井各项参数;
步骤二:对矩阵X1,X2每一行进行PCA主成分分析法降维,分别选取降维至k1,k2维后的数据对原信息的贡献率超过90%时的k1,k2个特征值,Yn=[X1第n行降维后的k1个特征值,X2第n行降维后的k2个特征值],n∈{0,1,...,N}是降维提取特征后的数据样本;
步骤三:设定相似性矩阵A中每个元素Aij初值为0,i,j初值为1,设定循环序数h初值为0,设定总聚类循环次数H,需满足H<N-3;
所述的相似性矩阵A,矩阵的第i行第j列表示的是第i口油井降维提取特征后的数据样本Yi和第j口油井降维提取特征后的数据样本Yj之间的相似度,公式为
所述的总聚类循环次数H,一般设为10即可又快又准地实现油井数据聚类;
步骤四:选取第h口油井特征数据Yh,第h+1口油井特征数据Yh+1,第h+2口油井特征数据Yh+2井作为聚类初始点,用k-means算法对降维后的油井数据Yn,n∈{0,1,...,N}聚类成三类;
步骤五:判断Yi和Yj是否被分为同一类别时,当Yi和Yj被分为同一类时,Aij的值累加1/H;
步骤六:j=j+1,当j<N+1时,循环执行步骤五,否则将j设为1并执行步骤七;
步骤七:i=i+1,当i<N+1时,循环执行步骤五,否则执行步骤八;
步骤八:h=h+1,当h<H时,循环执行步骤四至步骤七,否则,结束循环并执行步骤九;
步骤九:遍历相似性矩阵A,当A中某个元素值Aij处于[0.5,1)时,说明特征数据Yi,数据数据Yj属于同一类别的概率大于0.5时,即大部分的情况下第i口油井和第j口油井经数据聚类分析后是属于同一个类别的,则可以认为实际上这两口油井就是属于一个类别当中的;
步骤十:然后再对这些特征数据对两两进行处理,分为三种不同情况,第一种是当两个特征数据都没有被划分到某个类别的时候,将它们划分为同一个类别,同时标记两个特征数据为已标记状态;第二种情况是两个特征数据中有一个被划分到某个类别,而另一个没有类别标签的时候,将没有标签的特征数据标记为与有类别标签的特征数据相同标签,两个特征数据也同样标记为已标记状态;最后一种情况是两个特征数据都已经被标记,但是被分类到不同的类别当中,此时,将两个类别合并为一个类别;最终,得到三类油井的聚类情况,辅助油田工作人员更为科学地对高产高效井、高产低效井和低产低效井进行分别管理,优化。

Claims (1)

1.一种基于k-means的油井参数分析组合算法,其特征在于包括以下步骤:
步骤一:将采油厂N口油井的实时原始数据按与产量相关的参数排列成矩阵X1和按与效率相关的参数排列成矩阵X2
所述的原始油井数据包括与产量相关的参数,如:冲程、冲次、实际生产时间、实际产液量、井底流压;和与效率相关的参数,如:泵效、系统效率、油压、套压、油温、含水率、平均有功功率、平均转速、平均功率因数、平均电机的输出轴功率、光杆功率、泵功率、有效功率、电机功率损耗、皮带损耗、减速箱损耗、四连杆功率损耗、抽油杆功率损失、抽油泵损失功率、油管摩阻损失功率、系统效率、地面效率、电机效率、皮带四连杆及减速箱效率、井下效率、抽油杆部分效率、平衡率、电机负载率、抽油机负载率、油管压头损失、泵吸入口压力、有效举升高度、泵效、泵充满系数、冲程损失泵效、气体损失泵效、漏失损失泵效、容积损失泵效和有功日耗电量;
所述的矩阵X1,X2,每行代表采油厂中的一口油井的一组实时数据,每列为顺序排列的油井多元参数;
步骤二:对矩阵X1,X2每一行进行PCA主成分分析法降维,分别选取降维至k1,k2维后的数据对原信息的贡献率超过90%时的k1,k2个特征值,Yn=[X1第n行降维后的k1个特征值,X2第n行降维后的k2个特征值],n∈{0,1,...,N}是降维提取特征后的数据样本;
步骤三:设定相似性矩阵A中每个元素Aij初值为0,i,j初值为1,设定循环序数h初值为0,设定总聚类循环次数H,需满足H<N-3;
所述的相似性矩阵A,矩阵的第i行第j列表示的是第i口油井降维提取特征后的数据样本Yi和第j口油井降维提取特征后的数据样本Yj之间的相似度,公式为
步骤四:选取第h口油井特征数据Yh,第h+1口油井特征数据Yh+1,第h+2口油井特征数据Yh+2井作为聚类初始点,用k-means算法对降维后的油井数据Yn,n∈{0,1,...,N}聚类成三类;
步骤五:判断Yi和Yj是否被分为同一类别时,当Yi和Yj被分为同一类时,Aij的值累加1/H;
步骤六:j=j+1,当j<N+1时,循环执行步骤五,否则将j设为1并执行步骤七;
步骤七:i=i+1,当i<N+1时,循环执行步骤五,否则执行步骤八;
步骤八:h=h+1,当h<H时,循环执行步骤四至步骤七,否则,结束循环并执行步骤九;
步骤九:遍历相似性矩阵A,当A中某个元素值Aij处于[0.5,1)时,说明特征数据Yi,数据数据Yj属于同一类别的概率大于0.5时,即大部分的情况下第i口油井和第j口油井经数据聚类分析后是属于同一个类别的,则可以认为实际上这两口油井就是属于一个类别当中的;
步骤十:然后再对这些特征数据对两两进行处理,分为三种不同情况,第一种是当两个特征数据都没有被划分到某个类别的时候,将它们划分为同一个类别,同时标记两个特征数据为已标记状态;第二种情况是两个特征数据中有一个被划分到某个类别,而另一个没有类别标签的时候,将没有标签的特征数据标记为与有类别标签的特征数据相同标签,两个特征数据也同样标记为已标记状态;最后一种情况是两个特征数据都已经被标记,但是被分类到不同的类别当中,此时,将两个类别合并为一个类别;最终,得到三类油井的聚类情况,辅助油田工作人员更为科学地对高产高效井、高产低效井和低产低效井进行分别管理,优化。
CN201810459511.8A 2018-05-15 2018-05-15 一种基于k-means的油井参数分析组合算法 Pending CN108678728A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810459511.8A CN108678728A (zh) 2018-05-15 2018-05-15 一种基于k-means的油井参数分析组合算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810459511.8A CN108678728A (zh) 2018-05-15 2018-05-15 一种基于k-means的油井参数分析组合算法

Publications (1)

Publication Number Publication Date
CN108678728A true CN108678728A (zh) 2018-10-19

Family

ID=63806306

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810459511.8A Pending CN108678728A (zh) 2018-05-15 2018-05-15 一种基于k-means的油井参数分析组合算法

Country Status (1)

Country Link
CN (1) CN108678728A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115828130A (zh) * 2023-02-14 2023-03-21 中国石油天然气股份有限公司 基于聚类算法的多参数优势水流通道自动识别方法及系统
CN116011351A (zh) * 2023-03-28 2023-04-25 中国石油大学(华东) 一种基于聚类算法和WideDeep网络的油井合理沉没度确定方法
CN117684947A (zh) * 2022-12-14 2024-03-12 中国科学院沈阳自动化研究所 一种基于深度学习的油井井底流压软测量方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101266621A (zh) * 2008-04-24 2008-09-17 北京学门科技有限公司 一种高维稀疏数据聚类系统及方法
CN103900824A (zh) * 2014-03-27 2014-07-02 哈尔滨工程大学 基于瞬时转速聚类分析的柴油机故障诊断方法
CN104166804A (zh) * 2014-08-20 2014-11-26 中国科学技术大学 一种基于时频域单源点稀疏成分分析的工作模态辨识方法
CN104680257A (zh) * 2015-03-12 2015-06-03 天津市万众科技发展有限公司 面向抽油机工作过程的智能优化方法
CN105046326A (zh) * 2015-03-13 2015-11-11 重庆科技学院 基于功图主元分析的抽油机参数优化方法
CN105760673A (zh) * 2016-02-22 2016-07-13 中国海洋石油总公司 一种河流相储层地震敏感参数模板分析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101266621A (zh) * 2008-04-24 2008-09-17 北京学门科技有限公司 一种高维稀疏数据聚类系统及方法
CN103900824A (zh) * 2014-03-27 2014-07-02 哈尔滨工程大学 基于瞬时转速聚类分析的柴油机故障诊断方法
CN104166804A (zh) * 2014-08-20 2014-11-26 中国科学技术大学 一种基于时频域单源点稀疏成分分析的工作模态辨识方法
CN104680257A (zh) * 2015-03-12 2015-06-03 天津市万众科技发展有限公司 面向抽油机工作过程的智能优化方法
CN105046326A (zh) * 2015-03-13 2015-11-11 重庆科技学院 基于功图主元分析的抽油机参数优化方法
CN105760673A (zh) * 2016-02-22 2016-07-13 中国海洋石油总公司 一种河流相储层地震敏感参数模板分析方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117684947A (zh) * 2022-12-14 2024-03-12 中国科学院沈阳自动化研究所 一种基于深度学习的油井井底流压软测量方法
CN117684947B (zh) * 2022-12-14 2024-05-07 中国科学院沈阳自动化研究所 一种基于深度学习的油井井底流压软测量方法
CN115828130A (zh) * 2023-02-14 2023-03-21 中国石油天然气股份有限公司 基于聚类算法的多参数优势水流通道自动识别方法及系统
CN116011351A (zh) * 2023-03-28 2023-04-25 中国石油大学(华东) 一种基于聚类算法和WideDeep网络的油井合理沉没度确定方法
CN116011351B (zh) * 2023-03-28 2023-06-13 中国石油大学(华东) 一种基于聚类算法和WideDeep网络的油井合理沉没度确定方法

Similar Documents

Publication Publication Date Title
CN108678728A (zh) 一种基于k-means的油井参数分析组合算法
CN107305601B (zh) 一种抽油机井系统效率因素分析方法
CN105257277B (zh) 基于多变量灰色模型的有杆泵抽油井井下故障预测方法
CN111784093B (zh) 一种基于电力大数据分析的企业复工辅助判断方法
CN105525909A (zh) 分析油藏储层非均质性质的方法
CN112580851B (zh) 丛式井场抽油机井群错峰开井间抽运行调度方法
CN109255134A (zh) 一种抽油机井故障情况的获取方法
CN108011367A (zh) 一种基于深度决策树算法的电力负荷特性挖掘方法
CN109582714B (zh) 一种基于时间衰减关联的政务事项数据处理方法
CN113011089B (zh) 一种基于深度学习的机采井系统效率优化方法与装置
CN106321072A (zh) 一种基于泵功图的抽油井故障诊断方法
CN113137211B (zh) 一种基于模糊综合决策的油井生产参数自适应调控方法
CN114596010B (zh) 一种结合注意力机制的BiGRU网络钻井工况识别方法
CN110288257A (zh) 一种深度超限示功图学习方法
CN114718861A (zh) 基于深度学习的螺杆泵井工况智能诊断方法
CN111144433A (zh) 基于svm模型油井工况智能诊断分析方法及装置
CN105863607A (zh) 基于整体区块抽油机井运行状况评价与整改方法
CN109753729A (zh) 实时优化钻井作业参数的方法及装置、电子设备
Tang et al. Prediction of casing damage in unconsolidated sandstone reservoirs using machine learning algorithms
CN113052374B (zh) 一种数据驱动的油井套损深度智能预测方法
Guizhi et al. Application of big data analysis in oil production engineering
CN108493933A (zh) 一种基于深度决策树算法的电力负荷特性挖掘方法
CN117391227A (zh) 基于集成学习算法的抽油机系统效率预测方法及系统
CN109236277A (zh) 一种基于产生式规则的抽油井故障诊断专家系统
Patri Modeling and recognition of events from multidimensional data: doctoral symposium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181019